UTF-8 (Unicode Transformation-8-bit). кодування, визначене Міжнародною організацією зі стандартизації (ISO) у ISO 10646 . Він може представляти до 2 097 152 кодових точок (2^21), більш ніж достатньо, щоб охопити поточні 1 112 064 кодових точок Unicode.
UTF-8 є система кодування для Unicode. Він може перетворити будь-який символ Unicode у відповідний унікальний двійковий рядок, а також може перетворити двійковий рядок назад у символ Unicode. Це значення «UTF» або «Формат перетворення Юнікоду».
UTF-8 кодує символи Unicode в послідовність 8-бітних байтів. Стандарт містить більше мільйона різних кодових точок і є надмножиною всіх символів, які сьогодні широко використовуються. Для порівняння, ASCII (Американський стандартний код для обміну інформацією) включає 128 кодів символів.
Цей дизайн із 66 захищеними символами намагався бути сумісним із ISO/IEC 2022. UTF-1 використовує арифметику за модулем 190 (256 − 66 = 190). Для порівняння, UTF-8 захищає всі 128 символів ASCII і потребує для цього один біт і другий біт для самосинхронізації, що призводить до арифметики "по модулю 64" (8 − 2 = 6; 26 = 64).
UTF8 Encode Encoding перетворює дані або задану послідовність символів, символів, алфавітів тощо у визначений формат для безпечної передачі даних. Декодування – це процес зворотного кодування, вилучення інформації з перетвореної форми.
Підтримка TIBCO iProcess Suite для UTF-8 (або UCS-2 у випадку SQL Server) дозволяє вам працювати в міжнародному середовищі та в багатонаціональному середовищі, використовуючи більше одного багатобайтового набору символів одночасно.