UTF-8 є система кодування для Unicode. Він може перетворити будь-який символ Unicode у відповідний унікальний двійковий рядок, а також може перетворити двійковий рядок назад у символ Unicode. Це значення «UTF» або «Формат перетворення Юнікоду». 3 квітня 2024 р.
Приклади
характер | Двійковий UTF-8 | |
---|---|---|
£ | U+00A3 | 11000010 10100011 |
И | U+0418 | 11010000 10011000 |
ह (літера деванагарі HA) | U+0939 | 11100000 10100100 10111001 |
€ | U+20AC | 11100010 10000010 10101100 |
Оскільки UTF-8 є кодуванням змінної довжини, визначення кількості байтів, які використовуються для кожного символу під час декодування, слідує прямому правилу: Якщо старший біт дорівнює 0, символ представлено 7 бітами, що відповідають стандартним символам ASCII.
Функція utf8_decode() є вбудованою функцією PHP використовується для декодування рядка UTF-8 до ISO-8859-1. Ця функція декодує назад до закодованого рядка, який кодується за допомогою функції utf8_encode(). Параметр: ця функція приймає один необхідний параметр $string.
кодувати (рядок) Кодує будь-який наданий рядок JavaScript ( string ) як UTF-8 і повертає версію рядка в кодуванні UTF-8. Він видає помилку, якщо вхідний рядок містить нескалярне значення, тобто єдиний сурогат.
UTF-8 — це система кодування Unicode. Це може перекладати будь-який символ Unicode у відповідний унікальний двійковий рядок, а також може перекладати двійковий рядок назад у символ Unicode. Це значення «UTF» або «Формат перетворення Юнікоду».