6 Двубайтне кодування (ISO10646, UTF-8)
ISO10646
У 1991 році ISO та Консорціумом Unicode вирішили співпрацювати у визначенні універсального стандарту кодування для багатомовних текстів. З того часу обидві організації тісно співпрацюють для забезпечення єдиної технічної основи для обробки електронної інформації на різних мовах. Міжнародна організація зі стандартизації (ISO) розробила міжнародні стандарт кодування називається ISO 10646. ISO 10646 забезпечує єдиний стандарт для кодування символів на всіх основних мовах світу, включаючи традиційні і спрощені китайські ієрогліфи.
ISO випустила першу версію ISO 10646 стандарт в 1993 році, вона містила 20 902 символи. Остання версія стандарту ISO 10646 була випущена у листопаді 2005 року і містить більше 70 000 символів.
UTF-8 - формат перетворення Юнікоду.
UTF-8 є важливим кодування через наступні причин:
сумісний з ASCII;
легко підтримується;
компактний і ефективний для більшості сценаріїв;
легко обробляється, на відміну від інших мультибайтних кодувань.