Відмінності між версіями «4 ASCII»
(Створена сторінка: ASCII (англ. Американський стандартний код для обміну інформацією) - американська стандартн...) |
|||
Рядок 1: | Рядок 1: | ||
ASCII (англ. Американський стандартний код для обміну інформацією) - американська стандартна кодувальна таблиця для друкованих символів і деяких спеціальних кодів. В американському варіанті англійської мови вимовляється [ескі], тоді як у Великобританії частіше вимовляється [аскі]. | ASCII (англ. Американський стандартний код для обміну інформацією) - американська стандартна кодувальна таблиця для друкованих символів і деяких спеціальних кодів. В американському варіанті англійської мови вимовляється [ескі], тоді як у Великобританії частіше вимовляється [аскі]. | ||
− | + | ||
+ | ASCII представляє собою кодування для представлення десяткових цифр, латинського та національного алфавітів, розділових знаків і керуючих символів. Спочатку розроблена як 7-бітна, з широким розповсюдженням 8-бітного байта ASCII стала сприйматися як половина 8-бітної. У комп'ютерах зазвичай використовують розширення ASCII з задіяною другою половиною байта (наприклад [[КОИ-8]]). | ||
+ | |||
+ | |||
+ | == Накладення символів == | ||
+ | Завдяки символу BS (повернення на крок) на принтері можна друкувати один символ поверх іншого. В ASCII було передбачено додавання таким чином діакрітікі до букв, наприклад: | ||
+ | *a BS ' → á | ||
+ | *a BS ` → à | ||
+ | *a BS ^ → â | ||
+ | *o BS / → ø | ||
+ | *c BS , → ç | ||
+ | *n BS ~ → ñ | ||
+ | '''''Примітка:''' у старих шрифтах апостроф ' малювався з нахилом вліво, а тильда ~ була зрушена вгору, так що вони якраз підходили на роль акута і тильди зверху.'' | ||
+ | |||
+ | Якщо на символ накладається той же символ, то виходить ефект жирного шрифту, а якщо на символ накладається підкреслення, то виходить підкреслений текст. | ||
+ | *a BS a → a | ||
+ | *a BS _ → a | ||
+ | |||
+ | == Національні варіанти ASCII == | ||
+ | |||
+ | Стандарт ISO 646 (ECMA-6) передбачає можливість розміщення національних символів на місці '''@ [\] ^ `{|} ~'''. На додаток до цього, на місці '''#''' може бути розміщений '''£''', а на місці '''$''' - '''¤'''. Така система добре підходить для європейських мов, де потрібні лише кілька додаткових символів. Варіант ASCII без національних символів називається US-ASCII, або «International Reference Version». | ||
+ | |||
+ | Для деяких мов з нелатинською писемністю (арабська, грецька, російська) існували більш радикальні модифікації ASCII. Одним з варіантів була відмова від малих латинських літер - на їх місці розміщувалися національні символи (для російської та грецької - лише великими літерами). Інший варіант - перемикання між US-ASCII і національним варіантом «на льоту» за допомогою символів SO (Shift Out) і SI (Shift In) - в цьому випадку в національному варіанті можна повністю усунути латинські букви і зайняти весь простір під свої символи. Див також [[КОИ-7]]. | ||
+ | |||
+ | Згодом виявилося зручніше використовувати 8-бітове кодування, де нижню половину кодової таблиці (0-127) займають символи US-ASCII, а верхню (128 - 255) - додаткові символи, включаючи набір національних символів. Таким чином, верхня половина таблиці ASCII до повсюдного впровадження [[Юнікод]] у активно використовувалася для подання локалізованих символів, літер місцевої мови. Відсутність єдиного стандарту розміщення кириличних символів в таблиці ASCII додвало безліч проблем з кодуваннями ([[КОИ-8]], [[Windows-1251]] та інші). Інші мови з нелатинською писемністю теж страждали через наявність кількох різних кодувань. | ||
+ | |||
+ | В [[Юнікод]] і перші 128 символів теж збігаються з відповідними символами US-ASCII. | ||
+ | |||
+ | == Кодування == | ||
+ | {| border="1" cellspacing="0" style="text-align: center; font-family: monospace" | ||
+ | |- | ||
+ | ! width="4%" | | ||
+ | ! width="6%" | .0 || width="6%" | .1 | ||
+ | ! width="6%" | .2 || width="6%" | .3 | ||
+ | ! width="6%" | .4 || width="6%" | .5 | ||
+ | ! width="6%" | .6 || width="6%" | .7 | ||
+ | ! width="6%" | .8 || width="6%" | .9 | ||
+ | ! width="6%" | .A || width="6%" | .B | ||
+ | ! width="6%" | .C || width="6%" | .D | ||
+ | ! width="6%" | .E || width="6%" | .F | ||
+ | |- | ||
+ | ! 0. | ||
+ | | NUL || SOH || STX || ETX | ||
+ | | EOT || ENQ || ACK || BEL | ||
+ | | BS || TAB || LF || VT | ||
+ | | FF || CR || SO || SI | ||
+ | |- | ||
+ | ! 1. | ||
+ | | DLE || DC1 || DC2 || DC3 | ||
+ | | DC4 || NAK || SYN || ETB | ||
+ | | CAN || EM || SUB || ESC | ||
+ | | FS || GS || RS || US | ||
+ | |- | ||
+ | ! 2. | ||
+ | | || ! || " || # | ||
+ | | $ || % || & || ' | ||
+ | | ( || ) || * || + | ||
+ | | , || — || . || / | ||
+ | |- | ||
+ | ! 3. | ||
+ | | 0 || 1 || 2 || 3 | ||
+ | | 4 || 5 || 6 || 7 | ||
+ | | 8 || 9 || : || ; | ||
+ | | < || = || > || ? | ||
+ | |- | ||
+ | ! 4. | ||
+ | | @ || A || B || C | ||
+ | | D || E || F || G | ||
+ | | H || I || J || K | ||
+ | | L || M || N || O | ||
+ | |- | ||
+ | ! 5. | ||
+ | | P || Q || R || S | ||
+ | | T || U || V || W | ||
+ | | X || Y || Z || [ | ||
+ | | \ || ] || ^ || _ | ||
+ | |- | ||
+ | ! 6. | ||
+ | | ` || a || b || c | ||
+ | | d || e || f || g | ||
+ | | h || i || j || k | ||
+ | | l || m || n || o | ||
+ | |- | ||
+ | ! 7. | ||
+ | | p || q || r || s | ||
+ | | t || u || v || w | ||
+ | | x || y || z || { | ||
+ | | | || } || ~ || DEL | ||
+ | |} |
Версія за 01:05, 20 грудня 2011
ASCII (англ. Американський стандартний код для обміну інформацією) - американська стандартна кодувальна таблиця для друкованих символів і деяких спеціальних кодів. В американському варіанті англійської мови вимовляється [ескі], тоді як у Великобританії частіше вимовляється [аскі].
ASCII представляє собою кодування для представлення десяткових цифр, латинського та національного алфавітів, розділових знаків і керуючих символів. Спочатку розроблена як 7-бітна, з широким розповсюдженням 8-бітного байта ASCII стала сприйматися як половина 8-бітної. У комп'ютерах зазвичай використовують розширення ASCII з задіяною другою половиною байта (наприклад КОИ-8).
Накладення символів
Завдяки символу BS (повернення на крок) на принтері можна друкувати один символ поверх іншого. В ASCII було передбачено додавання таким чином діакрітікі до букв, наприклад:
- a BS ' → á
- a BS ` → à
- a BS ^ → â
- o BS / → ø
- c BS , → ç
- n BS ~ → ñ
Примітка: у старих шрифтах апостроф ' малювався з нахилом вліво, а тильда ~ була зрушена вгору, так що вони якраз підходили на роль акута і тильди зверху.
Якщо на символ накладається той же символ, то виходить ефект жирного шрифту, а якщо на символ накладається підкреслення, то виходить підкреслений текст.
- a BS a → a
- a BS _ → a
Національні варіанти ASCII
Стандарт ISO 646 (ECMA-6) передбачає можливість розміщення національних символів на місці @ [\] ^ `{|} ~. На додаток до цього, на місці # може бути розміщений £, а на місці $ - ¤. Така система добре підходить для європейських мов, де потрібні лише кілька додаткових символів. Варіант ASCII без національних символів називається US-ASCII, або «International Reference Version».
Для деяких мов з нелатинською писемністю (арабська, грецька, російська) існували більш радикальні модифікації ASCII. Одним з варіантів була відмова від малих латинських літер - на їх місці розміщувалися національні символи (для російської та грецької - лише великими літерами). Інший варіант - перемикання між US-ASCII і національним варіантом «на льоту» за допомогою символів SO (Shift Out) і SI (Shift In) - в цьому випадку в національному варіанті можна повністю усунути латинські букви і зайняти весь простір під свої символи. Див також КОИ-7.
Згодом виявилося зручніше використовувати 8-бітове кодування, де нижню половину кодової таблиці (0-127) займають символи US-ASCII, а верхню (128 - 255) - додаткові символи, включаючи набір національних символів. Таким чином, верхня половина таблиці ASCII до повсюдного впровадження Юнікод у активно використовувалася для подання локалізованих символів, літер місцевої мови. Відсутність єдиного стандарту розміщення кириличних символів в таблиці ASCII додвало безліч проблем з кодуваннями (КОИ-8, Windows-1251 та інші). Інші мови з нелатинською писемністю теж страждали через наявність кількох різних кодувань.
В Юнікод і перші 128 символів теж збігаються з відповідними символами US-ASCII.
Кодування
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0. | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | TAB | LF | VT | FF | CR | SO | SI |
1. | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
2. | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | — | . | / | |
3. | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4. | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5. | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6. | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7. | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |