Відмінності між версіями «2 Рівні відповідності»
(Створена сторінка: В HTML є одне DTD на всі документи, в SGML кожен документ повинен мати своє DTD. XML це золота серед...) |
|||
(Одна проміжна версія одного користувача не показана) | |||
Рядок 1: | Рядок 1: | ||
− | + | Якщо в SGML кожен документ повинен мати свій DTD, а у HTML є один DTD на всіх, то XML являє собою компроміс: документ може мати (або посилатися на) DTD, а може і обходитися без DTD. В останньому випадку кожен новий тег і атрибут визначаються самим фактом свого вживання. Таким чином, для XML-документів існує два рівні відповідності стандарту: документи, що не мають DTD, але задовольняють усі інші вимоги синтаксису XML, називають правильно структурованими (well-formed), щоб відрізняти їх від документів валідних (valid), які мають у своєму складі DTD (або посилання на зовнішній DTD). | |
− | + | Правильно структуровані документи, хоча і поступаються за «правильністю» документам валідним, але підходять для більшості практичних випадків. Це означає, що ви можете відразу ж почати описувати структуру вашого документа на «майже людській» мові, вигадуючи теги на ходу і слідкувати лише за їх правильною вкладеністю: | |
+ | |||
<РЕЧЕННЯ> | <РЕЧЕННЯ> | ||
− | < ПІДМЕТ > | + | <ПІДМЕТ> |
− | <ІМЕННИК> | + | <ІМЕННИК> мама </ ІМЕННИК> |
− | </ ПІДМЕТ > | + | </ ПІДМЕТ> |
− | </ РЕЧЕННЯ> | + | <ПРИСУДОК тип = "простий"> <ДІЄСЛОВО> мила </ ДІЄСЛОВО> |
− | + | </ ПРИСУДОК> | |
+ | <ДОПОВНЕННЯ тип = "пряме"> | ||
+ | <ІМЕННИК> раму </ ІМЕННИК> | ||
+ | </ ДОПОВНЕННЯ> </ РЕЧЕННЯ> | ||
+ | |||
+ | |||
+ | Як видно з цього прикладу, імена тегів і атрибутів можна писати і по-українськи. Досвід HTML показав, наскільки важлива ретельна і своєчасна інтернаціоналізація всіх аспектів мови, що претендує на якусь роль в Інтернеті. Тому творці XML подбали, зокрема, про те, щоб в іменах тегів і атрибутів можна було користуватися не тільки латинськими літерами, але й кирилицею, ієрогліфами і взагалі будь-якими символами з репертуару Unicode, які вважаються «літерами» хоча б в одній мові або системі писемності. Така розмітка дозволить інтерпретатору XML порубати документ на шматочки відповідно до його тегової структури. Після цього в дію вступає інший додаток - його завданням може бути, наприклад, автоматичне індексування документа, занесення його до бази даних або (частіше за все) форматування відповідно до прикладеної до документа стильової специфікації. (У нашому прикладі можна було б, скажімо, розфарбувати різні частини мови різними кольорами.) Однак важливо розуміти, що всі ці завдання лежать вже за межами власне мови XML, - яка, таким чином, вільна від турботи про візуальне (або будь-яку інше) подання документа і дозволяє сфокусуватися на його логічній структурі. |
Поточна версія на 18:32, 24 грудня 2012
Якщо в SGML кожен документ повинен мати свій DTD, а у HTML є один DTD на всіх, то XML являє собою компроміс: документ може мати (або посилатися на) DTD, а може і обходитися без DTD. В останньому випадку кожен новий тег і атрибут визначаються самим фактом свого вживання. Таким чином, для XML-документів існує два рівні відповідності стандарту: документи, що не мають DTD, але задовольняють усі інші вимоги синтаксису XML, називають правильно структурованими (well-formed), щоб відрізняти їх від документів валідних (valid), які мають у своєму складі DTD (або посилання на зовнішній DTD). Правильно структуровані документи, хоча і поступаються за «правильністю» документам валідним, але підходять для більшості практичних випадків. Це означає, що ви можете відразу ж почати описувати структуру вашого документа на «майже людській» мові, вигадуючи теги на ходу і слідкувати лише за їх правильною вкладеністю:
<РЕЧЕННЯ> <ПІДМЕТ> <ІМЕННИК> мама </ ІМЕННИК> </ ПІДМЕТ> <ПРИСУДОК тип = "простий"> <ДІЄСЛОВО> мила </ ДІЄСЛОВО> </ ПРИСУДОК> <ДОПОВНЕННЯ тип = "пряме"> <ІМЕННИК> раму </ ІМЕННИК> </ ДОПОВНЕННЯ> </ РЕЧЕННЯ>
Як видно з цього прикладу, імена тегів і атрибутів можна писати і по-українськи. Досвід HTML показав, наскільки важлива ретельна і своєчасна інтернаціоналізація всіх аспектів мови, що претендує на якусь роль в Інтернеті. Тому творці XML подбали, зокрема, про те, щоб в іменах тегів і атрибутів можна було користуватися не тільки латинськими літерами, але й кирилицею, ієрогліфами і взагалі будь-якими символами з репертуару Unicode, які вважаються «літерами» хоча б в одній мові або системі писемності. Така розмітка дозволить інтерпретатору XML порубати документ на шматочки відповідно до його тегової структури. Після цього в дію вступає інший додаток - його завданням може бути, наприклад, автоматичне індексування документа, занесення його до бази даних або (частіше за все) форматування відповідно до прикладеної до документа стильової специфікації. (У нашому прикладі можна було б, скажімо, розфарбувати різні частини мови різними кольорами.) Однак важливо розуміти, що всі ці завдання лежать вже за межами власне мови XML, - яка, таким чином, вільна від турботи про візуальне (або будь-яку інше) подання документа і дозволяє сфокусуватися на його логічній структурі.