Требования к XML Blueberry

Рабочий проект W3C от 21 сентября 2001 года

Эта версия:
http://www.w3.org/TR/2001/WD-xml-blueberry-req-20010921
Последняя версия:
http://www.w3.org/TR/xml-blueberry-req
Предыдущая версия:
http://www.w3.org/TR/2001/WD-xml-blueberry-req-20010620
Редактор:
Джон Коуэн (John Cowan), Reuters ( jcowan@reutershealth.com )

Copyright ©2001 W3C ® ( MIT, INRIA, Keio), все права защищены. Действуют правила W3C в отношении ответственности, торговых марок, использования документов и лицензирования программного обеспечения.


Краткий обзор

Предлагаемый документ перечисляет правила разработки и требования к исправлению Blueberry для рекомендации XML, ограниченно переработанного издания XML 1.0, разрабатываемой рабочей группой Консорциума Всемирной сети по ядру XML исключительно для решения проблем с кодировками.

Статус этого документа

Документ является рабочим проектом W3C, выпущенным в качестве передачи рабочей группы по ядру XML в соответствии с её уставом и текущей деятельностью по программе XML . Список текущих рабочих проектов и записок W3C находится по адресу http://www.w3.org/TR.

Документ представляет собой незавершённую работу, являющуюся консенсусом рабочей группы W3C по ядру XML на данный момент. Он опубликован с целью его рассмотрения членами W3C и другими заинтересованными лицами. Публикация в качестве рабочего проекта не подразумевает одобрения членами W3C. Замечания должны присылаться по адресу www-xml-blueberry-comments@w3.org, который является открытым и автоматически архивируемым списком рассылки.

1. Введение

Рекомендация Консорциума XML 1.0 [XML] была впервые издана в 1998 году, и, несмотря на обнаружение большого количества опечаток, вылившегося во вторую редакцию 2001 года, оставалась (по замыслу) неизменной в отношении того, что является формально правильным XML, а что нет. Такая стабильность была чрезвычайно полезна для возможности взаимодействия. Тем не менее, стандарт Unicode [Unicode], на который опирается XML 1.0, не был таким статичным, развившись с версии 2.0 до версии 3.1. Символы, представленные в Unicode 3.1, но не представленные в Unicode 2.0, могли быть использованы в символьных данных XML. Несмотря на это, указанные символы не допускаются в именах XML, таких как наименования типов элементов, названия атрибутов, нумерованные значения атрибутов, объекты программных инструкций и так далее. Кроме того, некоторые символы, которые бы следовало разрешить в именах XML, разрешены не были, вследствие недосмотра и несоответствий в Unicode 2.0.

В результате, полноценная XML-разметка на родном языке не возможна на, по меньшей мере, следующих языках: амхарский, бирманский, коренные канадские языки, ирокезский, дивехи (мальдивский), китайский хакка (алфавит Бопомофо), кхмерский, Minnan Chinese (алфавит Бопомофо), монгольский (традиционный алфавит), оромо, сирийский, тигре и Yi, из-за того, что символы, необходимые для записи на этих языках не присутствовали в Unicode 2.0. К тому же в наименованиях XML можно использовать только часть полного набора символов из китайского (особенно используемого в Гонконге) и японского языков.

Упор был сделан на то, что на многих указанных языках можно писать, используя другие алфавиты, в особенности латинский, что позволяет использовать для разметки буквы других алфавитов. Однако как раз этот же довод подходит для многих языков (например, греческого), которые ранее были полностью кодированы в Unicode 2.0. Дискриминация языков только из-за того, что их алфавиты не были закодированы в Unicode 2.0, по сути, несправедлива. Стоит сказать, что использование букв других алфавитов коренными читателями и авторами является гораздо более трудной задачей, чем использование родного алфавита.

Кроме того, XML 1.0 стремится приспособиться к традициям обозначения конца строки различных современных операционных систем, дискриминируя традиции, использовавшиеся на универсальных вычислительных машинах IBM (мейнфреймах) и совместимых с ними. В результате XML-документы на таких машинах не являются обычными текстовыми файлами в их традиционном понимании. Документы на XML 1.0, сделанные с помощью указанных ЭВМ, вынуждены либо нарушать существующие правила обозначения конца строки, либо использовать в иных случаях ненужные этапы преобразования перед структурным анализом (парсингом) и по завершении их создания. Непосредственная возможность взаимодействия особенно важна, когда хранилища данных используются мейнфреймами и немейнфреймами совместно (в противоположность копированию с одного на другой).

Идёт подготовка скорее новой версии XML, чем списка опечаток к XML 1.0, так как изменения касаются самого определения правильно построенного документа. Процессорам XML 1.0 следует продолжать отклонять документы, содержащие новые символы в наименованиях XML или новые правила обозначения конца строки. Предполагается, что различие между XML 1.0 и XML Blueberry будет обозначено в объявлении (декларации) XML.

2. Принципы разработки

  1. Задачи XML 1.0, перечисленные в разделе 1.1 рекомендации XML, ещё раз подтверждаются.

  2. Документы на XML Blueberry должны допускать полное и непосредственное использование систем записи, поддерживаемых Unicode 3.1.

  3. Документы на XML Blueberry должны допускать полное и непосредственное использование операционных сред, поддерживаемых Unicode 3.1.

  4. Изменения, касающиеся обработки XML Blueberry, вносимые в процессоры XML 1.0, должны быть сведены к минимуму.

3. Требования

  1. Документы на XML Blueberry должны допускать использование всех символов Unicode 3.1 в наименованиях XML, насколько это применимо к XML.

  2. Документы на XML Blueberry должны поддерживать правила, касающиеся обозначения конца строки, связанные с Unicode 3.1, насколько это применимо к XML.

  3. Рабочая группа должна рассмотреть проблему будущих обновлений Unicode.

  4. Рабочая группа должна рассмотреть проблему упорядочивания W3C согласно объяснениям в Символьной модели W3C [CharMod]

  5. При создании XML Blueberry, рабочая группа не должна принимать во внимание никакие исправления для XML 1.0 кроме тех, которые требуются для выполнения предлагаемых требований.

4. Ссылки

CharMod
W3C (Консорциум Всемирной сети). Символьная модель для Всемирной сети (ведётся разработка). [Кембридж, Массачусетс]. http://www.w3.org/TR/charmod
XML
W3C (Консорциум Всемирной сети). Рекомендация Расширяемый язык разметки (XML). Версия 1.0, вторая редакция. [Кембридж, Массачусетс]. http://www.w3.org/TR/REC-xml
Unicode
Консорциум Unicode. Стандарт Unicode, версия 3.1. [Reading, MA: Addison-Wesley Developers Press, 2000]. http://www.unicode.org

Обратите внимание на то, что оригинальная версия документа существует только на английском языке. Предлагаемый перевод может содержать ошибки, неточности и т. д.

ROL.RU