Требования к XML Blueberry
Рабочий проект W3C от 21 сентября 2001 года
- Эта версия:
- http://www.w3.org/TR/2001/WD-xml-blueberry-req-20010921
- Последняя версия:
- http://www.w3.org/TR/xml-blueberry-req
- Предыдущая версия:
- http://www.w3.org/TR/2001/WD-xml-blueberry-req-20010620
- Редактор:
- Джон Коуэн (John Cowan), Reuters ( jcowan@reutershealth.com )
Copyright ©2001 W3C ® ( MIT, INRIA, Keio), все права защищены. Действуют правила W3C в отношении ответственности, торговых марок, использования документов и лицензирования программного обеспечения.
Краткий обзор
Предлагаемый документ перечисляет правила разработки и требования к исправлению Blueberry для рекомендации XML, ограниченно переработанного издания XML 1.0, разрабатываемой рабочей группой Консорциума Всемирной сети по ядру XML исключительно для решения проблем с кодировками.
Статус этого документа
Документ является рабочим проектом W3C, выпущенным в качестве передачи рабочей группы по ядру XML в соответствии с её уставом и текущей деятельностью по программе XML . Список текущих рабочих проектов и записок W3C находится по адресу http://www.w3.org/TR.
Документ представляет собой незавершённую работу, являющуюся консенсусом рабочей группы W3C по ядру XML на данный момент. Он опубликован с целью его рассмотрения членами W3C и другими заинтересованными лицами. Публикация в качестве рабочего проекта не подразумевает одобрения членами W3C. Замечания должны присылаться по адресу www-xml-blueberry-comments@w3.org, который является открытым и автоматически архивируемым списком рассылки.
1. Введение
Рекомендация Консорциума XML 1.0 [XML] была впервые издана в 1998 году, и, несмотря на обнаружение большого количества опечаток, вылившегося во вторую редакцию 2001 года, оставалась (по замыслу) неизменной в отношении того, что является формально правильным XML, а что нет. Такая стабильность была чрезвычайно полезна для возможности взаимодействия. Тем не менее, стандарт Unicode [Unicode], на который опирается XML 1.0, не был таким статичным, развившись с версии 2.0 до версии 3.1. Символы, представленные в Unicode 3.1, но не представленные в Unicode 2.0, могли быть использованы в символьных данных XML. Несмотря на это, указанные символы не допускаются в именах XML, таких как наименования типов элементов, названия атрибутов, нумерованные значения атрибутов, объекты программных инструкций и так далее. Кроме того, некоторые символы, которые бы следовало разрешить в именах XML, разрешены не были, вследствие недосмотра и несоответствий в Unicode 2.0.
В результате, полноценная XML-разметка на родном языке не возможна на, по меньшей мере, следующих языках: амхарский, бирманский, коренные канадские языки, ирокезский, дивехи (мальдивский), китайский хакка (алфавит Бопомофо), кхмерский, Minnan Chinese (алфавит Бопомофо), монгольский (традиционный алфавит), оромо, сирийский, тигре и Yi, из-за того, что символы, необходимые для записи на этих языках не присутствовали в Unicode 2.0. К тому же в наименованиях XML можно использовать только часть полного набора символов из китайского (особенно используемого в Гонконге) и японского языков.
Упор был сделан на то, что на многих указанных языках можно писать, используя другие алфавиты, в особенности латинский, что позволяет использовать для разметки буквы других алфавитов. Однако как раз этот же довод подходит для многих языков (например, греческого), которые ранее были полностью кодированы в Unicode 2.0. Дискриминация языков только из-за того, что их алфавиты не были закодированы в Unicode 2.0, по сути, несправедлива. Стоит сказать, что использование букв других алфавитов коренными читателями и авторами является гораздо более трудной задачей, чем использование родного алфавита.
Кроме того, XML 1.0 стремится приспособиться к традициям обозначения конца строки различных современных операционных систем, дискриминируя традиции, использовавшиеся на универсальных вычислительных машинах IBM (мейнфреймах) и совместимых с ними. В результате XML-документы на таких машинах не являются обычными текстовыми файлами в их традиционном понимании. Документы на XML 1.0, сделанные с помощью указанных ЭВМ, вынуждены либо нарушать существующие правила обозначения конца строки, либо использовать в иных случаях ненужные этапы преобразования перед структурным анализом (парсингом) и по завершении их создания. Непосредственная возможность взаимодействия особенно важна, когда хранилища данных используются мейнфреймами и немейнфреймами совместно (в противоположность копированию с одного на другой).
Идёт подготовка скорее новой версии XML, чем списка опечаток к XML 1.0, так как изменения касаются самого определения правильно построенного документа. Процессорам XML 1.0 следует продолжать отклонять документы, содержащие новые символы в наименованиях XML или новые правила обозначения конца строки. Предполагается, что различие между XML 1.0 и XML Blueberry будет обозначено в объявлении (декларации) XML.
2. Принципы разработки
-
Задачи XML 1.0, перечисленные в разделе 1.1 рекомендации XML, ещё раз подтверждаются.
-
Документы на XML Blueberry должны допускать полное и непосредственное использование систем записи, поддерживаемых Unicode 3.1.
-
Документы на XML Blueberry должны допускать полное и непосредственное использование операционных сред, поддерживаемых Unicode 3.1.
-
Изменения, касающиеся обработки XML Blueberry, вносимые в процессоры XML 1.0, должны быть сведены к минимуму.
3. Требования
-
Документы на XML Blueberry должны допускать использование всех символов Unicode 3.1 в наименованиях XML, насколько это применимо к XML.
-
Документы на XML Blueberry должны поддерживать правила, касающиеся обозначения конца строки, связанные с Unicode 3.1, насколько это применимо к XML.
-
Рабочая группа должна рассмотреть проблему будущих обновлений Unicode.
-
Рабочая группа должна рассмотреть проблему упорядочивания W3C согласно объяснениям в Символьной модели W3C [CharMod]
-
При создании XML Blueberry, рабочая группа не должна принимать во внимание никакие исправления для XML 1.0 кроме тех, которые требуются для выполнения предлагаемых требований.
4. Ссылки
- CharMod
- W3C (Консорциум Всемирной сети). Символьная модель для Всемирной сети (ведётся разработка). [Кембридж, Массачусетс]. http://www.w3.org/TR/charmod
- XML
- W3C (Консорциум Всемирной сети). Рекомендация Расширяемый язык разметки (XML). Версия 1.0, вторая редакция. [Кембридж, Массачусетс]. http://www.w3.org/TR/REC-xml
- Unicode
- Консорциум Unicode. Стандарт Unicode, версия 3.1. [Reading, MA: Addison-Wesley Developers Press, 2000]. http://www.unicode.org
Обратите внимание на то, что оригинальная версия документа существует только на английском языке. Предлагаемый перевод может содержать ошибки, неточности и т. д.
ROL.RU
|