Теги RSS и XML
Все файлы XML имеют определенную структуру, она несколько похожа на разметку html файлов, но служит совсем другим целям. Основными элементами XML являются элементы (nodes – узлы). Каждый элемент обязан иметь открывающий и закрывающий тег (есть также краткая форма записи тегов, не содержащих в себе текстовых узлов). Элементы могут иметь атрибуты, которые должны заключаться в кавычки. Также в XML есть инструкции обработки и комментарии. А теперь я приведу пример простого XML файла:
<?xml version=»1.0″ encoding=»widows-1251″?><!—Инструкции обработки (а это комментарий)—>
<data>
<item attr=»value»> <!—Элемент с атрибутом—>
</item>
</data>
Это что касается формата XML, а так как RSS основан на нем, то и его структура имеет тот же вид.
RSS – Really Simple Syndication
Начнем разбор этого стандарта сразу с рассмотрения примера:
<?xml version=»1.0″ encoding=»windows-1251″?><!—1—>
<rss version=»2.0″ xmlns:yandex=»http://news.yandex.ru»><!—2—>
<channel><!—3—>
<title>Новости</title><!—4—>
<link>http://www.my_news.ru/</link><!—5—>
<discription>Новости, которые не стоит пропускать</discription><!—6—>
<image><!—7—>
<url>http://www.my_news.ru/my_news.gif</url><!—8—>
<title>Новости</title><!—9—>
<link>http://www.my_news.ru/</link><!—10—>
</image><!—11—>
<item><!—12—>
<title>Новость №1</title> <!—13—>
<link>http://www.my_news.ru/my_new.php?nn=1</link><!—14—>
<description>Что-то произошло и мы вам об этом расскажем</description><!—15—>
<pubDate>Fri, 23 Jan 2004 15:13:01 +0300</pubDate><!—16—>
</item><!—см. 11—>
<item><!—см. 12—>
<title>Новость №2</title><!—см. 13—>
<link>http://www.my_news.ru/my_new.php?nn=2</link><!—см. 14—>
<description>Что-то произошло и мы вам об этом тоже расскажем</description><!—см. 15—>
<pubDate>Fri, 23 Jan 2004 16:27:32 +0300</pubDate><!—см. 16—>
</item><!—см. 11—>
</channel>
</rss><!—см. 11—>
Все элементы структуры файла пронумерованы, теперь по порядку рассмотрим, что они означают:
-
XML — Начало любого XML-документа, содержит атрибуты version (версия) и encoding (указывается кодировка файла). Тэг обязательно должен начинаться с первой позиции строки. Хотя стандартная кодировка RSS — UTF-8, при работе с кириллицей лучше ставить кодировку «windows-1251″, это позволит импортировать ваши новости на страницы других сайтов без проблем;
-
RSS — Корневой элемент, содержит версию RSS-документа, рассматривайте эти данные просто как «шаманское» заклинание;
-
CHANNEL — Обязательный элемент, говорящий о том, что дальше идут данные RSS-канала;
-
TITLE — Заголовок канала, или его название;
-
LINK — Ссылка на сайт, откуда взяты новости;
-
DESCRIPTION — Краткое описание RSS-канала, т.е. более подробное;
-
IMAGE — Логотип для представления канала (необязательный элемент, но желателен);
-
URL — Ссылка на логотип;
-
TITLE — заменяющий текст для логотипа;
-
LINK — Ссылка для перехода при щелчке по изображению;
-
Все теги файла XML, а соответственно и RSS, должны иметь закрывающие теги!
-
ITEM — Отдельный заголовок для каждой новости;
-
TITLE — Название новости;
-
LINK — Ссылка на страничку, содержащую соответствующую новость, т.е. полный URL на вашу новость;
-
DESCRIPTION — Краткое описание новости;
-
PUBDATE — Дата публикации новости.
Вот теперь, когда мы рассмотрели структуру RSS-файла, вы можете приступать к созданию собственного RSS-канала. RSS-файл можно создавать как динамически, так и размещать на сайте статический html-файл, но это уже зависит от ваших возможностей и требований. В принципе, динамическое создание RSS-файлы приветствуется, но не обязательно. Если файл с требуемой структурой просто имеется на вашем сайте, то полный URL этого файла и будет адресом вашего RSS-канала.