RSS (Rich Site Summary)

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 13:19, 2 ноября 2018.
RSS
RSS icon
Расширение файла(ов) .rss, .xml
Разработчик Netscape Communications Corporation
Начальная версия 2000 году
Последний релиз
RSS 2.x
Тип формата группа XML-форматов
Расширенный от RDF
Стандарт RFC
Открытый формат? Yes
Веб-сайт rssboard.org

RSS – это специальный формат из семейства XML-форматов, с помощью которого можно получать новости, практически, любого сайта, не заходя на сам сайт.

В разных версиях аббревиатура RSS имела разные расшифровки:

  • Rich Site Summary (RSS 0.9x) — обогащённая сводка сайта.
  • RDF Site Summary (RSS 0.9 и 1.0) — сводка сайта с применением инфраструктуры описания ресурсов.
  • Really Simple Syndication (RSS 2.x) — очень простой сбор информации.

Общий смысл всех этих вариантов сводится к тому, что RSS - это способ публикации (трансляции) и распространения информации с сайта. Синдикация веб-контента означает быстрое распространение информации, благодаря одновременному размещению сразу в нескольких источниках.[Источник 1].

Использование

RSS 2.0 - транслирует, кратко публикует описание для информации и ссылку на полную версию контента в вебе. Тем не менее, часто сайты отдают статьи целиком прямо в RSS-ленту, для удобства пользователей. От этого они теряют какую-то долю посещаемости и дохода, но чего не сделаешь ради читателей. Другие сайты действуют наоборот — обрезают анонс новой статьи на самом интересном, вынуждая читателя переходить по ссылке для просмотра этого контента целиком. Многие современные браузеры, почтовые клиенты и интернет-пейджеры умеют работать с RSS-лентами, среди них Safari, Maxthon, Miranda, Mozilla Firefox (до Firefox 63), Mozilla Thunderbird, Opera, Opera Mini, Microsoft Internet Explorer (начиная с 7-й версии), Yandex Browser. Кроме того, существуют специализированные приложения (RSS-агрегаторы), собирающие и обрабатывающие информацию RSS-каналов.

История

Впервые технологию RSS применила в конце 90-х компания Netscape для раздачи новостей на своем портале Netcenter. Первой открытой официальной версией RSS стала версия 0.90. К 2000 году формат получил широкое распространение и разделился на два разных стандарта - RSS 1.0, основанный на стандартах XML и RDF организации W3C, и RSS 0.92, основанный на версии формата от Netscape Communications Corporation 0.91. Последняя версия формата RSS - 2.0 является дальнейшим развитием этой ветки (кстати, автор этой версии Дейв Вайнер и придумал свою расшифровку аббревиатуры — Really Simple Syndication). В 2006 году вступил в борьбу с RSS вступил конкурирующий формат - Atom, продвигаемый компанией Google Inc. 5 января 2006 года с сайта my.netscape.com был удален файл rss-0.91.dtd, ссылки на который были размещены в большом количестве трансляций формата RSS версии 0.91. Это событие привело к сбою некоторых онлайн и оффлайн агрегаторов, так как потоки, ссылающиеся на этот DTD, стали неправильными.[Источник 2]

Несовместимость

Из-за существования нескольких различных версий формата RSS-каналов программы - агрегаторы должны уметь работать со всеми вариантами, что создаёт некоторые трудности их разработчикам. Проблемы совместимости возникают также при вставке в RSS-описания небольших HTML (HyperText Markup Language) - фрагментов, которые в одних случаях оформляются как CDATA-узлы, а в других — как HTML-кодированные PCDATA-узлы. Существуют проблемы с различными форматами представления дат и метаданных, таких как частота обновления.

Недостатки RSS

  • Большинство пользователей подписываются на источники, которые хоть немного приглянулись. Информации становится больше, и человек не успевает ее обрабатывать.
  • Поисковые роботы индексируют ленты раньше, чем первоисточник, засчет чего последнему достаются фильтры: он получает от поисковика статус малополезного сайта для пользователя. Решением этой проблемы будет отказ от выкладывания полных версий статей и мотивация читателя перейти на источник-оригинал.
  • Воровство контента. Трастовые сайты также могут воровать контент, и поисковики будут считать их первоисточниками. А вот менее жирные оригиналы будут падать в позициях поисковой выдачи.
  • Даже если ворованный контент в конце имеет ссылку, откуда статья, то вероятность, что гость продолжит чтение после перехода, мала. А без указания линка и вовсе не стоит надеяться на трафик.
  • XML-язык, на котором пишутся RSS-ленты, удобен для парсинга.

Как добавить на сайт RSS

Разместить RSS на сайте можно несколькими способами:

  • Создание кода в XML формате вручную. Принципы работы HTML и RSS похожи: в обоих случаях используется технология размещения текстовых файлов. В RSS используется стандарт RDF, от английского Resource Description Framework, т.е. схема описания ресурса. Он основан на XML, который в свою очередь имеет два своих шаблона: OCS и OPML. Создать ленту возможно и с помощью других языков программирования, если такие навыки есть. Например, C#.
  • Генераторы лент, например: feed43, dapper, feedity, feedburner.
  • Дополнительные инструменты, предлагаемыми различными платформами создания сайта, например, Blogger, Vox, WordPress. Здесь не нужно обладать знаниями языков программирования, системы предоставляют готовый шаблон с заголовком, описание, метаданными и другим необходимым материалом для работы с новостями.

Таким образом, RSS удобная технология как для пользователей, так и для веб-мастеров. Посетители имеют возможность собирать все интересующие их сайты в одном месте и читать их обновления без ручной проверки каждого в отдельности. Кроме того, они могут настраивать вид новостей. Это бесплатно, поскольку сайт получает взамен целевую аудиторию, которая заинтересована в материале. Повышается ссылочная масса, улучшаются поведенческие факторы. [Источник 3]

Пример файла RSS 1.0

<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
         xmlns="http://purl.org/rss/1.0/">

 <channel rdf:about="http://www.xml.com/xml/news.rss">
   <title>XML.com</title>
   <link>http://xml.com/pub</link>
   <description>
     XML.com features a rich mix of information and services 
     for the XML community.
   </description>
   <image rdf:resource="http://xml.com/universal/images/xml_tiny.gif" />
   <items>
     <rdf:Seq>
       <rdf:li resource="http://xml.com/pub/2000/08/09/xslt/xslt.html" />
       <rdf:li resource="http://xml.com/pub/2000/08/09/rdfdb/index.html" />
     </rdf:Seq>
   </items>
   <textinput rdf:resource="http://search.xml.com" />
 </channel>

 <image rdf:about="http://xml.com/universal/images/xml_tiny.gif">
   <title>XML.com</title>
   <link>http://www.xml.com</link>
   <url>http://xml.com/universal/images/xml_tiny.gif</url>
 </image>

 <item rdf:about="http://xml.com/pub/2000/08/09/xslt/xslt.html">
   <title>Processing Inclusions with XSLT</title>
   <link>http://xml.com/pub/2000/08/09/xslt/xslt.html</link>
   <description>
    Processing document inclusions with general XML tools can be 
    problematic. This article proposes a way of preserving inclusion 
    information through SAX-based processing.
   </description>
 </item>

 <item rdf:about="http://xml.com/pub/2000/08/09/rdfdb/index.html">
   <title>Putting RDF to Work</title>
   <link>http://xml.com/pub/2000/08/09/rdfdb/index.html</link>
   <description>
    Tool and API support for the Resource Description Framework 
    is slowly coming of age. Edd Dumbill takes a look at RDFDB, 
    one of the most exciting new RDF toolkits.
   </description>
 </item>

 <textinput rdf:about="http://search.xml.com">
   <title>Search XML.com</title>
   <description>Search XML.com's XML collection</description>
   <name>s</name>
   <link>http://search.xml.com</link>
 </textinput>
</rdf:RDF>

Пример файла RSS 2.0

<?xml version="1.0"?>
<rss version="2.0">
  <channel>
    <title>Liftoff News</title>
    <link>http://liftoff.msfc.nasa.gov/</link>
    <description>Liftoff to Space Exploration.</description>
    <language>en-us</language>
    <pubDate>Tue, 10 Jun 2003 04:00:00 GMT</pubDate>

    <lastBuildDate>Tue, 10 Jun 2003 09:41:01 GMT</lastBuildDate>
    <docs>http://blogs.law.harvard.edu/tech/rss</docs>
    <generator>Weblog Editor 2.0</generator>
    <managingEditor>editor@example.com</managingEditor>
    <webMaster>webmaster@example.com</webMaster>

    <item>
      <title>Star City</title>
      <link>http://liftoff.msfc.nasa.gov/news/2003/news-starcity.asp</link>
      <description>How do Americans get ready to work with Russians aboard the
        International Space Station? They take a crash course in culture, language
        and protocol at Russia's Star City.</description>
      <pubDate>Tue, 03 Jun 2003 09:39:21 GMT</pubDate>
      <guid>http://liftoff.msfc.nasa.gov/2003/06/03.html#item573</guid>
    </item>

    <item>
      <title>Space Exploration</title>
      <link>http://liftoff.msfc.nasa.gov/</link>
      <description>Sky watchers in Europe, Asia, and parts of Alaska and Canada
        will experience a partial eclipse of the Sun on Saturday, May 31st.</description>
      <pubDate>Fri, 30 May 2003 11:06:42 GMT</pubDate>
      <guid>http://liftoff.msfc.nasa.gov/2003/05/30.html#item572</guid>
    </item>

    <item>
      <title>The Engine That Does More</title>
      <link>http://liftoff.msfc.nasa.gov/news/2003/news-VASIMR.asp</link>
      <description>Before man travels to Mars, NASA hopes to design new engines
        that will let us fly through the Solar System more quickly.  The proposed
        VASIMR engine would do that.</description>
      <pubDate>Tue, 27 May 2003 08:37:32 GMT</pubDate>
      <guid>http://liftoff.msfc.nasa.gov/2003/05/27.html#item571</guid>
    </item>

    <item>
      <title>Astronauts' Dirty Laundry</title>
      <link>http://liftoff.msfc.nasa.gov/news/2003/news-laundry.asp</link>
      <description>Compared to earlier spacecraft, the International Space
        Station has many luxuries, but laundry facilities are not one of them.
        Instead, astronauts have other options.</description>
      <pubDate>Tue, 20 May 2003 08:56:02 GMT</pubDate>
      <guid>http://liftoff.msfc.nasa.gov/2003/05/20.html#item570</guid>
    </item>
  </channel>
</rss>

[Источник 4]

Источники

  1. RSS — это должен знать каждый // amateurblogger.ru. URL: https://amateurblogger.ru/rss-eto-dolzhen-znat-kazhdyj/ (дата обращения: 19.10.2018).
  2. RSS // Википедия. [2017—2018]. Дата обновления: 25.10.2018. URL: http://ru.wikipedia.org/?oldid=84081096 (дата обращения: 05.03.2017).
  3. Что такое RSS сайта // semantica.in. URL: https://semantica.in/blog/chto-takoe-rss-sajta.html (дата обращения: 05.03.2017).
  4. RSS // Википедия. [2017—2018]. Дата обновления: 25.10.2018. URL: http://ru.wikipedia.org/?oldid=84081096 (дата обращения: 05.03.2017).

Ссылки

  • rssboard.org [Электронный ресурс]: Should Feed Readers Count Unread Items? / Дата обращения: 20.10.2018. Режим доступа: http://www.rssboard.org/
  • wikipedia.org [Электронный ресурс]: RSS / Дата обращения: 20.10.2018. Режим доступа:https: https://ru.wikipedia.org/wiki/RSS
  • amateurblogger.ru [Электронный ресурс]: RSS — это должен знать каждый / Дата обращения: 20.10.2018. Режим доступа:https: https://amateurblogger.ru/rss-eto-dolzhen-znat-kazhdyj/