RSS c'est quoi au juste ?
RSS (ou Atom), concrètement, c'est:
- un fichier XML (pour mémoire, XML (eXtensible Markup Language) est un langage de description et d'échange de documents structurés défini par le Consortium W3C en 1998),
- qui sera placé sur le site web,
-
sous une icône orange du genre
,
,
ou de plus en plus
- automatiquement mis à jour par le site (qui doit donc être dynamique).
Comme le fichier RSS est destiné à alimenter, généralement en continu, différents outils d'exploitations, on parle plus souvent de canal RSS, de flux RSS, de fil RSS ou encore, en anglais, de RSS feed. Tous ces termes désignent la même chose : un fichier formaté respectant l'un des standard RSS et téléchargeable via une URL.
Comme le signifie l'acronyme RSS (Rich Site Summery) le fichier RSS donne, sous une forme standardisée, une description résumée d'un site et précise :
- le titre du site, ,
- l'URL de sa page d'accueil,
- une brève description, en 2-3 lignes, de ce site.
Cette description globale est alors suivie par une liste comprenant généralement les 10 dernières informations publiées sur le site avec pour chacune d'elles :
- le titre de la page,
- l'URL de cette page,
- un petit résumé de cette information,
- la date de publication de cette information,
- éventuellement, l'identification de l'auteur de la page.
Le tout forme une page web qui est peu lisible par l'être humain (exemple : le fichier RSS des nouveautés du site www.awt.be) mais qui peut par contre être très facilement exploitée par de multiples outils dont principalement des agrégateurs RSS .
Un même objectif, plusieurs formats !
En fait, le terme RSS recouvre plusieurs formats globalements assez semblables dans leurs objectifs mais tout de même différents dans leurs spécifications. Ce sont les sociétés Netscape et UserLand Software qui, chacune de leur côté, ont jeté les bases du RSS et qui les ont publié dès la fin des années 90. Ces formats, aujourd'hui obsolètes, sont identifés commes les versions RSS 0.90 et 0.91. Sur ces bases, UsrLand a développé les versions 0.92, 0.93 et 0.94 de la norme qui restait toutefois une norme commerciale puisque défendue par un acteur du marché.
Enfin, en juillet 2003, la version RSS 2.0 est publiée par le "Berkman Center for Internet & Society" de la Harvard Law School sous licence libre (Creative Commons license).
Mais l'histoire serait trop simple ainsi : dans l'intervale, un "RSS-DEV Working Group" s'est formé en 2000 et propose lui aussi une norme pour le RSS (ici appelé "RDF Site Summary" parce qu'il se base sur la norme RDF (Resource Description Framework) du W3C). Cette variante qui est dénommée RSS 1.0.
Enfin, l'IETF (Internet Engineering Task Force), organe internationnal ouvert qui a présidé à la standardisation des protocoles les plus populaires de l'Internet (via ses fameux "RFC"), s'est aussi saisi de cette question et a créé un groupe de travail (Atompub) sur le sujet. Ces travaux ont débouché le 5 décembre 2005 sur la publication du RFC 4287 décrivant "The Atom Syndication Format" appelé Atom 1.0 qui devrait logiquement s'imposer comme format standard.
On trouvera sur le blog associé quelques réflexions et comparaisons entre Atom 1.0 et RSS 2.0.
Pour ceux que les détails techniques intéressent, ils trouveront sur le site de Jean-Yves STERVINOU une traduction française de la spécification de la norme RSS 2.0 .