Icône de flux RSS Cette icône est donc appelée à remplacer progressivement les multiples variantes de rectangles, souvent orangés, marqués XML ou RSS. Ne vous précipitez pas sur votre logiciel graphique pour refaire l'icône à votre sauce : Le site Feed Icons vous propose de télécharger cette icône dans une grande variété de tailles et de formats.

Plus fondamentale est la publication d'un format standardisé pour les flux mettant fin progressivement, on peut l'espérer, à la disparité des saveurs concurrentes RSS 0.93, RSS 1.0, RSS 2.0. Bref, à l'avenir le RSS ce sera Atom, défini dans le RFC 4287.

La lecture de la spécification des flux Atom donne à penser qu'elle hérite plutôt de RSS 2.0 que de la version concurrente RSS 1.0 aussi appelée RDF. Concrètement, j'ai été agréablement impressionné par cette spécification qui permet de créer à la fois des flux relativement simples tout en restant conforme mais qui donne aussi la possibilité d'enrichir le flux avec des contenus plus complexes (HTML, XHTML, XML, podcast,...) ouvrant ainsi ce standard à de nombreuses exploitations possibles. Au minimum, un flux Atom 1.0 requière tant pour la définition du flux (appelé ici <feed>) que de chacun des éléments (nommés <entry>) la spécification de :
  • un titre <title>
  • une date de mise à jour <updated>
  • un identifiant <id>
Cet identifiant est une chaîne qui doit permettre d'identifier le flux ou l'élément de façon universelle et permanente. En particulier, cet identifiant ne doit pas changer même si l'article auquel il réfère est renommé ou remanié. De même, si l'élément est exporté, agrégé ou re-publié sur un autre site, l'identifiant original doit être maintenu. Ceci devrait faciliter le triage des nouvelles par les agrégateurs et éviter que l'on nous présente comme un nouvel article un élément qui a seulement subit quelques corrections orthographiques. Pour être complet, il faut savoir que que sous RSS 2.0, il est aussi possible de spécifier un identifiant dans la balise <guid> mais comme celui-ci est facultatif, il n'a été que rarement utilisé.

Autre évolution intéressante, la spécification d'une adresse de courrier électronique pour l'auteur n'est plus obligatoire comme elle l'était en RSS 2.0. Ceci évitera de contribuer à la prolifération du spam. En fait, l'information <author> doit être elle-même structurée en sous-éléments dont le <name> est obligatoire tandis que <email> et <uri> sont facultatifs.

La présentation des  dates est plus familière pour les francophones car elle se compose essentiellement de la date en chiffres et inversée ainsi que de l'heure en mode 24h. On aura par exemple <updated>2006-01-31T17:54:05Z</updated> pour spécifier une heure du fuseau GMT. Pour les autres zones, il convient de remplacer le "Z" par "+01:00" par exemple.

Enfin, les éléments de contenu sont par défaut supposé présenter du texte simple mais peuvent aussi admettre des contenus plus riches. On distinguera 4 balises pour le contenu :
  • <title> pour le titre du flux ou pour celui d'un élément (obligatoire)
  • <subtitle> pour une sous-titre du flux (n'existe pas pour les éléments)
  • <summary> donne un résumé succinct de l'article  (n'existe pas pour le flux)
  • <content> peut donner le contenu intégral de l'article ou un lien vers ce contenu. 
Les trois premiers peuvent être exprimés soit en texte simple (par défaut) ou éventuellement en XHTML avec l'attribut type="xhtml".  L'élément <content> admet aussi un contenu en HTML ou XML,  encore un contenu binaire  (base64-encoded) comme un enregistrement audio ou enfin un pointeur vers un contenu situé sur le Web.

Pour une comparaison plus détaillée entre RSS 2.0 et Atom 1.0 on pourra se reporter à l'article de Tim Bray "RSS 2.0 and Atom 1.0, Compared" .

L'arrivée de Atom 1.0 a certes été préparée par la diffusion préalable de la spécification provisoire Atom 3.0 mais il n'en reste pas moins vrai que certains logiciels d'agrégation ne sont pas encore aptes à gérer toutes les subtilités de ce nouveau standard.