Una aproximación a la tecnología RSS si está pensando en elaborar una intranet con información jurídica (*)

ARTÍCULO BLOG

Beatriz Piera, experta documentalista y gestora de proyectos sobre sistemas de información, realiza un excelente artículo sobre los sistemas RSS. Las siglas de RSS provienen de la expresión en inglés Really Simple Sindication; es decir, sindicación realmente simple. Este término hace referencia al sistema completo por el cual una página publica información a través de los canales o fuentes RSS y otras personas pueden acceder a los titulares, noticias o actualizaciones de las páginas web que desean recibir desde a través de su lector de RSS.

Funcionamiento y principales usos

Las siglas de RSS provienen de la expresión en inglés Really Simple Sindication; es decir, sindicación realmente simple. Este término hace referencia al sistema completo por el cual una página publica información a través de los canales o fuentes RSS y otras personas pueden acceder a los titulares, noticias o actualizaciones de las páginas web que desean recibir desde a través de su lector de RSS.

La aplicación o plataforma que se utiliza para la recepción resumida de las novedades se denomina agregador o lector de RSS. A estos se les indica una serie de sitios de interés (subscripciones) y periódicamente comprueba si hay entradas nuevas y las almacena. De esta forma, el usuario puede ver en el lector todas las novedades en un único lugar, en lugar de visitar todas las páginas.

Esta tecnología fue ampliamente utilizada durante la primera década del 2000, especialmente por el hecho de que la mayoría de blogs disponen ‘de serie’ de una herramienta de publicación de Feeds RSS o Atom. También por el hecho de que los navegadores más utilizados, Firefox, Safari y Google, incorporaban un lector de Feeds que simplificaba mucho la tarea de administrarlos y organizarlos.

Sin embargo, a partir de 2013, Google decidió no mantener su lector de feeds, decisión a la que se unieron otros navegadores. La publicación en redes sociales, especialmente Twitter y Facebook, ha ido progresivamente tomando el relevo a los blogs, así como la evolución de los entornos multimedia (Youtube) los desplazó aún más. Desde entonces, muchas páginas modificaron sus diseños para incluir widgets de twitter o canales de Youtube como fuente principal de novedades en lugar de publicar canales de feeds. A día de hoy, la sindicación de contenidos textuales mediante RSS deriva en su mayoría de otras fuentes automatizadas de datos (como por ejemplo, el BOE).

El presente estudio no tiene como objetivo analizar qué ha ocurrido con los lectores de feeds (aunque puede ser de utilidad conocerlos como veremos más adelante en el ejemplo que se ha desarrollado con Innoreader), sino evaluar si puede resultar conveniente adaptar la estructura de las webs de AC para recolectar automáticamente contenidos publicados por webs de organismos e instituciones oficiales que permiten este uso por parte de terceros.

Por ello, es conveniente tener en cuenta que aparte de los lectores de feeds, es posible utilizar la programación para que nuestras páginas muestren de forma automática los feeds de otras páginas. De hecho, muchos CMS incluyen esta opción por defecto gracias a plugins configurables que permiten programar lectores de feeds sin tener conocimientos de programación. Simplemente hay que introducir la URL del canal RSS que se quiere mostrar, y este se actualizará automáticamente cada vez que se produzca una actualización. LifeRay, Oracle, WordPress, Joomla y Drupal incluyen estas extensiones en sus plugins.

Que es un feed

Un feed no es más que un archivo XML. Su estructura suele ser una versión muy simplificada de la noticia o artículo que referencia. Mostrando, habitualmente: Titulo, Hipervínculo, Extracto del contenido (excerpt) y Fecha de publicación.

En este sentido es muy similar a un sitemap.xml, aunque la principal diferencia entre ambos es que un sitemap tiene como objetivo mostrar a los indexadores la estructura de una web, y un feed muestra a nuestros lectores lo último publicado. Veamos, en el gráfico a la izquierda, un ejemplo de rss feed extraído del BOE:

<rss version="2.0"> 
<channel> 
<title>BOE - Boletín Oficial del Estado</title> 
<link>http://www.boe.es/diario_boe/</link> 
<description> 
Leyes, disposiciones, actos, textos legales y anuncios publicados en la edición de hoy 
</description> 
<language>es-es</language> 
<pubDate>Fri, 07 Feb 2020 00:00:00 +0100</pubDate> 
<lastBuildDate>Fri, 07 Feb 2020 00:00:00 +0100</lastBuildDate> 
<webMaster>webmaster@boe.es</webMaster> 
<item> 
<title>Sumario</title> 
<link>http://www.boe.es/boe/dias/2020/02/07/</link> 
<description> 
Sumario del diario núm. 33, correspondiente al viernes 7 de febrero de 2020. - Referencia: BOE-S-2020-33 - KBytes: 360 
</description> 
<category>Sumario</category> 
<guid isPermaLink="true">http://www.boe.es/boe/dias/2020/02/07/</guid> 
<pubDate>Fri,

Como se interpreta este código

Existen múltiples ejemplos de código para leer y mostrar feeds. Simplemente como muestra para poder observar su simplicidad en cuanto a programación, he escogido el siguiente ejemplo https://entreunosyceros.net/crear-lector-feed-php-jquery/ , realizado para páginas programadas en PHP. Como vemos, su programación es muy sencilla, sin embargo, este modelo tiene el inconveniente de que para su mantenimiento es necesario saber escribir código.

Por el contrario, si nuestro site está desarrollado con un CMS como WordPress o Drupal, el mantenimiento de los feeds lo puede realizar cualquier usuario sin conocimientos de programación, simplemente introduciendo la URL del canal y estableciendo los parámetros de consulta. WordPress es el CMS en el que se basan los sites de AC actualmente, por lo que si se deseara, podrían incluirse widgets de lectura de canales RSS a día de hoy.

Un ejemplo de plugin para WordPress lo tenemos en el siguiente video:

(*) Beatriz Piera. Licenciada en Documentación y directora de proyectos de sistemas de información en la Universidad de Barcelona

cross