Recuperación de la Información en la Web
Para realizar la recuperación de la información de la World Wide Web muchos son los estándares y las tecnologías utilizadas: etiquetas META en las páginas HTML, el metalenguaje XML para los documentos, RDF para el intercambio de datos, formatos de vinculación de contenido como RSS o Atom, etc.
Lo primero que se debe hacer para recuperar información de una determinada página es vincular o especificar los datos que están asociados a dicho documento. Para este fin se utilizan las etiquetas META en las páginas HTML que se basan en especificar mediante una serie de elementos, datos sobre el autor de la página, el tema sobre el que trata o las palabras clave que contiene, entre muchos otros.
Últimamente está muy en auge crear documentos que resumen o describen el contenido de la página (feed), con un formato determinado (RSS, ATOM...) y a los cuales se "suscriben" o se "sindican" los lectores que quieran estar al día de las actualizaciones sobre el contenido de la página.
Para conseguir todo lo que se ha comentado es necesario una serie de estándares sobre la creación de documentos que contengan la información (XML) y también sobre la transmision de los datos en la web (RDF).
Contenidos
- Metadatos
- Documentos XML/RDF
Jorge Vico Pedrero |