Datos abiertos y datos abiertos enlazados

Es importante ser claro al respecto de los que significa ser abierto para garantizar la interoperabilidad que, en lo referente a los datos, se trata de la habilidad para interoperar o integrar diferentes conjuntos de datos, permitiendo que componentes distintos trabajen juntos. Así, una parte del material abierto pueda ser mezclado con otro material abierto, lo que resulta fundamental para entender los principales beneficios prácticos de la apertura: el incremento dramático de la habilidad de combinar distintas bases de datos o conjuntos de datos y así desarrollar más y mejores productos y servicios. 

Acceso y explotación de datos abiertos 

La iniciativa de datos abiertos, a la que se han sumado numerosas organizaciones y administraciones públicas, recomienda exponer los datos cuanto antes, sin preocuparse mucho por el formato. Así pues, podrían ser datos abiertos: 

  • Un fichero o ficheros Excel (es un formato propietario). 

  • Un fichero o ficheros en formato CSV (que tienen problemas con textos con algún formato, como los saltos). 

  • Un API que proporciona acceso a tablas o vistas desconectadas. 

  • Smart data. Datos con información acerca de los datos. 

  • Linked Open Data. Datos abiertos y enlazados (o enlazables) con otros datos. 

Es decir, no todos los datos abiertos son iguales, ni ofrecen las mismas facilidades de interoperación. Siendo cierto que la rapidez es un factor de innovación, la incomodidad de uso es indudablemente un freno. En este sentido, los datos abiertos pueden tener problemas en función de la solución que se adopte: 

  • Obtención. ¿Se descargan ficheros o existe un API para acceder a los datos? 

  • Modelo de datos. ¿Es cerrado o abierto? ¿Público o privado? ¿Estándar o propietario? ¿Expresivo? ¿Extensible? 

  • Relación entre los datos. ¿Se dispone de un API sobre vistas de los datos o es posible ejecutar consultas con lenguajes estándar (como SQL o SPARQL)? 

  • Enlazado de datos. ¿Los datos son relacionables con fuentes externas o son cerrados? 

  • Actualización de datos. ¿Los datos se descargan o existe un API que siempre accede a los datos actualizados? ¿La actualización es responsabilidad del reutilizador o del propietario de los datos? 

  • Difusión de los datos. ¿Se proporcionan una serie de enlaces o existe una web que permite su consulta online? ¿Es una difusión pasiva o activa? 

Datos enlazados bajo los estándares de la Web Semántica 

Nuestra solución para estos problemas pasa por el uso de estándares de la Web Semántica, en particular los relacionados con Linked Data. Tim Berners-Lee es el responsable tanto del concepto de Web Semántica -que acuñó en 2001 en un artículo seminal publicado en 'Scientific American', 'Semantic Web'-, como del de Linked Data desarrollado a partir de una nota de diseño relacionada con la construcción del proyecto de Web Semántica. 

Linked Data o Datos Enlazados o Enlazables designan un método de publicación estructurada de datos que, en la práctica es el que hace posible la navegación por hiperdata y la construcción de Grafos de Conocimiento.  Este método de publicación posibilita que las personas pueden interrogar los datos de un grafo de manera semántica. 

Para publicar de acuerdo con los principios de la Web de los Datos Enlazados o Linked Data Web es preciso utilizar algunos estándares como http, RDF y URIs, que se utilizan no tanto para servir las páginas que leen las personas, sino para editar las páginas que pueden interpretar automáticamente los sistemas y, por tanto, compartir la información con ellos. Esto posibilita conectar los datos de diferentes fuentes en un grafo unificado e interrogable. 

Por tanto, los proyectos de Datos abiertos con GNOSS son proyectos de Datos Abiertos Enlazados (Linked Open Data), desplegables con rapidez y que responden a los posibles problemas con el máximo nivel de interoperabilidad: 

  • Obtención. Proporcionan un API que permite acceder a los datos de cada una de las entidades de manera individual. 

  • Modelo de datos. Los modelos son abiertos, desarrollados mediante ontologías estándar de uso público, extensibles para añadir nuevas entidades o relaciones y con datos expresivos que informan de su significado a personas y máquinas. 

  • Relación entre los datos. Si el proyecto lo requiere, pueden proporcionar un interfaz SPARQL para que los usuarios ejecuten sus propias consultas sobre los datos. 

  • Enlazado de datos. Los datos se pueden enlazar con fuentes externas y también ser enlazados desde fuentes externas, contribuyendo a la Linked Open Data Cloud. 

  • Actualización de datos. El acceso a los datos mediante un API garantiza que los datos reutilizados son siempre los últimos, de modo que los reutilizadores no tienen que preocuparse del proceso de actualización de datos. 

  • Difusión de los datos. Los proyectos de datos abiertos de GNOSS tienen una expresión web que permite el acceso e indexado de los datos y su máxima difusión a través de sitios webs con un diseño cuidado y herramientas de consulta que permiten a los usuarios explorar y encontrar.