Introducción a Datos Abiertos

Pasos para la publicación

Para iniciar un proceso de apertura y publicación debe cumplir cuatro etapas: definir, preparar, publicar y difundir.

definir, preparar,publicar, difundir

Figura 2: Etapas para la publicación

Etapa 1: Definir

El primer paso es identificar los datos a publicar, y priorizarlos buscando que los procesos de apertura cumplan un propósito, que puede atender a impulsar una política de transparencia, a atender necesidades de usuarios que reutilizarán esos datos, o para cumplir con obligaciones institucionales, entre otros.

Las buenas prácticas recomiendan priorizar aquellos datos de mayor demanda para asegurar la reutilización de los mismos y por lo tanto hay impacto directo sobre las demandas.

Etapa 2: Preparar

Para publicar los datos, se deben preparar en formato abierto e incorporar la información necesaria para facilitar la comprensión y reutilización de los mismo.

La preparación de los datos implica algunas de las siguientes tareas:

  • Extracción: extraer los datos desde las fuentes originales, que pueden ser sistemas administrativos, herramientas de análisis de datos, planillas, etc.
     
  • Anonimización y/o disociación: de los datos para resguardar la identificación de las personas a través de los datos. Puede consultar las guías disponibles sobre estos procesos.
     
  • Estandarización: la estandarización de datos y formatos es necesaria para que los datos puedan ser utilizados de manera sencilla y facilitar la interoperabilidad. Esto implica el uso de estándares para diferentes tipos de datos o el uso de codigueras y  datos referenciales como los publicados por AGESIC.
     
  • Control de calidad: hacer chequeos de calidad de los datos para lograr sean exactos, oportunos y conformes con la realidad. Por ejemplo, que en campos numéricos no se encuentre texto como siglas del tipo S/D o nulo, entre otras. Para profundizar los temas de calidad puede consultar la guía de “Buenas prácticas para la Publicación de Datos Abiertos” y el “Marco de referencia de calidad de Datos de Agesic” donde se detallan aspectos de la calidad de los datos.
     
  • Transformación: existen diferentes formatos válidos para la publicación de Datos Abiertos según sus niveles de apertura, los más comunes son: .csv, .xml y. json.
     
  • Crear un diccionario de datos y/o metadatos: para su correcta interpretación. Los metadatos son datos que describen el conjunto de datos y su contenido. Incluyen información de la organización y personas responsables de la publicación e información sobre contenido de los mismos.

Se espera que el resultado de esta etapa sean datos en formatos abiertos, que cumplan con los principios de Datos Abiertos y listos para ser publicados.

 

Etapa 3: Publicar

Una vez preparados los datos, se podrán publicar en el Catálogo Nacional de Datos Abiertos.

Existen dos formas para la publicación:

  • Manual: consiste en acceder al Catálogo, crear el conjunto de datos completando el formulario respectivo y luego cargar los datos y metadatos uno a uno.

Nota: en el caso de publicar datos vinculados a las obligaciones de las instituciones de Transparencia Activa, se dispone de plantillas y proceso que facilitan esta tarea. Puede consultar la guía para la publicación de datos abiertos de transparencia activa.

  • Automatizada: la publicación automatizada se puede realizar utilizando la interface para la programación de aplicaciones (API). Esta interfaz además de permitir la publicación de datos es útil para programar el consumo de datos.

Al publicar es posible generar una pre visualización de los datos sin necesidad de realizar la descarga.

Estas visualizaciones permiten acceder a datos en formato tabular, como se muestran en el siguiente ejemplo del conjunto Turismo Receptivo del Ministerio de Turismo;;

Figura 3: vista previa con gráficas del conjunto: Turismo Receptivo del Ministerio de Turismo

También es posible incorporar visualizaciones desarrolladas en herramientas externas al Catálogo Nacional de Datos Abiertos, que faciliten la comprensión de los datos, sin necesidad de descargarlos y procesarlos. Ejemplo de pre visualizaciones con herramientas externas es la imagen que se muestra a continuación donde se presenta un análisis de los datos tabulares de la imagen anterior, pero en una gráfica de barras apiladas de forma horizontal: :

Figura 4: vista previa con gráficas del conjunto: Turismo Receptivo del Ministerio de Turismo

 

Etapa 4: Difundir

Para que los datos sean reutilizados y generen valor, es necesario que la comunidad sepa cuando se publican nuevos conjuntos de datos, por lo tanto, es sumamente importante que se difunda su publicación tanto en sitios web como redes sociales entre otras.

En el sitio de Datos de Uruguay se puede acceder a las novedades sobre la temática de datos públicos en general que incluye datos estadísticos, datos geográficos, datos abiertos, etc. Todas las instituciones públicas pueden utilizarlo como canal de difusión.

Con esta última etapa, se cierra el proceso de apertura y publicación, pero no el ciclo de vida de los conjuntos de datos. Es responsabilidad de las instituciones y organizaciones publicadoras mantener y actualizar los datos publicados en el Catalogo. en cada etapa del proceso es siempre de la organización publicadora.

Etiquetas