Desarrollo de la metodología para el etiquetado semántico

ico_tarea5

Desarrollo de la metodología para el etiquetado semántico del perfil del contratante

Durante el periodo indicado se desarrolló una metodología para poder etiquetar los perfiles semánticos. Esta metodología se realizó contando con la solución elegida por la Diputación Provincial de Huesca para etiquetar sus datos semánticamente: RDF. La metodología a utilizar contiene los siguientes puntos:

  • Instalación del repositorio de datos semánticos. Para disponer de datos en RDF es necesario instalar en primera instancia un servidor o repositorio capaz de almacenar y consultar estos datos. Esta primera fase contiene las sub-fases:
    • Instalación
    • Configuración

De cara a la aplicación de este punto se plantea la posibilidad de utilizar como repositorio la herramienta Virtuoso Universal Server o su variante libre Virtuoso Open-Source Edition.

  • Desarrollo del mapeo. La información disponible en el perfil del contratante está habitualmente en bases de datos relacionales, es necesario realizar un mapeo de este tipo de datos a datos semánticos que sigan la ontología CONTSEM.
    • Estudio de la tecnología. Estudio del lenguaje o las herramientas necesarias para realizar el mapeo.
    • Análisis base de datos. Para extraer efectivamente los datos es necesario analizar cómo están estructurados.
    • Desarrollo. Una vez se conoce el lenguaje y el modelo relacional se realiza el mapeo.
    • Validación. Se valida con datos de prueba proporcionados por la administración.

Como tecnología referente para este apartado presuponemos la futura utilización del estándar R2RML para realizar el mapeo entre bases de datos relacionales y RDF. Si las implementaciones de este estándar no fuesen suficientes también se podría recurrir a D2RQ u otras aplicaciones de RDB2RDF .

  • Desarrollo de la herramienta. Una vez se dispone del mapeo, es necesario implementar la herramienta o programa que realice el mapeo escrito periódicamente para disponer de los datos semánticos más actualizados en todo momento.
  • Pruebas. Una vez la herramienta está funcionando es necesario realizar pruebas de carga y comprobar su correcto funcionamiento.
  • Publicación. Finalmente, publicar el punto de acceso SPARQL y publicitar su uso, así como otras tareas relacionadas como realizar documentos para el usuario final con tutoriales, consultas de ejemplo o en última instancia un buscados semántico ligero que explore estos datos.