elembudo


Edición semántica 2
abril 28, 2009, 11:28 pm
Filed under: General | Etiquetas: , , , ,

    En este post intentaré resumir “las mejoras semánticas” (semantic enhancements), introducidas  por David Shotton, Portwin K, Klyne G, Miles A, en un artículo de investigación biomédica publicado en PLoS, (Impact of Environment and Social Gradient on Leptospira Infection in Urban Slums), y relacionadas y explicadas en “Avendtures in semantic publishing: Enhancements of a Research Article”   

 

    El artículo es largo, denso y muy técnico, ya que presenta innovaciones difíciles de entender en un primer momento. He intentado traducir de la mejor manera posible todas las cuestiones técnicas, pero…, así que pido la colaboración de los posibles lectores para que corrijan todos aquellos errores técnicos o de traducción.

      También he intentado ilustrar cada mejora semántica con imágenes capturadas del propio artículo, de manera que la explicación teórica vaya acompañada del ejemplo práctico.

    Quizás sea conveniente empezar por un resumen gráfico, que muestra el ecosistema de artículos, documentos, hojas de cálculo, fusiones de datos y RDF files que conforman las mejoras semánticas añadidas por los autores al artículo original.

 ecosistema-semantico2

 

1. COSAS QUE LOS AUTORES NO HAN ALTERADO (MUCHO, SEGÚN ELLOS MISMOS)

 Navegación dentro del documento. Los links internos permanecen, pero han sido desplazados a un menú fijo en la parte superior del documento, añadiéndose un link a “data fusion supplements”.

 Comentarios de los lectores. No se duplica el sistema  de PLoS que permite a los lectores registrar sus comentarios, los autores animan a los lectores a hacer comentarios sobrel artículo original y el artículo mejorado semánticamente utilizando el sistema PLoS NTDs y en el blog de PLoS

 

2.PROPORCIONANDO ACCESO A DATOS PROCESABLES

 Se trata de proporcionar los datos fuente,(datos que no han sido procesados para ser utilizados, “raw data”), contenidos dentro del artículo de forma que se puedan procesar por el lector. Para ello se añadieron cabeceras (headers) a hojas de cálculo con los datos fuente, (proporcionadas por los autores), se registraron nuevos DOIs, y añaden un link para su descarga en las imágenes pertinentes.

 raw-dta

 

3.FUSIÓN DE DATOS CON INFORMACIÓN DE OTROS RECURSOS

 Mashup, pero los autores prefieren definirlo como fusión de datos, presentando cinco ejemplos.

 Fusión de datos geoespaciales

Tomando la imagen de una distribución geoespacial sin referencias de longitud ni latitud, se superpone una foto de satélite sobre el callejero del lugar de referencia. Se utiliza el API de Google Maps.

data-fusion1 

Fusión de datos geoespaciales a través de múltiples publicaciones

Se han superpuesto varias imágenes geoespaciales, una primera publicada en un artículo de otros autores y una segunda, la imagen mejorada, del párrafo anterior.

 data-fusion2

  Trazado del estudio sobre las localizaciones en espacio y tiempo

Sobre las localizaciones de en Google Maps se van trazando los distintos estudios realizados sobre el tema en el mundo.

 data-fusion3

  

4.AÑADIENDO VALOR AL TEXTO

 Destacando términos textuales

Subrayado automático de términos textuales con color, mediante un menú fijo en la cabecera del documento, en el que aparecen los conceptos claves del contenido, y presionando sobre el concepto deseado, inmediatamente, los términos relacionados se destacan.

subrrayadoter 

 

Links en determinadas entidades a fuentes de información externas

Se hace un link en cada término subrayado del concepto clave organismo a la clasificación de taxonomías de uBio. De esta manera se dan definiciones ontológicas que pueden ayudar a los lectores, y facilitar la búsqueda de artículos relacionados.

 

Herramienta supporting claims para permitir citas en el contexto

Se construye un caja de texto en la que aparece una frase como introducción, y otra como discusión, o de resultados, y así  proporcionar al lector cierta información sobre la afirmación citada, sin necesidad de abrir una ventana nueva en un link externo o tener que buscar el artículo.

citationincontext 

citationincontext2

 

Los autores indican que el concepto de mostrar el sumario de un documento citado no es nuevo, y que se ha utilizado en publicidad contextual, como por ejemplo la demostración de Kawa. La novedad introducida en el artículo semántico es que el link a la cita se produce en el nivel de la llamada a la cita, de manera que contruyen dos citas diferentes para el mismo artículo citado.

En la imagen la cita es [6] , en distintos párrafos del artículo, la herramienta supporting claims tiene texto diferente.

 

5.HACIENDO LA INFORMACIÓN MÁS ACCESIBLE

 Document summary

Al lado del título como se puede ver en la imagen

documentsummary 

 Este sumario consta de seis secciones:

 1. Study summary, que podría considerarse un abstract digital tal y como lo propusieron en su momento, Seringhaus and Gerstein

and Gerstein et al. e implementado por FEBS Letters

 2. Nube de tags, muestra en orden alfabético los términos destacados en el texto del artículo con su color establecido el menú de conceptos destacados. A primer golpe de vista el lector es capaz de determinar los términos más utilizados en el estudio.

nubetags 

3. Árbol de tags, los mismos términos de la nube de tags, han sido segregados en categorías semánticas usadas en los conceptos destacados. La novedad del arbol de tags es que permite combinar los beneficios de la nube de tags con las clasificaciones semánticas jerárquicas

arboltags 

4. Términos ontológicos sobre la materia objeto del estudio, se presentan en una simple lista ordenada alfabéticamente.

 terminosontologicos

5. Estadísticas del documento, un simple set de estadísticas, sumarizando el número de autores, citas, refencias, figuras, figuras complementarias y tablas.

estadisticas 6. Análisis de las citas, análisis numérico de las citas dentro del artículo, en términos de frecuencia de uso en las distintas partes del documento. Los datos puros se presentan en una hoja de cálculo para su descarga, que también contiene la contabilidad de 53 referencias citadas en google acholar y en WOK en marzo de 2009.

  CITO, Citation Typing Ontology, que a través de un  vocabulario controlado permite la clasificación de las citas y referencias del artículo.

 La ontología propiamente dicha está disponible en este link, dicha ontología pretende ser lo suficientemente amplia como para que los autores sean capaces de clasificar las citas incluidas en sus artículos.

 Una vez desarrollado CITO, las citas del artículo mejorado semánticamente se han clasificado en los siguientes términos:

 En términos de naturaleza o tipo de relaciones entre citas, como por ejemplo rehusado por o se utiliza la metodología. Estas relaciones son objetos propietarios en CITO, y no son excluyentes entre sí.

 En términos de naturaleza o tipo de obra (work), como por ejemplo, review o research paper. Son subclases de tipo de obra, ha de elegirse una subclase.

 En términos de naturaleza o tipo de expresión de la obra. Son subclases de expresión (expresión): libro, revista o artículo,  debe elegirse una.

 En términos de naturaleza o tipo de la manifestación de la expresión de una obra, (of the manifestation of expression of a work), como por ejemplo, documento en papel o página web, también son subclases pero no son excluyentes.

 En términos de peer-review de la expresión de la obra, si es peer-review o no.

  cito11

 Además se incluye un menú para ordenar las citas por orden alfabético, año de publicación, frecuencia dentro del artículo, número, y el botón de turn citation typing off, para ocultar o mostrar la clasificación ontológica de cada una de ellas.

cito2

 Abstracts en idioma alternativo

El artículo original incluía en supporting information la traducción del abstract al portugués, ya que los autores son brasileños y el estudio analiza el efecto de la leptospira en Brasil, que podía descargarse en un Word.

 Los autores del artículo mejorado semánticamente, convierten el Word en un documento web añadiéndole botones para colorear los términos de los conceptos destacados, igual que en el texto del artículo, incluyen la referencia del autor de la traducción.

abstracportu 

 

    Figuras interactivas

6.INTERACTIBIDAD DEL USUARIO. ARTÍCULO VIVO 

 

Se toma una figura del artículo original compuesta por 6 paneles fijos, y se convierte en interactiva, de manera que los paneles pueden moverse y superponerse unos sobre otros.

 Figura original

figurainteractivaoriginal 

Figura interactiva

figurainteractiva 

 

7.PREVISIÓN DE NUEVOS LINKS

 El artículo original carecía de vínculos externos dificultando al lector la posibilidad de ver los trabajos citados o los abstracts de los mismos.

 Esta situación fue resuelta por los autores del artículo enriquecido semánticamente mediante:

 Links a las referencias citadas

 Links a sitios externos:

 Links a instituciones académicas de los autores, organismos de financiación y proveedores de software.

  En la cabecera del artículo mejorado se añaden links al artículo original, y al site de PLoS NTDs.

   En el pie del documento se incluyen marcadores sociales, Connotea de Nature, Delicious, la licencia Creative Commons del trabajo mejorado, XHTML/RDFa Web serivico de validación de páginas web del World Wide Web Consortium (W3C).

     En los detalles del documento, links la licencia Creative Commons del artículo original.

 8. METADATOS DE LA CITAS

 La principal creación de la web semántica son los metadatos legibles por el ordenador. Los autores han desarrollado este principio en tres direcciones:

 Metadatos embebidos usando RDFa

RDF es una especificación del W3C para la definición mediante metadatos, generalmente en XML, de los recursos que se pueden encontrar en un sitio.

Se han embebido en el documento html del artículo mejorado, los metadatos relativos a las citas, autores, idiomas usados, el DOI, la licencia Creative Commons, las geo-coordinadas y los datos del estudio, utilizando el estandar RDFa, que puede ser descargado para la inspección humana, en el link “Extract RDFa” en el pie del artículo.

 Metadatos de autoreferencia legibles por ordenador- En formato Notation 3

Estos metadatos en formato N3 contienen los mismos datos que el RDFa embebido, pero con el plus de la categorización de la cita del propio artículo y del abstract. Disponibles en el pie del artículo, Document details in RDF (N3 file)   

 Lista de las citas clasificadas antológicamente, también en formato N3, en el pie del documento, Citation details in RDF (N3 file)

Anuncios

1 comentario so far
Deja un comentario

[…] Posts Más Vistos Edición semántica 2 […]

Pingback por Más “semantic publishing”: Semantic Biochemical Journal « elembudo




Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s



A %d blogueros les gusta esto: