Archivado en: General | Etiquetas: Edición científica, Edición semántica, PLoS, Semantic publishing, Web semántica
En este post intentaré resumir “las mejoras semánticas” (semantic enhancements), introducidas por David Shotton, Portwin K, Klyne G, Miles A, en un artículo de investigación biomédica publicado en PLoS, (Impact of Environment and Social Gradient on Leptospira Infection in Urban Slums), y relacionadas y explicadas en “Avendtures in semantic publishing: Enhancements of a Research Article”
El artículo es largo, denso y muy técnico, ya que presenta innovaciones difíciles de entender en un primer momento. He intentado traducir de la mejor manera posible todas las cuestiones técnicas, pero…, así que pido la colaboración de los posibles lectores para que corrijan todos aquellos errores técnicos o de traducción.
También he intentado ilustrar cada mejora semántica con imágenes capturadas del propio artículo, de manera que la explicación teórica vaya acompañada del ejemplo práctico.
Quizás sea conveniente empezar por un resumen gráfico, que muestra el ecosistema de artículos, documentos, hojas de cálculo, fusiones de datos y RDF files que conforman las mejoras semánticas añadidas por los autores al artículo original.

1. COSAS QUE LOS AUTORES NO HAN ALTERADO (MUCHO, SEGÚN ELLOS MISMOS)
Navegación dentro del documento. Los links internos permanecen, pero han sido desplazados a un menú fijo en la parte superior del documento, añadiéndose un link a “data fusion supplements”.
Comentarios de los lectores. No se duplica el sistema de PLoS que permite a los lectores registrar sus comentarios, los autores animan a los lectores a hacer comentarios sobrel artículo original y el artículo mejorado semánticamente utilizando el sistema PLoS NTDs y en el blog de PLoS
2.PROPORCIONANDO ACCESO A DATOS PROCESABLES
Se trata de proporcionar los datos fuente,(datos que no han sido procesados para ser utilizados, “raw data”), contenidos dentro del artículo de forma que se puedan procesar por el lector. Para ello se añadieron cabeceras (headers) a hojas de cálculo con los datos fuente, (proporcionadas por los autores), se registraron nuevos DOIs, y añaden un link para su descarga en las imágenes pertinentes.

3.FUSIÓN DE DATOS CON INFORMACIÓN DE OTROS RECURSOS
Mashup, pero los autores prefieren definirlo como fusión de datos, presentando cinco ejemplos.
Fusión de datos geoespaciales
Tomando la imagen de una distribución geoespacial sin referencias de longitud ni latitud, se superpone una foto de satélite sobre el callejero del lugar de referencia. Se utiliza el API de Google Maps.
Fusión de datos geoespaciales a través de múltiples publicaciones
Se han superpuesto varias imágenes geoespaciales, una primera publicada en un artículo de otros autores y una segunda, la imagen mejorada, del párrafo anterior.

Trazado del estudio sobre las localizaciones en espacio y tiempo
Sobre las localizaciones de en Google Maps se van trazando los distintos estudios realizados sobre el tema en el mundo.

4.AÑADIENDO VALOR AL TEXTO
Destacando términos textuales
Subrayado automático de términos textuales con color, mediante un menú fijo en la cabecera del documento, en el que aparecen los conceptos claves del contenido, y presionando sobre el concepto deseado, inmediatamente, los términos relacionados se destacan.
Links en determinadas entidades a fuentes de información externas
Se hace un link en cada término subrayado del concepto clave organismo a la clasificación de taxonomías de uBio. De esta manera se dan definiciones ontológicas que pueden ayudar a los lectores, y facilitar la búsqueda de artículos relacionados.
Herramienta supporting claims para permitir citas en el contexto
Se construye un caja de texto en la que aparece una frase como introducción, y otra como discusión, o de resultados, y así proporcionar al lector cierta información sobre la afirmación citada, sin necesidad de abrir una ventana nueva en un link externo o tener que buscar el artículo.

Los autores indican que el concepto de mostrar el sumario de un documento citado no es nuevo, y que se ha utilizado en publicidad contextual, como por ejemplo la demostración de Kawa. La novedad introducida en el artículo semántico es que el link a la cita se produce en el nivel de la llamada a la cita, de manera que contruyen dos citas diferentes para el mismo artículo citado.
En la imagen la cita es [6] , en distintos párrafos del artículo, la herramienta supporting claims tiene texto diferente.
5.HACIENDO LA INFORMACIÓN MÁS ACCESIBLE
Document summary
Al lado del título como se puede ver en la imagen
Este sumario consta de seis secciones:
1. Study summary, que podría considerarse un abstract digital tal y como lo propusieron en su momento, Seringhaus and Gerstein
and Gerstein et al. e implementado por FEBS Letters
2. Nube de tags, muestra en orden alfabético los términos destacados en el texto del artículo con su color establecido el menú de conceptos destacados. A primer golpe de vista el lector es capaz de determinar los términos más utilizados en el estudio.
3. Árbol de tags, los mismos términos de la nube de tags, han sido segregados en categorías semánticas usadas en los conceptos destacados. La novedad del arbol de tags es que permite combinar los beneficios de la nube de tags con las clasificaciones semánticas jerárquicas
4. Términos ontológicos sobre la materia objeto del estudio, se presentan en una simple lista ordenada alfabéticamente.

5. Estadísticas del documento, un simple set de estadísticas, sumarizando el número de autores, citas, refencias, figuras, figuras complementarias y tablas.
6. Análisis de las citas, análisis numérico de las citas dentro del artículo, en términos de frecuencia de uso en las distintas partes del documento. Los datos puros se presentan en una hoja de cálculo para su descarga, que también contiene la contabilidad de 53 referencias citadas en google acholar y en WOK en marzo de 2009.
CITO, Citation Typing Ontology, que a través de un vocabulario controlado permite la clasificación de las citas y referencias del artículo.
La ontología propiamente dicha está disponible en este link, dicha ontología pretende ser lo suficientemente amplia como para que los autores sean capaces de clasificar las citas incluidas en sus artículos.
Una vez desarrollado CITO, las citas del artículo mejorado semánticamente se han clasificado en los siguientes términos:
En términos de naturaleza o tipo de relaciones entre citas, como por ejemplo rehusado por o se utiliza la metodología. Estas relaciones son objetos propietarios en CITO, y no son excluyentes entre sí.
En términos de naturaleza o tipo de obra (work), como por ejemplo, review o research paper. Son subclases de tipo de obra, ha de elegirse una subclase.
En términos de naturaleza o tipo de expresión de la obra. Son subclases de expresión (expresión): libro, revista o artículo, debe elegirse una.
En términos de naturaleza o tipo de la manifestación de la expresión de una obra, (of the manifestation of expression of a work), como por ejemplo, documento en papel o página web, también son subclases pero no son excluyentes.
En términos de peer-review de la expresión de la obra, si es peer-review o no.

Además se incluye un menú para ordenar las citas por orden alfabético, año de publicación, frecuencia dentro del artículo, número, y el botón de turn citation typing off, para ocultar o mostrar la clasificación ontológica de cada una de ellas.

Abstracts en idioma alternativo
El artículo original incluía en supporting information la traducción del abstract al portugués, ya que los autores son brasileños y el estudio analiza el efecto de la leptospira en Brasil, que podía descargarse en un Word.
Los autores del artículo mejorado semánticamente, convierten el Word en un documento web añadiéndole botones para colorear los términos de los conceptos destacados, igual que en el texto del artículo, incluyen la referencia del autor de la traducción.
- Figuras interactivas
6.INTERACTIBIDAD DEL USUARIO. ARTÍCULO VIVO
Se toma una figura del artículo original compuesta por 6 paneles fijos, y se convierte en interactiva, de manera que los paneles pueden moverse y superponerse unos sobre otros.
Figura original
Figura interactiva
7.PREVISIÓN DE NUEVOS LINKS
El artículo original carecía de vínculos externos dificultando al lector la posibilidad de ver los trabajos citados o los abstracts de los mismos.
Esta situación fue resuelta por los autores del artículo enriquecido semánticamente mediante:
Links a las referencias citadas
Links a sitios externos:
Links a instituciones académicas de los autores, organismos de financiación y proveedores de software.
En la cabecera del artículo mejorado se añaden links al artículo original, y al site de PLoS NTDs.
En el pie del documento se incluyen marcadores sociales, Connotea de Nature, Delicious, la licencia Creative Commons del trabajo mejorado, XHTML/RDFa Web serivico de validación de páginas web del World Wide Web Consortium (W3C).
En los detalles del documento, links la licencia Creative Commons del artículo original.
8. METADATOS DE LA CITAS
La principal creación de la web semántica son los metadatos legibles por el ordenador. Los autores han desarrollado este principio en tres direcciones:
Metadatos embebidos usando RDFa
RDF es una especificación del W3C para la definición mediante metadatos, generalmente en XML, de los recursos que se pueden encontrar en un sitio.
Se han embebido en el documento html del artículo mejorado, los metadatos relativos a las citas, autores, idiomas usados, el DOI, la licencia Creative Commons, las geo-coordinadas y los datos del estudio, utilizando el estandar RDFa, que puede ser descargado para la inspección humana, en el link “Extract RDFa” en el pie del artículo.
Metadatos de autoreferencia legibles por ordenador- En formato Notation 3
Estos metadatos en formato N3 contienen los mismos datos que el RDFa embebido, pero con el plus de la categorización de la cita del propio artículo y del abstract. Disponibles en el pie del artículo, Document details in RDF (N3 file)
Lista de las citas clasificadas antológicamente, también en formato N3, en el pie del documento, Citation details in RDF (N3 file)
1 comentario hasta ahora
Deja un comentario
[...] Posts Más Vistos Edición semántica 2 [...]
Pingback por Más “semantic publishing”: Semantic Biochemical Journal « elembudo diciembre 23, 2009 @ 8:53 pm