Figura 6. Grafo causal creado automáticamente que evalúa la relación entre smoking y lung cancer.
Bibliografía.
El algoritmo devuelve un esquema de la información útil de la oración que se almacena dentro de una base de datos. Una vez que todas las frases se han terminado de procesar y esquematizar, se representará automáticamente a través de la API de Java Jgraph7 el grafo causal con los datos almacenados.
A la hora de representar el grafo, algunas de estas oraciones comparten el mismo nodo antecedente o consecuente, como por ejemplo el nodo risk lung cancer, que aparece varias veces. Este nodo hereda todos los modificadores que aparecen en todas las frases. Una relación está especificada por un modificador si la flecha entra dentro del nodo apuntando al modificador implicado. En caso contrario, la flecha de la relación señalará al borde del nodo. Tanto causas como efectos pueden ser descritos de forma general (pulmonary hypoplasia) o más específicamente: los médicos generalmente hablan de pulmonary hypoplasia localizada en right lung o right upper lobe pulmonary hypoplasia. Por esto, en los textos médicos es frecuente encontrar localizaciones (right) o especificaciones (upper lobe) en frases nominales. Si la relación tiene más de un modificador, la flecha apuntará a un nodo intermedio que a su vez dirigirá otras flechas a los modificadores correspondientes. La intensidad de la relación, si existe, estará marcada en rojo, y el tipo de enlace causal en negro. Como se puede ver en el grafo (figura 6), hay cuatro nodos con la palabra smoking, o similar, y otros cuatro con las palabras lung cancer. El resto de nodos se han creado durante el proceso. Por lo tanto, con un grafo como éste se pueden establecer nuevas relaciones ocultas a primera vista, como por ejemplo la existente entre smoking y fluid being accumulate around the lungs, con un cierto grado de relación, teniendo en cuenta los modificadores y cuantificadores que aparecen en el camino causal que enlazan estos dos nodos.
El objetivo de este artículo es por un lado (i) presentar un programa capaz de recuperar oraciones causales o condicionales de documentos de texto pertenecientes a diferentes géneros y (ii) representar los resultados automáticamente mediante un grafo causal en el que se muestran, de modo explícito, los cuantificadores aproximados y las cercas semánticas con la que se califican los nodos o se matizan los enlaces. Las sentencias recuperadas son utilizadas como una base de datos para estudiar la causalidad imperfecta.
(7) http://www.jgraph.com (última visita: octubre 2010).
Descargar este artículo en formato PDF