miércoles, 9 de enero de 2013

Lexrank , la centralidad como solucion para generar resumenes con coherencia y cohesion bastante aceptable


En esta línea, Erkan y Radev (2004b) presentan LexRank, uno de los
métodos más aceptados para calcular la centralidad en un grafo, aplicado a la
generación automática de resúmenes multi-documento. LexRank construye
un grafo para el conjunto de documentos a resumir en el que existe un vértice
por cada oración del mismo. Para determinar los enlaces entre los vértices,
las oraciones se representan por sus vectores de frecuencias (tf × idf), y
se calcula la similitud léxica entre ellos utilizando la métrica del coseno,
obteniendo así una matriz de similitudes. Aquellos pares de oraciones que
presenten una similitud superior a un determinado umbral se enlazan entre sí
en el grafo. Partiendo de la hipótesis de que las oraciones que son similares
a muchas otras son las más importantes en relación al tema central del40 Capítulo 2. Trabajo Previo
documento, la extracción de oraciones relevantes consiste en identificar las
oraciones que actúan como centroides en el grafo. En el artículo se investigan
distintas definiciones de centralidad léxica en múltiples documentos:

No hay comentarios:

Publicar un comentario