jueves, 17 de enero de 2013

Resumen automático multi-documento


Resumen automático multi-documento
 En este caso, el  resumen se realiza sobre los contenidos de un conjunto de
documentos.
 En esta sección se abordarán los 2 temas siguientes:
• Requisitos que debe cumplir el resumen automático multi-documento.
• Tipos de resumen automático multi-documento.
2.3.1. Requisitos
 El resumen automático multi-documento debe cumplir una serie de requisitos
que se enumeran a continuación:
• Clustering: habilidad para agrupar documentos parecidos y buscar información
relacionada.
• Cobertura: habilidad para localizar y extraer los puntos más importantes de
varios documentos.
• Anti-redundancia: habilidad para minimizar redundancias entre los pasajes del
resumen.
• Cohesión del resumen: habilidad para combinar pasajes textuales de forma que
le resulte útil al lector. Las principales técnicas en este sentido son: ordenación
de los pasajes del más importante al menos importante, de forma que si el lector
deja de leer el  resumen haya podido obtener los contenidos de mayor
relevancia, ordenación de los pasajes por fecha, ordenación por temas...
• Coherencia: los  resumenes generados deben ser totalmente entendibles por el
usuario.
• Inconsistencias de las fuentes: como algunos  documentos pueden contener
errores con frecuencia, el resumen debería ser capaz de reconocer e informar de
dichas inconsistencias.
• Actualizaciones: cuando se genera un nuevo resumen automático, debería tener
en cuenta los resumenes previos generados.
2.3.2. Tipos
 Los tipos de resumen automático multi-documento que existen son:
• Resumen a partir de las secciones comunes de los  documentos: localiza las
partes importantes que la colección de documentos tienen en común y las utiliza
para efectuar el resumen. Resumen Automático                         Estela Castillo Bartolomé
5
• Resumen a partir de las secciones comunes y de las secciones únicas de los
documentos: exactamente igual que el anterior, pero teniendo en cuenta también
para el resumen las partes más importantes únicas de cada documento.
• Resumen del documento central: crea un  resumen sencillo del documento
central del grupo.
• Resumen del documento central y del resto: idéntico al anterior, pero
incluyendo también pasajes y palabras claves del resto de  documentos para
obtener una cobertura más completa del conjunto de todos ellos.
• Resumen del último documento y del resto: genera el  resumen a partir del
documento más reciente de la colección, incluyendo pasajes y palabras claves
del resto de documentos.
• Resumen a partir de las secciones comunes y de las secciones únicas de los
documentos teniendo en cuenta la fecha: realiza un resumen de forma similar al
segundo tipo pero dándole más importancia a los pasajes de los  documentos
más recientes.

No hay comentarios:

Publicar un comentario