Resumen automático multi-documento
En este caso, el resumen se realiza sobre los contenidos de un conjunto de
documentos.
En esta sección se abordarán los 2 temas siguientes:
• Requisitos que debe cumplir el resumen automático multi-documento.
• Tipos de resumen automático multi-documento.
2.3.1. Requisitos
El resumen automático multi-documento debe cumplir una serie de requisitos
que se enumeran a continuación:
• Clustering: habilidad para agrupar documentos parecidos y buscar información
relacionada.
• Cobertura: habilidad para localizar y extraer los puntos más importantes de
varios documentos.
• Anti-redundancia: habilidad para minimizar redundancias entre los pasajes del
resumen.
• Cohesión del resumen: habilidad para combinar pasajes textuales de forma que
le resulte útil al lector. Las principales técnicas en este sentido son: ordenación
de los pasajes del más importante al menos importante, de forma que si el lector
deja de leer el resumen haya podido obtener los contenidos de mayor
relevancia, ordenación de los pasajes por fecha, ordenación por temas...
• Coherencia: los resumenes generados deben ser totalmente entendibles por el
usuario.
• Inconsistencias de las fuentes: como algunos documentos pueden contener
errores con frecuencia, el resumen debería ser capaz de reconocer e informar de
dichas inconsistencias.
• Actualizaciones: cuando se genera un nuevo resumen automático, debería tener
en cuenta los resumenes previos generados.
2.3.2. Tipos
Los tipos de resumen automático multi-documento que existen son:
• Resumen a partir de las secciones comunes de los documentos: localiza las
partes importantes que la colección de documentos tienen en común y las utiliza
para efectuar el resumen. Resumen Automático Estela Castillo Bartolomé
5
• Resumen a partir de las secciones comunes y de las secciones únicas de los
documentos: exactamente igual que el anterior, pero teniendo en cuenta también
para el resumen las partes más importantes únicas de cada documento.
• Resumen del documento central: crea un resumen sencillo del documento
central del grupo.
• Resumen del documento central y del resto: idéntico al anterior, pero
incluyendo también pasajes y palabras claves del resto de documentos para
obtener una cobertura más completa del conjunto de todos ellos.
• Resumen del último documento y del resto: genera el resumen a partir del
documento más reciente de la colección, incluyendo pasajes y palabras claves
del resto de documentos.
• Resumen a partir de las secciones comunes y de las secciones únicas de los
documentos teniendo en cuenta la fecha: realiza un resumen de forma similar al
segundo tipo pero dándole más importancia a los pasajes de los documentos
más recientes.
No hay comentarios:
Publicar un comentario