domingo, 13 de enero de 2013

Generación automática de resúmenes.

http://acoca2.blogs.uv.es/files/2010/12/Generaci%C3%B3n-autom%C3%A1tica-de-res%C3%BAmenes.pdf

7.-CONCLUSIONES
Del análisis desarrollado sobre necesidades en el procesamiento de la
información en el proceso de recuperación documental y con relación con las
líneas de investigación que se están trabajando desde los grupos de
investigación de las universidades  podemos enumerar las siguientes
conclusiones:
 1.- El increíble crecimiento de la producción documental ha obligado a
desarrollar herramientas que permitan procesar la información de una forma
eficiente. Para ello se han creado  sistemas de producción automática de
resúmenes que permiten a los usuarios procesar y representar el contenido de
los documentos de forma pertinente y fiable.
 2.- Actualmente las investigaciones llevadas a cabo han derivado en dos
líneas de trabajo fundamentales, a la hora de obtener los resúmenes de forma
automática. Por definición se van a diferenciar dos tipos de resúmenes, por
extracción y por abstracción.
 3.- El procesamiento del lenguaje natural va dirigido a solucionar la
ambigüedad del lenguaje natural a través de técnicas informáticas. Con ello se
pretende solucionar problemas  en varios niveles (morfosintáctico, sintáctico,
semántico y contextual).
 4.- Los métodos de representación  del conocimiento en la generación
automática de resúmenes se encuadra en tres grandes grupos: los métodos de
extracción basados en la estructura superficial, los métodos de sumarización a
medio camino entre el resumen y el  extracto, y los métodos gráficos y
relaciónales.
 5.- El proceso de evaluación permite clarificar el resultado más o menos
óptimo de la producción automática de resúmenes. Sin embargo es un
procedimiento complejo, que está condicionado por la propia complejidad de la
tarea de resumen (que se puede aplicar  no solo al resumen automático sino
también al manual).
 6.- Hemos comprobado que la investigación en la generación automática
de resúmenes va paralela a la investigación sobre Procesamiento de Lenguaje
Natural (PLN). Las investigaciones han experimentado un incremento
significativo en la década de los noventa y en estos momentos arroja
resultados prometedores, basándonos en el análisis de los proyectos que se
desarrollaron  podemos afirmar que en  el futuro la investigación está
garantizada. Los grandes proyectos americanos (TIDES) y europeos (Proyecto
WordNet) continúan buscando mejoras en los resultados.
Sin embargo, hay que  señalar que casi la totalidad de la investigación es en
lengua inglesa pues cualquier sistema que pretenda trabajar sobre la
información semántica de un documento precisa un módulo de desambigüación
del sentido de las palabras(WSD), los recursos léxicos,las ontologías están
orientadas a la desambiguación del sentido de las palabras en ingles . Además los numerosos recursos supone mayores facilidades en la fase de evaluación
de resultados. Es muy significativo  que el idioma de trabajo en que se
desarrolla la investigación es el ingles, por tanto  en este campo de
investigación se considera un handicap para los investigadores que utilizan el
español. No obstante en las universidades españolas la investigación en este
campo es en ingles. Sin embargo, la aparición de diferentes WordNets, dentro
del proyecto EurowordNet, permitirá el desarrollo de aplicaciones que podrán
incorporar módulos de WSD en español y un avance en los próximos años para
la investigación desde las universidades lengua española.

No hay comentarios:

Publicar un comentario