jueves, 17 de enero de 2013

Detección de redundancia


El objetivo de esta fase es detectar y eliminar
la informaci´on redundante de un documento,
para evitar as´ı que el resumen contenga
informaci´on repetida. Para lograr este
objetivo, nos basamos en un m´odulo de reconocimiento
de la implicaci´on textual (TE)
(Ferr´andez-Esc´amez, 2009), que nos indicar´a,
dadas dos oraciones si una se puede deducir
de la otra. Este sistema se basa en el c´omputo
de un conjunto de medidas l´exicas (como
por ejemplo, distancia de Leveshtein, Smith-
Waterman, similitud del coseno), sint´acticas
(´arboles de dependencia) y sem´anticas basadas
en WordNet 3.0 5, aplicando un clasificador
SVM con el objetivo de tomar la decisi´on
final.

No hay comentarios:

Publicar un comentario