Trabajo de grado en procesamiento del lenguaje natural: El sistema de WSD basado en maxima entropia

domingo, 10 de febrero de 2013

El sistema de WSD basado en maxima entropia

El modelado con ME proporciona un marco para la integraci´on de informaci´on para clasiﬁcaci´on desde muchas fuentes heterogeneas (Manning y Sch¨utze, 1999). Los modelos de probabilidad de ME han sido utilizados con ´exito en tareas del PLN tales comoPOS tagging o detecci´on de los l´ımites de la
frase (Ratnaparkhi, 1998).El m´etodo de WSD usado para este trabajo est´a basado en los modelos de probabilidadcondicional de ME, lo que ha resultado enuna implementaci´on de un m´etodo supervisado de aprendizaje autom´atico que obtieneclasiﬁcadores de sentidos de palabras a partir de un corpus anotado. Se entiende comoclasiﬁcador obtenido por esta t´ecnica comoun conjunto de coeﬁcientes que se estiman mediante un algoritmo de optimizaci´on, cadauno asociado a un atributo (feature) observado en el corpus de entrenamiento. El principal objetivo es obtener una distribuci´on deprobabilidad que maximice la entrop´ıa, estoes, asumiendo la m´axima ignorancia sobre losdatos de entrenamiento de tal forma que no seinduce ning´un conocimiento que no est´e propiamente en los datos.Nuestro sistema (que denominaremos MEWSD) se basa en una implementaci´on propiaen C++, cuyos detalles se pueden consultar en (Su´arez y Palomar, 2002) y (Su´arez, 2004).
http://adimen.si.ehu.es/~rigau/publications/sepln05-srp.pdf

Trabajo de grado en procesamiento del lenguaje natural

domingo, 10 de febrero de 2013

El sistema de WSD basado en maxima entropia

No hay comentarios:

Publicar un comentario