domingo, 10 de febrero de 2013

El sistema de WSD basado en maxima entropia


El modelado con ME proporciona un marco para la integraci´on de informaci´on para clasificaci´on desde muchas fuentes heterogeneas (Manning y Sch¨utze, 1999). Los modelos de probabilidad de ME han sido utilizados con ´exito en tareas del PLN tales comoPOS tagging o detecci´on de los l´ımites de la
frase (Ratnaparkhi, 1998).El m´etodo de WSD usado para este trabajo est´a basado en los modelos de probabilidadcondicional de ME, lo que ha resultado enuna implementaci´on de un m´etodo supervisado de aprendizaje autom´atico que obtieneclasificadores de sentidos de palabras a partir de un corpus anotado. Se entiende comoclasificador obtenido por esta t´ecnica comoun conjunto de coeficientes que se estiman mediante un algoritmo de optimizaci´on, cadauno asociado a un atributo (feature) observado en el corpus de entrenamiento. El principal objetivo es obtener una distribuci´on deprobabilidad que maximice la entrop´ıa, estoes, asumiendo la m´axima ignorancia sobre losdatos de entrenamiento de tal forma que no seinduce ning´un conocimiento que no est´e propiamente en los datos.Nuestro sistema (que denominaremos MEWSD) se basa en una implementaci´on propiaen C++, cuyos detalles se pueden consultar en (Su´arez y Palomar, 2002) y (Su´arez, 2004).
http://adimen.si.ehu.es/~rigau/publications/sepln05-srp.pdf

No hay comentarios:

Publicar un comentario