sábado, 9 de febrero de 2013

WSD: desambiguador semantico de las palabras


La resolucion de la ambiguedad semantica de las palabras (WSD, word sense disambiguation) es un campo de desarrollo abierto
dentro del procesamiento del lenguaje natural (PLN). La tarea consiste en asignar el sentido correcto a las palabras de entre las defi-
niciones que se pueden encontrar en un diccionario electr´onico. Es un problema dif´ıcil
que genera gran inter´es entre la comunidad
cient´ıfica.
Actualmente hay dos aproximaciones metodol´ogicas principales en este ´area: m´etodos
basados en el conocimiento y m´etodos basa-
¤
This paper has been partially supported by the
Spanish Government (CICyT) under project number
TIC2000-0664-C02-02 and the Valencia Government
(OCyT) under project number CTIDIB-2002-151.
dos en corpus. La primera utiliza el conocimiento ling¨u´ıstico previamente adquirido,
y la segunda utiliza t´ecnicas estad´ısticas y
aprendizaje autom´atico para inducir modelos
del lenguaje a partir de grandes conjuntos de
ejemplos textuales (Pedersen, 2001).
El aprendizaje autom´atico y basado en
corpus puede ser supervisado o no supervisado. Para el aprendizaje supervisado conocemos la clase de cada elemento dentro del conjunto de aprendizaje (en nuestro caso, la etiqueta de sentido) mientras que en el no supervisado la clasificaci´on de los datos de entrenamiento no es conocida (Manning y Sch¨utze,
1999).

No hay comentarios:

Publicar un comentario