miércoles, 26 de diciembre de 2012

nota mental

teniendo en cuenta que en las investigaciones que se han realizado se utiliza un corpus de entrenamiento de 1500 articulos por tema de dominio y deseo que el spinner maneje minimo 10 temas de dominio necesitaria 15000 articulos para un corpus grueso de entrenamiento lo que pienso que puede dificultar el tiempo de procesamiento , estoy modificando los eslabones de markov para que el guardado y la lectura no supere el O (N)

No hay comentarios:

Publicar un comentario