teniendo en cuenta que en las investigaciones que se han realizado se utiliza un corpus de entrenamiento de 1500 articulos por tema de dominio y deseo que el spinner maneje minimo 10 temas de dominio necesitaria 15000 articulos para un corpus grueso de entrenamiento lo que pienso que puede dificultar el tiempo de procesamiento , estoy modificando los eslabones de markov para que el guardado y la lectura no supere el O (N)
No hay comentarios:
Publicar un comentario