Se creo una carpeta con 132 archivos pdf con un peso total de 469 Megas .Los temas que contenían los archivos se enumeran de la siguiente manera.
* 34 Pdfs sobre PLN en general
* 86 Pdfs sobre Enterprise Java
* 1 Pdf sobre Análisis semántico latente
* 1 Pdf sobre Textual Entailment
* 1 Pdf Sobre Enertex y Cortex
* 1 Pdf sobre Metrica de Rouge
* 3 Pdfs sobre WordNet
* 2 Pdfs sobre WSD y stop words
* 1 Pdf sobre Levenshtein distance y similitud semantica
* 4 Pdfs sobre LexRank y TexRank
Se instalo Google Desktop
Se instalo File Seek
Se instalo Radex
Se realizaron 53 consultas , pidiéndole a los 3 programas recién instalados que buscaran en la carpeta donde estaban los archivos ,Para google desktop se agrego previamente la carpeta en opciones:
* 34 Pdfs sobre PLN en general
* 86 Pdfs sobre Enterprise Java
* 1 Pdf sobre Análisis semántico latente
* 1 Pdf sobre Textual Entailment
* 1 Pdf Sobre Enertex y Cortex
* 1 Pdf sobre Metrica de Rouge
* 3 Pdfs sobre WordNet
* 2 Pdfs sobre WSD y stop words
* 1 Pdf sobre Levenshtein distance y similitud semantica
* 4 Pdfs sobre LexRank y TexRank
Se instalo Google Desktop
Se instalo File Seek
Se instalo Radex
Se realizaron 53 consultas , pidiéndole a los 3 programas recién instalados que buscaran en la carpeta donde estaban los archivos ,Para google desktop se agrego previamente la carpeta en opciones:
Buscar ubicaciones
Añadir la unidad o carpeta que deseas incluir en la búsqueda Para FileSeek y Radex se coloco la carpeta donde debían realizar el proceso de búsqueda. Para las búsquedas de contenidos seleccionados aleatoriamente ,los resultados fueron los siguientes
Tiempo Estimado realizando las consultas : 34 Minutos Razones : Google Desktop
Nota: resultados parciales únicamente (0% completado). indexación única en curso. La indexación se lleva a cabo mientras el equipo se encuentra inactivo. Los mensajes de Outlook se indexan sólo si dicha aplicación se ha iniciado.
Tu consulta "X" no ha obtenido ningún resultado.
Sugerencias:
- Prueba la búsqueda web de Google para obtener resultados de Internet.
FileSeek:
No se puede implementar el método o la operación.
Radex:
Se generaba un PDF por cada resultado de busqueda.
Conclusiones:
Google desktop es una muy buena herramienta , el problema es que necesita indexar todo el computador para obtener resultados satisfactorios , lo que no lo hace practico.
Fileseek:
Realiza busquedas basadas en palabras iguales , no diferencia entre tildes ni UTF-8 , ni mayúsculas ni minúsculas.
Radex:
Resultados satisfactorios.
hay ciertos problemas de repetición de contenido que encuentra y solo devuelve el primer resultado de búsqueda del documento.
Estos problemas se solucionaran en el fin de semana.
Se necesitan hacer pruebas mas objetivas con mas programas y con muchos mas archivos.
Merci.
:)
|
No hay comentarios:
Publicar un comentario