domingo, 2 de enero de 2011

Analizando las 130 mil obras del Gobierno (Parte IV: Palabras finales)

Una tarea algo tediosa pero que ha rendido sus frutos. Lo raro y quizás sea porque haya cometido algún error es que el archivo obras-todo.txt tenga 126314 registros en cambio el script para MySQL muestre 126629 registros... muy raro en ese caso recomendaría que se trabaje con el archivo para MySQL.

Finalmente tenemos, para repetir:

- Webs descargados hacia mi disco duro usando el script en Perl.
- Información extraida de las páginas web y almacenadas en archivos de texto, organizados por región.
- Información compilada en un sólo archivo, con separaciones de tabulación, para Excel.
- Información compilada en un script para MySQL.

- Archivo de texto con separación de tabulaciones convertido a partir del script SQL.

Ahora la siguiente tarea será procesar la información y publicar los resultados. Si quieren hacer una consulta más potente les sugeriría que ejecuten la instrucción ALTER TABLE sobras ADD FULLTEXT KEY (obra) después de cargar el archivo MySQL en la base de datos.

Buscar:

Se ha producido un error en este gadget.