domingo, 2 de enero de 2011

Analizando las 130 mil obras del Gobierno (Parte I)

Como todos ya saben, la tan promocionada página de las 130 mil obras que tanto ha promocionado últimamente el Gobierno peruano recopila lo invertido por el Estado entre los periodos comprendidos entre el 2006 y el 2009. sin embargo, analizar todos estos datos desde la misma página web se convierte en una tarea tediosa y casi de hacer.

Y digo casi porque en tres días, trabajando en mis ratos libres, he podido descargar todo el contenido y pasarlo a un archivo para mysql y otro archivo de texto con separación de tabulaciones, para que los no programadores lo puedan analizar en Excel. Se van a llevar sorpresas y van a darse cuenta de las mentiras de los encargados de dicho sistema, es más, llamarle obras a cosas que no deberían llamárseles obras es el colmo de los casos.

El único inconveniente es que mis scripts me arrojan resultados diferentes. El archivo de texto con separación de tabulaciones tiene 126 315 registros, pero el archivo mysql contienen 126 629 registros, una diferencia de 314... para mis análisis voy a utilizar el archivo mysql... convertir el archivo mysql texto separado con tabulaciones va a ser una tarea adicional, pero estoy algo frustrado por lo de mis scripts.


Herramientas utilizadas

Para comenzar, no soy muy metido en la programación. Trabajo principalmente en plataformas Windows y el Visual Studio apenas lo conozco. Más he estado inmerso en la programación web trabajando con editores simples en Html, Javascript, Php, Mysql. No trabajo con Objetos (gran debilidad mía) pero varios de mis trabajos los he realizado de forma artesanal...

Para hacer esta tareita he utilizado:

Active Perl. El interprete/compilador gratuito que se puede utilizar en Windows, tanto en línea de comandos y como si se tratase de algún Visual Basic Script.


Scintillia: Algunos preferirán Notepad++ pero el Scite no me ha arrojado errores cuando se trata de abrir archivos inmensos.


Mozilla Firefox 3.6.13: El navegador de toda mi vida y en el que tengo instalado mis extensiones favoritas como el Web Developer y Firebug.

En mis siguientes posts voy a liberar la información para que otras personas puedan hacer lo que quieran...

Buscar:

Se ha producido un error en este gadget.