que hay geeks?!
Hoy vamos a ver como configurar Python y el tratamiento de datos de un Data Science
Python y Data Science
Lo primero que haremos es crear un entorno virtual para tener las dependencias instaladas de este proyecto. Para ello, crearemos una carpeta para nuestro proyecto y dentro de la carpeta, instalaremos virtualenvwrapper ejecutando
1 | sudo pip3 install virtualenv |
Y creamos nuestro entorno virtual
1 | virtualenv data-science |
Una vez instalado todo lo necesario, iniciamos nuestro entorno virtual. Para ello nos vamos a la raíz de nuestro documento, ejecutamos
1 2 3 4 5 | // Para activar el entorno virtual source bin/activate // Para desactivarlo deactivate |
Con el entorno activo, instalaremos dos librerías más, jupyter y pandas.
1 2 | // Instalamos jupiter pip3 install jupyter |
Con jupiter instalado, lanzamos la aplicación notebook debería de abrirse nuestro navegador
1 2 | // Iniciar Jupiter jupyter notebook |
En nuestro navegador, vamos a la carpeta que pone ‘pokemon’ y seguiremos los pasos de ejecución de cada línea.
Una vez instalemos pandas, podemos ir ejecutando distintos tipos de comandos para extraer y tratar la información.
Estos son los primeros pasos que vamos a dar el el tratamiento de datos con Python.