Apuntes NumPy y Pandas en Python para Big Data

Hola estimado lector, en esta ocasión voy a dejar un par de apuntes de Pandas y NumPy, en la estadística como caso de estudio ponemos el caso de los puestos de trabajo que he hay en España.

Caso a estudiar

El caso a estudiar será la oferta de puestos de trabajo en España, según diferentes gremios que aparecen en gob.datos.es, de diferentes años, acerca de los trabajos más demandados

Puestos de trabajo totales 2012

Por aquí pongo los puestos del trabajo que hay en total, en España 2012:

import pandas as pd
data=pd.read_csv('20141.csv', sep=';',header=1)
data= data.values
arr_name=[]
arr_tot=[]
for d in data:
    if d[0]=='Puestos de trabajo totales' and d[2]==2012 and d[1]!='Total':
        arr_name.append(d[1])
        str=d[3].replace(".","")
        str=str.replace(",", ".")
        arr_tot.append(float(str))
        
import matplotlib.pyplot as plt
 
## Declaramos valores para el eje y, en este caso son categorias
eje_x = arr_name
 
## Declaramos valores para el eje x, ahora son los valores
eje_y = arr_tot
 
## Creamos Gráfica y ponesmos las barras de color verde
plt.barh(eje_x, eje_y, color="green")
plt.ylabel('Numero de Empleados')
plt.xlabel('2012')
plt.title('Puestos de trabajo totales')
plt.show()

Puestos de trabajo totales 2013

Por aquí pongo los puestos del trabajo que hay en total, en España 2013:

import pandas as pd
data=pd.read_csv('20141.csv', sep=';',header=1)
data= data.values
arr_name=[]
arr_tot=[]
for d in data:
    if d[0]=='Puestos de trabajo totales' and d[2]==2013 and d[1]!='Total':
        arr_name.append(d[1])
        str=d[3].replace(".","")
        str=str.replace(",", ".")
        arr_tot.append(float(str))
        
import matplotlib.pyplot as plt
 
## Declaramos valores para el eje y, en este caso son categorias
eje_x = arr_name
 
## Declaramos valores para el eje x, ahora son los valores
eje_y = arr_tot
 
## Creamos Gráfica y ponesmos las barras de color verde
plt.barh(eje_x, eje_y, color="green")
plt.ylabel('Puestos de trabajo totales')
plt.xlabel('2013')
plt.title('Puestos de trabajo totales')
plt.show()

Puestos de trabajo totales 2014

Por aquí pongo los puestos del trabajo que hay en total, en España 2014:

import pandas as pd
data=pd.read_csv('20141.csv', sep=';',header=1)
data= data.values
arr_name=[]
arr_tot=[]
for d in data:
    if d[0]=='Puestos de trabajo totales' and d[2]==2014 and d[1]!='Total':
        arr_name.append(d[1])
        str=d[3].replace(".","")
        str=str.replace(",", ".")
        arr_tot.append(float(str))
        
import matplotlib.pyplot as plt
 
## Declaramos valores para el eje y, en este caso son categorias
eje_x = arr_name
 
## Declaramos valores para el eje x, ahora son los valores
eje_y = arr_tot
 
## Creamos Gráfica y ponesmos las barras de color verde
plt.barh(eje_x, eje_y, color="green")
plt.ylabel('Numero de Empleados')
plt.xlabel('2014')
plt.title('Puestos de trabajo totales')
plt.show()

Puestos de trabajo totales 2015

Por aquí pongo los puestos del trabajo que hay en total, en España 2015:

import pandas as pd
data=pd.read_csv('20141.csv', sep=';',header=1)
data= data.values
arr_name=[]
arr_tot=[]
for d in data:
    if d[0]=='Puestos de trabajo totales' and d[2]==2015 and d[1]!='Total':
        arr_name.append(d[1])
        str=d[3].replace(".","")
        str=str.replace(",", ".")
        arr_tot.append(float(str))
        
import matplotlib.pyplot as plt
 
## Declaramos valores para el eje y, en este caso son categorias
eje_x = arr_name
 
## Declaramos valores para el eje x, ahora son los valores
eje_y = arr_tot
 
## Creamos Gráfica y ponesmos las barras de color verde
plt.barh(eje_x, eje_y, color="green")
plt.ylabel('Numero de Empleados')
plt.xlabel('2015')
plt.title('Puestos de trabajo totales')
plt.show()

Gracias por visitar mi blog de informática, mi nombre es Tomás y soy formador y desarrollador web. Si quiere usted dejarme alguna sugerencia, ayuda o quiere un servicio de formación estoy escuchando ofertas en tomas.gonzalez@infogonzalez.com, en Facebook a https://www.facebook.com/Infogonzalez estoy deseando escucharle. Su duda o sugerencia NO molesta.

1 comentario en «Apuntes NumPy y Pandas en Python para Big Data»

Deja un comentario

Información básica sobre protección de datos Ver más

  • Responsable: Tomas Gonzalez.
  • Finalidad:  Moderar los comentarios.
  • Legitimación:  Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento:  No se ceden o comunican datos a terceros para prestar este servicio.
  • Derechos: Acceder, rectificar y suprimir los datos.
  • Información Adicional: Puede consultar la información detallada en la Política de Privacidad.

Tomas Gonzalez
Este sitio web utiliza cookies, si necesitas más información puedes visitar nuestra política de privacidad    Ver
Privacidad
Creative Commons License
Except where otherwise noted, the content on this site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
A %d blogueros les gusta esto: