domingo, 23 de abril de 2017

Como criar uma crosstable utilizando Python Pandas?

Um exemplo de como utilizar o Pandas para formatar os dados criando uma tabela de referência cruzada:

import pandas as pd

dados = pd.read_csv("arquivo.csv")

dados.describe()

nfocos_ref  nfocos_atnpp  nf_aqua_terra  julianday  ano
count  366.000000  366.000000  366.000000  366.000000  366.0
mean  6.344262  52.486339  11.292350  183.500000  2016.0
std  11.279588  88.889148  18.364328  105.799338  0.0
min  0.000000  0.000000  0.000000  1.000000  2016.0
25%  0.000000  0.000000  0.000000  92.250000  2016.0
50%  0.000000  8.500000  2.000000  183.500000  2016.0
75%  8.000000  62.750000  15.000000  274.750000  2016.0
max  68.000000  546.000000  117.000000  366.000000  2016.0

pv=dados.pivot_table(index='ano', columns='julianday', values='nfocos_atnpp',aggfunc='sum')

ano/julianday  1  2  3  4  5  6  7  8  9  10
1998    NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN
1999    0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0
2009    0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  2.0  2.0 
 
O links para a documentação oficial é:
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.crosstab.html