Python数据预处理(三) 数据运算
import pandas as pd
df=pd.read_excel(r'd:\mypythontest\sales.xlsx',sheet_name=0)
print(df)
df['合计']=df['Sale2013']+df['Sale2014']+df['Sale2015']+df['Sale2016']
print(df)
print(df.at[0,'Sale2013']>df.at[1,'Sale2014']) #单元格比较
print(df['Sale2013']<df['Sale2014']) #全列比较
print(df.count()) #所有列非空单元格的个数
print(df.count(axis=1)) #所有行非空单元格的个数
print(df['Sale2013'].count()) #指定列非空单元格的个数
print(df.sum()) #所有列求和
print(df.sum(axis=1)) #所有行求和
print(df['Sale2013'].sum()) #指定列求和
print(df.mean()) #求每列的平均值
print(df['Sale2013'].mean()) #求指定列的平均值
print(df.mean(axis=1)) #求每行平均值
print(df.max(axis=1)) #求每行的最大值
print(df.max()) #求每列的最大值
print(df.min(axis=1)) #求每行的最小值
print(df.min()) #求每列的最小值
print(df.median(axis=1)) #求每行的中位数
print(df.median()) #求每列的中位数
print(df.mode(axis=1)) #求每行的众数
print(df.mode()) #求每列的众数
print(df.var(axis=1)) #求每行的方差
print(df.var()) #求每列的方差
print(df.std(axis=1)) #求每行的标准差
print(df.std()) #求每列的标准差
print(df.quantile(0.5)) #求每列的二分之一分位数
print(df.quantile(0.5,axis=1)) #求每行的二分之一分位数
print(df['Sale2013'].corr(df['Sale2014'])) #求两列之间的相关性--皮尔逊相关系数
print(df.corr()) #所有数值列两两之间的相关系数