Python数据预处理(三) 数据运算

liftword2个月前 (03-30)技术文章11

import pandas as pd

df=pd.read_excel(r'd:\mypythontest\sales.xlsx',sheet_name=0)

print(df)

df['合计']=df['Sale2013']+df['Sale2014']+df['Sale2015']+df['Sale2016']

print(df)

print(df.at[0,'Sale2013']>df.at[1,'Sale2014']) #单元格比较

print(df['Sale2013']<df['Sale2014']) #全列比较

print(df.count()) #所有列非空单元格的个数

print(df.count(axis=1)) #所有行非空单元格的个数

print(df['Sale2013'].count()) #指定列非空单元格的个数

print(df.sum()) #所有列求和

print(df.sum(axis=1)) #所有行求和

print(df['Sale2013'].sum()) #指定列求和

print(df.mean()) #求每列的平均值

print(df['Sale2013'].mean()) #求指定列的平均值

print(df.mean(axis=1)) #求每行平均值

print(df.max(axis=1)) #求每行的最大值

print(df.max()) #求每列的最大值

print(df.min(axis=1)) #求每行的最小值

print(df.min()) #求每列的最小值

print(df.median(axis=1)) #求每行的中位数

print(df.median()) #求每列的中位数

print(df.mode(axis=1)) #求每行的众数

print(df.mode()) #求每列的众数

print(df.var(axis=1)) #求每行的方差

print(df.var()) #求每列的方差

print(df.std(axis=1)) #求每行的标准差

print(df.std()) #求每列的标准差

print(df.quantile(0.5)) #求每列的二分之一分位数

print(df.quantile(0.5,axis=1)) #求每行的二分之一分位数

print(df['Sale2013'].corr(df['Sale2014'])) #求两列之间的相关性--皮尔逊相关系数

print(df.corr()) #所有数值列两两之间的相关系数

相关文章

整理一份详细的数据预处理方法

数据预处理的主要步骤分为:数据清理、数据集成、数据规约和数据变换。本文将从这四个方面详细的介绍具体的方法。如果在一个项目中,你在这几个方面的数据处理做的都很不错,对于之后的建模具有极大的帮助,并且能快...

机器学习入坑指南(二):数据预处理

机器学习初步:数据预处理机器学习离不开大量的数据。在对这些数据进行分析前,我们先学习一下在 Python 中如何导入数据并对它进行预处理。1 导入需要的库利用 Python 进行数据分析所必须的库有两...

使用PandasGUI进行探索性数据分析

Pandasgui是一个开源的python模块,它为pandas创建了一个GUI界面,我们可以在其中使用pandas的功能分析数据和使用不同的功能,以便可视化和分析数据,并执行探索性数据分析。探索性数...

DeepSeek多格式文档处理实战指南:从Markdown到Word表格预处理

一、Markdown与HTML文件的天然优势解析1. 结构解析的正确率实证在医疗信息化场景的实战测试中,DeepSeek对Markdown文件的字段识别准确率达到98.7%,HTML文件解析准确率则为...

Python 数据可视化:使用 Matplotlib 和 Pandas 实现动态数据分析

一、引言在当今时代,数据可视化已经成为数据处理和分析的重要手段。通过将数据以图形的形式呈现,我们可以更直观地理解数据,发现数据之间的关联,以及预测未来的趋势。Python 作为一种广泛应用于数据分析和...