用python如何操作表格数据
使用pandas导入excel文件数据,要分析数据,我们要清除如何操作导入的数据,我们才好清洗,分析数据。
我们先学习下读表及简单的操作
我们直接读表吧,不指定表也就不限定啥的,先显示下。
在读的时候,路劲文件名称要一致,我就放在运行的根目录下,方便点。
import pandas as pd
df = pd.read_excel('ce123.xlsx')
print (df.head())
很明显,excel数据已经显示了,虽然数据不多,反正是测试的数据
,如果文件里面很多表格,我们怎么读取第一个表格呢?
我们现在指定读取表格sheet1的数据
import pandas as pd
df = pd.read_excel('ce123.xlsx', sheet_name='Sheet1')#指定第一个表格
print (df.head())
如果我们一张表的东西,我不要全部数据,我要去掉我前面几行,我不想读取
import pandas as pd
df = pd.read_excel('ce123.xlsx', skiprows=2)#跳过前3行
print (df.head())
#print (file_p)#不以文件的格式输出内容
import pandas as pd
df = pd.read_excel('ce123.xlsx', skiprows=1)#跳过前2行
print (df.head())
前面有些数据不多,显示空数据,现在我们去把表格数据增加一点数据
同样的代码,我们再继续运行下
刚刚表格自身添加的数据已经显示出来了。
有的时候,列数据太多,我只要显示我要的列就可以了,我们可以通过指定列读取数据
使用usecols='A,C'读取这两列数据
当然我们也可以使用列索引
usecols=[0, 2]
希望以上能帮到你。