Python用pandas 处理 CSV文件 三(python pandas处理csv数据)

liftword16小时前技术文章1

回顾一下前面CSV处理的知识

文章 1 Python处理CSV文件

文章2 Python处理CSV 之 二

pandas工具作为数据分析中的利器也可以处理CSV文件


  • 安装pandas
 pip install pandas
  • 创建一个CSV文件 内容如下,这是一批刚入职的员工信息
Name,Hire Date,Salary,Sick Days remaining
Graham Chapman,03/15/14,50000.00,10
John Cleese,06/01/15,65000.00,8
Eric Idle,05/12/14,45000.00,10
Terry Jones,11/01/13,70000.00,3
Terry Gilliam,08/12/14,48000.00,7
Michael Palin,05/23/13,66000.00,8


读取CSV文件

import pandas
df = pandas.read_csv('hrdata.csv')
print(df)
           Name Hire Date   Salary  Sick Days remaining
0  Graham Chapman  03/15/14  50000.0                   10
1     John Cleese  06/01/15  65000.0                    8
2       Eric Idle  05/12/14  45000.0                   10
3     Terry Jones  11/01/13  70000.0                    3
4   Terry Gilliam  08/12/14  48000.0                    7
5   Michael Palin  05/23/13  66000.0                    8

可以看到每一行有一个索引,从 0 开始到行数-1

获取所有的姓名

print(df["Name"])
0    Graham Chapman
1       John Cleese
2         Eric Idle
3       Terry Jones
4     Terry Gilliam
5     Michael Palin
Name: Name, dtype: object

指定索引

import pandas
df = pandas.read_csv('hrdata.csv', index_col='Name')
print(df)
# print(df["Name"])  会报错
print(df["Salary"])
  • print(df) 的结果: index_col='Name' 指定了索引列此时每一行的数字变成了Name
               Hire Date   Salary  Sick Days remaining
Name                                                  
Graham Chapman  03/15/14  50000.0                   10
John Cleese     06/01/15  65000.0                    8
Eric Idle       05/12/14  45000.0                   10
Terry Jones     11/01/13  70000.0                    3
Terry Gilliam   08/12/14  48000.0                    7
Michael Palin   05/23/13  66000.0                    8

print(df["Name"] 会报错:

print(df["Name"])
  • print(df["Salary"])


Name
Graham Chapman    50000.0
John Cleese       65000.0
Eric Idle         45000.0
Terry Jones       70000.0
Terry Gilliam     48000.0
Michael Palin     66000.0
Name: Salary, dtype: float64

获取第一个人的往期时间

print(df['Hire Date'][0])
  • df['Hire Date'] 取日期列的所有数字变成一个数组
  • df['Hire Date'][0] 取数组的第一个元素
在Excelt很容易表示这个过程,选选中第二列的所有数据,然后取第一个

读取CSV中部分列


import pandas
df = pandas.read_csv('hrdata.csv', 
            index_col='Employee', 
            parse_dates=['Hired'], 
            header=0, 
            names=['Employee', 'Hired','Salary', 'Sick Days'])
print(df)
                    Hired   Salary  Sick Days
Employee                                     
Graham Chapman 2014-03-15  50000.0         10
John Cleese    2015-06-01  65000.0          8
Eric Idle      2014-05-12  45000.0         10
Terry Jones    2013-11-01  70000.0          3
Terry Gilliam  2014-08-12  48000.0          7
Michael Palin  2013-05-23  66000.0          8
  • index_col='Employee', Employee实际上代码的是 Name的值
  • parse_dates=['Hired'], 处理第二列日期
  • header=0, 表示第0行是标题头,剩下行是数据
  • names=['Employee', 'Hired','Salary', 'Sick Days']) 要显示的列名


相关文章

使用python把csv汇总成excel(python怎么将csv文件中的列存入列表)

最近领导安排让我每周定时把grafana导出的csv文件进行统计汇总工作,需要处理的csv文件还是蛮多的,况且还要每周重复汇总处理。干脆写个脚本,每周执行一遍脚本,既方便还不会出错。一、需求分析1....

python爬虫25 | 爬取的数据怎么保存?CSV了解一下

大家好我是小帅b是一个练习时长两年半的练习生喜欢唱!跳!rap!篮球!敲代码!装逼!不好意思我又走错片场了接下来的几篇文章小帅b将告诉你如何将你爬取到的数据保存下来有文本文件、redis、数据库(My...

将MySQL查询结果输出为CSV格式的方法

技术背景在数据库管理和数据分析中,我们常常需要将MySQL查询结果以CSV格式输出,方便在其他工具(如Excel、Python数据分析库)中进行进一步处理。然而,由于CSV格式有其特定的规范,如字段分...

Django 如何使用视图动态输出 CSV 以及 PDF

Django 如何使用视图动态输出 CSV 以及 PDF这一篇我们需要用到 python 的 csv 和 reportLab 库,通过django视图来定义输出我们需要的 csv 或者 pdf 文件。...

Python版的迷你程序——json文件转换为csv

浅话C语言是过去几十年软件和硬件两个阵营之间,签署的最坚实的契约。硬件为C语言的语义提供了最能发挥其性能的基础构件,而软件虽然搞了很多的圆环套圆环般的层次,但最终都以C语言作为最后的沉淀收尾。----...

Python CSV文件的读写和处理(csv python 读取)

一、介绍CSV文件的概念和结构CSV(Comma-Separated Values,逗号分隔值)是一种常见的文本文件格式,用于存储表格数据。CSV 文件以纯文本形式存储数据,使用逗号作为字段之间的分隔...