第2天|16天搞定Python数据分析,Numpy有鸟用?
数据分析的用处,咱就不再多说了,反正有用没有,都是老板说了算。身为程序员的我们,重点关注的是,如何用编程语言(这里用Python),实现让老板一目了然的数据效果。
数据效果,在管理系统中,常常表现为数据表格和图形,外加点动画。没有图表的管理系统,在这个看颜值的时代,会显得苍白无力,会让人远离。
别的就不多说了,我截两张后台管理系统的界面给你看一下,你就知道我在说什么了。
有一点,我必须说一下,这个是后台Web管理系统来的,后面我也会分享的,老铁,请不要着急。我分享这两张图,主要是想告诉你,里面的数据源,是以数组的形式填充的。
认真学过《第6天 | 12天搞定Python,数据结构(上) 》和《第6天 | 12天搞定Python,数据结构(下) 》朋友,应该知道,在Python数据结构中,是没有数组这个容器的,但数组在开发过程中,确实常用的,于是就有了Numpy。
2.1 安装Numpy
NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。安装依然用pip或pip3命令。为了加快下载速度,我们使用清华的镜像就可以了。
用pip/pip3 install numpy -i
https://pypi.tuna.tsinghua.edu.cn/simple
稍等片刻,就安装好了,咱离图表实现又近一步了。
2.2 创建数组
数组有一维和多维,常用的有一维和二维。有一点要注意,数组不同于其他数据结构,数组的内容只能是同一种数据类型,比如全是整型,全是字符串,全是元组。
import numpy as np
# 创建一维整型数组
a = np.array([1, 2, 3])
print(a)
# 二维数组
b = np.array([["老陈", "编程"], ["Python", "Java"]])
print(b)
# 矩阵
c = np.array([[1, 2, 3], [4, 5, 6], [8, 9, 10]])
print(c)
# 行转列
print(c.T)
# 数组以0填充
x = np.zeros((3,), dtype=np.int)
print(x)
# 数组以1填充y
y = np.ones(3, dtype=int)
print(y)
# 生成数组系列,这个用法同之前的range类似
z = np.arange(1, 5)
print(z)
# 列表转成数组
x = [7, 8, 9]
a = np.asarray(x)
print(a)
# 元组转成数组
x = (5, 6, 7)
a = np.asarray(x)
print(a)
输出结果
[1 2 3]
[['老陈' '编程']
['Python' 'Java']]
[[ 1 2 3]
[ 4 5 6]
[ 8 9 10]]
[[ 1 4 8]
[ 2 5 9]
[ 3 6 10]]
[0 0 0]
[1 1 1]
[1 2 3 4]
[7 8 9]
[5 6 7]
2.3 数组访问
数组可通过下标、切片、索引等方式进行访问,这跟之前学Python基础知识并没有多大区别。循环迭代元素,也是类似的。
import numpy as np
"""
数组访问
"""
a = np.arange(1, 11)
# 用索引进行访问
s = slice(1, 3)
print(a[s])
# 切片,Python基础语法来的
b = a[2:7:3]
print(b)
# 用下标访问
i = a[2]
print(i)
# 这个新的语法,重点注意一下
a = np.array([[1, 2, 3], [3, 4, 5], [6, 7, 8]])
# 第2列元素
print(a[..., 1])
# 第2行元素
print(a[1, ...])
# 第2列及剩下的所有元素
print(a[..., 1:])
# 按坐标轴的方式获取:(0,0),(1,1)和(2,0)位置处的元素。
y = a[[0, 1, 2], [0, 1, 0]]
print(y)
# 过滤值
print(a[a > 6])
# 循环输出
for x in np.nditer(a):
print(x, end=", ")
输出结果
[2 3]
[3 6]
3
[2 4 7]
[3 4 5]
[[2 3]
[4 5]
[7 8]]
[1 4 6]
[7 8]
1, 2, 3, 3, 4, 5, 6, 7, 8,
2.4 数组操作
数组维度,可按需求进行调整和切割,可去掉重复的元素,可删除不需要的内容。在实现功能时,我不太喜欢说那么多,只想安静地敲代码。建议你也多多敲代码。
import numpy as np
print("---------维度调整---------")
a = np.arange(10)
# 输出维度数
print(a.ndim)
a = np.array([[4, 2, 3], [6, 5, 8]])
# 行数和列数
print(a.shape)
# 调整行数和列数
a.shape = (3, 2)
print(a)
# 还可以通过reshape调整
b = a.reshape(3, 2)
print(b)
print("-----------数组分割------------")
print("分割成3个相同的数组")
b = np.split(a, 3)
print(b)
print("按指定位置进行分割")
b = np.split(a, [3, 3])
print(b)
print("-----------添加元素------------")
np.append(a, [9, 10, 11], axis=None)
print(a)
# 插入元素
print(np.insert(a, 1, 11, axis=1))
print("-----------删除元素------------")
# 去掉重复值
u = np.unique(a)
print(u)
# 删除元素
print(np.delete(a, 5))
输出结果
---------维度调整---------
1
(2, 3)
[[4 2]
[3 6]
[5 8]]
[[4 2]
[3 6]
[5 8]]
-----------数组分割------------
分割成3个相同的数组
[array([[4, 2]]), array([[3, 6]]), array([[5, 8]])]
按指定位置进行分割
[array([[4, 2],
[3, 6],
[5, 8]]), array([], shape=(0, 2), dtype=int64), array([], shape=(0, 2), dtype=int64)]
-----------添加元素------------
[[4 2]
[3 6]
[5 8]]
[[ 4 11 2]
[ 3 11 6]
[ 5 11 8]]
-----------删除元素------------
[2 3 4 5 6 8]
[4 2 3 6 5]
2.5 数组函数
为了方便数组的操作,在NumPy中,提供了跟Python内置函数一样的功能,如去掉空格,大小写转换,获取最大值、最小值等。
import numpy as np
a = ["老陈"]
b = ["说编程"]
c = np.char.add(a, b)
print(c)
# 开头转成大写字母
print(np.char.capitalize("good"))
# 每个单词开头转成大写字母
print(np.char.title('i like python.'))
# 四舍五入
a = np.array([3.1, 6.66, 153, 0.782, 28.356])
print(np.around(a, decimals=1))
# 最小值
print(np.amin(a))
# 最大值
print(np.amax(a))
# 最大值-最小值
print(np.ptp(a))
# 排序
x = np.array([6, 4, 5])
print(np.sort(x))
a = np.array([[3, 8], [6, 2]])
print(np.sort(a))
# 过滤条件,保留剩下的,成为一维数组
y = np.where(a > 5)
print(a[y])
输出结果
['老陈说编程']
Good
I Like Python.
[ 3.1 6.7 153. 0.8 28.4]
0.782
153.0
152.218
[4 5 6]
[[3 8]
[2 6]]
[8 6]
好了,有关Numpy常用的内容,老陈讲完了,如果觉得对你有所帮助,希望老铁能转发点赞,让更多的人看到这篇文章。你的转发和点赞,就是对老陈继续创作和分享最大的鼓励。
一个当了10年技术总监的老家伙,分享多年的编程经验。想学编程的朋友,可关注今日头条:老陈说编程。分享Python,前端(小程序)、App和嵌入式方面的干货。关注我,没错的。