Python数据分析大杀器之Numpy详解
numpy 基础
NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。在我们数据分析时,方便我们进行数据的基本处理,并且它的速度很快。本文介绍一下numpy的基础用法,如果想要全面的学习numpy,可以参考numpy官方文档
首先导入numpy包,如果没有需要提前安装
pip install numpy
import numpy as np
?1.数组对象
我们可以使用np.arange()函数创建数组对象
首先我们创建一个一维数组
arr1 = np.arange(10)
arr1
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
使用type()查看arr1的类型
type(arr1)
numpy.ndarray
可以看出arr1的数据类型是ndarry
下面再来查看一下这个数组纬度的个数,数组纬度,和数组个数以及数组元素的类型
arr1.ndim
1
说明是一维数组
arr1.shape
(10,)
说明数组是(10,)的
arr1.size
10
数组一共有十个元素
arr1.dtype
dtype('int32')
说明数组的元素都是int32类型的
2.使用numpy创建多维数组
上面我们介绍了数组对象的基本使用,在numpy中,有多重方式可以创建数组对象,上面我们使用了np.arange(),下面我们看一下如何使用其他方法创建多维数组
下面这个两个代码返回结果一样
arr2 = np.array([1,2,3])
arr3 = np.arange(1,4)
arr2 == arr3
array([ True, True, True])
创建二维数组
arr4 = np.array([[1,2,3],[4,5,6]])
arr4
array([[1, 2, 3],
[4, 5, 6]])
创建3*3的零数组
np.zeros((3,3))
array([[0., 0., 0.],
[0., 0., 0.],
[0., 0., 0.]])
创建一个3*3的1数组
np.ones((3,3))
array([[1., 1., 1.],
[1., 1., 1.],
[1., 1., 1.]])
创建一个3*3的单位阵
np.eye(3)
array([[1., 0., 0.],
[0., 1., 0.],
[0., 0., 1.]])
使用dtype参数在定义数组时定义元素类型
np.eye(3,dtype='float')
array([[1., 0., 0.],
[0., 1., 0.],
[0., 0., 1.]])
生成指定值的3*3数组
np.full((3,3),fill_value=5)
array([[5, 5, 5],
[5, 5, 5],
[5, 5, 5]])
numpy定义数组的主要函数如下
3.多维数组数据类型
3.1 查看数据类型
4.numpy数组运算
4.1 数组相加
a = np.array([[0.0,0.0,0.0],[10.0,10.0,10.0],[20.0,20.0,20.0],[30.0,30.0,30.0]])
b = np.array([1.0,2.0,3.0])
print('第一个数组:')
print(a)
print('\n第二个数组:')
print(b)
print('\n第一个数组加第二个数组:')
print(a + b)
第一个数组:
[[ 0. 0. 0.]
[10. 10. 10.]
[20. 20. 20.]
[30. 30. 30.]]
第二个数组:
[1. 2. 3.]
第一个数组加第二个数组:
[[ 1. 2. 3.]
[11. 12. 13.]
[21. 22. 23.]
[31. 32. 33.]]
从上述结果可以看出,这两个数组的纬度并不相同,但是他们具有相同的列,此时,触发广播机制,第二个数组默认重复。其具体工作原理可以看一下下面这张图
注意:广播机制也不是任意两个数组都能触发的,例如下面这个例子
a = np.array([[0.0,0.0,0.0],[10.0,10.0,10.0],[20.0,20.0,20.0],[30.0,30.0,30.0]])
b = np.array([1.0,2.0])
a+b
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
Input In [23], in <cell line: 3>()
1 a = np.array([[0.0,0.0,0.0],[10.0,10.0,10.0],[20.0,20.0,20.0],[30.0,30.0,30.0]])
2 b = np.array([1.0,2.0])
----> 3 a+b
ValueError: operands could not be broadcast together with shapes (4,3) (2,)
此时报错了,这是因为a数组是(4,3),b数组是(2,)
6.基础索引和切片
numpy索引是中返回某一个给定位置的元素,切片是返回一个数组形式
通过下面这张图具体看一下切片的原理
下面我们通过一些实际例子来说明如何使用切片和索引
arr = np.arange(10)
print(arr)
print(arr[5])#返回数组的第六个元素
print(arr[5:8])# 返回数组的第6,7,8个元素,并返回数组
print(arr[1:6:2])#返回索引为1-6的元素,以2为步长
[0 1 2 3 4 5 6 7 8 9]
5
[5 6 7]
[1 3 5]
上述我们可以看出numpy中基础索引和切片的使用方法,基本和python的list用法一样,
下面我们看一下在多维数组情况下是如何使用的
二维数组情况下索引返回一个一维数组,切片返回一个二维数组
小编有点累后续知识晚点更新~
特此备注一下:也祝大家五一快乐,小编在此也送波福利(编程所有语言教程及附源码)
已设置好自动回复私信回复1 就可以啦~
已设置好自动回复私信回复1 就可以啦~
已设置好自动回复私信回复1 就可以啦~
(重要的事情说三遍)