Python数据分析大杀器之Numpy详解

liftword3个月前 (12-20)技术文章38

numpy 基础

NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。在我们数据分析时,方便我们进行数据的基本处理,并且它的速度很快。本文介绍一下numpy的基础用法,如果想要全面的学习numpy,可以参考numpy官方文档

首先导入numpy包,如果没有需要提前安装

pip install numpy

import numpy as np

?1.数组对象

我们可以使用np.arange()函数创建数组对象

首先我们创建一个一维数组

arr1 = np.arange(10)
arr1
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

使用type()查看arr1的类型

type(arr1)
numpy.ndarray

可以看出arr1的数据类型是ndarry

下面再来查看一下这个数组纬度的个数,数组纬度,和数组个数以及数组元素的类型

arr1.ndim
1

说明是一维数组

arr1.shape
(10,)

说明数组是(10,)的

arr1.size
10

数组一共有十个元素

arr1.dtype
dtype('int32')

说明数组的元素都是int32类型的

2.使用numpy创建多维数组

上面我们介绍了数组对象的基本使用,在numpy中,有多重方式可以创建数组对象,上面我们使用了np.arange(),下面我们看一下如何使用其他方法创建多维数组

下面这个两个代码返回结果一样
arr2 = np.array([1,2,3])
arr3 = np.arange(1,4)
arr2 == arr3
array([ True, True, True])

创建二维数组

arr4 = np.array([[1,2,3],[4,5,6]])
arr4
array([[1, 2, 3],
[4, 5, 6]])

创建3*3的零数组

np.zeros((3,3))
array([[0., 0., 0.],
[0., 0., 0.],
[0., 0., 0.]])

创建一个3*3的1数组

np.ones((3,3))
array([[1., 1., 1.],
[1., 1., 1.],
[1., 1., 1.]])

创建一个3*3的单位阵

np.eye(3)
array([[1., 0., 0.],
[0., 1., 0.],
[0., 0., 1.]])

使用dtype参数在定义数组时定义元素类型

np.eye(3,dtype='float')
array([[1., 0., 0.],
[0., 1., 0.],
[0., 0., 1.]])

生成指定值的3*3数组

np.full((3,3),fill_value=5)
array([[5, 5, 5],
[5, 5, 5],
[5, 5, 5]])

numpy定义数组的主要函数如下

3.多维数组数据类型

3.1 查看数据类型


4.numpy数组运算

4.1 数组相加



a = np.array([[0.0,0.0,0.0],[10.0,10.0,10.0],[20.0,20.0,20.0],[30.0,30.0,30.0]])
b = np.array([1.0,2.0,3.0])
print('第一个数组:')
print(a)
print('\n第二个数组:')
print(b)
print('\n第一个数组加第二个数组:')
print(a + b)
第一个数组:
[[ 0. 0. 0.]
[10. 10. 10.]
[20. 20. 20.]
[30. 30. 30.]]
第二个数组:
[1. 2. 3.]
第一个数组加第二个数组:
[[ 1. 2. 3.]
[11. 12. 13.]
[21. 22. 23.]
[31. 32. 33.]]

从上述结果可以看出,这两个数组的纬度并不相同,但是他们具有相同的列,此时,触发广播机制,第二个数组默认重复。其具体工作原理可以看一下下面这张图

注意:广播机制也不是任意两个数组都能触发的,例如下面这个例子

a = np.array([[0.0,0.0,0.0],[10.0,10.0,10.0],[20.0,20.0,20.0],[30.0,30.0,30.0]])
b = np.array([1.0,2.0])
a+b
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
Input In [23], in <cell line: 3>()
1 a = np.array([[0.0,0.0,0.0],[10.0,10.0,10.0],[20.0,20.0,20.0],[30.0,30.0,30.0]])
2 b = np.array([1.0,2.0])
----> 3 a+b
ValueError: operands could not be broadcast together with shapes (4,3) (2,)

此时报错了,这是因为a数组是(4,3),b数组是(2,)

6.基础索引和切片

numpy索引是中返回某一个给定位置的元素,切片是返回一个数组形式

通过下面这张图具体看一下切片的原理



下面我们通过一些实际例子来说明如何使用切片和索引

arr = np.arange(10)
print(arr)
print(arr[5])#返回数组的第六个元素

print(arr[5:8])# 返回数组的第6,7,8个元素,并返回数组

print(arr[1:6:2])#返回索引为1-6的元素,以2为步长
[0 1 2 3 4 5 6 7 8 9]
5
[5 6 7]
[1 3 5]

上述我们可以看出numpy中基础索引和切片的使用方法,基本和python的list用法一样,
下面我们看一下在多维数组情况下是如何使用的

二维数组情况下索引返回一个一维数组,切片返回一个二维数组


小编有点累后续知识晚点更新~


特此备注一下:也祝大家五一快乐,小编在此也送波福利(编程所有语言教程及附源码)

已设置好自动回复私信回复1 就可以啦~

已设置好自动回复私信回复1 就可以啦~

已设置好自动回复私信回复1 就可以啦~

(重要的事情说三遍)

相关文章

第6天|16天搞定Python数据分析,Pandas读数据

在进行数据分析时,用随机生成的数据,其实并没有多大的意义。有意义的数据,大多数是存在数据库(db)、文件(excel等),还有就是网络(html、json或xml)中的。有关文件的操作和解析,在学习P...

Python 数据工程全解析:从基础到实战

Python 数据工程学习指南在数据工程领域,Python 出色的滑稳性和存在大量充实的库,让它成为举象实施数据工程的重要选择。本文将从下列方面总结你如何利用 Python 执行大规模数据处理:1....

&quot;Python数据分析基石:Pandas全方位解析(史上最全面!)&quot;

pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快...

Python如何实现对Excel表格数据的分析处理?

在Python中提供了很多的用来处理和分析Excel表格数据的依赖库,比较常见的有pandas用于数据分析和处理,或者是用于读取Excel文件的openpyxl和xlrd,其中openpyxl适用于....

Pandas:一个高性能的数据分析Python库

前言Pandas是Python中一个非常强大的数据分析工具,它提供了丰富的数据处理和操作功能,可以快速高效地处理和转换数据。Pandas支持多种格式的数据输入和输出,包括CSV、Excel、JSON、...

Python常用的10种数据分析图表-Seaborn篇

内置示例数据集seaborn内置了十几个示例数据集,通过load_dataset函数可以调用。 其中包括常见的泰坦尼克、鸢尾花等经典数据集。# 查看数据集种类 import sea...