Python里for循环要遍历的数据很多很大怎么办?

liftword4个月前 (12-19)技术文章59

#春日生活打卡季#

首先面对这个问题,对于初学者来说了解基础的数据结构是非常重要的。掌握了数据结构在去分析相应的程序执行效率,这才是学编程的第一步。



在《数据结构》这门学科中,栈、队列属于是逻辑结构,其他属于是存储结构,在我们日常生活或者工作中都会用到这几种数据结构,比如扑克牌的洗牌和发牌就是顺序堆栈的应用,学好《数据结构》这门课不仅仅可以提高知识的认知,还可以提高对某一事物的思考,提供更多的思维方式。

任何一门编程语言都要在《数据结构》的基础上进行开发语言设计。Python也是一样的,要搞明白Python如何处理大量的循环数据,就要明白Python有哪些数据结构以及如何使用它。



最难的事,就是遗忘简单的动作,把简单的事重复做到极致,就是量变到质变的过程。Python的学习也是一样的,知识很简单,但是长时间不用,不去思考,过个三年五载这些知识就会被忘记了,往往就是捡了玉米丢了芝麻,那么Python里for循环要遍历的数据很大如何处理呢?接下来,就让我们一起去了解每一个数据结构的语法特性吧。

String和Number

  • String
# 记录开始时间

sstart_time = time.time()

# 字符串

string = "01234579"

for s in string:

print(s)

# 记录结束时间

send_time = time.time()

# 计算并打印执行时间

sexecution_time = send_time - sstart_time

print(f"string executed in {sexecution_time:4f}s")

采用字符串的方式,for循环数据,通过下图



可以得知,字符串类型,十个字符的执行时间为0.000724s.

  • Number
# 记录开始时间

istart_time = time.time()

# number

for n in range(0,10):

print(n)

# 记录结束时间

iend_time = time.time()

# 计算并打印执行时间

iexecution_time = iend_time - istart_time

print(f"number executed in {iexecution_time:4f}s")

数值类型的方式,for循环数据,通过下图



可以得知,数值类型,从0-9十个数字的执行时间为0.000686s

可以看出整形占24个字节、字符串占49个字节

# 整型

print(sys.getsizeof(0)) # 在32位机器上通常是24个字节,64位机器上是28个字节

print(sys.getsizeof(""))


在处理整形数据的时候使用了range()函数返回的是一个可迭代对象(类型是对象),而不是列表类型, 所以打印的时候不会打印列表。是不是可以理解以后所有的数据都可以通过字符串类型来遍历数据呢?!字符串虽然使用方法简单,但是有它的不方便之处。如果相对简单的数据,可以采用字符串来使用,如果涉及到复杂的数据,字符串就没办法应对了,就需要转换成其他数据类型了,比如如下程序:

string = "0,1,2,3,4,5,7,8,9,10"

string_split = string.split(",") # 拆分成字符串列表

for s in string_split:

print(s)


面对复杂的数据类型,字符串就没办法处理,就需要转换成列表了。那么列表和元组我们如何看待呢?

列表和元组

  • 列表
import time

import sys

# 记录开始时间

lstart_time = time.time()

# 列表

lists = list(range(10))

for l in lists:

print(l)

# 记录结束时间

lend_time = time.time()

# 计算并打印执行时间

lexecution_time = lend_time - lstart_time

print(f"list executed in {lexecution_time:4f}s")

列表作为常用的数据类型,通过程序执行可以看出



列表类型,从0-9十个数字的执行时间为0.000987s

  • 元组
# 记录开始时间

tstart_time = time.time()

# 元组

tuple = (0,1,2,3,4,5,6,7,8,9)

for t in tuple:

print(t)

# 记录结束时间

tend_time = time.time()

# 计算并打印执行时间

texecution_time = tend_time - tstart_time

print(f"tuple executed in {texecution_time:4f}s")

元组作为一个基础的数据类型,通过程序的执行



可以看出,执行的效率时0.000502s

通过本次的结果验证tuple>range>string>list当然这个结果并不是唯一的,真实开发环境下,还要服务器性能问题以及时间复杂度问题。如果你对人工智能有所了解你会发现矩阵的表现形式其实就是tuple类型。

在真实开发中可能会考虑数据的完整性问题,会考虑使用集合、字典、生成器、迭代器等,这些都是在Python中常用的处理大数据的方法,当然也可以采用并发操作,优化程序的时间复杂度,以及借助Cython的方式编写C语言的扩展,这些内容由于时间的问题,不会讲解,在余后的时间内会娓娓给大家道来的。

相关文章

python列表的长度及遍历 python中列表长度的函数

在 Python 中,可以使用 len() 函数来获取一个列表的长度,并使用 [] 运算符来创建一个列表。例如:python# 创建一个列表my_list = [1, 2, 3, 4, 5]# 访问列...

Python 中的列表推导式详解 python列表讲解

· 在 Python 中,列表推导式是一种简洁而富有表现力的方式,通过以紧凑的语法指定元素和条件来创建数据结构,如列表、字典和集合,通常使用单行代码,而不是使用传统的循环和附加操作。 在 Python...

某校教务管理系统post分析,Python实现自动查询成绩并发送短信

前言本人是一名大三大学生,考完试不久,由于自己不知道期末考试什么时候出考试成绩,并且每次查询成绩特别麻烦(首先得登录VPN连接学校内网,然后再登录教务管理系统,再进入查询界面,点击查询成绩等,相信各位...

python 列表list()创建方法下标与生成式遍历

1. 概念2. 创建3. 特点4. 下标/索引5. 列表生成式6. 列表的遍历概念:一个有序的、可变的数字存储容器。图示:创建:创建:中括号标识 [ ] ,元素用逗号分隔赋值创建:a = [ 1,2,...