Python 中的 UUID模块:生成唯一标识符

liftword4个月前 (12-17)技术文章72

前言

UUID,全称为Universally Unique Identifier,是一种128位的全局唯一标识符。这个标识符通过一定的算法计算出来,可以保证在一定的空间和时间上的唯一性。在Python中,UUID通常用于生成唯一的标识符,例如数据库表的ID字段、用户账号、订单等。

UUID的生成通常基于MAC地址、时间戳、命名空间、随机数或伪随机数等元素,以保证生成ID的唯一性。在Python中,UUID可以通过内置的uuid模块生成。该模块提供了多种生成UUID的算法,如uuid1()、uuid3()、uuid4()和uuid5()。

UUID的主要作用是让分布式系统中的所有元素都有唯一的辨识信息,避免数据库建立时的名称重复问题。此外,UUID还可以用于短时间内标记一个对象,或者可靠地辨别网络中的持久性对象

一.导入 uuid 模块

import uuid

二.基本用法

1.快速入门

生成 UUID

uuid.uuid4() 方法可以用来生成随机的 UUID。UUID 是一个类似于 xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx 格式的字符串。

import uuid
unique_id = uuid.uuid4()
print(unique_id)
#b8cbc6cd-2cf8-456d-80b1-050321151aad

获取 UUID 的各种形式

通过 hex、int 和 bytes 方法,可以获取 UUID 的不同形式,例如十六进制、整数和字节字符串。

import uuid


unique_id = uuid.uuid4()
        
hex_id = unique_id.hex
int_id = unique_id.int
bytes_id = unique_id.bytes
        
print(hex_id)
print(int_id)
print(bytes_id)
# 868cec4efaba4dbb86df73a08fd31afe
# 178848265901433220483206324019780590334
# b'\x86\x8c\xecN\xfa\xbaM\xbb\x86\xdfs\xa0\x8f\xd3\x1a\xfe'


三.UUID 的不同版本的用法

1.uuid1(): 基于主机和时间的 UUID。

import uuid


unique_id1 = uuid.uuid1()
print(unique_id1)
# e21ba897-ab08-11ee-9282-005056c00008

2.uuid3(): 基于命名空间和名字的 UUID。

用于根据给定的命名空间和名称生成UUID。该函数接受两个参数:命名空间和名称,并返回一个UUID对象。

import uuid  
  
# 定义命名空间和名称  
namespace = uuid.UUID('00000000-0000-0000-0000-000000000000')  
name = 'example'  
  
# 使用uuid3()函数生成UUID  
my_uuid = uuid.uuid3(namespace, name)  
  
# 输出UUID  
print(my_uuid)
# 0b409040-ac26-3ed8-b9d1-65c3178749d1

3.uuid4(): 随机生成的 UUID。

uuid4()函数是uuid模块中的一个方法,用于生成随机UUID。该函数不需要任何参数,并返回一个随机生成的UUID对象。

import uuid
unique_id = uuid.uuid4()
print(unique_id)
#b8cbc6cd-2cf8-456d-80b1-050321151aad


4.uuid5(): 基于命名空间和名字的 UUID,使用 SHA-1 散列算法。

uuid5()函数是用于生成基于SHA-1散列算法的UUID。这个函数需要两个参数:一个命名空间(namespace)和一个名称(name)。命名空间通常是一个已经存在的UUID,而名称是你想要为其生成UUID的字符串。

uuid模块中预定义了几个命名空间常量,包括:

  • uuid.NAMESPACE_DNS:当指定一个DNS名称时使用的命名空间。
  • uuid.NAMESPACE_URL:当指定一个URL时使用的命名空间。
  • uuid.NAMESPACE_OID:当指定一个ISO OID时使用的命名空间。
  • uuid.NAMESPACE_X500:当指定DER或文本输出格式的X.500 DN时使用的命名空间。
import uuid  
  
# 定义一个命名空间,通常使用预定义的UUID,比如DNS命名空间  
namespace = uuid.NAMESPACE_DNS  
name = 'baidu.com'  
  
# 使用uuid5()函数生成UUID  
my_uuid = uuid.uuid5(namespace, name)  
  
# 输出UUID  
print(my_uuid)
# 6121f649-ca8e-5e6f-847d-580647b71c0c


四.实际应用场景

uuid 模块在许多应用中都有着广泛的应用,以下是一些常用场景

  1. 数据库表ID字段:很多数据库表都有唯一标识符字段,用于区分表中的每一行记录。使用UUID作为这些字段的值可以确保数据的全局唯一性。
  2. 分布式系统:在分布式系统中,有时很难找到一个可靠的机制来生成全局唯一标识符。在这种情况下,可以使用uuid模块生成UUID来唯一标识各个节点或事务。
  3. 临时文件和资源名:当创建临时文件或需要为资源命名时,可以使用UUID来确保名称的唯一性,避免命名冲突。
  4. 用户会话管理:在Web应用程序中,用户会话是常见的需求。使用UUID可以确保每个用户会话在全球范围内的唯一性。
  5. 缓存和索引:UUID可以用作缓存的键或索引条目的标识符,确保它们的唯一性和稳定性。
  6. 事件跟踪和日志:在处理大量事件或日志数据时,使用UUID可以为每个事件生成一个唯一标识符,有助于跟踪和分析数据。
  7. 临时目录和文件名:当需要在程序中创建临时目录或文件时,为了避免命名冲突,可以使用UUID来命名这些文件或目录。
  8. API请求ID:在构建API时,为每个请求分配一个唯一的ID(使用UUID)可以帮助跟踪请求,并在出现问题时进行调试。
  9. 测试和模拟:在测试和模拟环境中,UUID可以用于生成唯一的测试数据或标识符,确保每次测试的独立性和可重复性。
  10. 多线程和并发编程:在多线程或多进程环境中,使用UUID可以作为线程或进程的唯一标识符,有助于管理和同步操作。


五. 注意事项

使用uuid模块的时候需要注意以下事项

  1. 全局唯一性:UUID的主要优势是它们几乎肯定是全局唯一的。然而,理论上仍然存在极小的可能性(尽管实际上几乎不可能)会生成两个相同的UUID。因此,在设计系统时,不应依赖于UUID的绝对唯一性,而应准备处理潜在的冲突。
  2. 版本选择:UUID模块支持生成基于不同算法的UUID,如UUID1(基于时间和MAC地址)、UUID3(基于名称和MD5散列)、UUID4(完全随机)和UUID5(基于名称和SHA-1散列)。选择适当的版本取决于具体的应用需求。
  3. UUID1的安全性:UUID1是基于MAC地址和当前时间戳生成的,因此可能会泄露有关生成UUID系统的信息。如果安全性是一个关键问题,使用UUID4可能是更好的选择,因为它完全基于随机数生成。
  4. 性能:生成UUID通常是一个快速的过程,但在性能关键的场景中,频繁生成UUID可能会影响性能。在这种情况下,可以考虑缓存UUID或使用其他唯一标识符生成策略。
  5. 存储和传输:UUID通常以字符串形式存储和传输,这可能会占用比必要更多的空间。如果空间是一个问题,可以考虑使用更高效的数据表示,如二进制格式。
  6. 可读性:UUID是一长串字符,对人类来说不易读也不易记。在需要用户交互或可读性的场景中,可能需要考虑使用更友好的标识符。
  7. 兼容性:UUID模块生成的UUID符合RFC 4122标准,这意味着它们应该与其他系统生成的UUID兼容。然而,在处理来自外部系统的UUID时,始终验证其格式和有效性是一个好习惯。
  8. 线程安全:Python的uuid模块是线程安全的,可以在多线程环境中安全使用。
  9. 依赖性问题:虽然UUID模块是Python标准库的一部分,但在某些受限环境中(如某些类型的嵌入式系统),可能不可用或需要额外的配置。
  10. 排序和索引:UUID不是为排序而设计的,因此,如果需要对UUID进行排序或索引操作,应考虑使用适当的数据库索引或排序算法。


更多用法参考官方文档

https://docs.python.org/3/library/uuid.html

相关文章

玩转Python—Python程序设计基础 python程序设计怎么学

前面的章节,小编已给大家介绍了Python的背景以及Windows系统与Linux系统安装Python程序的方法,今天小编给大家介绍Python程序设计基础。包含以下几个内容:1.数据类型2.标识符3...

大神闭关7天整理!137页Python学习笔记,全面总结看这一篇就够了

Python作为当下最热门的编程语言之一,从前几年一直火到现在,并且还有更甚的趋势。不仅吸引了众多业内人士,圈外人士也纷纷加入了学习Python的阵营之中。但很多朋友在学习Python时,直呼:太难了...

. Python 中的元组 python中的元组和列表的区别

元组是 Python 中的一种内置数据结构,可用于存储项目的有序集合。与列表类似,元组可以在单个实体中保存多种数据类型,但它们是不可变的,这意味着一旦创建,就无法修改、添加或删除元素。此属性使 Tu...

一学就废|Python基础碎片,开始Hello World

[狗头]开始python:Hello World我们开始学习一门新语言时,我们通常从打印 Hello world!中学习。在 Python 中,我们可以使用另一种方式通过导入__hello__模块来打...

8.python学习笔记-类 python中类有什么用

类的定义面向对象编程提供了一种有效的软件管理方式,通过编写描述现实世界中的事物和情景的类,可以定义同类对象的通用行为,继承父类的子类可以定制个性化的行为。根据类创建对象的过程称为实例化,指定可在实例中...

Python GUI 编程:tkinter 初学者入门指南——几何布局管理器 pack

Tkinter 可以使用几何布局管理器来组织窗口上的小部件。Tkinter 支持三种几何布局管理器:packgridplace在本文中,将介绍 Tkinter 的几何布局管理器 pack 以及如何使用...