python集合详解
Python中的集合的概念和数学里集合的概念是一致的,都是一组元素的集,且元素之间不能重复。Python中集合的定义和字典类似,都需要大括号,区别在于集合不需要映射。
集合有可变集合set和不可变集合frozenset。
集合的特点
- 无序:元素没有固定顺序。
- 元素唯一:自动去重,无重复值。
- 可哈希元素:元素必须不可变(如数字、字符串、元组等)。
创建可变集合
- 直接使用{}创建集合
- set()函数 创建集合
1,直接使用{}创建集合
set1 = {1,2,3,4}
s=set() #创建一个空的集合,注意,不能直接用{}来创建,因为他是空字典
#set()函数 创建集合
set2=set([1,2,3,4])
集合是无序的,不支持下标查询,也不支持切片操作
>>> set1 = {1,4,'python'}
>>> type(set1)
>>> set1[0] #注意:集合是无序的,不支持下标查询的
TypeError: 'set' object is not subscriptable
>>> set1[0:2] #注意:集合是无序的,不支持切片操作
TypeError: 'set' object is not subscriptable
集合元素增加
集合是可变序列,所以在创建后还可以进行添加或删除操作
- set.add(elem):增加单个元素到集合内
- set.update({elem,...}):添加多个元素,可以是另一个集合或者是列表、元组等
#添加单个元素
>>> my_set = {1,2,3}
>>> my_set.add(4)
>>> my_set
{1, 2, 3, 4}
# 添加多个元素
my_set.update({5, 6})
print(my_set)
{1, 2, 3, 4, 5, 6}
# 也可以通过其他类型一次性添加列表或者元组中的多个元素
my_set.update([7, 8, 9]) #也可以是元组(7,8,9)
print(my_set)
{1, 2, 3, 4, 5, 6, 7, 8, 9}
集合元素删除
- set.remove(elem):从集合内删除一个元素,如果元素不在则报错
- set.discard(elem):移除集合中的一个元素,如果元素不存在,则不做任何操作
- set.pop() :随机删除一个元素,并返回该元素
- set.clear():移除集合中的所有元素。
s = {1, 2, 3, 4}
s.remove(3) # 删除元素3,若不存在则报错
s.discard(10) # 删除元素10,若不存在不报错
s.pop() # 随机删除一个元素并返回
s.clear() # 清空集合 → set()
集合的交集、并集、及差集运算
- set.isdisjoint(other):判断两个集合是否有交集,如果有返回False;如果没有返回True。
- set.intersection(other):返回集合的交集,也可以使用 "&"符合。
- set.issubset(other) :判断set是否是other的子集
- set.union(other):返回集合的并集,也可以使用"|"符号
- set.difference(other) :差集 ,也可以使用"-"符号
>>> set1 = {1,4,'python'}
>>> set2={1,'python'}
#判断两个集合是否有交集
>>> set2.isdisjoint(set1)
False
#返回两个集合的交集,如果没有交集就返回空集合set()
>>> set2.intersection(set1) # set1 & set2
{1, 'python'}
#判断set2是否是set1的子集,如果是则返回True,如果不是返回False
>>> set2.issubset(set1)
True
#返回两个集合并集
>>set1.union(set3) # set1|set2
{1,4,'python'}
#返回两个集合的差集
>> set1.difference(set2) #set1-set2
{4}
不可变集合 frozenset
将一个集合冻结使之无法添加和删除元素
>>> set2={2, 3, 4, 5}
>>> set3 = frozenset(set2)
>>> set3
frozenset({2, 3, 4, 5})
>>> set3.remove(2)
Traceback (most recent call last):
File "", line 1, in
set3.remove(2)
AttributeError: 'frozenset' object has no attribute 'remove'
集合的用途
元素没有重复元素,可以自动去重,因为可以用来去除列表中的重复元素
集合的元素不重复性,通过将列表先强制转换为集合,再转换为列表形式实现
>>> list4 = [1,2,3,4,5,5,3,1,0]
>>> list4 = list(set(list4))
>>> list4
[0, 1, 2, 3, 4, 5]