Python:读取文本返回关键词及其权重
使用 jieba.analyse 库 函数 extract_tags( )
从文本 data 中提取关键词,并返回关键词及其权重。
参数:
data:待分析的文本(字符串)。
topK=10:提取权重最高的前 10 个关键词。
withWeight=True:返回关键词时同时返回权重值。
返回值:一个由 (关键词, 权重) 组成的元组列表,例如:[('人工智能', 0.8), ('机器学习', 0.7), ('数据挖掘', 0.65)]
from jieba.analyse import *
# 读取文本文件
with open('八项规定精神.txt', 'r', encoding='UTF-8') as f:
data=f.read()
# 方法一:extract_tags()
for keyword, weight in extract_tags(data, topK=10, withWeight=True):
print('%s %s' % (keyword, weight))
# 方法二:Textrank()
for keyword, weight in textrank(data, topK=10, withWeight=True):
print('%s %s' % (keyword, weight))