Python:读取文本返回关键词及其权重

liftword1个月前 (05-16)技术文章11

使用 jieba.analyse 库 函数 extract_tags( )

从文本 data 中提取关键词,并返回关键词及其权重。

参数:

data:待分析的文本(字符串)。

topK=10:提取权重最高的前 10 个关键词。

withWeight=True:返回关键词时同时返回权重值。

返回值:一个由 (关键词, 权重) 组成的元组列表,例如:[('人工智能', 0.8), ('机器学习', 0.7), ('数据挖掘', 0.65)]

from jieba.analyse import *

# 读取文本文件
with open('八项规定精神.txt', 'r', encoding='UTF-8') as f:
	data=f.read()

# 方法一:extract_tags()
for keyword, weight in extract_tags(data, topK=10, withWeight=True):
	print('%s %s' % (keyword, weight))

# 方法二:Textrank()
for keyword, weight in textrank(data, topK=10, withWeight=True):
	print('%s %s' % (keyword, weight))

相关文章

Python 实现从文本文件提取数据并分析保存

一、引言在日常的数据处理工作中,我们经常会遇到从文本文件中提取特定信息并进行分析的需求。本文将详细介绍如何使用 Python 编写代码,从一个包含用户网络使用信息的文本文件中提取用户姓名、入站流量和出...

Python处理文本的25个经典操作

Python处理文本的优势主要体现在其简洁性、功能强大和灵活性。具体来说,Python提供了丰富的库和工具,使得对文件的读写、处理变得轻而易举。简洁的文件操作接口Python通过内置的open()函数...

Python读写docx文件

Python读写docx文件Python读写word文档有现成的库可以处理pip install python-docx安装一下。https://python-docx.readthedocs.io/...

Python读写文本数据

问题你需要读写各种不同编码的文本数据,比如 ASCII,UTF-8或UTF-16编码等。解决方案使用带有 rt 模式的 open()函数读取文本文件。如下所示:# Read the entire fi...

用python帮别人写了个文字识别程序

文章目录前言一.需求分析二.代码实现1.百度文字识别2.查看文档获取access_token3.图片代码4.代码部分解读三.效果展示私信小编01即可获取大量Python学习资源前言就在前几天一个大一学...