程序员文章、书籍推荐和程序员创业信息与资源分享平台

网站首页 > 技术文章 正文

Python:读取文本返回关键词及其权重

hfteth 2025-06-15 16:26:20 技术文章 4 ℃

使用 jieba.analyse 库 函数 extract_tags( )

从文本 data 中提取关键词,并返回关键词及其权重。

参数:

data:待分析的文本(字符串)。

topK=10:提取权重最高的前 10 个关键词。

withWeight=True:返回关键词时同时返回权重值。

返回值:一个由 (关键词, 权重) 组成的元组列表,例如:[('人工智能', 0.8), ('机器学习', 0.7), ('数据挖掘', 0.65)]

from jieba.analyse import *

# 读取文本文件
with open('八项规定精神.txt', 'r', encoding='UTF-8') as f:
	data=f.read()

# 方法一:extract_tags()
for keyword, weight in extract_tags(data, topK=10, withWeight=True):
	print('%s %s' % (keyword, weight))

# 方法二:Textrank()
for keyword, weight in textrank(data, topK=10, withWeight=True):
	print('%s %s' % (keyword, weight))
最近发表
标签列表