python之jieba分词库使用

这篇文章距离上次修改已过719天，其中的内容可能已经有所变动。




# 导入jieba库
import jieba
 
# 创建自定义分词词典
jieba.load_userdict("自定义词库.txt")
 
# 设置词典中的词语的权重，可以是新词或者增加权重
jieba.suggest_freq(('你好', '世界'), True)
 
# 输入待分词的文本
text = "你好世界，我是程序员"
 
# 使用jieba进行分词
seg_list = jieba.cut(text)
 
# 转换分词结果为字符串，默认空格分隔
seg_string = ' '.join(seg_list)
 
print(seg_string)

这段代码展示了如何在Python中使用jieba库进行分词，并且包括了如何加载自定义词库和设置词的频率。这对于文本处理和自然语言处理的初学者来说是一个很好的示例。

python之jieba分词库使用

评论已关闭

推荐阅读