python之jieba分词库使用
# 导入jieba库
import jieba
# 创建自定义分词词典
jieba.load_userdict("自定义词库.txt")
# 设置词典中的词语的权重,可以是新词或者增加权重
jieba.suggest_freq(('你好', '世界'), True)
# 输入待分词的文本
text = "你好世界,我是程序员"
# 使用jieba进行分词
seg_list = jieba.cut(text)
# 转换分词结果为字符串,默认空格分隔
seg_string = ' '.join(seg_list)
print(seg_string)
这段代码展示了如何在Python中使用jieba库进行分词,并且包括了如何加载自定义词库和设置词的频率。这对于文本处理和自然语言处理的初学者来说是一个很好的示例。
评论已关闭