jieba分词自定义词典添加新词方法:以'000号'为例
jieba分词添加自定义词:以'000号'为例
在使用jieba进行中文分词时,有时需要添加一些特定的词语到词典中,例如地址中的'000号'。这时可以使用jieba.add_word()函数将新词添加到jieba的自定义词典中。
以下是添加新词'000号'并进行分词的完整代码示例:
import jieba
address = '北京市朝阳区建国路000号'
# 添加新词'000号'
jieba.add_word('000号')
# 进行分词
words = jieba.cut(address)
print(list(words)) # 输出:['北京市', '朝阳区', '建国路', '000号']
通过以上代码,jieba便可以正确识别'000号',并在分词结果中将其作为一个整体输出。
原文地址: https://www.cveoy.top/t/topic/f2gR 著作权归作者所有。请勿转载和采集!