jieba分词添加自定义词:以'000号'为例

在使用jieba进行中文分词时,有时需要添加一些特定的词语到词典中,例如地址中的'000号'。这时可以使用jieba.add_word()函数将新词添加到jieba的自定义词典中。

以下是添加新词'000号'并进行分词的完整代码示例:

import jieba

address = '北京市朝阳区建国路000号'
# 添加新词'000号'
jieba.add_word('000号')
# 进行分词
words = jieba.cut(address)
print(list(words))  # 输出:['北京市', '朝阳区', '建国路', '000号']

通过以上代码,jieba便可以正确识别'000号',并在分词结果中将其作为一个整体输出。


原文地址: https://www.cveoy.top/t/topic/f2gR 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录