中文较大的词库和规则集合有哪些
- 中文分词词库:包括jieba分词、THULAC分词、斯坦福分词等。
- 中文停用词表:包括哈工大停用词表、百度停用词表、中科院停用词表等。
- 中文情感词库:包括情感词汇本体、知网情感词库等。
- 中文词性标注库:包括中科院语言所的人民日报词性标注库、MSRA的SIGHAN Bakeoff 2005等。
- 中文命名实体识别库:包括MSRA的SIGHAN Bakeoff 2006、人民日报命名实体库等。
- 中文拼音库:包括汉字拼音对照表、中文汉字拼音音节表等。
- 中文语音识别语音库:包括华为、科大讯飞、百度等厂商的语音库。
- 中文OCR识别字库:包括百度OCR、腾讯OCR、阿里OCR等厂商的字库。
- 中文关键词提取库:包括TF-IDF、TextRank、LDA等算法的关键词提取库。
- 中文自然语言处理工具包:包括NLTK、Stanford NLP、THU NLP等。
原文地址: https://www.cveoy.top/t/topic/ddaA 著作权归作者所有。请勿转载和采集!