1. 中文分词词库:包括jieba分词、THULAC分词、斯坦福分词等。
  2. 中文停用词表:包括哈工大停用词表、百度停用词表、中科院停用词表等。
  3. 中文情感词库:包括情感词汇本体、知网情感词库等。
  4. 中文词性标注库:包括中科院语言所的人民日报词性标注库、MSRA的SIGHAN Bakeoff 2005等。
  5. 中文命名实体识别库:包括MSRA的SIGHAN Bakeoff 2006、人民日报命名实体库等。
  6. 中文拼音库:包括汉字拼音对照表、中文汉字拼音音节表等。
  7. 中文语音识别语音库:包括华为、科大讯飞、百度等厂商的语音库。
  8. 中文OCR识别字库:包括百度OCR、腾讯OCR、阿里OCR等厂商的字库。
  9. 中文关键词提取库:包括TF-IDF、TextRank、LDA等算法的关键词提取库。
  10. 中文自然语言处理工具包:包括NLTK、Stanford NLP、THU NLP等。
中文较大的词库和规则集合有哪些

原文地址: https://www.cveoy.top/t/topic/ddaA 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录