本论文使用了500篇文章的物流政策与新闻分类数据集,并由人工进行关键词标注。通过探索常见的词汇特征指标,我们选取了对于物流文本关键词提取有积极影响的特征指标,并设计了一种适用于物流文本的关键词抽取综合权重公式,该公式包括词频-逆文档频率特征、粗粒度特征等词汇特征指标。通过训练模型得到预测集数据,并与标注好的数据集采用准确率、召回率、综合评价指标、MAP和NDCG指标进行验证,我们得到的综合权重公式模型在各个指标上均有优秀的结果,论证了该模型的可行性。实验结果表明,每个特征指标的缺失都将降低各项指标的评价。本论文提出的模型能够高效地抽取文本的关键词,并且在排名上的表现也不错。这一研究成果为中文文本分类领域提供了重要的参考和启示,有望为相关领域的自然语言处理工作提供有益的支持。

使用物流政策与新闻分类数据集共计包含500篇文章并由人工进行关键词标注对于常见的词汇特征指标进行探索选取对于物流文本关键词提取有积极影响的特征指标并设计了一种适用于物流文本的关键词抽取综合权重公式。该公式包括词频-逆文档频率特征、粗粒度特征等词汇特征指标。训练模型得到预测集数据与标注好

原文地址: https://www.cveoy.top/t/topic/crIP 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录