本篇论文旨在探究物流文本数据的关键信息抽取有效方法。我们选取物流网站上的数据文本作为研究对象,但由于文本中可能存在非物流相关内容,我们采用了基于LineSentence的种子词汇扩展技术,对物流词汇进行了拓展。我们选择了“物流”、“运输”、“航运”等种子词汇,通过扩展得到了一系列物流相关的词汇。最后,我们通过判断爬取下来的文本是否包含扩展词汇,从而进行文本筛选,得到的文本数据均为物流相关文本,为后续实验的开展奠定了基础。本文将详细介绍我们的研究方法、实验过程以及相关结论,以期为物流文本数据的关键信息抽取提供有力支持。


原文地址: https://www.cveoy.top/t/topic/bU2P 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录