NameError Traceback most recent call last ipython-input-6-9c11b2e84532 in module 2 importlibreloadjieba 3 data=pdread_excelrE06-juypterinput8-12 LDA 分析 只提取中文xlsx#content type ---- 4 datacontent_cutted
-
首先,需要定义函数
chinese_word_cut,因为该函数在代码中被调用但未定义,导致出现NameError错误。 -
定义函数
chinese_word_cut,该函数用于对中文文本进行分词,代码如下:import jieba def chinese_word_cut(text): seg_list = jieba.cut(text) return " ".join(seg_list)函数中首先导入
jieba库,然后使用jieba.cut对文本进行分词,最后将分词结果用空格连接起来并返回。 -
在代码中调用
chinese_word_cut函数,将结果保存到data["content_cutted"]中,代码如下:data["content_cutted"] = data.content.apply(chinese_word_cut)该代码使用
apply方法将chinese_word_cut函数应用到data.content列的每个元素上,并将结果保存到data["content_cutted"]列中。 -
运行代码,确保没有出现错误。
原文地址: http://www.cveoy.top/t/topic/bjLv 著作权归作者所有。请勿转载和采集!