CountVectorizer 文本向量化工具详解：参数、用法及案例

CountVectorizer 是 scikit-learn 中用于将文本转换为数字向量的工具。它将文本中的单词转换为数字，并计算它们在文本中的出现频率。以下是 CountVectorizer 的参数和用法：

参数：

用法：

导入 CountVectorizer：from sklearn.feature_extraction.text import CountVectorizer
创建 CountVectorizer 对象：cv = CountVectorizer()
使用 fit_transform 方法将文本转换为数字向量：X = cv.fit_transform(text)
可以使用 get_feature_names 方法获取单词列表：words = cv.get_feature_names()
可以使用 toarray 方法将稀疏矩阵转换为数组：X = X.toarray()