修改后的代码:

abstract <- readLines("abstract.txt") single <- unlist(strsplit(abstract, " ")) # 列表拆分为向量 table(single)

可以拆分为单个字母

mmm <- unlist(strsplit(abstract, split = "")) table(mmm) # 统计高频字母

grep("[a]", single) grepl("[a]", single) # 注意与grep的区别 grep("[a-b]", single) # 可同时找到a,b的索引 gsub("a", "#", single) toupper(single)

新的代码同样能够找到高频词汇及字母

abstract=readLinesabstracttxtsingle=unliststrsplitabstract #列表拆分为向量tablesingle#可以拆分为单个字母mmm=unliststrsplitabstractsplit=# tablemmm#统计高频字母grepa singlegrepla single#注意与grep的区别grepa-b single#可同时找到ab的索引g

原文地址: https://www.cveoy.top/t/topic/P12 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录