使用R将 1942724GGC1942730CCA1942795AAG1942826CT1942829CT1942899TCGGAT1942938AGA1943029CT1943043CT1943251AC1943264GA1943276GT1943303GA1943314GT1943314GTG1943334GC这些字段在符号 处分开并整理成dataframe
你可以使用strsplit()函数将每个字符串按照":"分割成多个元素,然后使用data.frame()函数将这些元素组成的列表转换为dataframe。
以下是使用R进行的示例代码:
# 创建一个包含所有字符串的向量
strings <- c("1:942724:G:GC",
"1:942730:C:CA",
"1:942795:A:AG",
"1:942826:C:T",
"1:942829:C:T",
"1:942899:TCGGA:T",
"1:942938:AG:A",
"1:943029:C:T",
"1:943043:C:T",
"1:943251:A:C",
"1:943264:G:A",
"1:943276:G:T",
"1:943303:G:A",
"1:943314:G:T",
"1:943314:GT:G",
"1:943334:G:C")
# 定义一个函数,将字符串分割成多个元素
split_string <- function(string) {
unlist(strsplit(string, ":"))
}
# 使用lapply()函数将split_string函数应用于每个字符串
split_strings <- lapply(strings, split_string)
# 使用data.frame()函数将分割后的字符串转换为dataframe
df <- data.frame(do.call(rbind, split_strings))
# 为dataframe的列命名
colnames(df) <- c("A", "B", "C", "D")
# 打印结果
print(df)
运行以上代码将得到以下dataframe:
A B C D
1 1 942724 G GC
2 1 942730 C CA
3 1 942795 A AG
4 1 942826 C T
5 1 942829 C T
6 1 942899 TCGGA T
7 1 942938 AG A
8 1 943029 C T
9 1 943043 C T
10 1 943251 A C
11 1 943264 G A
12 1 943276 G T
13 1 943303 G A
14 1 943314 G T
15 1 943314 GT G
16 1 943334 G C
``
原文地址: http://www.cveoy.top/t/topic/iMlE 著作权归作者所有。请勿转载和采集!