alphafold2 单体序列文件格式写法
Alphafold2是一个深度学习模型,用于预测蛋白质的三维结构。它接受的输入是蛋白质的氨基酸序列。在输入数据中,蛋白质的单体序列文件格式应该包括以下信息:
-
序列的名称,例如:“proteinA”。
-
氨基酸序列,由20个标准氨基酸表示,每个氨基酸用一个字母表示。
-
单体序列的长度,即氨基酸序列中的氨基酸数目。
-
任何与序列相关的注释信息,例如序列来源、序列标识符等。
下面是一个示例单体序列文件:
proteinA
MFADKGTITVAKTGYGDRVMTVEGKLESLKE
VFQYAAEIGMKTAVGVDEVVIAATREETGHA
GEITGLTEKVLPGTDDRVIYDLGGGTFPISGA
PVGSDPDEVARRWMEQEGPEYWDRNTQIWQG
KAMYQLQEQVDNLELIANFEKTSKEDFMEAV
YKELGFQG
在这个示例中,序列名称是“proteinA”,序列长度为56,包含20个不同的氨基酸。注释信息为空。
原文地址: https://www.cveoy.top/t/topic/yzV 著作权归作者所有。请勿转载和采集!