GATK4所有模块及其介绍
GATK4是一款基因组分析工具套件,包括多个模块,每个模块都有不同的功能。以下是GATK4的模块及其介绍:
-
HaplotypeCaller:通过对每个样本的reads进行局部重组,来检测单个样本的变异。
-
Mutect2:用于检测单样本或对比分析多个样本的SNP和indel变异。
-
GermlineCNVCaller:检测个体基因组中存在的大片段拷贝数变异。
-
SomaticCNVCaller:检测肿瘤和正常组织之间的拷贝数变异。
-
CNNScoreVariants:使用深度神经网络对变异进行分类和评分,从而减少人工筛选的工作。
-
FilterMutectCalls:移除Mutect2检测到的低质量变异。
-
CollectReads:从BAM文件中提取reads,用于后续分析。
-
BaseRecalibrator:对测序数据进行质量校正,以消除Illumina质量分数的偏差。
-
ApplyBQSR:应用质量校正表来校正BAM文件中的碱基质量分数。
-
VariantFiltration:根据变异的质量、深度等信息,过滤掉低质量变异。
-
GenotypeGVCFs:将多个样本的GVCF文件合并,并进行基因型调用。
-
CombineGVCFs:将多个单样本GVCF文件合并成一个多样本GVCF文件。
-
ValidateVariants:验证变异数据的质量和一致性。
-
LiftoverVcf:将VCF文件从一个基因组版本转换到另一个基因组版本。
-
VariantAnnotator:对变异进行注释,包括功能注释、人口学注释等。
-
SelectVariants:根据指定的条件从变异集合中选择变异。
-
FastaAlternateReferenceMaker:根据变异信息和基因组参考序列生成新的个体特异性参考序列。
-
VariantToTable:将VCF文件转换成表格文件,方便后续处理和分析。
-
CountVariants:统计变异的数量和类型。
-
GatherVcfs:将多个VCF文件合并成一个大的VCF文件。
-
LeftAlignAndTrimVariants:对变异进行左对齐和修剪,使其在基因组上更准确。
-
VariantRecalibrator:使用机器学习方法对变异进行分类和评分,以减少人工筛选的工作。
-
ApplyVQSR:应用变异质量评分表来对变异进行筛选和过滤。
-
LearnReadOrientationModel:学习测序reads的方向信息,以提高基因型调用的准确性。
-
CreateSomaticPanelOfNormals:创建肿瘤样本的Panel of Normals,用于过滤假阳性变异。
-
GetPileupSummaries:生成pileup摘要文件,用于CNV变异检测。
-
CallCopyRatioSegments:检测每个样本的拷贝数变异。
-
ModelSegments:使用隐马尔可夫模型对CNV数据进行建模和分析。
-
PlotDenoisedCopyRatios:绘制CNV数据的图表,用于可视化分析。
-
DenoiseReadCounts:去除CNV分析中的噪声和假阳性信号。
总之,GATK4提供了一系列强大的工具,可用于从原始测序数据中检测变异和拷贝数变异,并对变异进行注释和过滤,以最终得到高质量的变异数据
原文地址: https://www.cveoy.top/t/topic/eomS 著作权归作者所有。请勿转载和采集!