GATK4是一款基因组分析工具套件,包括多个模块,每个模块都有不同的功能。以下是GATK4的模块及其介绍:

  1. HaplotypeCaller:通过对每个样本的reads进行局部重组,来检测单个样本的变异。

  2. Mutect2:用于检测单样本或对比分析多个样本的SNP和indel变异。

  3. GermlineCNVCaller:检测个体基因组中存在的大片段拷贝数变异。

  4. SomaticCNVCaller:检测肿瘤和正常组织之间的拷贝数变异。

  5. CNNScoreVariants:使用深度神经网络对变异进行分类和评分,从而减少人工筛选的工作。

  6. FilterMutectCalls:移除Mutect2检测到的低质量变异。

  7. CollectReads:从BAM文件中提取reads,用于后续分析。

  8. BaseRecalibrator:对测序数据进行质量校正,以消除Illumina质量分数的偏差。

  9. ApplyBQSR:应用质量校正表来校正BAM文件中的碱基质量分数。

  10. VariantFiltration:根据变异的质量、深度等信息,过滤掉低质量变异。

  11. GenotypeGVCFs:将多个样本的GVCF文件合并,并进行基因型调用。

  12. CombineGVCFs:将多个单样本GVCF文件合并成一个多样本GVCF文件。

  13. ValidateVariants:验证变异数据的质量和一致性。

  14. LiftoverVcf:将VCF文件从一个基因组版本转换到另一个基因组版本。

  15. VariantAnnotator:对变异进行注释,包括功能注释、人口学注释等。

  16. SelectVariants:根据指定的条件从变异集合中选择变异。

  17. FastaAlternateReferenceMaker:根据变异信息和基因组参考序列生成新的个体特异性参考序列。

  18. VariantToTable:将VCF文件转换成表格文件,方便后续处理和分析。

  19. CountVariants:统计变异的数量和类型。

  20. GatherVcfs:将多个VCF文件合并成一个大的VCF文件。

  21. LeftAlignAndTrimVariants:对变异进行左对齐和修剪,使其在基因组上更准确。

  22. VariantRecalibrator:使用机器学习方法对变异进行分类和评分,以减少人工筛选的工作。

  23. ApplyVQSR:应用变异质量评分表来对变异进行筛选和过滤。

  24. LearnReadOrientationModel:学习测序reads的方向信息,以提高基因型调用的准确性。

  25. CreateSomaticPanelOfNormals:创建肿瘤样本的Panel of Normals,用于过滤假阳性变异。

  26. GetPileupSummaries:生成pileup摘要文件,用于CNV变异检测。

  27. CallCopyRatioSegments:检测每个样本的拷贝数变异。

  28. ModelSegments:使用隐马尔可夫模型对CNV数据进行建模和分析。

  29. PlotDenoisedCopyRatios:绘制CNV数据的图表,用于可视化分析。

  30. DenoiseReadCounts:去除CNV分析中的噪声和假阳性信号。

总之,GATK4提供了一系列强大的工具,可用于从原始测序数据中检测变异和拷贝数变异,并对变异进行注释和过滤,以最终得到高质量的变异数据

GATK4所有模块及其介绍

原文地址: https://www.cveoy.top/t/topic/eomS 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录