一使用VCF2PCA对输入的VCF格式文件进行PCA分析与其他PCA分析工具相比VCF2PCA仅需要输入VCF格式的原始数据即可进行PCA分析。VCF2PCA首先将VCF格式文件逐行读取位点信息进行质控过滤低频率、三碱基和不符合哈迪-温伯格定律的位点质控不通过的位点不参与后面的计算因此用户不必再过滤额外进行过滤质控转格式等。二VCF2PCA在计算时高效主要从两个方法来讲 1 低内存的 2 速度快
点的分析报告:
本次分析使用VCF2PCA进行PCA分析,该工具能够自动进行质控过滤,不需要进行额外的数据转换和过滤。在计算时,VCF2PCA采用了低内存技术方法,即边读边计算,及时释放位点信息,减少内存需求。同时,VCF2PCA还采用了动态多线程并发计算的技术方案,提高了运行速度。
得到PCA结果后,我们使用K-means算法进行聚类分析,通过计算SSE和DBI来寻找最佳k值。在本次分析中,我们使用了脚本“aa.pl”重新设置k值并作图。
通过分析SSE和DBI结果,我们最终选择了k=4作为最佳的聚类个数。聚类结果如下图所示:
从图中可以看出,数据被分为了4个簇,并且每个簇都有明显的聚合程度。此外,我们还可以通过聚类结果来探索样品之间的关系,为后续的研究提供重要的参考。
原文地址: https://www.cveoy.top/t/topic/fcaF 著作权归作者所有。请勿转载和采集!