近日,真邁生物聯(lián)合上海交通大學(xué)醫(yī)學(xué)院在國際期刊Frontiers in Genetics上發(fā)表題為“Assessing the impact of sequencing platforms and analytical pipelines on whole-exome sequencing”的研究成果。該研究采用腫瘤標(biāo)準(zhǔn)品HD832和正常樣本HG001,通過NovaSeq 6000、NextSeq 550、GenoLab M,FASTASeq 300與SURFSeq 5000測序平臺,采用多款主流生信軟件,比較SNP和InDel在各測序平臺與分析軟件下的表現(xiàn)情況,發(fā)現(xiàn)測序平臺對于全外顯子組測序(WES)的結(jié)果影響較小,而分析軟件對WES結(jié)果的影響更大。此外,也強調(diào)了生物學(xué)重復(fù)對于WES檢測的重要性。
全外顯子組測序(WES)正迅速成為識別人類基因組目標(biāo)區(qū)域分子遺傳病變的經(jīng)濟有效的工具。近年來,隨著WES在遺傳病和腫瘤檢測領(lǐng)域的廣泛應(yīng)用,測序平臺和分析軟件對WES的結(jié)果的影響至關(guān)重要。
01?腫瘤樣本HD832中的對比結(jié)果
首先,該研究在3個測序平臺上(NovaSeq 6000, NextSeq 550, GenoLab M)通過7個分析軟件獲得高置信度陽性位點的檢測結(jié)果,發(fā)現(xiàn):軟件相同時,不同測序平臺之間檢測到的突變數(shù)目相差很小(圖1A, B)。在VarScan2分析軟件下,3個平臺上的平均SNP檢測數(shù)分別為233、232和234。所有平臺都無法檢測HD832給出的全部高可信度的陽性位點,但不同分析軟件得到的F Score和Recall的結(jié)果表明平臺之間的差異很小,而分析軟件間差異較大。例如,相同測序平臺的數(shù)據(jù)在Strelka2中檢測得到193個SNP位點,而在VarScan2中檢測到234個。這與給出的HD832已被ddPCR驗證過的陽性位點對比結(jié)果一致(圖1c)。對于InDel,測序平臺之間的差異僅為1-2個InDel (圖1B),但分析軟件之間的差異高達(dá)7個InDel。此外,SNVer和VarScan2在高置信度陽性位點的檢出率上表現(xiàn)最好。
圖1?3個測序平臺四個分析軟件在高置信陽性位點檢測中的結(jié)果對比
02?正常樣本HG001中的對比結(jié)果
為進(jìn)一步驗證腫瘤樣本中的發(fā)現(xiàn),又增加正常樣本HG001,并納入2個新測序平臺——FASTASeq 300和SURFSeq 5000,并去除了2個腫瘤檢測特異性的軟件。類似地,在同一個分析軟件下,不同測序平臺之間SNP檢測的差異較小。具體來說,在mpileup工具下,各平臺SNP檢測的F值范圍為0.8738到0.8856。而在InDel檢測中,差異更明顯。例如,表現(xiàn)較差的SNVer分析軟件的平均F值僅為0.4,而表現(xiàn)優(yōu)越的Strelka2分析軟件的平均F值高達(dá)0.76。這些發(fā)現(xiàn)表明:對于正常樣本HG0001,測序平臺的選擇對WES結(jié)果的影響可以忽略不計。相反,分析軟件的選擇對SNP檢測影響較小,但對InDel檢測影響較大。
圖2?五個測序平臺和五個分析軟件在正常樣本HG001檢測中的結(jié)果對比
1.?文章通過對多個數(shù)據(jù)集的比較分析,發(fā)現(xiàn)對于HD832和HG001樣本,分析軟件對WES結(jié)果的影響大于測序平臺;
2.?在HD832樣本中,SNVer和VarScan2在7個分析軟件中表現(xiàn)最佳。在HG001樣本的InDel檢測中,Strelka2在5個分析軟件中表現(xiàn)最佳;
3.?研究為新測序平臺和HD832標(biāo)準(zhǔn)樣本提供了多個實用的參考數(shù)據(jù)集。通過這些參考數(shù)據(jù)集,研究人員可以選擇更合適的分析軟件和測序平臺,從而提高遺傳變異檢測的準(zhǔn)確性和可靠性。
Sun, Yanping, et al. "Assessing the impact of sequencing platforms and analytical pipelines on whole-exome sequencing."?Frontiers in Genetics?15 (2024): 1334075.