在基因組學、特別是高通量測序領域,確保數據的準確性、可重復性和實驗室間的可比性至關重要。
NA12878并非化學試劑,而是一個被科研界廣泛用作標準參照物的人類細胞系及其衍生的基因組DNA。它被譽為基因組學的“標尺”或“質控品”,為評估測序技術、分析流程和實驗操作的性能提供了黃金基準。

一、身份溯源:來自一個特定個體
NA12878來源于一位匿名女性捐贈者的淋巴母細胞樣細胞系。該細胞系由美國Coriell細胞保藏所儲存和分發,編號為NA12878。它更重要的身份是國際“HapMap計劃”和“千人基因組計劃”中的核心樣本之一。因此,它擁有世界被測量得最為透徹、注釋最為精確的基因組序列信息。
二、核心價值:已知答案的“考卷”
NA12878的核心價值在于其基因組序列的“已知性”。經過全球多個頂尖測序中心使用多種技術平臺的反復、交叉測序和聯合分析,人們對其基因組的了解達到了新的精度。
三、主要用途:評估測序全流程的“試金石”
在基因組學研究中,NA12878被應用于多個關鍵環節,作為評估實驗和分析質量的客觀標準:
1.評估測序技術的性能:當一個新的測序平臺或化學試劑上市時,對其樣本進行測序是標準驗證步驟。將新平臺得到的數據與高置信度參考集進行比對,可以客觀評估該平臺的測序準確度、覆蓋均勻性、對特定變異的檢測能力等關鍵指標。
2.優化生物信息學分析流程:不同的生物信息軟件和參數設置對變異檢測結果有巨大影響。研究人員使用它的數據作為輸入,運行自己的分析流程。將檢測出的變異與高置信度集進行對比,可以計算出靈敏度(召回率)、精確度(陽性預測值)等量化指標,從而不斷優化分析流程,確保其最佳性能。
3.進行實驗室間比對:不同實驗室在檢測同一個樣本時,由于操作、試劑、儀器和分析的差異,結果可能不同。如果大家都使用NA12878作為對照,就可以將各自的結果與“標準答案”對比,找出系統偏差所在,實現實驗室間數據的標準化和可比性,這對于多中心研究項目至關重要。
結語
NA12878不是一個簡單的化學試劑,而是基因組學質量控制的基石和共同語言。它作為一個“已知基因組”的標準,使得評估技術優劣、優化分析流程、實現數據標準化成為可能。