的測序儀—包括ABI的Ion Torrent PGM和Illumina的Miseq—使得普通的實驗室也有能力進(jìn)行下一代測序。而Pacific Biosciences因為解讀了肆虐海地的病原體Vibrio cholerae的基因組而備受矚目。[1]同時,在臨床上人類基因組以近乎枯燥的規(guī)律而被闡明。正如Erika Check Hayden在《Nature》雜志上所報告,人類基因組測序中心的Richard Gibbs估計“在今年(2011年)有5,000人的基因組完成測序,明年預(yù)計為30,000人。”
“今年,基因組測序從名人測序轉(zhuǎn)向了臨床研究,”專攻基因組學(xué)的英國博士后Daniel MacArthur說道。去年,搖滾歌手Ozzy Osbourne對他的基因組進(jìn)行了測序。今年(2011年),Gibbs和同事們報告稱,由一對14歲的患有多巴反應(yīng)性肌張力障礙的異卵雙胞胎全基因組測序結(jié)果鑒定出了這種疾病的分子病因, 從而改進(jìn)了治療策略。[3]一位患有無從解釋的腸道疾病的小孩讓報道其感人故事的《密爾瓦基新聞衛(wèi)報》(Milwaukee Journal Sentinel)獲得了普利策獎。這名小孩患有的醫(yī)學(xué)罕見的遺傳畸變,該疾病zui后通過外顯子測序得到了解答,這是一場花費了75,000美元。在Walter Isaacson撰寫的蘋果創(chuàng)始人Steve Jobs傳記中,我們知道Jobs在自己被診斷患有胰腺癌后,他對自己的癌癥基因組進(jìn)行了“部分測序”,試圖找出一種進(jìn)行“靶向治療”的方法。[5]
通量提高,成本降低
Isaacson 寫道,Jobs的測序花費了大約100,000美金。自那之后,測序價格陡降了兩個數(shù)量級。在(2011年)二月份,Kevin Davies在《Bio-IT World》報道中稱全基因組測序服務(wù)商Complete Genomics Inc.(以下簡稱CGI)的測序價格為每人9,500美元,8個基因組起測。[6]據(jù)CGI的CEO Clifford Reid稱,該公司現(xiàn)在的報價是每個基因組4,000美元,一個月可完成750個基因組,到2012年初可實現(xiàn)每月1,000個。
以一個月完成750多個基因組的速度計算,CGI一年可以完成大約10,000個人類基因組測序。不過,Reid說得益于更多攝像機和DNA芯片的更利用,CGI將要全面配備的一種新儀器將使公司的產(chǎn)能提高到每年100,000個基因組。而超越性的下一代升級—有了更好的光學(xué)技術(shù)及更高密度的樣品空間的支持—將使上面說的數(shù)字提高到另一個數(shù)量級,到2015年實現(xiàn)每年測出1百萬個基因組,Reid說道。
更長的序列讀長可以做到線性拼接
同時,CGI公司正在開發(fā)一種新的技術(shù)LFR(long-fragment reads 長片段序列),通過此技術(shù)可以使公司依靠生物信息學(xué)工具將大量測得的序列通過拼接,達(dá)到100,000個堿基長度的片段。Reid說,以此長度序列,公司可以解決遺傳學(xué)上的“潛藏問題”,即將不同的DNA鏈進(jìn)行區(qū)分。
當(dāng)然,人類是雙倍體,攜帶了兩套染色體。目前的問題是,如果一個個體在一個基因上出現(xiàn)兩個突變,那這兩個突變是位于其中一個染色體拷貝上,還是兩個拷貝上各有一個錯誤? “醫(yī)生當(dāng)然必須知道這些信息以便做出正確的診斷,”Reid說。他解釋說,現(xiàn)有的技術(shù)無法做到,因為這些技術(shù)使基因組發(fā)生了重新裝配,使得無法將一個特定的突變定位到某個特定染色體。在這類系統(tǒng)中,“相位”(phase)信息—就是說基因組片段之間物理上互相連接的位置信息—丟失了。
CGI使用的是基于化學(xué)連接技術(shù)的短序列測序技術(shù),每次大約測70個堿基。不過通過將片段標(biāo)上標(biāo)簽,依片段的不同分子來源而進(jìn)行標(biāo)記,LFR技術(shù)則可以規(guī)避該問題。Reid補充說,LFR的另一個好處是能將公司的測序精度從10-5提高到10-7,或者說從每個二倍體基因組上60,000個錯誤降低到600個。
據(jù)公司的一位發(fā)言人透露,CGI在2011年底進(jìn)行LFR服務(wù)試點,正式啟動定于2012年。“我預(yù)計,這會是一筆大生意,”CGI科學(xué)顧問委員會成員、哈佛醫(yī)學(xué)院遺傳學(xué)家George Church如是說。
個人化NGS系統(tǒng)
Illumina公司
在NGS領(lǐng)域,其他一些新技術(shù)的發(fā)展,使一些不是從事人類全基因組研究的人員獲益匪淺。例如,Illumina推出的MiSeq,這是一種新的測序設(shè)備,可在不必要使用該公司的HiSeq測序儀的時候使用。
“很多的應(yīng)用只需要測到數(shù)百萬或者數(shù)十億個堿基,”Illumina公司的信息產(chǎn)品市場副總監(jiān)Jordan Stockton說,例如那些對細(xì)菌基因組的測序,或特定人類等位基因的靶向重測。
MiSeq采用了與HiSeq相同的邊合成邊測序的方法,這就意味著研究人員可以在MiSeq與HiSeq之間實現(xiàn)無縫切換,而無需再去學(xué)習(xí)全新的操作手冊。售價125,000美元的MiSeq平臺可在一次運行中產(chǎn)生小于2G的數(shù)據(jù)量,雙端讀長可以達(dá)到150bp,the Broad Institute顯示MiSeq單端測序可以達(dá)到300bp,MacArthur說,這也就是說雙端測序就可能達(dá)到500bp,因為中間會包含一些重疊區(qū),“這讓人印象非常深刻,”(HiSeq目前zui大能實現(xiàn)125bp的雙端讀長,主要是因為兩種設(shè)備在循環(huán)次數(shù)上存在差異。)
據(jù)Stockton的說法,Illuminazui近還宣稱開發(fā)了三種新的用于NGS的工具。一種是TrueSeq Amplicon Kit,可同時針對96個樣品實現(xiàn)每個樣品384個目標(biāo)的測序。第二種是簡化的文庫制備試劑盒,可以將“一天或兩天”的操作簡化至90分鐘。zui后一種是BaseSpace,該公司推出的云端生物信息學(xué)系統(tǒng)。
Stockton說,BaseSpace由5個工作流組成:細(xì)菌全基因組測序、靶向測序、宏基因組學(xué)、小RNA表達(dá)譜以及文庫質(zhì)量控制(為那些想在測序前進(jìn)行文庫質(zhì)量驗證的人)。不過“這種云技術(shù)的真正美妙之處就是,它非常易于為使用者增加新的功能”,他說道。事實上,Illumina計劃推出BaseSpace的“應(yīng)用商店”,這樣用戶可以將新的算法加入到自己的數(shù)據(jù)分析流程中。
Life Technologies公司
Life Technologies公司去年(2010年)憑借其每臺50,000美元的Ion Torrent PGM進(jìn)入低價臺式個人測序儀市場。該設(shè)備本質(zhì)上是將半導(dǎo)體芯片轉(zhuǎn)換成了超高密度pH計。推出之時,PGM采用稱為“314”的芯片,在兩個小時內(nèi)可產(chǎn)生1,000萬個堿基,每個讀長為100個堿基,花費500美元。后來改用“316”芯片,產(chǎn)能提高了10倍。目前試用用戶可用到的“318”芯片又提高了輸出能力,一次運行可產(chǎn)生10億堿基的數(shù)據(jù)。
Life Technologies的半導(dǎo)體測序芯片
ABI公司副總裁Mark Gardner解釋說,一次運行產(chǎn)生10億堿基數(shù)據(jù)得益于兩個方面,一是芯片上傳感器數(shù)量增加,314上傳感器數(shù)為140萬,現(xiàn)在是1130萬,可產(chǎn)生至少500萬個讀長;二是讀長增大,現(xiàn)在增長到了200堿基。Gardner說,到2012年某個時候,讀長將增加到400堿基,意味著318芯片理論上每次運行可以產(chǎn)出20億堿基的數(shù)據(jù),而價格仍是500美元。他說:“在美國人類遺傳學(xué)協(xié)會年會上,我們展示了525個堿基對的讀長。”
Gardner說,Life Technologies的5500系列遺傳分析系統(tǒng)也預(yù)計在2012年進(jìn)行升級。彼時,該系統(tǒng)將可運行Wildfire chemistry,將在實驗臺上進(jìn)行的模板制備(包括費時費錢的乳劑PCR步驟)工作轉(zhuǎn)到了儀器中進(jìn)行。這降低了樣品制備的費用,提高了讀取密度及一致性,Gardner說。通過使點樣更為緊湊并從頭尾雙向同時進(jìn)行讀取,Wildfire將成像特征數(shù)量提到了5倍。Gardner說這就足夠“在一次運行中完成10個基因組。”(目前5500x1系列遺傳分析系統(tǒng)每個運行產(chǎn)生大約2個人類基因組的數(shù)據(jù)量。)
454 Life Sciences
Roche Life Sciences的454 Life Sciences也升級了它的測序平臺。454 GS FLX+結(jié)合該公司的新的GS FLX Titanium Sequencing Kit XL+升級到GS FLX,將其讀長提高到了每個運行1000個堿基。“利用該系統(tǒng)可以獲取高質(zhì)量、高通量、與Sanger測序法相似長度的測序結(jié)果。”市場Mike Catalano說道,并且補充說到每運行一次可以產(chǎn)生700M的數(shù)據(jù)。454還為靶向測序提供了引物試劑盒,包括人類HLA區(qū)域擴增及白血病相關(guān)基因分析試劑盒(2012年推出)。
第三代測序
過去的一年還見證了稱為第三代測序技術(shù)的成果。其中的一件就是Pacific Bioscience的PacBio PR的正式推出。該平臺采用單分子熒光測序技術(shù),在解決海底霍亂流行及德國 E. coli 爆發(fā)中發(fā)揮了重大作用。
據(jù)Pacific Biosciences的CTO Stephen Turner稱,PacBio RS的讀長平均為2,500-3,000堿基,某些還長達(dá)22,000堿基,這使得該設(shè)備盡管與競爭技術(shù)相比每讀長的精度要低(85%-89%的精度),但特別適于解決基因組結(jié)構(gòu)問題。
Tuiner說,PacBiozui初是專注于一些小的常規(guī)應(yīng)用,包括細(xì)菌的從頭測序、病原體測序、病毒測序及目標(biāo)基因測序。不過,該技術(shù)*性地實現(xiàn)了一些新應(yīng)用,包括基于如5-甲基胞嘧啶及5-羥甲基胞嘧啶對用于讀取序列的聚合酶動力學(xué)影響而直接鑒定此類DNA修飾。
“這些化學(xué)修飾就像是高速路上的減速帶,當(dāng)聚合酶對其進(jìn)行驅(qū)動時,使得DNA的延伸變慢,或者有時候會變快,這取決于特定環(huán)境。那些模式產(chǎn)生特異信號從而可以檢測到它們。”Turner說。
納米孔技術(shù)
Oxford Nanopore公司正在開發(fā)兩種納米孔測序方法(“鏈條法”及“核酸外切酶法”,并已就后者同Illumina達(dá)成了商業(yè)化協(xié)議),公司拒絕評論其項目的進(jìn)展?fàn)顟B(tài),但一些在線信息顯示此系統(tǒng)由一系列的可以相互通訊的測序節(jié)點形成一個網(wǎng)絡(luò)結(jié)構(gòu),每個節(jié)點配置一個耗材倉庫。每個GridION節(jié)點可獨立運行,或通過網(wǎng)絡(luò)與其他節(jié)點通訊達(dá)到更大的測序效果,該架構(gòu)可實現(xiàn)多功能工作流。
不過,該公司在2011年10月20號公開的職位招聘列表包含一個“試用合作,DNA測序”職位,職責(zé)包括“管理與的基因組研究機構(gòu)中的重點客戶進(jìn)行的技術(shù)開發(fā)合作”,Oxford在不久的將來可能會褪去其神秘外紗并啟動試用程序。
另一個專注于納米孔的公司Genia也邁出了它們商業(yè)化的*步。據(jù)該公司CEO Stefan Roever稱,Genia正在開發(fā)一種使用生物孔和集成電路(相同的技術(shù)正驅(qū)動著計算機工業(yè)發(fā)展)的納米系統(tǒng)。Roever解釋說,該系統(tǒng)“運用的電子學(xué),并將其應(yīng)用到信號處理過程中非常棘手的問題,”也就是說,對單個DNA堿基通過納米孔時產(chǎn)生的微弱的電子順序信號進(jìn)行捕捉。
Roever說,Genia的系統(tǒng)的核心是活性芯片,能夠?qū)Ω鱾€孔進(jìn)行獨立讀取和控制。[8]芯片“通電”之后,研究人員可以對納米孔陣列進(jìn)行動態(tài)組裝,向納米孔中添加DNA樣并實施測序,同時可以依需要將這些DNA分子排出納米孔。盡管實驗表明其可以區(qū)分四種堿基并控制DNA的運動,但該技術(shù)目前還處在研發(fā)中,Roever說道。“我們希望2012年*季度能夠推出帶有幾百個傳感器的這種芯片的α版本。”
這種芯片如何與Oxford及其他的測序界大牛過招還需拭目以待。不過當(dāng)下還有一位大牛沒有參與到競爭中來,那就是第三代單分子測序公司Helicos BioSciences。據(jù)GenomeWeb Daily News報道,Helicos在11月14號宣稱2011年第三季度的收入增長,“但要小心因為缺乏現(xiàn)金注入而不得不在年底關(guān)門大吉。