2008年Google成立10周年,英國(guó)Nature雜志曾出版關(guān)于“討論大數(shù)據(jù)處理的技術(shù)問(wèn)題和未來(lái)挑戰(zhàn)”的專(zhuān)輯,最早提出了“Big?Data”的概念。隨著計(jì)算機(jī)科學(xué)技術(shù)和信息工程技術(shù)的迅猛發(fā)展和普及應(yīng)用,各行業(yè)數(shù)據(jù)呈爆炸性增長(zhǎng),大數(shù)據(jù)處理的迫切性和重要性已經(jīng)獲得全球?qū)W術(shù)界、工業(yè)界和各國(guó)政府的高度關(guān)注和重視。2012年3月,美國(guó)總統(tǒng)奧巴馬簽署并發(fā)布了“大數(shù)據(jù)研究發(fā)展創(chuàng)新計(jì)劃”,該計(jì)劃由美國(guó)國(guó)家自然科學(xué)基金會(huì)(NationalScience?Foundation,NSF)、美國(guó)國(guó)立衛(wèi)生研究院(National?Institutes?of?Health,NIH)、能源部(Department?of?Energy,DOE)、國(guó)防部(Department?of?Defense,DOD)等6大部門(mén)聯(lián)合投資2億美元啟動(dòng)。中國(guó)的學(xué)術(shù)界和工業(yè)界也在積極趕超世界前沿,廣泛開(kāi)展大數(shù)據(jù)技術(shù)的研究和開(kāi)發(fā)。“十一五”以來(lái),國(guó)家科技部973、863?計(jì)劃聯(lián)合工業(yè)和信息化部開(kāi)展的核高基等科技重大專(zhuān)項(xiàng)、國(guó)家自然科學(xué)基金等重大科研計(jì)劃均已將大數(shù)據(jù)列為重要的研究?jī)?nèi)容。
人類(lèi)基因組計(jì)劃(human?genome?project,HGP)、基因組單體型圖計(jì)劃(hapmapproject)、全基因組關(guān)聯(lián)分析(genome-wide?association?study,GWAS)、DNA元件百科全書(shū)(encyclopedia?of?DNA?elements,ENCODE)、表觀路線(xiàn)圖(NIH?roadmap?epigenomics)等大型組學(xué)計(jì)劃的順利完成,帶動(dòng)了生命科學(xué)領(lǐng)域的重大變革。高通量測(cè)序、高性能質(zhì)譜等組學(xué)技術(shù)得以快速發(fā)展,生命科學(xué)研究產(chǎn)生了大量有價(jià)值的包括基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等在內(nèi)的“生物大數(shù)據(jù)”。整合分析多重組學(xué)數(shù)據(jù)和臨床資料,構(gòu)建健康與疾病的知識(shí)網(wǎng)絡(luò),將有望對(duì)疾病發(fā)展和不同病理狀態(tài)進(jìn)行更加準(zhǔn)確的分類(lèi),為不同遺傳背景的患者提供個(gè)體化診斷及精準(zhǔn)治療。
1 精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)的系統(tǒng)整合與挖掘分析
1.1 生物醫(yī)學(xué)大數(shù)據(jù)的集成與管理
隨著信息技術(shù)的飛速發(fā)展,生物醫(yī)學(xué)領(lǐng)域進(jìn)入了海量數(shù)據(jù)時(shí)代。一方面,傳統(tǒng)醫(yī)療領(lǐng)域每天都在產(chǎn)生大量的診斷影像圖像、病理分析圖等,而且患者的數(shù)據(jù)通常需要保留至少50年以上,這些數(shù)據(jù)不僅包括大量在線(xiàn)或?qū)崟r(shí)數(shù)據(jù),還包括臨床決策支持中的診斷和用藥建議、各種結(jié)構(gòu)化數(shù)據(jù)表、非(半)結(jié)構(gòu)化文本文檔、醫(yī)療影像、電子錄音等多種數(shù)據(jù)。另一方面,各種組學(xué)數(shù)據(jù)是目前生物醫(yī)學(xué)領(lǐng)域增長(zhǎng)最快的數(shù)據(jù)類(lèi)型,是精準(zhǔn)醫(yī)學(xué)研究的重要組成部分。
測(cè)序技術(shù)的發(fā)展日新月異,1999年來(lái)自多個(gè)國(guó)家的科學(xué)家花費(fèi)30億美金、10年時(shí)間完成了一個(gè)人的基因圖譜序列,2007年測(cè)定一個(gè)亞洲人基因圖譜序列花費(fèi)3000萬(wàn)人民幣。目前測(cè)定一個(gè)人的基因圖譜序列只需數(shù)千元人民幣,Illumina公司生產(chǎn)的HiSeq?X?Ten測(cè)序儀1年至少可以完成18000人的全基因組測(cè)序。在此背景下,生命健康領(lǐng)域快速產(chǎn)生了大量的組學(xué)數(shù)據(jù)。與此同時(shí),各國(guó)也紛紛開(kāi)展以組學(xué)為基礎(chǔ)、以個(gè)性化治療為目的精準(zhǔn)醫(yī)學(xué)計(jì)劃。來(lái)自16個(gè)國(guó)家的科學(xué)家共同參與的腫瘤基因組圖譜計(jì)劃(the?cancer?genome?atlas,TCGA)已經(jīng)收入上萬(wàn)例患者樣本,涵蓋42種腫瘤類(lèi)型,目前已發(fā)現(xiàn)近1000萬(wàn)個(gè)與癌癥相關(guān)的基因突變,數(shù)據(jù)量超過(guò)5PB。美國(guó)100萬(wàn)人基因組研究的精準(zhǔn)醫(yī)療(precision?medicine?initiative)計(jì)劃正在全面展開(kāi);英國(guó)“10萬(wàn)基因組計(jì)劃”也進(jìn)行到了關(guān)鍵時(shí)刻。基因組技術(shù)正在以超乎人們想象的速度成為診斷和治療疾病的實(shí)用工具,N?Engl?J?Med專(zhuān)門(mén)為此向臨床醫(yī)師發(fā)布基因組測(cè)序的臨床應(yīng)用指南,希望幫助他們更有效地利用這一新技術(shù)。
對(duì)于生物醫(yī)學(xué)大數(shù)據(jù)的有效管理和利用是使其體現(xiàn)出巨大科學(xué)與產(chǎn)業(yè)價(jià)值的關(guān)鍵,同時(shí)也是大數(shù)據(jù)應(yīng)用的技術(shù)瓶頸。20世紀(jì)80~90年代,美國(guó)、日本、歐洲等發(fā)達(dá)國(guó)家和地區(qū)即已率先建立世界三大生物數(shù)據(jù)中心:美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)、日本DNA?數(shù)據(jù)庫(kù)(DDBJ)、歐洲生物信息研究所(EBI),掌握并管理全世界的生物數(shù)據(jù)和知識(shí)資源,并處于壟斷地位。我國(guó)人口眾多,具有豐富的生物樣本資源,但是,我國(guó)產(chǎn)生的許多科研數(shù)據(jù)資源不得不提交至上述數(shù)據(jù)中心,導(dǎo)致我國(guó)投入大量資金與人力產(chǎn)生的生物數(shù)據(jù)嚴(yán)重流失,嚴(yán)重威脅我國(guó)生物數(shù)字主權(quán)。
盡快建設(shè)一個(gè)國(guó)家級(jí)的生命信息中心不但意義重大,而且非常緊迫。為了更加有效地管理與利用生物醫(yī)學(xué)大數(shù)據(jù),科技部已經(jīng)率先啟動(dòng)面向精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)管理和服務(wù)需求的“生物大數(shù)據(jù)開(kāi)發(fā)與利用關(guān)鍵技術(shù)研究”等重大研究計(jì)劃,積極建設(shè)“組學(xué)大數(shù)據(jù)中心和知識(shí)庫(kù)”“疾病大數(shù)據(jù)處理分析與應(yīng)用”“基于區(qū)域醫(yī)療與健康大數(shù)據(jù)處理分析與應(yīng)用”等國(guó)家級(jí)的研究中心和技術(shù)聯(lián)盟。在技術(shù)層面,相對(duì)于世界三大數(shù)據(jù)中心建設(shè)之初,計(jì)算機(jī)硬件和軟件技術(shù)均已取得了長(zhǎng)足的進(jìn)步,我國(guó)已經(jīng)制造出穩(wěn)定高性能和高并行化的超級(jí)計(jì)算機(jī),并掌握了高輸入輸出的分布式存儲(chǔ)技術(shù)。我國(guó)有條件發(fā)揮后發(fā)優(yōu)勢(shì),盡快滿(mǎn)足精準(zhǔn)醫(yī)學(xué)快速發(fā)展所面臨的數(shù)據(jù)和分析的需求。
1.2 生物醫(yī)學(xué)大數(shù)據(jù)的挖掘與分析
面對(duì)生物醫(yī)學(xué)領(lǐng)域以幾何級(jí)數(shù)增長(zhǎng)的多樣化、海量數(shù)據(jù),建立標(biāo)準(zhǔn)化的分析方法極為重要,這是不同醫(yī)療單位、科研團(tuán)體之間實(shí)現(xiàn)數(shù)據(jù)共享、資源整合,并進(jìn)一步實(shí)現(xiàn)精準(zhǔn)醫(yī)療的前提。在醫(yī)療病歷的數(shù)據(jù)匯總和整合方面,美國(guó)初創(chuàng)公司Flatiron?Health采取了匹配算法和人工復(fù)核的手段實(shí)現(xiàn)臨床數(shù)據(jù)的挖掘,代表著行業(yè)內(nèi)的標(biāo)準(zhǔn)策略。整體來(lái)說(shuō),傳統(tǒng)醫(yī)療數(shù)據(jù)的挖掘仍處于開(kāi)始階段,依賴(lài)于模式識(shí)別、自然語(yǔ)言處理、混合型人機(jī)學(xué)習(xí)等技術(shù)的發(fā)展。
組學(xué)數(shù)據(jù)類(lèi)型較傳統(tǒng)醫(yī)療數(shù)據(jù)少,產(chǎn)生平臺(tái)相對(duì)一致,主要集中于Illumina、Life?Technologies和Roche三家公司,但面臨單一數(shù)據(jù)量大、可重復(fù)性差、處理流程多樣等問(wèn)題。基因組方面,已有大量的工具來(lái)鑒定個(gè)體基因組中的SNP、indel、copynumber?variation、基因融合等,但不同工具結(jié)果間的一致性相對(duì)較低。在轉(zhuǎn)錄組學(xué)研究領(lǐng)域,Su等通過(guò)比較不同平臺(tái)、不同實(shí)驗(yàn)室、不同分析流程處理的RNA-Seq數(shù)據(jù)發(fā)現(xiàn)未被注釋的exonexonjunction超過(guò)80%可以被qPCR證實(shí),而基因表達(dá)水平若需在不同平臺(tái)和實(shí)驗(yàn)室之間取得較高的一致性則需設(shè)定特殊的過(guò)濾標(biāo)準(zhǔn)。這些現(xiàn)狀顯示出建立準(zhǔn)確、統(tǒng)一、可追溯的分析標(biāo)準(zhǔn)的必要性。在此背景下,美國(guó)腫瘤研究所聯(lián)合Broad?研究所、系統(tǒng)生物學(xué)研究所(Institute?for?Systems?Biology,ISB)和七橋基因組公司(Seven?Bridges?Genomics)開(kāi)展了云試點(diǎn)項(xiàng)目(the?cloud?pilots?program,http://cbiit.nci.nih.gov/ncip/nci-cancer-genomics-cloud-pilots),希望實(shí)現(xiàn)從樣本收集到醫(yī)療數(shù)據(jù)、組學(xué)數(shù)據(jù)的分析、可視化等的統(tǒng)一。另有一系列商業(yè)和非商業(yè)化的云計(jì)算解決方案也在積極嘗試中,如DNAnexus(https://www.dnanexus.com),Galaxy(https://usegalaxy.org),CloudMan等。
1.3 精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)的整合與共享
有效利用生物醫(yī)學(xué)大數(shù)據(jù)的重要基礎(chǔ)是“聚類(lèi)”。整合多種組學(xué)數(shù)據(jù)以及將組學(xué)數(shù)據(jù)和臨床數(shù)據(jù)結(jié)合并用于臨床診斷、藥物開(kāi)發(fā)等精準(zhǔn)醫(yī)學(xué)范疇,需要統(tǒng)計(jì)基因組學(xué)、臨床應(yīng)用生物信息學(xué)、病理學(xué)、治療等多領(lǐng)域?qū)<矣行f(xié)作才能實(shí)現(xiàn)。雖然整合的過(guò)程困難重重,但國(guó)家級(jí)的基因組計(jì)劃已經(jīng)成為世界各國(guó)發(fā)展的熱點(diǎn),已有類(lèi)似的整合研究正在探索中。實(shí)驗(yàn)技術(shù)方面,Macaulay等開(kāi)發(fā)出了稱(chēng)為G&T-seq的新型測(cè)序方法,能夠?qū)崿F(xiàn)大規(guī)模的DNA和RNA平行測(cè)序,同時(shí)展現(xiàn)單個(gè)細(xì)胞的基因組序列和基因活性。生物信息方法學(xué)方面,Kaplan-Meier分析通過(guò)測(cè)序數(shù)據(jù)和臨床生存數(shù)據(jù)的結(jié)合可以篩選出多種類(lèi)型的標(biāo)志物。通過(guò)整合基因組突變、表達(dá)、拷貝數(shù)等數(shù)據(jù)可以富集出影響疾病的通路。PARADIG整合多種組學(xué)數(shù)據(jù),通過(guò)統(tǒng)計(jì)推斷得出患者特異的疾病通路,并能依據(jù)通路將患者分組,進(jìn)一步指導(dǎo)臨床治療。Yuan等整合了體細(xì)胞拷貝數(shù)變化、DNA甲基化、miRNA/mRNA/蛋白質(zhì)表達(dá)數(shù)據(jù)和臨床數(shù)據(jù),通過(guò)LASSO+Cox、隨機(jī)生存森林等計(jì)算一致性指數(shù),得出結(jié)論:分子數(shù)據(jù)結(jié)合臨床數(shù)據(jù)較二者獨(dú)立情況下更能準(zhǔn)確地預(yù)測(cè)患者生存情況。近年來(lái)還發(fā)現(xiàn)微生物組與人類(lèi)健康密切相關(guān),QIIME等工具可整合微生物組和臨床數(shù)據(jù),進(jìn)而發(fā)現(xiàn)腸道菌群與神經(jīng)系統(tǒng)、肝臟等疾病之間的關(guān)系,為精準(zhǔn)醫(yī)學(xué)的實(shí)現(xiàn)提供了新的視角。
上述分析層面的整合集中于研究階段,應(yīng)用層面的整合和共享是提高大數(shù)據(jù)再利用率和用于精準(zhǔn)醫(yī)學(xué)的進(jìn)一步要求。在數(shù)據(jù)整合方面,理清數(shù)據(jù)集之間的關(guān)系,如原始數(shù)據(jù)集、元數(shù)據(jù)集和知識(shí)型數(shù)據(jù)集之間的關(guān)系,平衡搜索速度和結(jié)果的特異性等尤為重要。云計(jì)算支撐大數(shù)據(jù)的解決方案為:結(jié)構(gòu)化數(shù)據(jù)采用數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)技術(shù)管理。半結(jié)構(gòu)化數(shù)據(jù)采用網(wǎng)頁(yè)、搜索引擎等技術(shù)展示。非結(jié)構(gòu)化數(shù)據(jù)用深度學(xué)習(xí)、網(wǎng)絡(luò)交互和群體智能處理。對(duì)非結(jié)構(gòu)化數(shù)據(jù)隨著挖掘過(guò)程的自適應(yīng)簡(jiǎn)約,頻繁使用的熱數(shù)據(jù)逐步變?yōu)榘虢Y(jié)構(gòu)化甚至結(jié)構(gòu)化,其余轉(zhuǎn)為冷存儲(chǔ)。在數(shù)據(jù)共享方面,一方面要有高性能的互聯(lián)網(wǎng)架構(gòu),實(shí)現(xiàn)高效率的存儲(chǔ)和傳輸;另一方面要注意數(shù)據(jù)的隱私和安全,通過(guò)數(shù)據(jù)加密、屏蔽隱私數(shù)據(jù)等技術(shù)手段和國(guó)家層面的法律法規(guī)的約束和引導(dǎo)才能得到保證。
2 生物大數(shù)據(jù)的精準(zhǔn)醫(yī)學(xué)應(yīng)用
2.1 大數(shù)據(jù)時(shí)代的疾病風(fēng)險(xiǎn)評(píng)估與健康指導(dǎo)
在過(guò)去很長(zhǎng)一段時(shí)間,人們只有在身體不適、已經(jīng)患某種疾病時(shí)才去尋求專(zhuān)業(yè)醫(yī)療的幫助。而此時(shí)疾病往往已進(jìn)展至較為嚴(yán)重的階段,錯(cuò)過(guò)了最佳的治療時(shí)間。大數(shù)據(jù)時(shí)代的到來(lái),特別是基因組、轉(zhuǎn)錄組、表觀組、蛋白質(zhì)組、代謝組、微生物組等生物大數(shù)據(jù)的不斷積累,為利用多重組學(xué)數(shù)據(jù)評(píng)估健康人群的患病風(fēng)險(xiǎn)提供了重要的理論依據(jù),《黃帝內(nèi)經(jīng)》提出的“上醫(yī)治未病”有望成為現(xiàn)實(shí)(圖1)。
美國(guó)影星Angelina?Jolie面對(duì)自身BRCA基因缺陷、家族女性親屬患乳腺癌去世等腫瘤高發(fā)風(fēng)險(xiǎn),接受乳腺和卵巢的外科切除手術(shù)已為大家熟知。美國(guó)斯坦福大學(xué)遺傳與個(gè)體化組學(xué)中心主任Michael?Snyder教授是利用組學(xué)數(shù)據(jù)評(píng)估個(gè)體健康研究的先行者,54歲時(shí)開(kāi)始采集自身血液樣本,歷經(jīng)14個(gè)月,共獲得20個(gè)時(shí)間點(diǎn)的樣品。通過(guò)整合分析樣品的基因組、轉(zhuǎn)錄組、蛋白質(zhì)組、代謝組和自身抗體譜,Michael?Snyder團(tuán)隊(duì)不僅全面揭示了個(gè)體在疾病和健康狀態(tài)下各分子的動(dòng)態(tài)變化,也表明其患2型糖尿病等疾病的風(fēng)險(xiǎn)較高。盡管Michael家族并未有人罹患2型糖尿病,其本身也不超重,但通過(guò)咨詢(xún)臨床醫(yī)師,發(fā)現(xiàn)其糖代謝已超過(guò)正常界限。根據(jù)醫(yī)師的建議,Michael?Snyder教授調(diào)整了自己的飲食結(jié)構(gòu)和生活規(guī)律,加入了鍛煉計(jì)劃。6個(gè)月后,其血糖水平恢復(fù)正常。
人類(lèi)基因組計(jì)劃的總負(fù)責(zé)人、美國(guó)NIH?現(xiàn)任主任Francis?S.?Collins?博士也曾嘗試了三家公司(23andMe、deCODE、Navigenics)的精準(zhǔn)醫(yī)學(xué)定制服務(wù),根據(jù)檢測(cè)結(jié)果“聯(lián)系了私人教練,下定決心節(jié)食并增加運(yùn)動(dòng),以減少罹患糖尿病的風(fēng)險(xiǎn)。此外,還查閱了關(guān)于黃斑變性的研究文獻(xiàn),發(fā)現(xiàn)多攝取不飽和脂肪酸對(duì)預(yù)防該病大有裨益。因此,在食譜中增加了更多的魚(yú)類(lèi)。鑒于我可能有罹患青光眼的風(fēng)險(xiǎn),我也下定決心每年進(jìn)行1次眼部檢查,包括眼壓測(cè)量”。
在我國(guó),隨著測(cè)序技術(shù)日趨成熟、測(cè)序成本日益降低,為臨床服務(wù)的測(cè)序服務(wù)商不斷增多。相信在不遠(yuǎn)的將來(lái),隨著基因檢測(cè)服務(wù)的逐步完善與規(guī)范,更多的普通人群也能像Snyder教授和Collins教授一樣,獲得專(zhuān)業(yè)解讀的個(gè)人基因組學(xué)信息,監(jiān)控個(gè)人健康狀況,更好地規(guī)劃自己的生活和未來(lái)。
2.2 整合分析多組學(xué)和臨床數(shù)據(jù)確定疾病靶點(diǎn)
自Pauling等確定鐮刀型細(xì)胞貧血癥(sickle?cell?anemia)的分子遺傳機(jī)制以來(lái),目前已被確定的遺傳病超過(guò)5000種,主要包括單基因遺傳病、多基因遺傳病、染色體異常遺傳病等三大類(lèi)。高通量測(cè)序和生物大數(shù)據(jù)分析已成功用于多基因遺傳病檢測(cè)、無(wú)創(chuàng)產(chǎn)前篩查(NIPT)和胚胎植入前遺傳學(xué)檢測(cè)(PGD)等臨床實(shí)踐,取得了良好的社會(huì)效益和經(jīng)濟(jì)效益。此外,高通量測(cè)序在檢測(cè)外周循環(huán)血液中的腫瘤細(xì)胞或腫瘤DNA/RNA,用于早期腫瘤篩查、檢測(cè)腫瘤復(fù)發(fā)、觀察臨床療效等方面也具有其獨(dú)特的優(yōu)勢(shì)。
我國(guó)科學(xué)家已經(jīng)在疾病隊(duì)列人群的全基因組關(guān)聯(lián)分析(genome-wide?association?study,GWAS)等多組學(xué)研究中積累了豐富的工作經(jīng)驗(yàn),為闡明復(fù)雜疾病發(fā)生的分子機(jī)制提供了重要的理論依據(jù)。1998年,中南大學(xué)夏家輝院士等成功地克隆人類(lèi)遺傳性神經(jīng)性耳聾的致病基因GJB3。交通大學(xué)賀林院士的團(tuán)隊(duì)率先完成第1例孟德?tīng)柍H旧w遺傳病A-1型短指(趾)癥致病基因的克隆與突變檢測(cè);通過(guò)對(duì)患病家系的遺傳連鎖分析,定位了第1例以中國(guó)人姓氏命名的罕見(jiàn)恒齒缺失的孟德?tīng)柍H旧w顯性遺傳病“賀–趙缺陷癥”的致病基因。安徽醫(yī)科大學(xué)張學(xué)軍教授等在銀屑病、系統(tǒng)性紅斑狼瘡、麻風(fēng)、白癜風(fēng)等復(fù)雜疾病的GWAS研究中發(fā)現(xiàn)一系列疾病易感基因。中山大學(xué)腫瘤醫(yī)院曾益新院士等開(kāi)展的鼻咽癌GWAS除證實(shí)人類(lèi)白細(xì)胞抗原與鼻咽癌的關(guān)聯(lián)性外,發(fā)現(xiàn)多個(gè)新的易感基因。軍事醫(yī)學(xué)科學(xué)院賀福初院士和周鋼橋教授開(kāi)展的肝臟蛋白質(zhì)組和肝癌的GWAS研究,發(fā)現(xiàn)乙型肝炎病毒相關(guān)肝癌的易感基因。中國(guó)醫(yī)學(xué)科學(xué)院基礎(chǔ)醫(yī)學(xué)研究所張學(xué)教授對(duì)于遺傳性脫發(fā)相關(guān)藥物靶點(diǎn)以及他與沈巖院士合作的反常性痤瘡家族基因的研究。中國(guó)醫(yī)學(xué)科學(xué)院腫瘤研究所詹啟敏院士團(tuán)隊(duì)在廣東潮汕地區(qū)開(kāi)展食管鱗狀細(xì)胞癌研究。林東昕院士課題組開(kāi)展的肺癌、食管癌流行病學(xué)研究;林東昕院士與鄭州大學(xué)王立東教授等對(duì)河南安陽(yáng)地區(qū)的食管癌隊(duì)列研究等。
一些復(fù)雜疾病往往是由遺傳、環(huán)境等多重因素導(dǎo)致的,僅依賴(lài)于臨床上的影像診斷和病理分析等難以對(duì)疾病作出準(zhǔn)確的診斷和分類(lèi)。綜合分析多種組學(xué)數(shù)據(jù)和臨床數(shù)據(jù),能夠更加準(zhǔn)確地確定各疾病的亞型。在乳腺癌中,不同的分子亞型在臨床癥狀、治療反應(yīng)和效果方面有明顯差異。由轉(zhuǎn)錄組數(shù)據(jù)確定的胰腺癌三種亞型,患者治療后的反應(yīng)具有差異性。而不同分子亞型的結(jié)直腸癌患者的存活時(shí)間顯著差異。除癌癥外,這種綜合分析也被用于其他復(fù)雜疾病的診療,如自閉癥譜系障礙。綜合分析外顯子組數(shù)據(jù)、基因表達(dá)譜、蛋白質(zhì)表達(dá)譜以及臨床上的心理測(cè)試和影像診斷,研究人員提出了新的自閉癥亞型,這一成果不僅加強(qiáng)了自閉癥診斷,也為后期選擇有效的治療方案提供了依據(jù)。
2.3 精準(zhǔn)醫(yī)學(xué)藥物研發(fā)及用藥指導(dǎo)
單一靶點(diǎn)的藥物可以靶向特定的腫瘤細(xì)胞。腫瘤是多基因疾病,需要多靶點(diǎn)的藥物治療。腫瘤的特點(diǎn)是過(guò)度增殖,因此開(kāi)發(fā)的抗腫瘤藥物主要用于抑制腫瘤生長(zhǎng),相應(yīng)的分子靶標(biāo)大多數(shù)屬于激酶與受體。多組學(xué)數(shù)據(jù)與臨床數(shù)據(jù)的整合分析,為疾病新靶點(diǎn)的確定提供了更加有效的技術(shù)手段。20世紀(jì)80年代后期,研究人員針對(duì)發(fā)現(xiàn)的一種過(guò)度表達(dá)HER2蛋白的侵襲性乳腺癌亞型研發(fā)了曲妥珠單抗(赫賽汀)用于治療HER2過(guò)度表達(dá)的轉(zhuǎn)移性乳腺癌。此后,曲妥珠單抗也被用于治療HER2過(guò)度表達(dá)性胃癌或食管胃結(jié)合部癌以及尿道癌,是基因靶向藥物的成功范例。在精準(zhǔn)醫(yī)療時(shí)代,相信更多的藥物研發(fā)將集中針對(duì)一種或多種疾病的靶點(diǎn)。
在用藥指導(dǎo)方面,臨床上多數(shù)僅根據(jù)癥狀體征、輔助檢查和影像學(xué)資料進(jìn)行診斷,針對(duì)具有相同或相似癥狀指標(biāo)的患者,將使用同樣的治療方案。而實(shí)際上,不同患者對(duì)同一種藥物的敏感性存在差異。個(gè)體間的用藥差異與患者本身的遺傳背景有緊密的關(guān)系。精準(zhǔn)醫(yī)療能夠根據(jù)分子特征將患者進(jìn)行細(xì)致分類(lèi),為有效治療提供參考。在指導(dǎo)臨床用藥方面,以常用抗凝藥物華法林為例,美國(guó)食品和藥物管理局(FDA)于2010?年2月修改了華法林的藥物說(shuō)明書(shū),建議在使用該處方藥前,要對(duì)維生素K環(huán)氧化物還原酶和P450代謝酶CYP2C9進(jìn)行基因檢測(cè),針對(duì)不同的基因類(lèi)型,配合抗凝藥學(xué)實(shí)踐,進(jìn)行藥物劑量調(diào)整,可減少抗凝過(guò)量的發(fā)生,具有積極的臨床意義。中日友好醫(yī)院院長(zhǎng)王辰院士介紹,目前美國(guó)已有166種藥物的說(shuō)明書(shū)標(biāo)注有相關(guān)的基因信息,歐洲藥品管理局(EMA)有88?種,日本藥品和醫(yī)療器械局(PMDA)有28種,而中國(guó)僅有不超過(guò)10種藥物使用說(shuō)明提出模糊要求而且不強(qiáng)制執(zhí)行。如果能堅(jiān)持推廣精準(zhǔn)用藥臨床醫(yī)學(xué)指導(dǎo),可望能有效避免卡馬西平、氯吡格雷、別嘌醇、甲氨蝶呤、巰嘌呤等藥物的嚴(yán)重不良事件,減少藥品的無(wú)效使用和醫(yī)保的不必要支出。
3 結(jié)語(yǔ)
現(xiàn)階段我國(guó)在基因測(cè)序技術(shù)、臨床隊(duì)列以及生物醫(yī)學(xué)大數(shù)據(jù)等方面已經(jīng)奠定了良好的研究基礎(chǔ)。然而,在生物大數(shù)據(jù)、生物樣本等資源共享方面仍然面臨一定的挑戰(zhàn)。同時(shí),如何有效集成、整合、分析不同來(lái)源、不同層次的生物大數(shù)據(jù),提供有效靶點(diǎn)用于臨床試驗(yàn)與用藥指導(dǎo),也是備受關(guān)注的重要科學(xué)問(wèn)題。針對(duì)正在醞釀啟動(dòng)的精準(zhǔn)醫(yī)學(xué)計(jì)劃,我國(guó)政府也在積極出臺(tái)相關(guān)的法律和法規(guī),在創(chuàng)新科技政策的引導(dǎo)下,積極推動(dòng)并協(xié)調(diào)多部門(mén)合作。各種行業(yè)協(xié)會(huì)、學(xué)術(shù)團(tuán)體同時(shí)努力發(fā)揮其交流融合的優(yōu)勢(shì)。在基礎(chǔ)研究方面,盡快建立符合精準(zhǔn)醫(yī)學(xué)需求的大型隊(duì)列、標(biāo)準(zhǔn)化生物標(biāo)本庫(kù)、中國(guó)人遺傳特征等大數(shù)據(jù)資料和相應(yīng)的分析標(biāo)準(zhǔn)。在醫(yī)療活動(dòng)的具體實(shí)施層面,及時(shí)納入精準(zhǔn)醫(yī)學(xué)的評(píng)價(jià)和治療體系,對(duì)不同基因型的患者提供個(gè)體化診斷及精準(zhǔn)藥物治療。地方政府、企業(yè)和金融機(jī)構(gòu)也通過(guò)各種形式積極參與,通過(guò)“交叉融合、協(xié)同創(chuàng)新”,相信適合我國(guó)國(guó)情的精準(zhǔn)醫(yī)學(xué)體系能很快進(jìn)入具體實(shí)施階段。
來(lái)源:《中國(guó)醫(yī)學(xué)前沿雜志(電子版)》,2015,7(6):4-10.?
作者:李艷明,楊亞?wèn)|,張昭軍,方向東
]]>