English | 中文版 | 手機(jī)版 企業(yè)登錄 | 個(gè)人登錄 | 郵件訂閱
當(dāng)前位置 > 首頁 > 行業(yè)資訊 > 新聞 > 因美納PrimateAI-3D算法引領(lǐng)基因組學(xué)邁入AI新紀(jì)元

因美納PrimateAI-3D算法引領(lǐng)基因組學(xué)邁入AI新紀(jì)元

瀏覽次數(shù):1229 發(fā)布日期:2023-6-6  來源:本站 本站原創(chuàng),轉(zhuǎn)載請(qǐng)注明出處

歷經(jīng)三十年,全球科學(xué)家繪制出完整的人類基因組圖譜,開啟了基因世界的大門。然而,每個(gè)人的遺傳密碼中都存在數(shù)百萬個(gè)變異,迄今為止只有0.07%的人類已被測(cè)序,并存在數(shù)據(jù)代表性不足。
 

如何加速解碼生命密碼?

如何解決基因組數(shù)據(jù)代表性不足?

如何推動(dòng)基因組學(xué)應(yīng)用于改善人類健康?

基因組學(xué)領(lǐng)域的“ChatGPT”——

PrimateAI-3D,正加速解碼精準(zhǔn)醫(yī)療和藥物靶點(diǎn)發(fā)現(xiàn)!

6月1日,全球基因測(cè)序和芯片技術(shù)的領(lǐng)導(dǎo)者因美納(納斯達(dá)克股票代碼:ILMN),宣布推出全新的人工智能(AI)算法——PrimateAI-3D,利用靈長(zhǎng)類動(dòng)物基因和先進(jìn)的人工智能技術(shù)來改善遺傳風(fēng)險(xiǎn)預(yù)測(cè)和藥物靶點(diǎn)發(fā)現(xiàn)。

 

同期,《科學(xué)》(Science)雜志發(fā)表主題特刊(第6648期)該期特刊中8篇論文中的4篇來自因美納和24個(gè)國(guó)家/地區(qū)的科學(xué)家們的合作,其中兩篇由因美納人工智能副總裁Kyle Farh擔(dān)任通訊作者,詳細(xì)介紹了PrimateAI-3D算法的訓(xùn)練方式及其在英國(guó)生物樣本庫(UK Biobank)隊(duì)列中50萬個(gè)基因組的應(yīng)用情況。另外兩篇有關(guān)靈長(zhǎng)類動(dòng)物進(jìn)化研究的論文也同期發(fā)表,為PrimateAI-3D的開發(fā)提供了信息。

圖片
《科學(xué)》(Science)雜志封面(第6648期)


 

自人類基因組圖譜繪成以來,全球科學(xué)家與臨床醫(yī)生不斷致力于深入研究基因變異,解碼基因與人類健康的奧秘。每個(gè)人都攜帶著數(shù)百萬種基因變異,正是這些變異導(dǎo)致了健康和疾病風(fēng)險(xiǎn)的個(gè)體差異,但目前大多數(shù)變異的作用方式尚不明確。盡管全球有80億人口,但全人類的遺傳多樣性仍然與10,000個(gè)共同祖先(起源種群)相似。要真正了解人類基因組,僅憑人類基因組測(cè)序中的數(shù)據(jù)遠(yuǎn)遠(yuǎn)不夠。

 

DNA就是活歷史

 

進(jìn)化是世界上持續(xù)時(shí)間最長(zhǎng)的實(shí)驗(yàn)。大自然在進(jìn)化中不斷通過隨機(jī)突變來測(cè)試基因,那些危害動(dòng)物健康的變異很快就會(huì)從基因庫中剔除,而那些中性或有益的變異則會(huì)留存并傳遞下去。Farh表示:“這些大自然實(shí)驗(yàn)的結(jié)果記錄在每個(gè)物種的基因組中,并一直留存下來,形成一份活檔案。”

 

盡管在形態(tài)上千差萬別,但現(xiàn)存靈長(zhǎng)類動(dòng)物(包括猿、猴、原猴亞目,例如狐猴和懶猴)與人類之間仍有90%以上的DNA是相同的。在黑猩猩或倭黑猩猩身上發(fā)生的突變同樣會(huì)在人類身上發(fā)生,而因美納科學(xué)家的研究表明,如果某種變異在另一種靈長(zhǎng)類動(dòng)物身上是接受自然選擇的結(jié)果,則該變異有99%的概率不會(huì)在人類身上引發(fā)疾病*[1]。

圖片
巴西馬米拉瓦可持續(xù)發(fā)展保護(hù)區(qū)的洪堡松鼠猴(cassiquiarensis) |馬塞洛·桑塔納攝

因此,通過對(duì)現(xiàn)代靈長(zhǎng)類動(dòng)物進(jìn)行測(cè)序,我們可以更好地了解哪些變異不會(huì)致病。本期《科學(xué)》(Science)雜志中題為《The landscape of tolerated genetic variation in humans and primates》的研究對(duì)來自233個(gè)非人靈長(zhǎng)類的800余個(gè)動(dòng)物進(jìn)行了測(cè)序,物種涵蓋全部16個(gè)科和86%以上的現(xiàn)存屬。但測(cè)序只是第一步:掌握所有數(shù)據(jù)之后,還需要進(jìn)行解讀。為此,因美納開發(fā)了PrimateAI-3D用作數(shù)據(jù)解讀方法。

圖片


PrimateAI-3D將最新的人工智能技術(shù)與先進(jìn)的基因測(cè)序能力結(jié)合在一起,這一產(chǎn)品的推出,振奮人心。因美納將持續(xù)助力臨床醫(yī)生和研究人員同步研究大量基因組數(shù)據(jù),并有可能成倍地加速正在進(jìn)行的關(guān)鍵工作,以更好地為患者提供服務(wù)。

通過自然選擇訓(xùn)練的AI算法

 

由因美納研發(fā)的PrimateAI-3D可高度準(zhǔn)確地發(fā)現(xiàn)致病變異,解決疾病面臨的關(guān)鍵挑戰(zhàn),從而成功實(shí)現(xiàn)個(gè)體化基因組精準(zhǔn)醫(yī)學(xué)。

 

為了獲得先進(jìn)的性能,PrimateAI-3D采用了與ChatGPT和AlphaFold類似的深度神經(jīng)網(wǎng)絡(luò)架構(gòu),不同之處在于PrimateAI-3D是根據(jù)基因組序列而不是人類語言來進(jìn)行訓(xùn)練。另外,在ChatGPT等生成性語言模型中,現(xiàn)有的文本就可以為訓(xùn)練提供信息,而人類基因組中導(dǎo)致疾病的基因變異在很大程度上卻是未知的。

 

為解決這個(gè)問題,PrimateAI-3D有效地利用自然選擇來訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的參數(shù)。這種訓(xùn)練基于此前對(duì)233種不同靈長(zhǎng)類動(dòng)物進(jìn)行測(cè)序時(shí)發(fā)現(xiàn)的數(shù)百萬種良性基因變異來開展,這也是迄今為止開展的最大規(guī)模的非人類靈長(zhǎng)類物種測(cè)序工作。神經(jīng)網(wǎng)絡(luò)會(huì)學(xué)習(xí)基因中代表良性變異的位置,并通過自然淘汰過程判斷哪些區(qū)域如果發(fā)生突變可能致病。PrimateAI-3D通過這種方式學(xué)習(xí)如何準(zhǔn)確預(yù)測(cè)人類的致病變異,準(zhǔn)確度高于任何人類預(yù)測(cè)。
 

圖片PrimateAI-3D

解碼精準(zhǔn)醫(yī)療和基于基因的藥物靶點(diǎn)發(fā)現(xiàn)

 

《科學(xué)》(Science)雜志上發(fā)表的《Rare penetrant mutations confer severe risk of common diseases》研究使用以下4種專病隊(duì)列比較了PrimateAI-3D與其他15種機(jī)器學(xué)習(xí)方法:神經(jīng)發(fā)育障礙隊(duì)列、自閉類障礙隊(duì)列、先天性心臟病隊(duì)列和英國(guó)生物樣本庫(UK Biobank)。前三個(gè)隊(duì)列是迄今為止最大規(guī)模的測(cè)序研究之一,研究對(duì)象包括患病兒童及其未患病的父母;而英國(guó)生物樣本庫中的50萬個(gè)基因組則大多來自普通人群中的健康成員。該研究還在國(guó)立衛(wèi)生研究院的ClinVar數(shù)據(jù)庫和其他數(shù)據(jù)集中評(píng)估了該算法。在6種不同的臨床基準(zhǔn)方面,PrimateAI-3D的表現(xiàn)均遠(yuǎn)勝過所有其他現(xiàn)有方法。這些發(fā)現(xiàn)有助于研究人員優(yōu)先考慮一小部分最有可能影響人類健康的變異。
 

圖片

罕見基因變異對(duì)復(fù)雜人類特征的多基因貢獻(xiàn),以血清膽固醇為代表
 

此外,PrimateAI-3D在預(yù)測(cè)英國(guó)生物樣本庫隊(duì)列中的常見病患病風(fēng)險(xiǎn)升高人群方面表現(xiàn)出驚人的提升,特別是在非歐洲種族群體中,首次證明了多基因風(fēng)險(xiǎn)評(píng)分在很大程度上不受祖先偏差影響,為公平地實(shí)施基于基因的精準(zhǔn)醫(yī)療邁出關(guān)鍵一步,適用于更多元化的人群。

 

圖片

我們發(fā)現(xiàn),普通人群中有97%的健康人群攜帶臨床相關(guān)疾病的高度可干預(yù)變異,到目前為止,我們掌握的信息是患有罕見病或癌癥才需要接受基因組測(cè)序,但實(shí)際情況似乎是,人群中每個(gè)健康個(gè)體的基因組中都存在極具影響力的變異,這些變異具有臨床相關(guān)性,而且至關(guān)重要。

 
圖片
將最新的人工智能技術(shù)應(yīng)用于基因組學(xué),以揭示糖尿病、心臟病和自身免疫性疾病等復(fù)雜遺傳疾病的關(guān)鍵底層信息,這一技術(shù)的推出為因美納在遺傳風(fēng)險(xiǎn)預(yù)測(cè)和藥物靶點(diǎn)發(fā)現(xiàn)方面給來巨大機(jī)遇。


PrimateAI-3D將集成在因美納的互聯(lián)軟件中,供基因組學(xué)界廣泛使用。

4篇最新Science論文

帶您了解因美納AI算法驅(qū)動(dòng)的
基因組學(xué)“ChatGPT”:
 

  • The landscape of tolerated genetic variation in humans and primates圖片
  • Rare penetrant mutations confer severe risk of common diseases
    圖片
    • A global catalog of whole-genome diversity from 233 primate species
      圖片
      • Genome-wide coancestry reveals details of ancient and recent male-driven reticulation in baboons
        圖片

[1]這一結(jié)論不適用于親緣關(guān)系較遠(yuǎn)的哺乳動(dòng)物,比如一種在老鼠或狗身上無害的變異,在大猩猩或人類身上可能就是致病的。

相關(guān)公司:因美納(中國(guó))科學(xué)器材有限公司(Illumina)
聯(lián)系電話:021-60321066 (按1)
E-mail:china_info@illumina.com


用戶名: 密碼: 匿名 快速注冊(cè) 忘記密碼
評(píng)論只代表網(wǎng)友觀點(diǎn),不代表本站觀點(diǎn)。 請(qǐng)輸入驗(yàn)證碼: 8795
Copyright(C) 1998-2024 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com