——歐陽應斌專訪篇
賽業(yè)生物科技集團技術副總裁、高級科學家歐陽應斌博士
從“阿爾法狗”到“阿爾法鼠”--引領生物科技人工智能的新篇章
2016年3月在圍棋人機大戰(zhàn)中,“阿爾法狗(AlphaGo)”最終戰(zhàn)勝人類,引起了全世界的廣泛關注,人工智能的威力讓人們驚訝,也讓神經(jīng)科學和深度學習進入了公眾的視野。
當前,人工智能已成為科技界研究的熱點,那么,人工智能在我們實驗動物這個領域有沒有相關研究呢?本期中國實驗動物信息網(wǎng)特邀賽業(yè)生物科技集團技術副總裁、高級科學家歐陽應斌博士為您介紹—“阿爾法鼠”—引領生物科技走向人工智能的“利器”。
記者:從去年的“阿爾法狗”到今年的“阿爾法鼠”,僅僅一年的時間,人工智能真的開始進入我們實驗動物這個領域了嗎?是什么觸發(fā)您們?nèi)ラ_展這一領域研究?
歐陽應斌:去年阿爾法狗的出現(xiàn)讓大師和大眾都目瞪口呆、措手不及。人工智能耕耘了那么多年,終于一舉打敗了人類頂級智慧游戲的最強大腦,這讓我們感覺到山雨欲來風滿樓,不久颶風將橫掃所有領域:機器人、自動駕駛、無人飛行、圖像識別、語音語義識別,還有諸多大眾視野之外的領域。我們馬上意識到,要找到我們這個狹窄領域的風口,而且要快!
記者:請您詳細介紹一下賽業(yè)生物的“阿爾法鼠”是什么?它是如何使用的?
歐陽應斌:用一句話來概括,就是我們把利用基因打靶技術制作基因工程鼠的方案設計過程人工智能化,變成復雜的生物信息算法,用強大的云端服務器進行運算,并且以www.alphaknockout.com網(wǎng)站的形式開放給科學界使用,目前網(wǎng)站上線一個月得到業(yè)內(nèi)用戶的關注。您只需登錄www.alphaknockout.com,輸入要敲除的基因信息,瞬間即可得到設計完善的方案,而且我們會根據(jù)生物信息學算法,提供三個方案,這三個方案按優(yōu)先次序排練,排第一位的是默認的最優(yōu)方案。
記者:“阿爾法鼠”的應用主要是把基因打靶技術制作基因工程鼠的過程實現(xiàn)智能化,那么請您說說基因打靶這項技術原理以及是怎樣實現(xiàn)智能化的?
歐陽應斌:基因打靶就是通過同源重組技術將外源基因定點整合進靶細胞基因組上某一確定的位點,以達到定點修飾改造染色體上某一基因的目的;虼虬屑夹g目前已被廣泛認為是一種理想的特定修飾與改造生物體遺傳物質(zhì)的最佳方法,其中包括了多種不同的基因敲除和敲入系統(tǒng),特別是條件性和誘導性基因打靶系統(tǒng)的建立,使得對基因在時間和空間上的靶位修飾更加明確、效果更加精確可靠。而設計基因打靶方案是一個非常考驗科研人員專業(yè)能力的工作,通常需要花費2-5個工作日才能制備一份完善合理的方案。現(xiàn)在通過“阿爾法鼠(AlphaKnockout)“基因打靶專家方案系統(tǒng)的開發(fā),替代了人工設計方案的過程,大大節(jié)約了科研人員的時間成本。
傳統(tǒng)意義上的基因打靶是利用同源重組對胚胎干細胞(ES)的基因組進行精準的遺傳修飾,然后將修飾過的ES細胞導入胚胎,并移植到體內(nèi)發(fā)育,進而得到帶基因修飾的可生殖遺傳的個體。近些年來,基因打靶的工具箱里又增加了ZFN、Talen和CRISPR幾種新的核酸酶工具,尤其是CRISPR,其便捷精準的基因剪切能力使其成為高效的基因組編輯器,在基因打靶領域也大有取代傳統(tǒng)技術的趨勢。
記者:在CRISPR技術風靡的今天,傳統(tǒng)的ES基因打靶技術還有生命力嗎?ES基因打靶技術又有了哪些突破?
歐陽應斌:去年年底Science上的一篇編者按('Any idiot can do it.'Genome editor CRISPR could put mutant mice in everyone's reach)很好地解答了這個問題。“傻瓜都會做”,這是基因打靶的教父Rudolf Yaenisch對CRISPR的評價。由于CRISPR的高效,甚至連國際上的Knockout Mouse Consortium都放棄了ES打靶技術。但這篇文章同時指出了CRISPR的局限性,對于小鼠的復雜的基因修飾(如大片段的基因敲入和條件性突變等),CRISPR有先天性不足,因為此時需要Donor DNA與受精卵中基因組的特定位置發(fā)生同源重組,而同源重組的效率是非常低的。我們可以在上百萬的ES細胞中篩選發(fā)生了正確的同源重組的個別細胞,但在有限的受精卵中進行篩選,成功的幾率就大大下降了,F(xiàn)在行業(yè)的很多用戶又重新回到了ES打靶這個技術上。賽業(yè)生物通過一系列的技術革新,推出的基于ES打靶的TurboKnockout技術把傳統(tǒng)的ES打靶從12個月以上的周期降低到6個月,與CRISPR打靶的周期沒有什么差別,價格也與CRISPR技術相當,因此成為ES打靶最新的金標準,讓ES打靶這項可追溯到30年前并于10年前獲得諾貝爾獎的重量級傳統(tǒng)技術重新煥發(fā)了青春。我們一年多前才推出TurboKnockout平臺,現(xiàn)在利用我們TurboKnockout小鼠做研究的論文都已經(jīng)發(fā)表了,顯示出其巨大的優(yōu)勢。
記者:通過“阿爾法鼠”將基因打靶的方案設計實現(xiàn)人工智能化后有什么優(yōu)勢?解決了傳統(tǒng)方法方案設計存在的哪些問題?
歐陽應斌:基因打靶方案的好壞直接影響基因打靶的效果。賽業(yè)生物的方案設計科學家都經(jīng)過了非常嚴格的訓練,為了出一份好的方案,我們需要考慮幾十種因素,并且根據(jù)這些因素的重要程度進行平衡,這是一個像下棋一樣考驗預測和判斷能力的智慧活動,一個非常熟練的方案設計科學家出一份方案需要一到兩個小時。然而即使是非常好的技術人員,疏漏也在所難免,而且什么方案是最好的,也基本靠主觀判斷。我們用電腦來實現(xiàn)上述人類的智慧活動有很大優(yōu)勢,我們把幾十種需要考慮的因素當做限制性條件,然后用人工智能算法從局部最優(yōu)不斷向全局最優(yōu)逼近,最后得到最好的方案。在我們強大的云端服務器的支持下,整個過程不超過半分鐘。
記者:行業(yè)用戶現(xiàn)在能在“阿爾法鼠”(www.alphaknockout.com)上做什么?“阿爾法鼠”的開發(fā)難度有多大?需要哪些技術力量支撐?未來“阿爾法鼠”一直會免費開放嗎?
歐陽應斌:我們第一個上線的是ES打靶的cKO方案,緊接著會有CRISPR的片段KO方案,下面還會有分別基于ES和CRISPR技術的KI和Point Mutation,甚至還會有雙敲除。到今年下半年,基本上小鼠和大鼠的所有基因打靶方案設計都會上線。這些方案設計上線后用戶都可以在“阿爾法鼠”(www.alphaknockout.com)系統(tǒng)上直接應用。
打造這樣的平臺需要一個集IT、生物以及生物信息三方面人才組成的高效團隊,把這三者有機地結合起來不是一件容易的事情。更為重要的是,賽業(yè)生物在過去幾年成功完成了數(shù)以千例的小鼠和大鼠基因打靶項目,我們有大量可靠的數(shù)據(jù)來訓練我們的人工智能系統(tǒng),讓系統(tǒng)進行深度學習,以達到系統(tǒng)參數(shù)的最優(yōu)。這一點類似于“阿爾法狗”大量學習人類棋譜,當然現(xiàn)在的“阿爾法狗”已經(jīng)看不上人類的棋譜了。我們的測試表明,我們的人工智能系統(tǒng)已經(jīng)明顯優(yōu)于經(jīng)驗豐富的人類專家了。
開發(fā)“阿爾法鼠”應用平臺,可以說是我們的一項公益事業(yè),我們希望給全球的研究人員提供一個有用的工具,凡是要做基因打靶,尤其是小鼠和大鼠的體內(nèi)試驗相關的,都可以來我們這里拿一份方案。我們不僅僅出具方案,還會告訴你為什么要這么出,考慮了哪些因素、有什么風險等等。歡迎廣大科研工作者使用“阿爾法鼠”,并給我們提出寶貴意見。
記者:謝謝歐陽博士接受我們的專訪,希望您及賽業(yè)公司在人工智能這條路上越走越遠!引領實驗動物這一領域快速發(fā)展,謀劃生物科技人工智能的新篇章。