基于數(shù)字孿生的生物制造系統(tǒng)是以數(shù)字孿生為核心,軟硬件多層次、多尺度深度結(jié)合的動(dòng)態(tài)系統(tǒng),從數(shù)據(jù)流的角度來(lái)看(圖1),該系統(tǒng)以集成在制造系統(tǒng)上的在線傳感器為數(shù)據(jù)來(lái)源,通過(guò)統(tǒng)一的數(shù)據(jù)接口傳輸至數(shù)字孿生,經(jīng)過(guò)數(shù)據(jù)同步、處理和預(yù)測(cè)后,用于系統(tǒng)自我修正的高階數(shù)據(jù)從數(shù)字孿生和物理實(shí)體間的雙向數(shù)據(jù)通道返回,關(guān)鍵數(shù)據(jù)經(jīng)可視化后展示在HMI上,而操作人員的指令則通過(guò)HMI傳輸回?cái)?shù)字孿生和物理實(shí)體。
圖1 基于數(shù)字孿生的細(xì)胞培養(yǎng)系統(tǒng)架構(gòu)設(shè)計(jì)
基于上述思路,該研究基于Python與C++混合編程技術(shù),開(kāi)發(fā)了基于數(shù)字孿生的開(kāi)源細(xì)胞培養(yǎng)框架,包含數(shù)字孿生、微型反應(yīng)器(支持在線細(xì)胞密度檢測(cè))和web端HMI應(yīng)用。其中數(shù)字孿生與微型反應(yīng)器分別連接至HMI,進(jìn)行交互與數(shù)據(jù)管理。該框架已開(kāi)源,歡迎下載體驗(yàn)。(https://github.com/BeichenZhao/BioDT)
圖2 數(shù)字孿生系統(tǒng)中的微型反應(yīng)器
數(shù)字孿生在過(guò)程分析技術(shù)(PAT)和高級(jí)過(guò)程控制(APC)方面的潛力引人注目。然而,在生物制造領(lǐng)域,尚未出現(xiàn)成熟的基于數(shù)字孿生的制造執(zhí)行系統(tǒng)(MES)。數(shù)字孿生究竟可以給人們帶來(lái)什么樣的幫助呢?該研究通過(guò)兩個(gè)案例研究,對(duì)這一問(wèn)題進(jìn)行初步闡述:
基于上述基于數(shù)字孿生的細(xì)胞培養(yǎng)系統(tǒng),針對(duì)中國(guó)倉(cāng)鼠卵巢細(xì)胞進(jìn)行實(shí)驗(yàn)。首先開(kāi)發(fā)了基于數(shù)字孿生的預(yù)測(cè)結(jié)果進(jìn)行手動(dòng)換液提醒功能。換液是在細(xì)胞培養(yǎng)中的常規(guī)操作,其目的是棄掉舊的培養(yǎng)基,換成新鮮的培養(yǎng)基來(lái)為細(xì)胞提供營(yíng)養(yǎng)支持。那么,在什么時(shí)間點(diǎn)換液,既能維持細(xì)胞的生長(zhǎng)代謝,又不造成培養(yǎng)基的浪費(fèi),成了研究人員關(guān)注的問(wèn)題。
本研究基于代謝物濃度,在HMI上集成了一個(gè)提示功能,如圖3所示,以葡萄糖為例,通過(guò)點(diǎn)擊“predict”按鈕,就可以得到未來(lái)一段時(shí)間內(nèi),葡萄糖和細(xì)胞密度變化的預(yù)測(cè)結(jié)果。
圖3 HMI中的預(yù)測(cè)功能界面
為了驗(yàn)證預(yù)測(cè)結(jié)果的準(zhǔn)確性,分別以葡萄糖和乳酸濃度為檢測(cè)指標(biāo)開(kāi)展了實(shí)驗(yàn),在不同的初始細(xì)胞接種密度下,預(yù)測(cè)值分別達(dá)到4 g/L和1 g/L時(shí),進(jìn)行換液并離線取樣測(cè)試。離線取樣的數(shù)據(jù)一方面是為了驗(yàn)證預(yù)測(cè)結(jié)果的準(zhǔn)確性,另一方面是為了通過(guò)HMI將該數(shù)據(jù)同步至數(shù)字孿生,校準(zhǔn)其預(yù)測(cè)結(jié)果,更新其動(dòng)力學(xué)參數(shù)。結(jié)果表明,該數(shù)字孿生系統(tǒng)可以準(zhǔn)確地預(yù)測(cè)代謝物濃度,為研究人員的理性決策提供參考。同時(shí)也能看出,預(yù)測(cè)結(jié)果的偏差總體呈現(xiàn)出隨時(shí)間縮小的趨勢(shì),這受益于數(shù)字孿生對(duì)動(dòng)力學(xué)參數(shù)的更新,從而使數(shù)字孿生可以更精準(zhǔn)地追蹤系統(tǒng)的狀態(tài)。
圖4 (a-c)在2, 5和10 (×106) cell·mL-1的初始接種密度下以葡萄糖濃度為指標(biāo)進(jìn)行手動(dòng)換液提醒;(d-f)在2, 5和10 (×106) cell·mL-1的初始接種密度下以乳酸濃度為指標(biāo)進(jìn)行手動(dòng)換液提醒
然而,換液仍然需要研究人員手動(dòng)操作,為了探究數(shù)字孿生系統(tǒng)的自動(dòng)化能力研究人員在控制系統(tǒng)中集成了一個(gè)蠕動(dòng)泵,以實(shí)現(xiàn)對(duì)葡萄糖濃度的調(diào)節(jié)。如圖5所示。數(shù)字孿生模型根據(jù)機(jī)理模型和歷史數(shù)據(jù)實(shí)時(shí)預(yù)測(cè)培養(yǎng)基中的葡萄糖濃度。當(dāng)預(yù)測(cè)的葡萄糖濃度低于5 g/L時(shí),蠕動(dòng)泵自動(dòng)開(kāi)啟,執(zhí)行一次補(bǔ)料動(dòng)作。用控制論的術(shù)語(yǔ)來(lái)說(shuō),這實(shí)現(xiàn)了對(duì)葡萄糖的模型預(yù)測(cè)控制(Model Predicting Control, MPC)。
圖5 葡萄糖補(bǔ)料系統(tǒng)連接示意圖
如圖6所示,為了驗(yàn)證模型預(yù)測(cè)的準(zhǔn)確度和控制效果的穩(wěn)定性,每隔12h進(jìn)行一次葡萄糖離線取樣測(cè)量,結(jié)果表明,基于數(shù)字孿生的模型預(yù)測(cè)控制可以將葡萄糖濃度穩(wěn)定地維持在5g/L。此外,與批次培養(yǎng)相比,在48 h的培養(yǎng)后,該策略使細(xì)胞得率提高了14.8%。
圖6(a)進(jìn)行葡萄糖補(bǔ)料的葡萄糖濃度變化;(b)是否使用葡萄糖自動(dòng)補(bǔ)料的細(xì)胞密度比較
那么,數(shù)字孿生是如何被構(gòu)建出來(lái)的呢。以本研究為例,細(xì)胞培養(yǎng)中的各項(xiàng)參數(shù)主要通過(guò)各種動(dòng)力學(xué)方程計(jì)算,下面列舉主要計(jì)算公式。
細(xì)胞密度使用Logistic方程計(jì)算:
其中,μ代表特定生長(zhǎng)速率 (cell/cell);μmax代表最大生長(zhǎng)速率 (cell/cell);X代表細(xì)胞密度 (cell/mL);Xmax代表最大細(xì)胞密度 (cell/mL)。
底物代謝用以下公式計(jì)算:
此外,每當(dāng)傳感器數(shù)據(jù)或離線檢測(cè)數(shù)據(jù)同步至數(shù)字孿生,其內(nèi)置的Levenberg-Marquardt算法就會(huì)對(duì)動(dòng)力學(xué)參數(shù)進(jìn)行重新測(cè)算,使其更好的捕捉細(xì)胞當(dāng)前的生理狀態(tài)。
數(shù)字孿生具備全時(shí)空尺度過(guò)程重建的能力,由于微型反應(yīng)器中的流場(chǎng)可以被認(rèn)為是全混流,在空間上分布基本均勻,該研究把目光放在了全時(shí)間尺度,即歷史過(guò)程重建、當(dāng)前動(dòng)力學(xué)參數(shù)計(jì)算和未來(lái)狀態(tài)預(yù)測(cè),并在批次培養(yǎng)實(shí)驗(yàn)中進(jìn)行了驗(yàn)證。
圖7 (a)根據(jù)傳感器數(shù)據(jù)更新的數(shù)字模型、數(shù)字映射和數(shù)字孿生預(yù)測(cè)的細(xì)胞密度變化值;(b)數(shù)字模型、數(shù)字映射和數(shù)字孿生對(duì)葡萄糖消耗的預(yù)測(cè);(c)數(shù)字模型、數(shù)字映射和數(shù)字孿生對(duì)乳酸產(chǎn)生的預(yù)測(cè);(d)數(shù)字孿生計(jì)算的比生長(zhǎng)速率;(e)數(shù)字孿生計(jì)算的葡萄糖消耗速率;(f)數(shù)字孿生計(jì)算的乳酸產(chǎn)生速率;(g)根據(jù)離線測(cè)量數(shù)據(jù)更新的數(shù)字模型、數(shù)字映射和數(shù)字孿生預(yù)測(cè)的細(xì)胞密度變化值;(h)數(shù)字孿生重建的葡萄糖濃度變化過(guò)程;(i)數(shù)字孿生重建的乳酸濃度變化過(guò)程
在這里,數(shù)字模型(Digital Model)、數(shù)字映射(Digital Shadow)和數(shù)字孿生(Digital Twin)分別被用于對(duì)培養(yǎng)過(guò)程中細(xì)胞密度的變化進(jìn)行預(yù)測(cè)。如圖7(a)所示,數(shù)字模型的靜態(tài)預(yù)測(cè)在開(kāi)始時(shí)與實(shí)驗(yàn)數(shù)據(jù)偏差較小,但隨著時(shí)間的推移增大。這是因?yàn)殪o態(tài)動(dòng)力學(xué)參數(shù)無(wú)法捕捉細(xì)胞生理代謝的變化,導(dǎo)致累積誤差無(wú)法消除。數(shù)字映射和數(shù)字孿生每15分鐘與傳感器數(shù)據(jù)同步一次,獲得了更準(zhǔn)確的追蹤結(jié)果。此外,數(shù)字孿生還提供了比生長(zhǎng)速率的變化情況(圖7(d)),由于一旦傳感器數(shù)據(jù)傳回,該值就會(huì)更新。僅用于跟蹤過(guò)程參數(shù)而言,在高采樣頻率下,數(shù)字孿生相對(duì)于數(shù)字映射的優(yōu)勢(shì)并不明顯。
如果只有離線測(cè)量數(shù)據(jù)可用,由于更新周期較長(zhǎng),即使數(shù)字映射周期性地進(jìn)行了校正,誤差也會(huì)隨著時(shí)間的推移擴(kuò)大(圖7(g))。數(shù)字孿生基于傳感器數(shù)據(jù)更新了μmax,從而跟蹤了細(xì)胞生理活性和比生長(zhǎng)速率的變化(圖7(d)),獲得了更加準(zhǔn)確的預(yù)測(cè)結(jié)果。
葡萄糖消耗和乳酸生成也分別通過(guò)數(shù)字模型、數(shù)字映射和數(shù)字孿生進(jìn)行了預(yù)測(cè),如圖7(b)(c)所示;讷@取的數(shù)據(jù),經(jīng)動(dòng)力學(xué)參數(shù)校正的數(shù)字孿生成功捕捉到了葡萄糖和乳酸濃度的變化,相較于數(shù)字模型和數(shù)字映射,預(yù)測(cè)結(jié)果更加準(zhǔn)確。利用數(shù)字孿生,還計(jì)算出了葡萄糖消耗速率和乳酸生成速率,顯示出隨時(shí)間的總體下降趨勢(shì)(圖7(e)(f))。這種現(xiàn)象可能是由于葡萄糖濃度降低和細(xì)胞密度增加而導(dǎo)致的代謝活性減少。這些實(shí)驗(yàn)結(jié)果表明了數(shù)字孿生在追蹤細(xì)胞代謝方面的能力,這對(duì)于理解處在動(dòng)態(tài)變化環(huán)境下的細(xì)胞活性變化至關(guān)重要。
圖7(h)(i)展示了通過(guò)利用數(shù)字孿生獲得的更新參數(shù)重新計(jì)算歷史的細(xì)胞密度、葡萄糖濃度和乳酸濃度的過(guò)程趨勢(shì)。由于離線數(shù)據(jù)僅反映了時(shí)間上離散的培養(yǎng)過(guò)程。通過(guò)重建整個(gè)培養(yǎng)過(guò)程,數(shù)字孿生使研究人員能夠更全面地研究歷史過(guò)程的條件,從而獲得對(duì)所研究的生物系統(tǒng)更詳細(xì)和準(zhǔn)確的理解。
結(jié)語(yǔ)
隨著數(shù)字孿生在各行各業(yè)的發(fā)展,人們逐步意識(shí)到這是一個(gè)極具發(fā)展?jié)摿Φ母拍,很有可能?huì)變革未來(lái)的生物制造模式。在物聯(lián)網(wǎng)的概念流行的時(shí)代,我們常說(shuō)“萬(wàn)物互聯(lián)”,現(xiàn)在我們已經(jīng)能無(wú)感地享受到傳感器的普及給我們帶來(lái)的便利。TJX團(tuán)隊(duì)認(rèn)為,我們有機(jī)會(huì)迎來(lái)一個(gè)“萬(wàn)物皆可計(jì)算”的時(shí)代,從基因表達(dá)、酶促反應(yīng),到細(xì)胞生長(zhǎng)代謝,再到反應(yīng)器流場(chǎng)仿真,從而建立代謝模型與計(jì)算流體力學(xué)耦合的多尺度、多層次模型,并且在工藝開(kāi)發(fā)的各個(gè)階段為工藝開(kāi)發(fā)人員提供建議;蛟S在不久的將來(lái),上位機(jī)軟件的數(shù)據(jù)展示界面中出現(xiàn)各個(gè)參數(shù)的預(yù)測(cè)曲線,會(huì)成為一件稀松平常的事情。