在上期直播中,我們邀請(qǐng)了迪必爾生物CEO 李雪良博士及研發(fā)工程師 趙北辰先生,帶來(lái)“從線性回歸到GPT:人工智能的演進(jìn)及其在生物工藝中的應(yīng)用”主題報(bào)告和實(shí)操演示。
現(xiàn)將直播過(guò)程中觀眾的提問(wèn)進(jìn)行整理和回復(fù),供大家參考和回顧。
Q1 ChatGPT可以在與人類對(duì)話中學(xué)到新知識(shí)嗎?
ChatGPT里的P表示,這個(gè)模型是pretrained 也就是說(shuō)是預(yù)學(xué)習(xí)的,它不會(huì)從跟人類的對(duì)話里學(xué)到任何新知識(shí)。這里要注意,機(jī)器學(xué)習(xí)里說(shuō)的學(xué)習(xí),是要調(diào)整其內(nèi)部參數(shù)的。之所以給我們的感覺(jué)好像是它在跟人類的一問(wèn)一答中學(xué)到了新知識(shí),那是因?yàn)楫?dāng)前的聊天歷史是作為模型輸入又輸進(jìn)去了。模型的參數(shù)本身并沒(méi)有調(diào)整。換一個(gè)人問(wèn)它同樣的問(wèn)題,它還會(huì)犯同樣的錯(cuò)誤;蛘吣銈兞奶煊涗浱L(zhǎng)了以后,前面的他就自動(dòng)刪掉了,不再做為模型輸入。
Q2 專家系統(tǒng)跟AI有什么區(qū)別?
廣義上說(shuō)專家系統(tǒng)是人工智能的一種。但是專家系統(tǒng)跟神經(jīng)網(wǎng)絡(luò)等算法有著根本區(qū)別。專家系統(tǒng)更多是基于基本原理以及人的經(jīng)驗(yàn)得到的一套規(guī)則,而神經(jīng)網(wǎng)絡(luò)等AI則是根據(jù)大量數(shù)據(jù)得到的統(tǒng)計(jì)規(guī)律。專家系統(tǒng)適用于缺少數(shù)據(jù)的情況。
Q3 為什么這么多年了無(wú)論是專家系統(tǒng)還是人工智能在生物工藝中都沒(méi)有得到普及?
這個(gè)一言難盡。至少有以下幾個(gè)方面的原因。(1)缺少數(shù)據(jù)。無(wú)論是實(shí)驗(yàn)還是生產(chǎn),獲取數(shù)據(jù)的成本一直都很高。尤其是訓(xùn)練模型所需要的較差的數(shù)據(jù)。只有好數(shù)據(jù)是沒(méi)法兒訓(xùn)練模型的。(2)過(guò)程裝備本身智能化程度較低,無(wú)法對(duì)接智能算法。(3)合成生物學(xué)產(chǎn)業(yè)本身是很新的一個(gè)產(chǎn)業(yè),現(xiàn)在其實(shí)才剛剛起步,從業(yè)人員中掌握了這些技術(shù)的人很少。迪必爾其實(shí)一直把解決這些問(wèn)題當(dāng)作自己不可推卸的責(zé)任。
Q4 人工智能跟PID控制哪個(gè)好用?神經(jīng)網(wǎng)絡(luò)能否替代PID?
人工智能與PID控制器的區(qū)別,就好比人的大腦與小腦的區(qū)別。PID像人的小腦,適用于底層基礎(chǔ)過(guò)程參數(shù)的控制。人工智能像人的大腦,適用于更高層次的優(yōu)化。簡(jiǎn)單的答案是不能替代。但是其實(shí)純比例控制器從數(shù)學(xué)上講,跟只有一個(gè)神經(jīng)元的神經(jīng)網(wǎng)絡(luò)是一模一樣的。
Q5 ChatGPT能裝到本地嗎?用這個(gè)必須聯(lián)網(wǎng)嗎?
ChatGPT這種大語(yǔ)言模型一般的個(gè)人電腦是跑不動(dòng)的,最低成本還是利用云服務(wù)器的算力。有一些小型的模型,功能少一些,可以部署到本地。
Q6 在生成UDF代碼時(shí),如何確保代碼的安全性和魯棒性?
盡管人工智能擁有海量的知識(shí)儲(chǔ)備,但它仍然可能犯錯(cuò)。為確保AI生成代碼的準(zhǔn)確性,首先要對(duì)要實(shí)現(xiàn)的任務(wù)進(jìn)行準(zhǔn)確拆解,將其邏輯清晰地表達(dá)出來(lái)供AI理解。其次,需要明確定義函數(shù)的輸入?yún)?shù)和輸出結(jié)果,對(duì)其數(shù)據(jù)類型和取值范圍加以限制。最后,在AI生成代碼后,必須對(duì)其進(jìn)行仔細(xì)審查,修正其中可能存在的問(wèn)題,在預(yù)實(shí)驗(yàn)中進(jìn)行驗(yàn)證,確保其功能、性能和安全性都符合預(yù)期,才能將其投入實(shí)際使用。
Q7 是否可以使用python的第三方庫(kù)?
D2MS 軟件內(nèi)置了功能完備的 Python 解釋器,允許我們下載和安裝各種第三方庫(kù),從而實(shí)現(xiàn)更加廣泛多樣的功能拓展。事實(shí)上,在編寫 UDF 代碼的過(guò)程中,我們已經(jīng)利用了一些實(shí)用的第三方庫(kù)。例如,通過(guò)使用 NumPy 庫(kù)提供的數(shù)組類型,我們可以方便地同時(shí)返回多個(gè)計(jì)算結(jié)果。
Q8 在使用生成式AI生成UDF代碼時(shí),需要遵循哪些邏輯和規(guī)范?
我們已經(jīng)把所需要的邏輯編寫成提示詞,供AI學(xué)習(xí)。具體來(lái)說(shuō)有以下規(guī)則:D2MS 軟件每秒調(diào)用一次函數(shù),通過(guò)參數(shù)傳遞所需值。函數(shù)應(yīng)返回單個(gè)浮點(diǎn)數(shù)或 NumPy 數(shù)組作為輸出參數(shù)。函數(shù)內(nèi)部應(yīng)使用清晰簡(jiǎn)潔的變量命名,用全局變量存儲(chǔ)必要信息和計(jì)數(shù)器,避免使用阻塞線程的操作,省略異常處理和打印語(yǔ)句。從 D2MS 接收的參數(shù)通常為過(guò)程變量或狀態(tài)信息,返回的是設(shè)定值,多個(gè)返回值需封裝為 NumPy 數(shù)組。遵循這些規(guī)范,UDF 函數(shù)便能與 D2MS 無(wú)縫配合,高效控制生物反應(yīng)器系統(tǒng)。
Q9 是否可以把過(guò)程控制的邏輯與人工智能結(jié)合?
除了利用生成式AI編寫UDF代碼,我們還可以進(jìn)一步將過(guò)程控制的邏輯與其他人工智能技術(shù)巧妙結(jié)合,以優(yōu)化生物反應(yīng)器系統(tǒng)的運(yùn)行。舉例來(lái)說(shuō),機(jī)器學(xué)習(xí)算法可用于對(duì)生物反應(yīng)過(guò)程的時(shí)間序列數(shù)據(jù)進(jìn)行建模和預(yù)測(cè),提前預(yù)估關(guān)鍵參數(shù)的變化趨勢(shì)。這不僅有助于實(shí)現(xiàn)更精準(zhǔn)的控制,還能在異常情況發(fā)生前提供預(yù)警,從而使我們能夠及時(shí)采取應(yīng)對(duì)措施。此外,強(qiáng)化學(xué)習(xí)也是一個(gè)值得探索的方向。通過(guò)與生物反應(yīng)器系統(tǒng)不斷交互,強(qiáng)化學(xué)習(xí)智能體可自主學(xué)習(xí)和優(yōu)化控制策略,在動(dòng)態(tài)變化的環(huán)境中自適應(yīng)地調(diào)整控制參數(shù),有望在復(fù)雜工藝過(guò)程中取得更優(yōu)的控制效果。我們可以期待,人工智能在生物反應(yīng)器系統(tǒng)的智能化控制中將扮演日益重要的角色,為生物工程領(lǐng)域的創(chuàng)新發(fā)展注入新的動(dòng)力。