本報(bào)訊(通訊員 張梓欣 記者 劉盾)“通過(guò)智能技術(shù),我們發(fā)現(xiàn)了許多未研究過(guò)的病毒群體,以及具有特殊長(zhǎng)度、復(fù)雜基因組結(jié)構(gòu)的RNA(核糖核酸)病毒類型?!比涨?,中山大學(xué)醫(yī)學(xué)院教授施莽團(tuán)隊(duì)在將人工智能技術(shù)應(yīng)用于病毒鑒定方面實(shí)現(xiàn)突破。他們跨越重重技術(shù)難關(guān),發(fā)現(xiàn)了大量全新RNA病毒。
過(guò)去,人們通過(guò)分離培養(yǎng)病毒,在顯微鏡下觀察確認(rèn)病毒的存在。隨著技術(shù)發(fā)展,科學(xué)家們利用測(cè)序技術(shù),通過(guò)比較未知病毒和已知病毒核酸序列的相似性,來(lái)識(shí)別和鑒定新病毒。然而,這些傳統(tǒng)的病毒發(fā)現(xiàn)方法比較依賴既有知識(shí),還有很多病毒缺乏同源性或同源性低,用傳統(tǒng)方法很難識(shí)別,這類病毒被稱為“暗物質(zhì)病毒”。
如何突破傳統(tǒng)病毒發(fā)現(xiàn)方法的瓶頸,用更高效、更精準(zhǔn)的方法去發(fā)現(xiàn)和鑒定新病毒,并進(jìn)行下游的驗(yàn)證工作?
2020年起,中山大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了一種基于同源性的生物信息學(xué)算法,它能夠幫助科研人員發(fā)現(xiàn)遠(yuǎn)緣的病毒,但仍面臨著操作煩瑣,以及難以深入探測(cè)“暗物質(zhì)病毒”的技術(shù)難關(guān)。2022年,中山大學(xué)研究團(tuán)隊(duì)與阿里云李兆融團(tuán)隊(duì)的一次偶然交流,為發(fā)現(xiàn)“暗物質(zhì)病毒”帶來(lái)了契機(jī)。此后,兩個(gè)團(tuán)隊(duì)展開(kāi)緊密合作,聯(lián)合開(kāi)發(fā)用于病毒發(fā)現(xiàn)的人工智能模型。
反復(fù)優(yōu)化模型后,LucaProt人工智能算法能夠?qū)Σ《竞头遣《净蚪M序列深度學(xué)習(xí),且能在數(shù)據(jù)集中后,自主判斷病毒序列?!芭c傳統(tǒng)方法相比,LucaProt結(jié)合了序列和預(yù)測(cè)結(jié)構(gòu)信息,在準(zhǔn)確性、效率以及檢測(cè)病毒多樣性方面展現(xiàn)出很大優(yōu)勢(shì)。”項(xiàng)目相關(guān)負(fù)責(zé)人介紹,LucaProt人工智能算法專為RNA病毒發(fā)現(xiàn)而設(shè)計(jì),其框架融合了蛋白質(zhì)序列與隱含的結(jié)構(gòu)信息??蒲腥藛T輸入蛋白質(zhì)序列,就可以對(duì)該序列進(jìn)行判別。
在來(lái)自全球生物環(huán)境樣本的10487份RNA測(cè)序數(shù)據(jù)中,研究團(tuán)隊(duì)利用這套算法,發(fā)現(xiàn)了超過(guò)51萬(wàn)條病毒基因組,代表超過(guò)16萬(wàn)個(gè)潛在病毒種及180個(gè)RNA病毒超群,使RNA病毒超群數(shù)量擴(kuò)容約9倍。其中23個(gè)超群無(wú)法通過(guò)序列同源方法識(shí)別,被稱為病毒圈的“暗物質(zhì)”。
《中國(guó)教育報(bào)》2024年10月21日 第01版
工信部備案號(hào):京ICP備05071141號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120170024
中國(guó)教育報(bào)刊社主辦 中國(guó)教育新聞網(wǎng)版權(quán)所有,未經(jīng)書(shū)面授權(quán)禁止下載使用
Copyright@2000-2022 www.solnowat.com All Rights Reserved.