人工智能在生物醫(yī)藥和生物材料設(shè)計(jì)中的賦能作用至關(guān)重要,通過(guò)先進(jìn)的模型、算法和數(shù)據(jù)分析,能深入解析藥物分子的構(gòu)效關(guān)系,優(yōu)化候選藥物結(jié)構(gòu),將有效地縮短研發(fā)周期并降低成本。但聚合物不確定的序列和復(fù)雜的分子組成使其難以全面表征結(jié)構(gòu),且生物活性聚合物的樣本量小,難以構(gòu)建大數(shù)據(jù)模型進(jìn)行精準(zhǔn)預(yù)測(cè)。因此,如何基于人工智能實(shí)現(xiàn)小樣本數(shù)據(jù)下聚合物結(jié)構(gòu)預(yù)測(cè)是領(lǐng)域核心挑戰(zhàn)。
近日,華東理工大學(xué)信息學(xué)院唐漾教授與材料學(xué)院劉潤(rùn)輝教授等在人工智能和抗耐藥菌多肽模擬聚合物進(jìn)行跨領(lǐng)域合作研究。首次在基于人工智能實(shí)現(xiàn)小樣本多肽模擬聚合物活性預(yù)測(cè)和逆向設(shè)計(jì)研究中取得關(guān)鍵突破,僅依賴小樣本(<100)結(jié)構(gòu)與活性數(shù)據(jù)實(shí)現(xiàn)在龐大聚合物空間(>1060)中精準(zhǔn)預(yù)測(cè)聚合物抗菌活性,并通過(guò)逆向設(shè)計(jì)發(fā)現(xiàn)大量具有突出廣譜抗耐藥菌活性和高選擇性的優(yōu)選聚合物結(jié)構(gòu),為抗耐藥菌多肽模擬聚合物研究提供了新思路。該成果以“AI-guided Few-shot Inverse Design of HDP-Mimicking Polymers against Drug-Resistant Bacteria”(人工智能輔助抗耐藥菌宿主防御肽模擬聚合物的小樣本逆向設(shè)計(jì))為題發(fā)表在Nature Communications《自然?通訊》上(https://www.nature.com/articles/s41467-024-50533-4)。
全球抗生素耐藥性風(fēng)險(xiǎn)不斷升級(jí),亟需探索高效抗耐藥菌廣譜抗菌劑的新策略。宿主防御肽因具有抗耐藥菌活性和不易使微生物產(chǎn)生耐藥性等優(yōu)勢(shì)被寄予厚望,其易結(jié)構(gòu)不穩(wěn)定、易酶解、難以大規(guī)模制備等缺點(diǎn)限制其實(shí)際應(yīng)用,傳統(tǒng)半經(jīng)驗(yàn)化的設(shè)計(jì)方法仍難以滿足抗耐藥菌化合物的迫切需求。盡管人工智能輔助藥物發(fā)現(xiàn)研究已經(jīng)取得進(jìn)展,但多肽模擬聚合物的無(wú)規(guī)序列導(dǎo)致難以全面表征聚合物結(jié)構(gòu),且小樣本數(shù)據(jù)限制了對(duì)聚合物性能的精準(zhǔn)預(yù)測(cè)與對(duì)超高維聚合物空間的高效探索。因此,基于小樣本聚合物實(shí)現(xiàn)人工智能設(shè)計(jì)具有理想目標(biāo)活性的優(yōu)選聚合物一直未取得突破。
前期,唐漾教授等就小樣本學(xué)習(xí)與多模態(tài)表征學(xué)習(xí)開(kāi)展相關(guān)研究,聚焦提高小樣本數(shù)據(jù)下模型的預(yù)測(cè)性能,為本研究打下良好基礎(chǔ)。劉潤(rùn)輝教授課題組通過(guò)多肽聚合物模擬宿主防御肽實(shí)現(xiàn)了體內(nèi)外高效抗耐藥菌活性,顯示了多肽聚合物在抗耐藥菌研究中的廣闊前景,為聚合物合成與驗(yàn)證提供堅(jiān)實(shí)的技術(shù)支撐(IEEE/ACM Trans. Comput. Biol. Bioinf. 2023, 20, 3044-3055;IEEE/CAA JAS. 2023, 11, 1106-1126;Nat. Microbiol. 2024, 9, 1325;Nat. Commun. 2021, 12, 5898;Nat. Commun. 2018, 9, 5297;J. Am. Chem. Soc. 2023, 145, 25753;J. Am. Chem. Soc. 2022, 144, 1690;Angew. Chem. Int. Ed. 2020, 59, 7240)。
本研究以β-多肽聚合物為模型,通過(guò)構(gòu)建面向聚合物的多模態(tài)信息(文本序列、圖形、描述符)表征構(gòu)架以提取完整、全面的多尺度聚合物信息訓(xùn)練預(yù)測(cè)模型,實(shí)現(xiàn)小樣本聚合物數(shù)據(jù)下對(duì)海量聚合物結(jié)構(gòu)的精準(zhǔn)抗菌性能預(yù)測(cè)。通過(guò)搭建圖語(yǔ)法蒸餾框架,將β-氨基酸與同源天然的α-氨基酸的化學(xué)結(jié)構(gòu)拆解為大量分子圖語(yǔ)法片段,并重新組合成新的分子以訓(xùn)練生成模型,實(shí)現(xiàn)小樣本數(shù)據(jù)精準(zhǔn)定位高維聚合物空間的搜索范圍,通過(guò)強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)預(yù)測(cè)模型與生成模型的迭代交互,獲得83個(gè)具有廣譜抗耐藥菌活性和高選擇性的優(yōu)選聚合物庫(kù)。最后對(duì)其中一個(gè)優(yōu)選聚合物DM0.8iPen0.2開(kāi)展合成與抗耐藥菌研究,結(jié)果表明人工智能模型預(yù)測(cè)抗菌活性與實(shí)驗(yàn)數(shù)據(jù)高度一致,驗(yàn)證了人工智能對(duì)多肽模擬聚合物活性的精準(zhǔn)預(yù)測(cè)。

圖1 基于小樣本β-多肽聚合物的人工智能框架實(shí)現(xiàn)聚合物逆向設(shè)計(jì)
華東理工大學(xué)信息科學(xué)與工程學(xué)院博士研究生吳天宇、材料科學(xué)與工程學(xué)院副研究員周敏是論文的第一作者,材料科學(xué)與工程學(xué)院劉潤(rùn)輝教授和信息科學(xué)與工程學(xué)院唐漾教授為通訊作者。本論文得到了中國(guó)工程院院士錢鋒教授和歐洲科學(xué)院院士Jürgen Kurths教授的悉心指導(dǎo)。該成果得到了國(guó)家自然科學(xué)基金委基礎(chǔ)科學(xué)中心項(xiàng)目、國(guó)家自然科學(xué)基金委杰出青年科學(xué)基金項(xiàng)目、國(guó)家自然科學(xué)基金委重點(diǎn)項(xiàng)目、科技部重點(diǎn)研發(fā)計(jì)劃項(xiàng)目等課題的資助。