據(jù)中國農(nóng)科院*新消息,該院生物技術(shù)研究所汪海博士與美國康奈爾大學(xué)愛德華·巴克勒(Edward Buckler)院士團隊合作,開發(fā)出從基因組DNA序列預(yù)測基因表達調(diào)控模式的人工神經(jīng)網(wǎng)絡(luò)模型,它在分子育種領(lǐng)域的作用相當(dāng)于谷歌的“AlphaGo”之于圍棋,為人工智能(AI)輔助定向育種開辟了新方向。相關(guān)研究成果在線發(fā)表于《美國科學(xué)院院刊》。
汪海表示,AI技術(shù)在基因組學(xué)研究中尚未得到廣泛應(yīng)用,緣于生物中具有許多序列高度相似性的基因家族,在訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型時將基因隨機分配到訓(xùn)練集和測試集中,會導(dǎo)致該模型優(yōu)先學(xué)習(xí)DNA序列中跟基因家族或進化相關(guān)的基序,而不是真正決定基因表達調(diào)控的基序。
該研究以基因家族代替單個基因為單位隨機分配訓(xùn)練集和測試集數(shù)據(jù),成功建立了預(yù)測二元化基因表達量的卷積神經(jīng)網(wǎng)絡(luò)模型;進一步利用多種算法進行解析,獲得了調(diào)控基因表達的關(guān)鍵DNA基序。在此模型基礎(chǔ)上,科研人員利用進化上親緣關(guān)系較近的兩個物種,成功預(yù)測了同源基因的相對表達量,并進一步獲得了調(diào)控同源基因相對表達量的關(guān)鍵DNA基序。
農(nóng)業(yè)網(wǎng)(Agronet.com.cn)微信掃一掃: 盡“掃”天下農(nóng)商情