威尼斯人娱乐城-澳门威尼斯人娱乐城-大发888老虎机苹果版

清華主頁(yè) - 清華新聞 - 專(zhuān)題推薦 - 抗疫期間的清華科研 - 正文

交叉信息研究院曾堅(jiān)陽(yáng)研究組提出從大規(guī)??茖W(xué)文獻(xiàn)中提取生物醫(yī)學(xué)實(shí)體關(guān)系的新型深度學(xué)習(xí)模型

清華新聞網(wǎng)6月10日電 近日,清華大學(xué)交叉信息研究院曾堅(jiān)陽(yáng)研究組成功開(kāi)發(fā)了從大規(guī)??茖W(xué)文獻(xiàn)中提取生物醫(yī)學(xué)實(shí)體關(guān)系的深度學(xué)習(xí)模型,相關(guān)研究成果“基于機(jī)器學(xué)習(xí)的大規(guī)模生物醫(yī)學(xué)關(guān)系自動(dòng)抽取技術(shù)”(A novel machine learning framework for automated biomedical relation extraction from large-scale literature repositories)于6月8日在《自然·機(jī)器智能》(Nature Machine Intelligence)上在線(xiàn)發(fā)表。

理解藥物、靶點(diǎn)、病毒、副作用等等生物醫(yī)學(xué)實(shí)體之間的相互作用規(guī)律,是生物醫(yī)學(xué)研究者們長(zhǎng)期以來(lái)致力于探索和研究的問(wèn)題,關(guān)于這些作用規(guī)律的研究成果廣泛分布在超過(guò)3000萬(wàn)篇的科研文獻(xiàn)當(dāng)中,且文獻(xiàn)的數(shù)量還在不斷增加。目前,大多數(shù)知名的生物醫(yī)學(xué)數(shù)據(jù)庫(kù)例如DrugBank、CTD、SIDER和BioGRID,都是由人類(lèi)科學(xué)家花費(fèi)大量的時(shí)間和精力從科學(xué)文獻(xiàn)中整理而來(lái)的。雖然深度學(xué)習(xí)技術(shù)可以被用來(lái)加速這一過(guò)程,但在生物醫(yī)學(xué)這種專(zhuān)業(yè)性領(lǐng)域,大規(guī)模的訓(xùn)練數(shù)據(jù)卻并非能夠輕易得到。為了解決這一問(wèn)題,曾堅(jiān)陽(yáng)研究團(tuán)隊(duì)采用了一種基于遠(yuǎn)監(jiān)督的深度學(xué)習(xí)策略,使得模型能夠在不依賴(lài)于人工標(biāo)注數(shù)據(jù)的情況下應(yīng)用到各種生物醫(yī)學(xué)關(guān)系抽取場(chǎng)景當(dāng)中。此外,作者所提出的集成了隱式句法樹(shù)學(xué)習(xí)和注意力機(jī)制的模型,在多項(xiàng)生物醫(yī)學(xué)關(guān)系抽取任務(wù)當(dāng)中,都取得了領(lǐng)先的實(shí)驗(yàn)結(jié)果。這項(xiàng)研究成果表明,這種新型的機(jī)器學(xué)習(xí)框架能夠?yàn)樯镝t(yī)學(xué)關(guān)系發(fā)現(xiàn)提供有力的幫助。目前,該工作已被應(yīng)用到一項(xiàng)旨在從已有的老藥中發(fā)現(xiàn)治療“新冠病毒”(COVID-19)的潛在藥物的工作當(dāng)中,相關(guān)的研究成果已發(fā)布在生物預(yù)印本網(wǎng)站bioRxiv上(https://www.biorxiv.org/content/10.1101/2020.03.11.986836v1)。

曾堅(jiān)陽(yáng)研究組所提出的生物醫(yī)學(xué)關(guān)系自動(dòng)抽取框架已成功應(yīng)用到多個(gè)生物醫(yī)學(xué)場(chǎng)景當(dāng)中,包括:通過(guò)抽取出的提示性信息指導(dǎo)了若干實(shí)驗(yàn)驗(yàn)證,從而確認(rèn)了新的藥物-靶點(diǎn)作用關(guān)系;在一項(xiàng)針對(duì)新冠肺炎的老藥新用研發(fā)任務(wù)中,該關(guān)系抽取模型被應(yīng)用到一個(gè)回顧性研究當(dāng)中,即通過(guò)查找文獻(xiàn)支持來(lái)驗(yàn)證針對(duì)“非典”(SARS)或“中東呼吸綜合征”(MERS)的老藥新用策略的可行性,從而間接證明該老藥新用策略針對(duì)“新冠病毒”(COVID-19)的有效性;針對(duì)更多的生物實(shí)體間的作用關(guān)系抽取,如病毒-宿主、藥物-副作用間的關(guān)系抽取,該框架已在初步實(shí)驗(yàn)中驗(yàn)證了其有效性。

生物醫(yī)學(xué)實(shí)體關(guān)系抽取的流程圖

該論文通訊作者為清華大學(xué)交叉信息院副教授曾堅(jiān)陽(yáng)和助理研究員趙誕,第一作者為清華大學(xué)交叉信息研究院碩士生洪禮翔。該研究由國(guó)家自然科學(xué)基金、南京圖靈人工智能研究院和中關(guān)村海華前沿信息技術(shù)研究院支持。

原文鏈接:

https://www.nature.com/articles/s42256-020-0189-y

供稿:交叉信息院

編輯:李晨暉

審核:程曦

2020年06月10日 10:56:28

相關(guān)新聞

讀取內(nèi)容中,請(qǐng)等待...

最新動(dòng)態(tài)

清華大學(xué)新聞中心版權(quán)所有,清華大學(xué)新聞網(wǎng)編輯部維護(hù),電子信箱: [email protected]
Copyright 2001-2020 news.tsinghua.edu.cn. All rights reserved.