人工智能在藥物研發(fā)中的應用(上):AI與制藥場景如何相互“適配”?
近年來,人工智能(AI)已經被廣泛應用于多個行業(yè),徹底改變了 社會 生活的許多領域。
在制藥這一傳統(tǒng)行業(yè),AI也已經有了諸多應用。AI逐漸應用于藥物發(fā)現的靶點發(fā)現,虛擬篩選,化合物設計與合成,ADME-T性質和理化性質預測,藥物臨床試驗設計、管理、患者招募,藥物警戒應用和真實世界證據生成等多個流程和環(huán)節(jié)。
那么,AI應用于制藥的邏輯是什么?AI會如何改變藥物研發(fā)?如何應對制藥行業(yè)的效率挑戰(zhàn)?本文分為上下篇,本篇重點介紹AI在制藥行業(yè)多場景中展開及面臨的挑戰(zhàn)。
制藥受困
從制藥行業(yè)的困境說起。
在過去的數十年里,許多科學、技術和管理因素都取得了巨大進步,這有助于提高藥物研發(fā)的生產率(R&D)。然而,自1950年以來,每10億美元研發(fā)投入獲得批準的新藥數量幾乎每9年減少一半,該趨勢在60年間非常穩(wěn)定,被稱為制藥行業(yè)的反摩爾定律(Eroom’s Law)。新藥的開發(fā)成本越來越高,藥物研發(fā)面臨著嚴重的生產力危機。
對于反摩爾定律主要有三種解釋,即低垂果實假設(好摘的果子被摘走了)、監(jiān)管障礙假設(新藥申報的監(jiān)管要求不斷增高)、研發(fā)模式問題。前兩種解釋都是客觀事實難以改變,那么,是否有更好的藥物研發(fā)模式?這是制藥行業(yè)一直在思考的問題。
制藥行業(yè)在遭遇生產力困境的同時,也面臨著數據困境。
隨著全 社會 數字化信息化的快速推進、藥物研發(fā)設備的升級和長期的積累,可用的藥物研發(fā)數據越來越多,以至于在一定時間范圍內無法使用常規(guī)方法和軟件工具分析和處理所有數據。傳統(tǒng)的統(tǒng)計學在浩瀚的大數據面前越來越力不從心。制藥企業(yè)正在經歷數字化轉型,大量的數據產生。于是,日益增長的數據處理的需求,與現有數據分析能力之間的矛盾,推動制藥行業(yè)尋求新出路。
AI的橄欖枝
2016年3月,AI程序AlphaGo大勝韓國著名棋手李世石,是AI發(fā)展 歷史 上的里程碑事件。這一事件加快了AI在 社會 生活多個領域的 探索 和應用,也讓制藥行業(yè)看到了提高藥物研發(fā)生產率的希望。2016年后,AI在制藥行業(yè)的技術測試大量開展。實驗科學不再是唯一選項,以數據為中心的藥物發(fā)現逐漸走上舞臺。
在隨后的幾年時間里,AI制藥逐漸 升溫,概念驗證研究持續(xù)不斷、大量的資本涌入AI驅動的生物技術初創(chuàng)公司、制藥公司與AI生物技術公司和AI技術供應商之間的合作越來越多。一些領先的制藥公司的高管認為,AI不僅僅是一個先導化合物發(fā)現的工具,而且是一個促進生物學研究、發(fā)現新的生物靶點和開發(fā)新的疾病模型的更通用的工具。
AI在制藥的多場景中展開
數年間,AI已經被嘗試應用于藥物研發(fā)的幾乎所有流程和環(huán)節(jié),主要有以下方面:
/ / 靶點確認
靶點確認是藥物開發(fā)中的關鍵步驟,也是最復雜的步驟之一。目前已知的藥物靶點絕大多數為蛋白質,通過機器學習的方法,從蛋白質原始信息中提取特征,構建準確穩(wěn)定的模型進行功能的推斷、預測和分類,已經成為靶點研究的重要手段。從患者的樣本中、海量的生物醫(yī)學資料中提取基因組學、蛋白質組學、代謝組學等多組學數據,借助深度學習來分析非疾病和疾病狀態(tài)之間的差異,也可用來發(fā)現對疾病有影響的蛋白質。
/ / 基于表型的藥物發(fā)現
在過去的三十多年里,基于靶點的藥物發(fā)現都是藥物發(fā)現的主要方法。近年來,基于表型的藥物發(fā)現(直接使用生物系統(tǒng)進行新藥篩選)受到關注。機器學習可以在表型篩選中將細胞表型與化合物作用方式聯系起來,獲得靶點、信號通路或遺傳疾病關聯的聚類。而AI強大的圖像處理能力,能夠將生物系統(tǒng)的所有形態(tài)特征整合,系統(tǒng)研究藥物潛在的作用方式和信號通路,擴展對于疾病的生物學認識。
/ / 分子生成
機器學習方法可以產生新的小分子。AI可以通過對海量的化合物或者藥物分子的學習,獲得化合物分子結構和成藥性方面的規(guī)律,進而根據這些規(guī)律生成很多自然界從未存在過的化合物作為候選藥物分子,有效構建擁有一定規(guī)模且高質量的分子庫。
/ / 化學反應設計
AI目前正在取得進展的化學領域之一是對化學反應和合成路線進行建模和預測。AI可以將分子結構映射為可以由機器學習算法處理的形式,根據已知化合物的結構,形成多條合成路線,并推薦最佳合成路線。反過來,在給定反應物的情況下,深度學習、遷移學習可以預測化學反應結果。AI還可用來 探索 新的化學反應。
/ / 化合物篩選
AI能夠對化合物的化學結構與生物活性之間的關系進行建模,預測化合物的作用機制。一個典型的例子是MIT的研究人員基于深度學習發(fā)現了新的抗生素。研究人員訓練了一個能夠預測具有抗菌活性的分子的深層神經網絡,在幾天內篩選超過 1 億個化合物,根據模型的預測分數對化合物進行排名,最終確定了8種與已知抗生素在結構上差別較大的抗生素。
/ / ADMET性質預測
藥代動力學性質不夠理想,是臨床研究階段藥物研發(fā)失敗的主要原因之一。深度學習可以自動識別化合物的相關特征,評估數據集中多個ADMET參數之間的隱藏的關系和趨勢,預測化合物的細胞滲透性和溶解性等性質。
/ / 藥物臨床試驗
新藥開發(fā)中資金投入最多的階段是臨床試驗階段,AI在臨床試驗的設計、管理、患者招募方面皆有應用潛力。自然語言處理技術可從各種結構化和非結構化數據類型中提取信息,找到符合臨床試驗入組標準的受試者;也可用于關聯各種大型數據集,找到變量之間的潛在關系,改進患者與試驗的匹配情況。諾華已使用機器學習算法監(jiān)控和管理所有的臨床試驗。
/ / 藥物警戒
AI將對傳統(tǒng)的藥物警戒帶來沖擊。隨著監(jiān)管要求的嚴格和患者安全意識的提高,藥物警戒的工作量和成本大大增加。AI可以將藥物不良反應從接收到報告的整個流程實現自動化,優(yōu)化藥物警戒的工作并降低成本。基于AI系統(tǒng)還有可能通過預測能力展開藥物風險評估。
/ / 真實世界研究
AI的進步提供了分析大型多維RWD(真實世界數據)的新策略。AI能夠識別真實世界數據中的內在關聯,生成新的假設,也能為臨床試驗提供新的信息。最新的一個案例是,AI通過分析真實世界數據,可以找出不會影響試驗的總生存期的風險比的入組標準,從而擴大臨床試驗的人群范圍。
AI在藥物研發(fā)中的應用還包括 理化性質預測、藥物重定向、制劑開發(fā)中的應用 等。
問題顯現
AI在藥物研發(fā)中的應用遠非一帆風順,歸結起來,是AI如何與制藥場景相互“適配”的問題。
對制藥行業(yè)來說,走AI的路,就要穿AI的鞋。AI方法對于其適用對象的相關條件有諸多要求。如同傳統(tǒng)藥物研發(fā)需要配備必要的硬件設備和必要的環(huán)境設施(如科學儀器設備、實驗室等),基于AI的藥物研發(fā)需要配備數據、算法、算力,其中對數據的要求最為嚴格。
傳統(tǒng)的藥物研發(fā)以實驗科學為主。數十年來,藥物研發(fā)數據的記錄、治理和儲存都以實驗為核心,根據實驗的需求來調整,數據是實驗的“附屬”。而AI作為虛擬科學、計算科學和數據科學范疇內的方法,直接從數據入手,將數據放在第一位,對于數據的格式、標準、質量、數量都有內在的要求。在這樣的情況下,AI直接使用傳統(tǒng)藥物研發(fā)模式的數據往往遇到困難。
對AI來說,進入制藥的主場,就應當遵循制藥的規(guī)律。比如,藥物的開發(fā)是一個多維同步優(yōu)化的過程,鑒于數據的規(guī)模和復雜性,基于AI的藥物研發(fā)往往需要重寫機器學習算法,而不是簡單地調用。AI與制藥這一傳統(tǒng)行業(yè)的核心業(yè)務深度融合,需更深刻的行業(yè)理解力和更高的技術準確率。AI雖然已經可以從大量已知論文、實驗數據中挖掘新的知識,改變了傳統(tǒng)基于學術經驗的研究方式,然而方法的準確性、可解釋性、可重復性等還有待提高。
此外,傳統(tǒng)的藥物研發(fā)模式已有相對健全的監(jiān)管政策、行業(yè)體系。作為一種新的模式,AI在制藥行業(yè)的應用 探索 ,也需要相應的行業(yè)政策和體系來規(guī)范和引導。
文 智藥邦 侯小龍
來源 中國食品藥品網