• 大數據為藥物研發助力


    來源:中國醫藥報   作者:白毅    時間:2016-11-25





      隨著制藥行業數據的不斷積累和生命科學及健康領域數據的蓬勃發展,大數據在新藥研發中起到越來越重要的作用。近日,有關專家在接受記者采訪時表示,大數據已成為藥物研發領域的關鍵因素,對于大數據的擁有及正確的應用將成為今后藥物研發競爭的重點所在。


      藥物研發的迫切需求


      藥渡項目管理部運營總監李琪介紹,藥物研發是一個高投入、高風險、長周期的工作,其研發費用動輒數十億美元,研發周期長達10~15年,而成功率卻微乎其微。如果能在藥物研發早期獲得足夠的數據,創建更為有效的開發流程,針對最有希望的產品優先分配資源,不僅能夠提高研發效率,更能降低失敗風險。


      “新藥研發,已經離不開大數據的支撐。”咸達數據旗下信狐藥訊聯合創始人王海林表示,藥物篩選、立項、臨床、上市等所有環節,都需要大數據的支撐。如通過大數據分析,可以提高效率,縮短周期,降低風險,節約成本;利用化學結構數據,可以幫助研發者快速確立化學結構或有針對性進行結構改造;利用深度學習、虛擬篩選數據,能夠快速分析藥物臨床前實驗,找出有效的目標藥物;利用臨床試驗數據,可以快速建立藥代動力學模型,評估療效,預判不良反應,加快臨床試驗速度。


      湯森路透產品解決方案部門李寅博士認為,在眾多涉及大數據的行業中,制藥行業是真正的數據密集型的專業領域,尤其是未來創新藥的探索與開發將與大數據密不可分。


      李琪表示,新藥研發的相關數據量巨大,每一個成功上市的藥物背后都有上百萬頁的文獻資料,同時藥物研發數據涵蓋藥學、藥理、毒理、藥代動力學、藥學專利、藥物化學(合成)、臨床藥理學、藥劑學、藥物分析學等十幾個學科研究領域。在藥物研發的過程中,必須“站在巨人的肩膀上”進行創新。如果研究人員對已上市藥物的各項學科數據了如指掌,在此基礎上開展的創新研究的成功機會就會增加很多。然而,在當今這個信息大爆炸的時代,每天都有海量的化學反應、醫藥文獻、專利申請等藥物相關數據文獻被公開發表,藥物的文獻調研和閱讀絕非易事。比如,全球已上市糖尿病藥物近30個,每個藥物的文獻資料約2萬頁,那么要開發一個糖尿病新藥,需要把所有已上市糖尿病藥物百萬頁的相關資料都閱讀一遍。即使是對于一個有10年研發經驗的高級藥物研發人員來說,閱讀這么大量的文獻也是個不可能完成的任務,這是有限的生命與研發創新之間最大的矛盾。如何讓藥物研發人員能夠迅速了解所關注藥物的歷史數據,讓藥物研發創新開展得更高效,是全球需要解決的問題。解決了這一難題,藥物研發創新的成功機會就會顯著提高。


      從整合、分析到解讀


      在藥物研發領域中,大數據具有信息量大、信息種類繁多、數據產生的速度快等特點。李寅強調,最重要的不僅僅是數量,而是對于數據的“整合”“分析”與“解讀”。大家競爭的不再是誰可以獲得某個信息,而是誰可以從浩瀚的數據海洋中快速地找到那些真正具有價值的“珍珠”,或通過對于數據的分析,及時總結出規律,發現“深海采珠”的捷徑。


      李寅首先從數據的整合角度介紹,藥物研發領域的大數據在具備準確性、時效性、全面性的基礎上,在不同種類、不同層次、不同維度還應該構建合理的相關性,即將“知識孤島”連接起來,聯點成線,組線成網,進一步形成立體結構。這種關聯性在很大程度上可以決定基礎信息數據是否能夠通過人工或者某種人工智能最終上升成為知識,并進一步幫助人們產生新的假設,完成新的構想,推動研發活動的進展,產生進一步的數據,并進一步升華成知識。例如:在湯森路透的創新藥研發數據庫INTEGRITY中,所有不同的知識領域都具有“縱向”相關性。通過簡單的“快速檢索”,可以查找到與伊馬替尼直接相關的信息有:7個靶點,1314個生物標記物,6929篇文獻,418個核心專利,27條全合成路徑,1857個實驗藥理學數據,2646個PKPD數據,1807個臨床試驗記錄,11家公司或研究機構,8個疾病的綜述以及115個實驗模型。通過這個專業工具,可以在幾秒鐘內全面收集該藥的主要信息及研發數據。


      其次,數據的呈現及分析方式對于是否能夠全面挖掘數據的潛在價值起到決定性作用。李寅認為,尤其在制藥行業中,通過數據分析并借助一定的可視化手段,可以從繁多的數據中找到線索,發現問題的核心,為解決問題提供正確方向。在新藥立項之前,往往要對靶點的作用機制進行深入調研,從臨床前、市場潛力、臨床、專利等方面確定新藥分子在未來市場中的前景及可能遇到的各種風險。數據分析及呈現方式的選擇直接影響到受眾對于數據的理解,從而影響到最終的決策。如在湯森路透的競爭情報模塊(CortellisforCI)中,可以查找近幾年來糖尿病領域中比較新的靶點SGLT-2領域中的所有藥物(共54個),并對這些藥物進行分析,如分析這些藥物的研發進展(10個藥物上市,4個提交新藥申請,7個藥物在Ⅲ期臨床研究階段,5個藥物在Ⅱ期臨床研究階段等),分析研發藥物數量最多的機構(阿斯利康、禮來、賽諾菲等公司),治療的適應證,或是研發技術類別等。這些全面的信息可以為研發立項決策提供大量情報,分析呈現出的結果清晰并有說服力。


      而最重要的一點,則在于大數據的“解讀”。這也是任何規模的數據信息最后產生價值的關鍵所在,更是大數據的整個生命周期的關鍵所在。李寅強調,對于數據不正確的解讀,很可能給人們指出錯誤的方向,得出有偏差的結論,增加了新藥項目的決策風險。制藥相關的數據解讀是一個非常專業的領域,通常需要借助相關專業領域中的專家來做。但由于專家的知識層次各異,領域稍有差異,結果可能謬以千里。所以,對各方專家的觀點都需要進行驗證。


      機遇與挑戰并存


      “大數據要求有大量的原始數據積累,不但要有完整準確的數據,還要有持續生產數據的能力,以及科學的數據運算、分析。即使是在藥物研發先進的歐美國家,大數據的建立也還處于早期階段,尚不完善。現階段,國內在這些方面更是嚴重欠缺。”李琪認為,近年來,國外制藥行業在新藥研發過程中對研發信息平臺的依賴性非常高,比如湯森路透的Integrity是國際制藥企業較為廣泛使用的藥物研發數據庫。但在國內,此類專業藥物研發數據信息平臺幾乎沒有,是藥物研發的“迫切需求”。


      “藥渡正在不斷摸索如何利用大數據為藥物研發助力。”李琪介紹,他們自主開發的藥物大數據綜合信息服務平臺,致力于為醫藥研發企業等提供全面的“一站式藥物研發大數據信息服務”。目前,平臺已收錄整理了超過5000個全球上市和臨床在研的化學藥和生物藥的科學數據,涵蓋藥物立項調研、研究開展、人才交流等多方面,并通過藥渡網、移動應用“DrugA-Z”、紙質和數字出版物、藥物研發對照品庫、專業技術報告等多種形式與途徑,讓醫藥研發信息“觸手可得”,基于藥渡大數據出版的紙質出版物《ThePharmaceuticalIndex》年卷系列書籍也已出版發行。


      王海林認為,咸達數據現已整合國內基礎的數據信息,如專利、藥物批文、注冊、市場銷售等,為藥物研發、生產等提供數據分析產品。他強調,大數據的建立需要綜合多方力量才能實現,必須以開放合作的方式,共同打造服務于新藥開發的數據平臺。


      李寅表示,湯森路透曾邀國際制藥巨擘(TOP50)進行了以“大數據在行業中的現狀及未來的挑戰”及“大數據在制藥領域中的應用”為主題的深入調研。從調研結果看出,大數據的機遇挑戰并存。從機遇角度分析,大數據將對傳統藥物研發起到至關重要的作用。40%的受訪者認為,大數據將在藥物發現和開發領域中成為最重要的因素;26.5%的意見認為,市場分析將是大數據引領制藥行業的關鍵。當前的一些熱點話題,如精準醫療、合作創新、藥物警戒等都將是大數據的重要舞臺。而如何整合結構化數據庫,如何充分利用內外部的實驗數據,如何兼顧社交媒體的數據等,是大數據面臨的挑戰。在未來的藥物研發中,誰能有效解決這些問題,誰就可以最大效率地利用數據,在研發、生產等競爭中搶得先機。(本報記者白毅)



      版權及免責聲明:凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章,不代表本網觀點和立場。版權事宜請聯系:010-65363056。

    延伸閱讀

    熱點視頻

    第六屆中國報業黨建工作座談會(1) 第六屆中國報業黨建工作座談會(1)

    熱點新聞

    熱點輿情

    特色小鎮

    版權所有:中國產業經濟信息網京ICP備11041399號-2京公網安備11010502003583

    www.色五月.com