必?fù)P醫(yī)藥(Beyang Therapeutics),成立于2021年,是一家既年輕又成熟的Biotech公司。基于ExCEED(Experiment + Computation w/ Enhanced Evaluation & DMPK)技術(shù)平臺,必?fù)P專注于計算模擬技術(shù)和藥物發(fā)現(xiàn)實(shí)驗(yàn)技術(shù)的高度融合,尋找更快、更智能的方法來發(fā)現(xiàn)新的和更好的藥物。
基于多年在行業(yè)深耕的經(jīng)驗(yàn)和獨(dú)特的創(chuàng)新視角,胡齊悅在2021年創(chuàng)立了必?fù)P醫(yī)藥。他的初衷是:“我希望必?fù)P作為創(chuàng)新藥物的‘夢工廠’,以另外一種方式,匯聚有各自專長的人組成精煉小團(tuán)隊,研發(fā)出Best in Class的分子,加速藥物研發(fā)進(jìn)程。”從分子設(shè)計、成藥性評價與生物學(xué)評價三個核心環(huán)節(jié)入手,必?fù)P期望打造一個能不斷產(chǎn)出高質(zhì)量分子的創(chuàng)新藥“夢工廠”,助力中國創(chuàng)新藥走出國門、邁向海外。

必?fù)P的團(tuán)隊來自世界各地,精煉且資深。
胡齊悅在Pfizer(輝瑞)La Jolla實(shí)驗(yàn)室工作十多年后,選擇回國加入恒瑞醫(yī)藥。在中國創(chuàng)新藥的發(fā)展萌芽階段,繼續(xù)深耕近十年后,成立了必?fù)P醫(yī)藥。公司創(chuàng)始團(tuán)隊成員均擁有超過20年新藥研發(fā)與計算模擬結(jié)合的實(shí)踐經(jīng)驗(yàn),累計對20余個臨床階段候選藥物或已上市新藥的研究與開發(fā)做出過重要貢獻(xiàn),例如Adebrelimab、Axitinib、Crizotinib、Sunitinib、Sylatron等等。
必?fù)P的“夢工廠”模式不僅在于小而精的團(tuán)隊本身,還在其強(qiáng)大的創(chuàng)造能力。
必?fù)P的優(yōu)勢體現(xiàn)在,具有挑戰(zhàn)性的靶點(diǎn)與適應(yīng)癥選擇,以及臨床前項目管線的推進(jìn)和有明顯差異化的數(shù)據(jù)。
成立不到三年,已經(jīng)有一款以滴眼治療眼底疾病的項目管線正在推進(jìn)臨床注冊申報研究,該適應(yīng)癥臨床可用藥物匱乏,且無治療指南推薦藥物,未滿足臨床需求巨大。同時,另一款治療高危型白血病復(fù)發(fā)難治亞型的項目也即將進(jìn)入臨床注冊申報研究,該適應(yīng)癥標(biāo)準(zhǔn)療法為化療,尚無針對性靶向療法獲批,亦存在非常明確的未滿足臨床需求。

無論是眼科項目還是腫瘤項目,均在臨床前研究中,通過與所選適應(yīng)癥/靶點(diǎn)上最好的藥物頭對頭比較,充分證明其 Best in Class 潛力。
三年前,速石寫過一篇文章,盤點(diǎn)了全球44家頂尖藥企用人工智能輔助新藥研發(fā)的現(xiàn)狀。到今天,依然可以得出這個結(jié)論:我們離主要靠計算機(jī)發(fā)現(xiàn)藥物,通過一大堆機(jī)器人完成實(shí)驗(yàn)測試,然后將它們送給患者的世界還相距甚遠(yuǎn)。
但這并不意味著,我們不能繼續(xù)往前。
正是計算機(jī)技術(shù)的應(yīng)用讓創(chuàng)新藥研發(fā)這件事情變得扁平化,把中國與世界的距離拉近。
胡齊悅在輝瑞就專注于計算機(jī)輔助藥物研發(fā)的工作,在恒瑞任職期間,帶領(lǐng)團(tuán)隊充分發(fā)揮計算模擬與實(shí)驗(yàn)的協(xié)同作用,并將計算模擬的應(yīng)用從小分子領(lǐng)域進(jìn)一步拓展到包括抗體、重組蛋白、ADC和RNA等生物大分子形式。

胡齊悅表示,相比Me Too,做Best in Class會更需要計算機(jī)技術(shù)的幫助,或者說,借助這樣的技術(shù)可以把這件事做得更好。比如分子設(shè)計,一般靠的是研究人員經(jīng)驗(yàn),他知道什么樣的化學(xué)結(jié)構(gòu)可以跟靶點(diǎn)有很好的結(jié)合。但一個人即使再有經(jīng)驗(yàn),也不可能窮舉所有可能性,這時候可以借助計算機(jī)的力量把已知可能的分子都設(shè)計出來,通過一個評價體系來排序并選擇。
而一個奇思妙想的結(jié)構(gòu),有時能點(diǎn)燃創(chuàng)造的火花。
而像成藥性評價,如果通過AI機(jī)器學(xué)習(xí)的算法模擬實(shí)驗(yàn)數(shù)據(jù)訓(xùn)練預(yù)測模型可以節(jié)省人力、物力以及實(shí)驗(yàn)資源,并能更快獲得最終的實(shí)驗(yàn)結(jié)果。
Biotech的主業(yè),始終是前沿靶點(diǎn)和技術(shù),解決未滿足臨床需求。必?fù)P的“夢工廠”模式,最重要的就是專注于自己的核心目標(biāo),同時充分借助外部的力量。
隨著整個制藥行業(yè)的發(fā)展與成熟,CRO、CMO、第三方研究所等專業(yè)機(jī)構(gòu)的出現(xiàn),為行業(yè)的發(fā)展帶來了全新的商業(yè)模式,很多非核心業(yè)務(wù)都可以被拆分出來,實(shí)現(xiàn)“分布式”分工協(xié)同,讓必?fù)P的發(fā)展更輕松與高效。
比如,做新藥研發(fā)云平臺的速石科技就是必?fù)P的合作伙伴之一。
過去一年,必?fù)P在速石平臺的使用趨勢如下圖:

最高達(dá)到1500+核心并發(fā),最低值是0。
真正做到:需要的時候就在那。無需預(yù)測,想用就用,用完即走。
給必?fù)P帶來的好處在于:
首先,輕松無負(fù)擔(dān)。無需增加自有資產(chǎn),占用公司現(xiàn)金流;
其次,使用方式靈活。需要的時候購買,用完即走,不需要培養(yǎng)一個專門的團(tuán)隊;第三,減少前期摸索時間與降低試錯成本。
還在美國工作的時候,胡齊悅就已經(jīng)知道云的優(yōu)勢了。
在恒瑞時他曾經(jīng)也想上云,但即便在大型藥企,從無到有地搭建一套可用研發(fā)環(huán)境依舊是復(fù)雜的:從爭取公司資源,到招聘專業(yè)人才,包括后續(xù)一系列采購設(shè)備、設(shè)計底層架構(gòu)、打通網(wǎng)絡(luò)、部署系統(tǒng)、管理維護(hù)集群等工作。
考慮到這些繁瑣耗時的工作都需要他付出相當(dāng)大的精力,就一直沒往這個方向投入。
而在本地機(jī)器購買完成的那一刻起,就開始了固定資產(chǎn)的貶值。

創(chuàng)立了必?fù)P后,作為一家企業(yè)的創(chuàng)始人,面臨的問題就更多更現(xiàn)實(shí)了。
專門準(zhǔn)備一個機(jī)房,招一堆人來搭建整個環(huán)境和底層架構(gòu),再專門找IT維護(hù)。他直接表示:“這個對于多數(shù)Biotech不實(shí)際”。而且每年可以投入到機(jī)房的費(fèi)用是一定的,但是需要做計算的事其實(shí)是在增長的,這種模式也非常不靈活,很難匹配一家高速增長的企業(yè)需求。
在胡齊悅看來,速石提供的新藥研發(fā)云平臺是一條捷徑或者說高速路,而這對藥物研發(fā)企業(yè)具有很重要的價值。

面對多樣的藥物研發(fā)場景和BIO/AI工具,如分子對接、虛擬篩選、蛋白質(zhì)折疊等,速石能為像必?fù)P這樣的用戶提供三大核心價值:
1. 標(biāo)準(zhǔn)藥物研發(fā)環(huán)境的規(guī)劃與搭建。
速石站在醫(yī)藥公司整個新藥研發(fā)體系與架構(gòu)視角進(jìn)行標(biāo)準(zhǔn)藥物研發(fā)環(huán)境的規(guī)劃與搭建,為企業(yè)提供一整套即開即用的CADD/AIDD研發(fā)平臺,一體化產(chǎn)品端到端交付到用戶手里。
有效降低用戶的前期投入與摸索成本,任何起步的公司都可以嘗試,沒有使用門檻,且對企業(yè)的未來擴(kuò)張有極強(qiáng)的兼容性與彈性。
2. 藥物設(shè)計研發(fā)流程的構(gòu)建與驗(yàn)證,BIO/AI應(yīng)用的適配和銜接。
速石深入藥物研發(fā)業(yè)務(wù)場景,為用戶提供藥物研發(fā)流程自動化的構(gòu)建與驗(yàn)證,對上層BIO/AI應(yīng)用運(yùn)行提供支持與優(yōu)化,同時與底層資源聯(lián)動,給用戶更靈活、更高效使用資源的能力。
一方面把用戶原來手動做的工作自動化,大大提升用戶的工作效率;另一方面為用戶提供應(yīng)用與資源層面的最佳實(shí)踐參考,解決了研發(fā)場景里普遍存在的資源利用率不高、成本難以把控等問題。
3. 處理研發(fā)與IT領(lǐng)域的交叉問題。
做計算機(jī)輔助藥物研發(fā),遇到的通常是介于藥物研發(fā)與計算機(jī)IT領(lǐng)域的交叉問題,定位困難,解決復(fù)雜,非常消耗用戶精力。速石能幫用戶預(yù)判部分問題,通過自動化減少部分問題發(fā)生,定位并解決部分問題,幫助用戶專注更重要的藥物研發(fā)工作。

此外,速石的新藥研發(fā)平臺還能支持市面上所有主流新藥研發(fā)應(yīng)用,和AlphaFold、RoseTTAFold等常用AI框架的快速搭建,并提供開源/自有分子庫構(gòu)建與治理,如Zinc、Drugbank、Maybridge、Enamine等等。
速石常見BIO應(yīng)用實(shí)證:
Vina/ Amber/ MOE/ LeDock
我們問了胡齊悅一個假設(shè)性的問題:
“如果沒有預(yù)算,你會怎么使用我們平臺?”
或者換一種表達(dá)方式:“如果沒有資源限制,你會如何使用計算機(jī)技術(shù)來輔助藥物研發(fā)?”
他回答:“會用得更多。”
多跟少之間的權(quán)衡點(diǎn)具體有哪些?
第一, 研究的全面性。
面對資源限制,企業(yè)首要考慮的是該研究項目的必要性與重要性,然后計算需要投入的時間與資源量。這可能會嚴(yán)重影響研究的全面性。
以設(shè)計分子為例,藥物研發(fā)人員會從現(xiàn)有的資源與認(rèn)知出發(fā),制定研究計劃,無法考慮超出資源之外及認(rèn)知之外的可能性。
隨著研究邊界的不斷拓展,可能會因?yàn)橛邢薜馁Y源與認(rèn)知,對某一個項目帶來致命的、決定性的負(fù)面影響。而研發(fā)人員永遠(yuǎn)無法知道錯過了什么。

第二,應(yīng)用與資源的適配。
資源限制會對研發(fā)人員使用應(yīng)用的方式提出要求,他們需要能根據(jù)任務(wù)特性挑選更合適、性價比更高的機(jī)器。
如果只選用大機(jī)型執(zhí)行任務(wù),將會浪費(fèi)大量資源,而如果錯誤選擇了小機(jī)型,很可能中途會面臨任務(wù)失敗。
如何找到應(yīng)用與資源類型、資源規(guī)模的最佳適配,需要不斷地學(xué)習(xí)和實(shí)踐。
第三,時間與金錢的取舍。
從事藥物研發(fā),研發(fā)速度不是唯一的考量。要提升研發(fā)的深度與廣度,實(shí)現(xiàn)整體效率的提升,充足的資源必不可少,但這也意味著企業(yè)需要付出更多的成本。企業(yè)需要在效率與成本間做抉擇,甚至需要根據(jù)外部環(huán)境的變化做動態(tài)調(diào)整。這也是大部分企業(yè)都在面臨的難題。
Take Away
蘇州必?fù)P醫(yī)藥科技有限公司是一家創(chuàng)新的制藥公司,利用其專有的ExCEED 平臺來加速針對未滿足臨床需求的新藥發(fā)現(xiàn)和開發(fā)進(jìn)程。創(chuàng)始人和管理團(tuán)隊平均擁有超過20年新藥研發(fā)經(jīng)驗(yàn),曾任職于輝瑞、默克、阿斯利康、先靈葆雅和恒瑞。他們在藥物靶點(diǎn)選擇、CADD、AIDD、生物篩選和優(yōu)化以及DMPK方面具有豐富的經(jīng)驗(yàn)。他們共同參與促成了20 多個臨床候選分子的開發(fā),其中多個藥物(Adebrelimab、Axitinib、Crizotinib、Sunitinib、Sylatron等)已獲得 FDA 和 NMPA 的批準(zhǔn),于中美兩地上市。
必?fù)P建立了專有的計算機(jī)加速藥物發(fā)現(xiàn)整合平臺ExCEED,該平臺利用新的分子生成和優(yōu)化方法 MMPT 和計算機(jī) DMPK 模擬預(yù)測來指導(dǎo)臨床前候選分子的發(fā)現(xiàn)和開發(fā),能夠大幅拓展可探索化學(xué)空間,打破制藥專家固有思維的桎梏,從而提高藥物研發(fā)效率,獲得更優(yōu)質(zhì)的分子。公司專注于眼科、腫瘤等具備臨床未滿足需求的疾病領(lǐng)域,旨在打造全球新藥研發(fā)界的“DreamWorks”(夢工廠),充分發(fā)揮團(tuán)隊在藥物發(fā)現(xiàn)階段的優(yōu)勢,自建管線與合作授權(quán)開發(fā)(License-out or Co-development) 并行。
關(guān)于fastone云平臺在各種BIO應(yīng)用上的表現(xiàn),可以點(diǎn)擊以下應(yīng)用名稱查看:
速石科技新藥研發(fā)行業(yè)白皮書,可以戳下方查看:
新藥研發(fā)37問 │ 頂尖藥企AIDD調(diào)研
-END-
我們有個一站式新藥研發(fā)平臺
集成行業(yè)應(yīng)用與自編譯軟件
支持AlphaFold、RoseTTAFold等常用AI應(yīng)用
可視化Workflow隨心創(chuàng)建、便捷分享
提供Zinc、Drugbank等開源/自有分子庫
CADD專家團(tuán)隊全面支持
掃碼免費(fèi)試用,送200元體驗(yàn)金,入股不虧~
P封面-1024x517.png)
更多BIO電子書歡
迎掃碼關(guān)注小F(ID:iamfastone)獲取

你也許想了解具體的落地場景:
王者帶飛LeDock!開箱即用&一鍵定位分子庫+全流程自動化3.5小時完成20萬分子對接
1分鐘告訴你用MOE模擬200000個分子要花多少錢
155個GPU!多云場景下的 Amber自由能計算
提速2920倍!用AutoDock Vina對接2800萬個分子
新藥研發(fā)平臺:
國產(chǎn)調(diào)度器之光——Fsched到底有多能打?
創(chuàng)新藥研發(fā)九死一生,CADD/AIDD是答案嗎?
全球44家頂尖藥企AI輔助藥研行動白皮書
近期重大事件:
速石科技入駐粵港澳大灣區(qū)算力調(diào)度平臺,參與建設(shè)數(shù)算用一體化發(fā)展新范式
速石科技成NEXT PARK產(chǎn)業(yè)合伙人,共同打造全球領(lǐng)先的新興產(chǎn)業(yè)集群
速石科技出席ICCAD2023,新一代芯片研發(fā)平臺助力半導(dǎo)體企業(yè)縮短研發(fā)周期
速石科技與芯啟源開啟戰(zhàn)略合作,聯(lián)手打造軟硬件一體芯片研發(fā)云平臺
速石科技作為特邀服務(wù)商入駐IC PARK,合力打造集成電路產(chǎn)業(yè)新生態(tài)
速石科技成為國家“芯火”深圳雙創(chuàng)基地(平臺)戰(zhàn)略合作伙伴,推動國產(chǎn)EDA公共技術(shù)服務(wù)云平臺建設(shè)

a16z的Vijay Pande博士在上周寫的文章《AI is Too Dumb… For Now》,同樣認(rèn)為現(xiàn)階段的AI還是太“笨”了。如果人工智能不能變得比現(xiàn)在“聰明”很多,它在生物領(lǐng)域的潛力將是有限的。
Vijay Pande博士,a16z普通合伙人,主要專注于生物制藥和醫(yī)療領(lǐng)域的投資。
此前,Vijay是斯坦福大學(xué)的 Henry Dreyfus 化學(xué)教授,結(jié)構(gòu)生物學(xué)和計算機(jī)科學(xué)教授,開創(chuàng)并一直在推動計算機(jī)科學(xué)技術(shù)在醫(yī)學(xué)和生物學(xué)領(lǐng)域的應(yīng)用。他擁有300多篇出版物,兩項專利,兩種新型候選藥物。
那么,如果想要讓AI更加“聰明”,數(shù)據(jù)上,算法上,具體應(yīng)該怎么做呢?
用“AI inside”替代“Intel inside”,對企業(yè)來說又意味著什么?
我們看看他怎么說的:
為了證明AI在生物領(lǐng)域的應(yīng)用價值,我們走了很長一段路。
2018年,我還在《紐約時報》上爭辯:考慮到醫(yī)生的大腦很大程度更是黑匣子的前提下,圍繞醫(yī)學(xué)中人工智能“黑匣子”的恐懼到底有多不合理,以及未來的障礙和機(jī)會可能在哪里。
(注:這個爭辯背景是,有人提出沒有人知道那些高級AI算法到底是怎么學(xué)習(xí)的,過程過于黑箱,令人害怕。而Vijay說其實(shí)人類做決策很多時候是出于直覺,也不一定能說清背后的邏輯推理過程,本質(zhì)上是個更大的黑箱。)
今天,已經(jīng)有大量證據(jù)表明AI能掀起醫(yī)療和生命科學(xué)領(lǐng)域的革命(更不用說其他領(lǐng)域),甚至在一度被認(rèn)為過于復(fù)雜而無法通過算法處理的一系列任務(wù)上表現(xiàn)得超越人類。
但是,盡管有了這些證據(jù),現(xiàn)實(shí)中的現(xiàn)實(shí)是:如果人工智能不能變得比現(xiàn)在更智能,它在生物領(lǐng)域的潛力將是有限的。
AI可以被訓(xùn)練(很像狗),但不能真正理解;它可以玩游戲,但僅限于已知規(guī)則;總之,它無法超越訓(xùn)練本身。
拿識別與致病蛋白質(zhì)結(jié)合的小分子為例,人工智能能夠超出人類能力地加速和擴(kuò)大藥物發(fā)現(xiàn)范圍,它必須從給定的訓(xùn)練數(shù)據(jù)中推斷出物理規(guī)律(比如原子可以堆積多近)、化學(xué)規(guī)律(比如不同化學(xué)鍵的強(qiáng)度)和生物學(xué)規(guī)律(比如蛋白質(zhì)口袋的靈活性)。但如果在任何方向上數(shù)據(jù)量過小,就會導(dǎo)致毫無意義的結(jié)果。 哈佛大學(xué)醫(yī)學(xué)院使用自研的VirtualFlow云平臺調(diào)用16萬核CPU對接10億分子花了15小時:《15小時虛擬篩選10億分子,《Nature》+HMS驗(yàn)證云端新藥研發(fā)未來 - 速石科技BLOG (www.jf-health.com) 》

需要明確的是:我們所討論的不是一些類似于人類的科幻人工智能概念,也不是只有生物學(xué)才需要面對的“笨”人工智能挑戰(zhàn)。但是,由于需要大量行業(yè)專業(yè)知識才能理解問題的根源和提出可能的解決方案,在生物和醫(yī)療領(lǐng)域最能感受到依賴于這些樸素算法帶來的影響。
如果我們想在生物學(xué)和醫(yī)療領(lǐng)域更有意義地應(yīng)用人工智能,并取得真正的進(jìn)步,我們需要能夠創(chuàng)建具備行業(yè)專業(yè)知識的更“聰明”的AI算法。
那么,怎么才能做到呢?
對這個領(lǐng)域的玩家意味著什么?
房地產(chǎn)行業(yè)的至理名言是“l(fā)ocation,location,location”,而在人工智能領(lǐng)域,永遠(yuǎn)是“數(shù)據(jù),數(shù)據(jù),數(shù)據(jù)”。
然而,現(xiàn)在的數(shù)據(jù)不太適合AI在生物學(xué)中的實(shí)際應(yīng)用。探索這些數(shù)據(jù)可以得到一些零散的信息,但沒法得出普適性的生物學(xué)洞察。而且,這些數(shù)據(jù)也缺乏對AI學(xué)習(xí)內(nèi)容和方向上的控制,無法避免數(shù)據(jù)缺陷。
為了讓人工智能在生物和醫(yī)療領(lǐng)域得到更實(shí)際和更廣泛地應(yīng)用,需要通過自動化的方式生成數(shù)據(jù)。自動化的好處在于:更系統(tǒng)化,更可重復(fù),不受人類情感約束,比如過于重復(fù)過于無聊。
但更關(guān)鍵的點(diǎn)在于如何設(shè)計實(shí)驗(yàn),需要在一開始就有針對性地為AI提供數(shù)據(jù),從而確保更高質(zhì)量的數(shù)據(jù),規(guī)避數(shù)據(jù)缺陷。AI應(yīng)該在開始數(shù)據(jù)收集之前就介入,這樣能更好地進(jìn)行實(shí)驗(yàn)設(shè)計,確定實(shí)驗(yàn)路線。但很多時候,AI往往是在實(shí)驗(yàn)快要結(jié)束的時候被硬塞進(jìn)來的。
這跟科學(xué)家們之前受過的訓(xùn)練完全不同,以前的實(shí)驗(yàn)?zāi)繕?biāo)往往是驗(yàn)證一個特定假設(shè),而現(xiàn)在因?yàn)?strong>AI極大地擴(kuò)展了可能性,為我們開啟了新世界的大門,讓我們可以擁抱那些我們不知道我們不知道的現(xiàn)實(shí)。
還是拿識別與靶標(biāo)蛋白質(zhì)結(jié)合的小分子為例(在初創(chuàng)公司和制藥企業(yè)中越來越常用的應(yīng)用場景):
一方面,AI可以變得特別強(qiáng)大,尤其是當(dāng)結(jié)果信息可以匯總,加強(qiáng)原來的數(shù)據(jù),開始新一輪學(xué)習(xí);
另一方面,AI可能會選擇一些違反科學(xué)家直覺的分子。以前,藥物化學(xué)家會根據(jù)經(jīng)驗(yàn),對哪些修改會提高親和力和選擇性下一系列賭注,通常會排除他們“知道”行不通的選擇。而除了需要在計算機(jī)上進(jìn)行大量天文數(shù)字模擬計算之外,AI不需要排除任何可能的修改,從而幫助藥物化學(xué)家擴(kuò)大探索范圍,選擇應(yīng)該制造和測試的分子。
這里就有一個虛擬篩選海量分子的案例,我們調(diào)用了10萬核CPU資源,花了15小時搞定了2800萬個分子:《生信云實(shí)證Vol. 生信分析上云案例, AutoDock Vina分子對接虛擬篩選 (www.jf-health.com)

這就是人工智能的力量——超越人類所能做的。當(dāng)然,前提是它是“聰明”的,而不是“笨”的。
除了更高質(zhì)量的數(shù)據(jù),我們顯然還需要更優(yōu)秀的算法。
學(xué)彈吉他是件有挑戰(zhàn)性的事情,但對于會彈鋼琴的人來說則要容易得多(因?yàn)樗麄円呀?jīng)會看樂譜、操作一種樂器以及對音高和音調(diào)有敏感性)。我們可以將學(xué)鋼琴當(dāng)成學(xué)吉他的“預(yù)訓(xùn)練”。而在生物領(lǐng)域,預(yù)訓(xùn)練看起來像是一種醫(yī)學(xué)轉(zhuǎn)錄算法,在使用醫(yī)學(xué)術(shù)語和分類學(xué)進(jìn)行訓(xùn)練之前,先使用英語語言和語法進(jìn)行訓(xùn)練。預(yù)訓(xùn)練為AI提供了大量練習(xí),教會它有關(guān)概念之間的關(guān)系,并且具有一些明顯可見的好處,比如加快以更少輸入實(shí)現(xiàn)更高準(zhǔn)確度這個過程。預(yù)訓(xùn)練的缺點(diǎn)是它仍然依賴于AI根據(jù)已知數(shù)據(jù)發(fā)現(xiàn)和推斷已知規(guī)則。
另一種方案是把行業(yè)專業(yè)知識直接編進(jìn)算法里。這里的關(guān)鍵是以一種足夠通用的方式表示數(shù)據(jù),讓它可以處理所有不同的排列組合。例如,在自然語言處理中,樸素AI以像素的形式輸入數(shù)據(jù),然后將其翻譯為字母、單詞和句子等。使用更智能的編碼可以將文本顯示為字母,這樣可以大大減少訓(xùn)練數(shù)據(jù)量,為數(shù)據(jù)貧乏的環(huán)境和更可預(yù)測的算法打開大門。在生物中,這可能意味著不再以體素(3D像素)的格式向AI描述分子,而是從包含了化學(xué)鍵信息的圖形開始,這意味著更大的化學(xué)空間。 讓數(shù)據(jù)表示包含更多目標(biāo)信息是棘手的,必須經(jīng)過深思熟慮,因?yàn)樗赡茏兊梅浅G宄踩菀谆蚍疵妫兊酶訌?fù)雜難懂。
當(dāng)算法從一開始就面向某個特定生物應(yīng)用進(jìn)行設(shè)計時,它們也將變得更智能,同時能獲得行業(yè)專業(yè)知識。生物領(lǐng)域使用的很多AI技術(shù)都是直接從非生物應(yīng)用中搬過來的;放射學(xué)中的算法與用于基本圖像識別的神經(jīng)網(wǎng)絡(luò)類型是一樣的。
現(xiàn)在我們開始看到了針對生物學(xué)問題設(shè)計的算法和訓(xùn)練的出現(xiàn),像自監(jiān)督算法的變體,它們從通用對應(yīng)物開始,但結(jié)合了生物學(xué)見解來幫助學(xué)習(xí)。例如,了解細(xì)胞自然特征(染色質(zhì)、細(xì)胞器等)的細(xì)胞成像算法可以讓我們更自然地使用自監(jiān)督方法。這是因?yàn)閿?shù)據(jù)更加一致(所有類型都相同,全都是細(xì)胞成像),并且圖像中的元素在沒有高級機(jī)器學(xué)習(xí)的情況下是眾所周知的(因?yàn)槲覀兞私饧?xì)胞的基本生物學(xué))。這也將帶來更好的整體表現(xiàn),并降低訓(xùn)練數(shù)據(jù)量需求。
最終,當(dāng)算法與特定行業(yè)的計算方法成功融合時,它們將變得更智能,并提高適用性。
以分子動力學(xué)模擬為例,這是一種可以對分子物理和化學(xué)的許多方面進(jìn)行編碼的強(qiáng)大計算方法,但它仍然依賴于以臨時、有偏見和依賴于人類判斷的方式完成的參數(shù)和訓(xùn)練。通過將AI融入這些模擬計算中,可以使參數(shù)選擇更加穩(wěn)健和可重復(fù),帶來方法的整體改進(jìn)。
在《生信云實(shí)證Vol.6:155個GPU!多云場景下的Amber自由能計算 - 速石科技BLOG (www.jf-health.com)》中,我們調(diào)用155個GPU進(jìn)行基于分子動力學(xué)模擬的煉金術(shù)自由能計算。

今天,我們在蛋白質(zhì)、細(xì)胞和器官水平上看到了這樣的組合。
未來,我們將基于AI模擬整個生物體。
綜上所述,所有這些都導(dǎo)致人工智能的“智能”發(fā)生翻天覆地的變化——從基于任務(wù)的簡單訓(xùn)練(類似于訓(xùn)練狗的特定技巧)轉(zhuǎn)變?yōu)樾枰儆?xùn)練的更通用的智能,更自然地超出訓(xùn)練本身(在科學(xué)范圍內(nèi)),實(shí)現(xiàn)更準(zhǔn)確的預(yù)測。
把“Intel inside”換成“AI inside”,對創(chuàng)業(yè)公司和老牌企業(yè)意味著什么?生物領(lǐng)域并不是第一個正在適應(yīng)這種大轉(zhuǎn)變的行業(yè)。從華爾街到麥迪遜大道再到硅谷,每個人都在適應(yīng)AI,我們能看到文化障礙與技術(shù)障礙幾乎一樣高。
對于一家生物公司來說,更實(shí)際和更廣泛地采用AI意味著將人工智能以及懂人工智能技術(shù)的人員將融入每個團(tuán)隊,而不是一個通常在最后才被叫過來了解其他人做了些什么的獨(dú)立AI小組。這可能意味著企業(yè)需要配備在人工智能和生物領(lǐng)域“雙語”的人員,以及建立一種重視雙方的文化:渴望計算能力的生物學(xué)家和深深植根于生物領(lǐng)域的計算科學(xué)家。
眾所周知,改變根深蒂固的文化非常困難。
初創(chuàng)公司在這方面有明顯優(yōu)勢,可以從0開始構(gòu)建基于AI原生的團(tuán)隊和思維方式。對于老牌企業(yè)來說,與其他創(chuàng)新一樣,領(lǐng)先的永遠(yuǎn)是那些能夠調(diào)整傳統(tǒng)模式的公司。當(dāng)然,他們也可以選擇建立全新的以AI為中心的團(tuán)隊,讓這些團(tuán)隊承擔(dān)越來越多的責(zé)任,從內(nèi)部進(jìn)行瓦解。

一種新的人才即將到來。
過去,“藥物獵人”是藥物化學(xué)家。但是隨著可以幫助完成機(jī)械重復(fù)工作和分子合成的CRO公司的興起,現(xiàn)在誰制造分子遠(yuǎn)不如誰設(shè)計它們重要。隨著“量化分析師”的出現(xiàn),我們看到金融領(lǐng)域就有類似的轉(zhuǎn)變,這些人更多擁有計算技能而不是對該領(lǐng)域?qū)I(yè)知識。同樣的,這種轉(zhuǎn)變也將發(fā)生在化學(xué)和生物實(shí)驗(yàn)室里。
到目前為止,這些生物“量化分析師”必須依賴大數(shù)據(jù)來支持他們的統(tǒng)計方法,由于成本和復(fù)雜性,現(xiàn)在還很難落地。但未來的智能算法能將他們的技能應(yīng)用于小數(shù)據(jù)——從而應(yīng)用到公司的所有領(lǐng)域。大數(shù)據(jù)是基礎(chǔ)設(shè)施和管線問題;小數(shù)據(jù)永遠(yuǎn)是個智力問題,通過智能算法來解決,而不僅僅是靠聰明人。
正是這種能處理小數(shù)據(jù)能力的智能算法,將使AI無處不在。
與之前的其他重大技術(shù)轉(zhuǎn)變一樣,從樸素到智能 AI 的轉(zhuǎn)變將重塑整個組織結(jié)構(gòu),而不僅僅是與其最接近的功能。
為什么?因?yàn)楦斆鞯娜斯ぶ悄芸梢詭椭卮鹪?jīng)只屬于精明的人類判斷領(lǐng)域的關(guān)鍵業(yè)務(wù)問題。
太多人將人工智能視為生物制藥進(jìn)步歷史長河中的下一個階段。
人們很容易把AI當(dāng)成又一項技術(shù)進(jìn)步,然而,這是一個過于狹隘的觀點(diǎn),因?yàn)?strong>與其他技術(shù)不同,人工智能——尤其是這些智能算法——不僅是解決一個問題的工具,而且是可以應(yīng)用于所有問題的工具。真正的力量不僅在于將其用作單一工具,還在于使用AI放大和整合公司中的所有工具和技術(shù)。
它不僅僅只是擺在桌面上的一個新盒子,而是我們在每個角色中的學(xué)徒和盟友。隨著人工智能無處不在,它將變得更聰明,我們也是。
我們基于全球44家頂尖藥企(包括3家中國藥企)在利用AI輔助藥物研發(fā)上的行動(共涉及55家AI初創(chuàng)企業(yè)、12家IT-云服務(wù)商、7所高校)制作了《【2021年】全球44家頂尖要求AI輔助藥物研發(fā)行動白皮書》,有興趣的可掃碼添加小F微信獲取。

我們有個為應(yīng)用定義的云計算平臺
集成多種EDA應(yīng)用,大量任務(wù)多節(jié)點(diǎn)并行
應(yīng)對短時間爆發(fā)性需求,連網(wǎng)即用
跑任務(wù)快,原來幾個月甚至幾年,現(xiàn)在只需幾小時
5分鐘快速上手,拖拉點(diǎn)選可視化界面,無需代碼
支持高級用戶直接在云端創(chuàng)建集群
掃碼免費(fèi)試用,送200元體驗(yàn)金,入股不虧~

更多電子書歡迎掃碼關(guān)注小F(ID:imfastone)獲取

你也許想了解具體的落地場景:
LS-DYNA求解效率深度測評 │ 六種規(guī)模,本地VS云端5種不同硬件配置
揭秘20000個VCS任務(wù)背后的“搬桌子”系列故事
155個GPU!多云場景下的Amber自由能計算
怎么把需要45天的突發(fā)性Fluent仿真計算縮短到4天之內(nèi)?
5000核大規(guī)模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對接2800萬個分子
從4天到1.75小時,如何讓Bladed仿真效率提升55倍?
從30天到17小時,如何讓HSPICE仿真效率提升42倍?
關(guān)于為應(yīng)用定義的云平臺:
2小時,賬單47萬!「Milkie Way公司破產(chǎn)未遂事件」復(fù)盤分析
高情商:人類世界模擬器是真的!低情商:你是假的……
【2021版】全球44家頂尖藥企AI輔助藥物研發(fā)行動白皮書
EDA云平臺49問
國內(nèi)超算發(fā)展近40年,終于遇到了一個像樣的對手
幫助CXO解惑上云成本的迷思,看這篇就夠了
花費(fèi)4小時5500美元,速石科技躋身全球超算TOP500
