不可否認(rèn),在當(dāng)今世界,人類的信息數(shù)據(jù)已經(jīng)隨著研究領(lǐng)域的擴(kuò)展進(jìn)入了指數(shù)級增長的時代,傳統(tǒng)的信息處理方式存儲量小且反應(yīng)速度慢,大數(shù)據(jù)分析體系便應(yīng)運而生。在當(dāng)下的科學(xué)技術(shù)逐漸成熟的今天,如何將數(shù)據(jù)分析應(yīng)用于各個領(lǐng)域,實現(xiàn)效率的跨越式提升和產(chǎn)業(yè)的升級轉(zhuǎn)型,是目前各個行業(yè)都在研究的問題。而作為研究與人類疾病、基因、微生物等相關(guān)的生命科學(xué),更是亟待有工作高效、體量更大的數(shù)據(jù)分析體系協(xié)助進(jìn)行深入的研究創(chuàng)新。
大數(shù)據(jù)邂逅生命科學(xué),創(chuàng)新轉(zhuǎn)型的契機(jī)
將數(shù)據(jù)分析運用于生命科學(xué)的領(lǐng)域,其實已經(jīng)在世界級科技巨頭公司投入應(yīng)用并成為了大公司業(yè)務(wù)運行的得力助手。比如微軟公司所開發(fā)的Azure Machine Learning,就是是微軟云平臺上的一款托管式機(jī)器學(xué)習(xí)服務(wù),可以幫助研究人員輕松創(chuàng)建、部署和管理監(jiān)督式和非監(jiān)督式機(jī)器學(xué)習(xí)模型。研究人員可以使用Azure Machine Learning快速實現(xiàn)生物序列分析、衛(wèi)星圖像分析、情感分析等
多個應(yīng)用場景,從而提高研究和分析的效率。
早在2011年,麥肯錫就在報告《大數(shù)據(jù)的下一個前沿:創(chuàng)新、競爭和生產(chǎn)力》中預(yù)估,數(shù)據(jù)分析在醫(yī)療領(lǐng)域每年能夠產(chǎn)生3000億美元的潛在價值,年生產(chǎn)增長率為0.7%,而且先進(jìn)的分析方法可以將標(biāo)準(zhǔn)化的疾病治療轉(zhuǎn)化為個性化的風(fēng)險評估、診斷、治療和監(jiān)測,個性化醫(yī)療的到來將可能改變整個系統(tǒng)利益相關(guān)者的命運。在個性化醫(yī)療過程中,數(shù)據(jù)分析將會對醫(yī)療服務(wù)方、支付方、制藥企業(yè)和醫(yī)療設(shè)備企業(yè)等各方產(chǎn)生深遠(yuǎn)甚至是決定性的影響。
而在當(dāng)下,數(shù)據(jù)分析已經(jīng)廣泛應(yīng)用在生命科學(xué)領(lǐng)域,實現(xiàn)了數(shù)據(jù)分析個性化、海量信息的構(gòu)建、醫(yī)療服務(wù)的個性化等各種超前的服務(wù)。在數(shù)字化服務(wù)的幫助之下,生命科學(xué)開啟了以患者為中心,通過醫(yī)藥生產(chǎn)、流通、服務(wù)向產(chǎn)業(yè)鏈上下游以及高附加值服務(wù)領(lǐng)域發(fā)展。
大數(shù)據(jù)分析在生命科學(xué)領(lǐng)域的應(yīng)用
在當(dāng)下,數(shù)據(jù)分析在生命科學(xué)領(lǐng)域的實際應(yīng)用,主要體現(xiàn)在信息歸攏、糾正偏差、提高效率等方面。
合零為整
大數(shù)據(jù)分析的合零為整功能,主要體現(xiàn)在大數(shù)據(jù)分析系統(tǒng)可以自動識別不同數(shù)據(jù)表格之間的聯(lián)系,允許客戶以查詢數(shù)據(jù)庫的方式直接操作這些表格,還可以對訪問系統(tǒng)的用戶進(jìn)行信息采集、建檔和歸類,組建一個有序的新數(shù)據(jù)庫,為進(jìn)行客戶的精準(zhǔn)需求分析和個性化醫(yī)療提供統(tǒng)一且全面的標(biāo)準(zhǔn)和依據(jù)。
比如在協(xié)和醫(yī)院所引進(jìn)的SAS數(shù)據(jù)分析軟件,就是以此來做信息庫的統(tǒng)計分析研究和具體的統(tǒng)計分析工作,包括臨床研究的數(shù)據(jù)管理和藥理中心比較分散的數(shù)據(jù)分析管理等等,大大提升了信息管理的效率和精準(zhǔn)度。
提高效率
生物科學(xué)高性能計算需要海量的計算資源,存儲量和計算周期都在增加;與此同時,生命科學(xué)的數(shù)據(jù)分析計算往往比較復(fù)雜,對速度要求越來越高,傳統(tǒng)的手動統(tǒng)計和區(qū)域網(wǎng)絡(luò)已經(jīng)難以滿足這種需求。因此大數(shù)據(jù)的分析系統(tǒng)的存儲量和效率的優(yōu)勢,得以顯現(xiàn),通過強(qiáng)大的數(shù)據(jù)整合能力和大體量的數(shù)據(jù)庫儲存,對于用戶的指令做出快速及時的反應(yīng),簡化運算流程,降低手工運作的復(fù)雜性。
比如金賽藥業(yè)所采用的SAS數(shù)據(jù)分析體系,在提升新藥品上市等工作中發(fā)揮了重要作用。金賽藥業(yè)相關(guān)工作人員介紹說,在SAS、CACHE等服務(wù)器所組建的軟硬件設(shè)備基礎(chǔ)上進(jìn)行的智能開發(fā),讓工作人員在同等條件下效率提升了200%,在2022年搶占新冠藥品上市的過程中,數(shù)據(jù)分析系統(tǒng)在4個小時之內(nèi)完成了top line的結(jié)果提交,12個小時成功提交所有的package,保證了新藥品搶占市場先機(jī)。
糾正偏差
隨著信息科技的發(fā)展,生命科學(xué)領(lǐng)域的數(shù)據(jù)庫體量將會越來越大,內(nèi)容也會越來越復(fù)雜,更需要通過精準(zhǔn)的運作和計算糾正偏差,保障數(shù)據(jù)無誤。大數(shù)據(jù)分析系統(tǒng)的運算過程是由特定的引擎進(jìn)行判斷和驅(qū)動,幾乎不需要人工干預(yù)人工干預(yù)度低,可以快速實現(xiàn)計算的自動化和流程化,在這個過程中出現(xiàn)的操作異常會自動提示,進(jìn)行人工修正或者干預(yù)。此外,大數(shù)據(jù)分析系統(tǒng)還有提前預(yù)測功能,從根本上減少出現(xiàn)錯誤的概率,實現(xiàn)信息的準(zhǔn)確傳達(dá)和運算。
比如在疫情期間,美國克利夫蘭醫(yī)學(xué)中心就在SAS的協(xié)助下合作創(chuàng)建了創(chuàng)新性分析模型,幫助醫(yī)院準(zhǔn)確預(yù)測患者人數(shù)、所需床位和呼吸機(jī)數(shù)量等關(guān)鍵信息,根據(jù)這些預(yù)測的實時變化,醫(yī)院和衛(wèi)生部門及時調(diào)整醫(yī)療資源分配,為新冠及其他患者提供更好的醫(yī)療服務(wù)。
大數(shù)據(jù)分析系統(tǒng),生命科學(xué)的未來“神輔助”
在信息化擴(kuò)展至全球的時代,大數(shù)據(jù)分析系統(tǒng)對于生命科學(xué)研究來說,起著越來越重要的作用。那么在醫(yī)療、醫(yī)藥、康養(yǎng)等相關(guān)行業(yè)如何能把握住時代契機(jī),通過人工智能技術(shù)實現(xiàn)產(chǎn)業(yè)技術(shù)升級和效率的再度飛躍?
SAS中國生命科學(xué)行業(yè)首席顧問顧天倫先生認(rèn)為,未來生命科學(xué)領(lǐng)域?qū)囊运幤窞橹行南蛞曰颊邽橹行霓D(zhuǎn)移,讓患者更好地參與到臨床試驗當(dāng)中去進(jìn)一步優(yōu)化設(shè)計和實施。因此,隨著數(shù)據(jù)標(biāo)準(zhǔn)不斷地完善復(fù)雜,越來越多的相關(guān)企業(yè)希望能有標(biāo)準(zhǔn)統(tǒng)一的rest API接口共大數(shù)據(jù)分析系統(tǒng)的程序員或者醫(yī)學(xué)工作者來
簡化流程,提高效率。在創(chuàng)新層面來說,未來,基于臨床線、基于風(fēng)險的質(zhì)量管理、醫(yī)學(xué)監(jiān)察的可視化的審核,以及藥物警戒信號的可視化管理等一系列的可視化分析都會不斷搭建,可以助力行業(yè)內(nèi)部更快的發(fā)現(xiàn)藥物安全性信號,以最快的速度排查臨床試驗運營過程中不合規(guī)的部分,讓臨床數(shù)字創(chuàng)新帶給患者最大的益處。這也是未來大數(shù)據(jù)分析體系在生命科學(xué)領(lǐng)域發(fā)展的主要潮流。