More  

小編的世界 優質文選 生物

英特爾報告:量子優勢將極大地推動醫學和生物學研究


2021年12月18日 - 生物小編  
   

量子前哨發布時間: 2021-12-17 16:55

(圖片來源:網絡)

俄勒岡健康與科學大學和英特爾公司發布在ArXiv網站的一份報告《生物學和醫學量子優勢前景》<1>顯示,如果實現廣泛的量子優勢,將大大有利於某些醫學和生物學研究。該報告指出,追求卓越量子算法的優勢之一是開發更好的經典算法和混合量子-經典算法。

該報告指出,隨著第一代NISQ(含噪中等規模量子)設備從實驗室進入雲端,現在是生物學和醫學領域的計算學家開始探索量子方法可能給他們的研究工具箱帶來的價值的大好時機。

過去三十年裏,生物學和醫學已經發展成為高度定量的領域。然而,盡管計算方法和高性能計算(HPC)環境的擴展促進了實質性的進展,但對理解生物和臨床系統的能力的基本限制仍然存在。

系統複雜性就是一個例子。實用算法通常通過簡化框架來管理系統複雜性,導致現有的計算模型往往無法捕捉和協調重要的系統動力學。如果能夠制造出足夠強大的量子計算機,有望從根本上降低算法複雜性。反過來,也將以更高的效率模擬許多困難的問題,這可能會減少計算時間並提高實際模型的保真度。

第二個限制是規模。僅就醫療保健而言,2013年就產生了多達153 EB的數據,預計複合年增長率為48%,根據這一增長率推斷,2020年產生的數據可能超過2300 EB。生物學中的高通量測序革命產生了大量高度複雜的基因組、表觀基因組、轉錄組、蛋白質組和代謝組數據類型(以及其他數據類型)。這些海量數據資源對於在二次分析和再現性研究中重複使用高價值數據至關重要。然而,即使廣泛使用HPC基礎設施,大型生物信息學和計算生物學工作流通常也會持續數天、數周或更長時間。

雖然預計量子計算技術不會在短期內解決可擴展性限制,但是從長遠來看,FTQC(容錯量子計算)設備可能會為其中一些挑戰提供部分解決方案。

如何定義量子優勢?

我們如何從理論角度定義量子優勢?該報告指出,理論上的量子優勢由四個關鍵屬性定義:

1.問題:一個正式的計算問題。

2.算法:一種經典算法和一種量子算法,每種算法都解決計算問題。

3.資源:經典算法和量子算法消耗的一個或多個資源,如時間、空間或數據。

4.界限:經典算法和量子算法的資源消耗的分析界限(例如,最壞情況下的時間複雜度界限)。

理論上的量子優勢可以根據兩個因素進行分類(如圖1)。第一個與計算問題的經典難度有關,它由最著名的經典算法或可證明的上界定義。具體來說,計算問題可以根據它的經典算法複雜度(通常針對最壞情況輸入)是多項式還是超越多項式分別劃分為簡單問題和困難問題。第二個因素與量子算法相對於經典算法的優勢大小有關。通常這些優勢來自計算資源複雜度的降低。與算法複雜度一樣,優勢的大小也可以分為多項式或超越多項式。

注:如果一個算法的時間T(n)沒有任何多項式上界,則稱這個算法具有超越多項式(superpolynomial)時間。

這裏需要明確的是,“容易”和“困難”僅指經典的可計算性;它們不是指實際量子優勢的可獲得性或實現量子方法的困難。

圖1 左上:多項式在經典困難問題上的優勢。左下:多項式在經典簡單問題上的優勢。右上:超越多項式在經典困難問題上的優勢。右下:超越多項式在經典簡單問題上的優勢。

量子優勢潛在可行性

有關量子硬件方面各種量子優勢潛在可行性的概述如表1所示。

表1 量子優勢潛在可行性。注:表中數字為文獻中的算法,可在報告原文查看。

追求NISQ優勢

隨著混合-量子經典方法的發展,理解量子優勢及其計算基准變得更加重要。許多為NISQ設備開發的混合方法可以被稱為變分量子算法(VQA)。一般來說,VQA利用三個基本組成部分:i)參數化量子電路(PQC),ii)目標函數,以及iii)經典優化器(圖2)。例如,變分量子本征求解器(VQE)和許多變分QML(量子機器學習)算法。

至關重要的是,這些算法在實現和應用中具有很大的靈活性。

圖2 VQA的示意圖。

如圖2所示,VQA第一步是將問題和目標函數映射到哈密頓算符H。在此映射之後,VQA的執行過程如下:首先,量子電路被初始化,參數化量子電路的第一次執行可被視為初始ansatz。接下來,執行測量以提取計算目標函數損失所需的信息。使用此測量,經典優化器然後計算參數更新以最小化目標函數的損失。該過程迭代進行,直到系統從初始ansatz收斂到最低能量態。該低能態表示哈密頓算符最低能量態的近似和上界。

該報告介紹了有可能追求NISQ優勢的四類混合算法,包括變分量子模擬(VQS)算法、變分量子機器學習(QML)算法、量子近似優化算法(QAOA)和量子退火算法(QA)。變分量子本征求解器(VQE)是最常見的VQS算法。通常QML方法可分為以下四類:

1.在具有經典數據的經典設備上執行的學習算法。

2.在具有量子數據的經典設備上執行的學習算法。

3.在具有經典數據的量子設備上執行的學習算法。

4.在具有量子數據的量子設備上執行的學習算法。

生物學和醫學量子優勢前景

1.模擬量子物理

在原子水平上模擬微觀性質和過程是計算生物學研究的一個關鍵領域。這些任務通常需要量子力學模擬,這對於除了最小的量子系統以外的所有量子系統來說都是經典難題。這些固有的局限性意味著大多數經典方法都是近似的,並且通常提供定性的理解。相比之下,許多相同問題的量子力學模擬是量子計算機的自然任務。在NISQ時代之後,預計大型量子系統的模擬可用於預測經典設備無法有效計算的生化性質和行為。

該報告總結了生物學和醫學領域在短期或中期內可能實現量子優勢的具體應用,見表2。

表2 生物學和醫學領域的預期量子優勢。

2.模擬經典物理

經典模擬的量子算法。已經提出了許多有針對性的量子算法,用於尋找低能構象和搜索候選分子,其中許多是專門為蛋白質折疊而開發的。更一般地說,振幅放大可用於探索具有平方優勢的經典變量的構象空間。此外,其他優化相關子程序也顯示了理論上的量子優勢,例如優化場景中的逃逸鞍點。

除了優化和搜索之外,還可以應用QML算法。已經有了一些例子,比如利用量子深度學習來搜索化學空間。考慮到混合量子-經典結構,這些方法的經驗優勢可能在短期內實現。

最後,近年來解決經典微分方程的量子算法也取得了進展,無論是在一般情況下還是在特定應用中,如有限元法(FEM)或Navier-Stokes。重要的是,在這些量子算法中,有一些用於解決更困難的非齊次和非線性偏微分方程的情況。

經典模擬的前景。關於構象空間的搜索,量子優勢是可能實現的。但最近的工作表明,即使是FTQC,提供平方優勢的一般方法(例如,振幅放大)本身的價值也可能有限。因此,預計領域知識和附加量子子程序的集成將是實現任何未來優勢的關鍵。

對於QML,特別是混合量子-經典算法,值得進一步探索短期兼容方法以改進經典物理模擬。

最後,導致模擬困難的流體模擬的兩個主要方面可能是系統尺寸和湍流。雖然尚不清楚是否可以用量子方法有效地解決湍流問題,但微分方程的量子算法可以降低系統規模方面的複雜度,這在某些情況下可能會帶來超越多項式優勢。

3.生物信息學

針對生物信息學中的問題,已經提出了少量的量子算法(表2)。其中包括針對NP難問題的FTQC設備開發的理論算法,例如序列比對、利用振幅放大和量子行走的進化樹推斷。為了使這些理論量子算法實用化,預計這些理論量子算法需要大量的改進和努力。

在短期內,這些改進可能包括i)使用VQA、QAOA或QA框架為NISQ設備改寫它們,ii)整合更大的生物學背景。這種類型的工作已經存在於新的基因組裝配、序列比對和生物網絡推斷中。

從長期來看,可以通過優化近期方法和在可能的情況下集成快速量子算法子程序來追求運行優勢。可能與這項工作相關的已知量子算法包括回溯算法、動態編程算法、字符串運算算法和微分方程算法。

考慮到這些措施,這些問題的運行優勢可能仍然是最難實現的。

此外,量子優勢的其他障礙包括i)現有經典啟發式算法的複雜性及其解決的許多問題的內在並行性,ii)現有量子硬件和當代研究背景下問題實例的規模,iii)現有經典管道受益於廣泛的機構支持和在職人員利益(包括在醫療環境中的廣泛臨床驗證),以及iv)FTQC基於實踐中的振幅放大實現多項式優勢的可能先決條件。因此,盡管目前在這個方向上的研究顯示了長期前景,並且應該進一步探索,但是這些量子優勢中的許多在短期內似乎不太可能。

4.量子機器學習

變分量子機器學習(QML)有望為廣泛的生物學研究和臨床應用提供一個方法學工具箱。

大量的數值和理論證據表明,NISQ硬件上的變分QML算法具有多種優勢。其中包括存在設備、參數、特征和標簽噪聲時的魯棒性。應用的廣度可能類似於深度學習,這是一套用於生成和預測建模的高度靈活的方法學工具,目前在該領域廣泛使用。

關於量子優勢,需要進一步的實驗工作來評估現有變分QML的潛在優勢是否能夠產生運行優勢。特別是樣本複雜性優勢可能會產生巨大影響。事實上,如果在生物和臨床研究中常見的數據分布上能夠證明哪怕是很小的多項式縮減,它們可能會在實例很少(例如,由於疾病發生率)或樣本采集昂貴、有創或困難的情況下找到重要的應用。符合這一標准的例子包括罕見表型的診斷和預後,從EHR數據中識別多種藥物的不良反應,以及根據臨床結果診斷癌症及其亞型,如藥物敏感性和疾病預後。總之,盡管QML優勢的實際應用在很大程度上仍停留在理論上,但它們解決現有領域限制的潛力為進一步研究變分QML方法提供了充分的動力。

5.量子數據結構

在生物信息學和計算生物學中,非傳統的數據結構長期以來一直被經典算法所利用。例如,許多用於糾錯序列數據的最先進算法利用布隆過濾器(Bloom Filter),其核心優勢在於能夠以較低的假陽性查找概率換取顯著的內存節約——這是大型生物信息學管道中的常見限制。

可以想象,量子計算機固有的概率性質和量子信息提供的新的數據輸入模式,如角度和相位編碼,可能推動在FTQC體系中開發類似有用的量子數據結構和抽象,如QRAM。從中期來看,共同努力開發一個開放的量子數據結構庫可能有助於提高我們對量子方法類型的理解,這些量子方法可能具有長期的實際優勢。

報告全文:

https://arxiv.org/pdf/2112.00760.pdf

編輯:王衍