用 DNA 儲存資料!微軟寫入速度取得重大突破

作者 | 發布日期 2021 年 12 月 04 日 11:26 | 分類 Microsoft , 儲存設備 , 零組件 Telegram share ! follow us in feedly


拜 IoT 物聯網之賜,我們早已進入 PB 級(Petabyte)資料量的大數據時代,未來 Metaverse 元宇宙真的來到,全球資料量勢必再翻好幾個數量級達到 EB 級(Exabyte)的可怕程度。如今,全球每一天累積的資料量就達到 2.5PB,長此以往,每年全球所產生的資料將會呈現非常驚人的指數性增長,人們很快就會面臨「儲存能力趕不上資料產生速率」的棘手難題。或許專門儲存我們基因資訊的 DNA,將會成為解決未來資料儲存難題的聖杯。 

在 EB 級超大數據量的衝擊下,傳統儲存媒體完全不夠看。根據《自然》期刊預測,如果我們所有影片、照片及文件都儲存到傳統快閃記憶體晶片上的話,那麼到了 2040 年,該晶片所消耗的矽,將會是預期供應量的 10 到 100 倍。由此可見,面對未來資料儲存,我們已到了非改弦更張不可的地步。

在尋求未來儲存的諸多努力中,DNA 儲存成為最有潛力的解決方案之一。與華盛頓大學分子資系統實驗室(Molecular Information Systems Laboratory,MISL)合作的微軟,即為當前 DNA 儲存的先驅之一,該公司最近在將 DNA 做為資料儲存的研究中取得一些突破與進展。

最新研究論文,微軟宣布推出第一款「奈米級」DNA 儲存寫入器,該研究團隊預計其 DNA 寫入密度可達每平方公分 25×10^6  個序列,比之前產品寫入密度高出「三個數量級」(1,000 倍)。其最重要的地方在於,該產品首度表明其成功達到 DNA 儲存所需要的最低寫入速度。

相對硬碟是使用 0 與 1 來儲存,DNA 儲存則使用 4 個化學鹼基:腺嘌呤(adenine,A)、鳥嘌呤(guanine,G)、胞嘧啶(cytosine,C)和胸腺嘧啶(thymine,T)。這些化合物會成對連接,在雙螺旋梯形結構上形成梯級。事實證明,透過 DNA 將 0 與 1 轉換成 A / G / C / T 四個字母儲存複雜大數據絕對可行。

身為全球最大雲端儲存服務供應商之一,微軟就是看好 DNA 儲存在密度、永續性及儲存壽命無與倫比的優勢。據稱 DNA 具備每平方英吋儲存 1EB 資料的驚人密度,這是目前支援最大儲存量最佳儲存方案 LTO 磁帶遠遠無法達到的水準。且磁帶儲存年限頂多 30 年,但 DNA 儲存可延續保存數千年之久。

然而 DNA 卻有兩大致命傷:寫入速度與成本,尤其高昂成本讓人望之卻步,目前數 MB DNA 儲存就要數千美元。隨著微軟推出奈米級 DNA 儲存寫入器,以及掌握最小寫入速度閾值,DNA 寫入速度進展到可行性的另一個階段。微軟接下來的重點研發工作就是嵌入數位邏輯晶片,讓數百萬電極點的個別控制,能以每秒儲存數 KB 資料的速度寫入 DNA 之中,一旦達成,屆時 DNA 儲存的效能與成本表現將達到與磁帶相提並論的等級。

(首圖來源:微軟