因為上週比利時的一次暴雷,Google 損失了 0.000001% 的資料

作者 | 發布日期 2015 年 08 月 21 日 8:16 | 分類 Big Data , Google , 伺服器 follow us in feedly
google官網

強大如 Google,也要怕閃電。

13 日,比利時布魯塞爾西南郊外的 St.Ghislaina 小鎮遭遇了雷電天氣。結果,Google 位於該鎮的資料中心所儲存的資料,受到了「嚴重」的損失




pingwest 配圖

▲ Google 比利時資料中心成立時的照片。

閃電擊中了資料中心所用的電網,導致主要電力系統供電中斷。資料中心隨即切換到了兩種備用系統:備用供電線路和伺服器內建電池。一般來說,兩種災備方案對於資料中心肯定是夠了,但誰會想到,內建的電池這次出現了問題。

根據 Google 透露的情況,在從 13 日到 19 日這段時間裡,由於部分資料中心伺服器的電池耗盡時間太長(extended or repeated battery drain),這些涉及伺服器儲存的 I/O 出現了零星的存取失敗情況:大約 0.000001% 的資料受到了影響。

這些伺服器位於 Google Compute Engine 的北歐區域的 europe-west1-b,受影響的伺服器在該資料中心比率約為 5%。

pingwest 配圖

雖然看起來資料損失比率極小,但對於擁有海量資料的 Google 來說,本次數據損失並不是一件小事……產業人士估計,Google 擁有 10-15 exabyte(EB)的資料,每 exabyte 等於 100 萬 TB,而每 TB 等於 1000GB。如果把這個數字帶入到計算裡,0.000001% 大約等於 100 多 GB 的資料。當然,Google 雖然沒有公布比利時資料中心的資料儲存量具體有多少,但我們可以估計,至少有數 GB 到數十 GB 的資料,在本次雷暴中丟失。

pingwest 配圖

▲ Google 比利時資料中心。

Google 的資料中心架構工作人員正在著手解決這個問題。目前,大部分的伺服器已經使用更換了具備更好抗災性的儲存硬體。另外,Google 也重申,Google 雲端服務的彈性計算架構遍布全球各地,用戶可以設定在災難發生時,自動切換到備用的彈性架構上。目前,Google Compute Engine 在全球共有三個伺服器,分別位於比利時、台灣彰化和美國愛荷華州。

(本文由 PingWest 授權轉載) 

發表迴響