西南航空大癱瘓:上萬航班取消,竟是因 1990 年代 IT 系統

作者 | 發布日期 2022 年 12 月 30 日 8:09 | 分類 航太科技 , 軟體、系統 line share follow us in feedly line share
西南航空大癱瘓:上萬航班取消,竟是因 1990 年代 IT 系統


上週超強冬季風暴「艾略特」(Storm Elliott)讓美國民航業在聖誕假期這週,經歷「數十年一遇」的嚴重癱瘓。

航班資訊追蹤工具FlightAware數據顯示:12月21~26日全美航班取消總數超過1.7萬班。好在極寒氣流經過後,接近聖誕前夕和聖誕節當天,各航空公司都恢復正常80%以上。

唯獨西南航空是異類:取消航班數越來越多,整個航空公司從聖誕節五天前就陷入崩潰,直到聖誕節三天後,仍處於癱瘓狀態。

最近幾天到過聖荷西機場SJC的矽谷人,應對這畫面不陌生:旅客擠滿出境大廳,隊伍甚至排到航站外;無人認領的行李堆滿轉盤區,到處都混亂一片。

田納西州的納許維爾國際機場,西南航空甚至將客服「外包」給警察。一支12月27日晚間上傳影片顯示,某警察威脅因航班取消無處可去的乘客「西南打電話叫我們來,你們沒有合法機票,如果不走我就要逮捕你!」

各地機場「盛況」可說都是西南航空的鍋。據不完全統計,三天內西南航空單日取消數平均2,500航班,甚至更多,直到週末才恢復。FlightAware平台數據顯示,自聖誕那週末後,全美大部分取消航班都是西南航空;28日開始全美國只有西南航空還在取消航班。

這不是西南航空第一次全系統癱瘓導致航班取消。2021年10月西南就經歷過類似情況,只是程度沒有這次誇張。一而再、再而三讓乘客失望,且還是在全民回家團聚的聖誕假期……西南航空怎麼了?

透過多名民航業人士及西南航空員工透露的情況,嘗試還原本次西南大癱瘓背後的原因。

罪魁禍首:古老過時的排班系統

毫無疑問,冬季風暴艾略特是這次大癱瘓的導火線。12月21日,歷史性溫帶炸彈氣旋在北美上空形成,美國、加拿大均發布暴風雪警告。12月23日開始,北美多主要城市均進入暴風雪範圍。21~25日聖誕節當天,共有一萬多航班延誤或取消。

▲ 12月23日加拿大上空時風暴強度接近峰值。(Source:NOAA’s GOES 16 Satellite, Public domain, via Wikimedia Commons)

然而西南航空老舊機組排班平台,才是本次大癱瘓的核心原因。多位民航業工作人員,包括網路匿名西南航空員工都表示,西南航空一直使用極其古老的後端系統,特別是機組排班平台,系統十分古老,規則也非常誇張。

具體來說,一般航空公司需要看一下自家即時系統或FAA公開數據,就可以知道機長和空服人員所在地。這邏輯很簡單,但西南偏不這樣做,而是採用非常過時的「預排+手動記錄」系統:

西南為機組人員排班之後,會自動把位置挪到該航班的目的地;如果航班改道、延誤和取消,西南系統無法自動更新機組人員位置,還要人工確認航班狀況,然後手動修改。各地因暴風雪導致大延誤、取消班機時,西南員工還要大量人工追蹤+手動修改,導致人力嚴重不足,無法及時追蹤航班最新情況和修改應付。

雪球越滾越大,排班平台終於出現嚴重的資訊錯誤,沒有一條是正準的。整個系統就完全「失靈」了。如洛杉磯起飛航班,機票賣光了,大批乘客登機手續辦好了,行李都收了,西南系統也安排機組了──結果整組空服員還在幾千英里外的紐約、達拉斯和丹佛,只有一個機長在現場,當然沒辦法飛。

更離譜的還在後面。

12月28日的公司通話,COO Andrew Watterson承認有上述情況,並因資訊錯誤太嚴重,系統完全無法使用,公司只好緊急通知所有機組人員,要求他們自己回報目前所在地。

而回報方式應該要怎麼樣?員工自己登錄系統回報?寄信傳簡訊?填線上表格?都太高估西南航空了。所謂自己回報,是叫所有機組員打「一支」電話號碼。西南航空不光自動排班平台不能用,人工行政能力也極其有限。一邊乘客在機場排隊到九霄雲外,一邊全國上萬名機組員打同一支電話回報地點,兩邊都等到天荒地老。

甚至有員工等電話接通的時間長達23小時,排班平台嚴重失靈,不僅讓公司無法掌握員工準確地點,甚至還引發「衍生災害」──美國監管部門FAA規定,民航機組人員工作一定時間,必須強制休息才可繼續飛。通常航空公司系統可自動統計員工工作時間,超時後可在目前地點自動預訂旅館。

然而西南後台系統嚴重癱瘓,四散的機組人員不但沒辦法上工,連旅館都沒得住;訂不到房間,這些員工強制休息時間就不能計算,更無法工作。知情人士透露,那兩天西南員工完全放棄公司系統了,很多機組員自己花錢訂旅館,儘管不知道之後能否報帳。

又一個雪球越滾越大。

除了系統,西南航空崩潰前幾天才剛惹怒大批員工,新仇舊恨當然更加劇系統癱瘓程度。

12月後美國面臨「三重疫情」(Tripledemic):新冠、流感、RSV(呼吸道融合病毒)同時大流行,許多人都告病在家,西南航空也未倖免。12月21日公司信內容為西南航空副總裁Chris Johnson在丹佛機場發布營運緊急狀態令(State of Operational Emergency)。

他說太多人請病假和事假,導致人員短缺,公司不得不臨時修改丹佛機場員工請假規則,請病假復工後必須出具診斷證明,且必須是親自看病,遠距看病不算,否則直接開除;駁回已批准事假,所有請假員工自動復工,不按時上班的直接開除;自願加班人數不夠,公司強制加班,不加班員工同樣開除。

這封信一寄出就炸鍋了。

已請病假和事假的丹佛員工就直接不來上班。坊間傳聞21~22日丹佛機場至少100名地勤員工辭職。考慮到丹佛又是西南航空最大據點,惹怒地勤員工的後果可想而知。最離譜的是這架航班:從坦帕飛丹佛班機,因丹佛地勤全罷工,就算已經到達丹佛也不得不飛回坦帕。

重啟再來

本就艱難的復工進度,一次次遭沉重打擊,最後所有努力都付諸流水。西南航空目前計畫是:取消所有航班「重開機」,因這後台系統除了清空重來,沒有別的辦法了。這就是為什麼26日開始西南航空航班取消越來越多,旅客和行李積壓越來越嚴重。矽谷朋友在SJC看到的「盛況」,都只是九牛一毛。畢竟西南航空全美流量最高的機場,SJC連前十都排不上。

26日Reddit西南航空非官方討論區,有位自稱是員工的匿名用戶發文說明,讓大家更清楚目前西南航空究竟崩潰到什麼程度,以及接下來應該如何安排旅行。這篇文已刪除,不過原文大意如下:

  • 這次大癱瘓,導火線確實是冬季風暴,但癱瘓到如此程度,完全是西南航空咎由自取。如果西南客服還告訴你是因為風暴,那就是在說謊(其實是公司給的說法)。
  • 癱瘓主因是機組排班軟體完全失靈,且打電話人工排班也不管用。「如果我們有更好的技術不用打電話,這問題早就解決了」。
  • 如果旅客被困住,還有別的交通方式可選──直接離開機場是最快的方法,不要猶豫。
  • 行李能不托運就不托運,因為沒人能保證行李會出現在哪。目前托運行李完全可用災難形容,如果有托運行李遺失可能至少要一個月或更久才能找回。
  • 不要等西南恢復,不要碰運氣:3天內航班一定會取消;4~7天內「有可能」會照班表飛;7天後應該會恢復正常。

Reddit網友還幫出主意:「困在機場沒事可做?去行李轉盤找沒人認領的行李,看看上面如果有電話號碼,告訴失主行李現在的位置。」

了解大崩潰細節後,許多網友表示,對民航業技術不太了解,沒想到21世紀航空公司,居然還能因排班系統如此老舊而造成大癱瘓。更讓網友憤怒的是,西南一次次因同樣原因出包,最後還是員工匿名發文才能了解真相。

接受美國媒體採訪時,COO Andrew Watterson也不得不承認,公司系統實在太老舊:「我們飛機足夠,但排班調度軟體出了問題。我們的技術無法將機組人員和航班立即準確配合。 」Watterson將西南航空後台系統形容成紙牌屋──任何小地方出小問題,都會導致紙牌屋瞬間崩塌。「馬上就要解決問題的時候,又出了新問題……我們不得不重設系統。」

這場大崩潰導致全美上百萬人無法在聖誕節前回家,也讓西南航空高層顏面盡失。他們口口聲聲說「要解決系統問題」,但後續就像「狼來了」故事。

西南航空飛行員工會主席Casey Murray接受CNN採訪時表示,「過去一年半,我們一直遭上同樣問題。不同規模崩潰越來越頻繁,但其實只要把IT系統、流程搞好就能解決。」據他了解,西南航空後台系統從1990年代就沒更動過了。

(本文由 品玩 授權轉載;首圖來源:Pixabay