員工竊取前東家演算法還拿去 PyTorch 開源？MIT 教授控告 Facebook

上週，兩位麻省理工學院（MIT）教授設立的創業公司將 Facebook 告上法庭，指控 Facebook 侵犯他們的商業機密，還將核心演算法放在 GitHub 開源，開源的還恰好是深度學習框架 PyTorch 的關鍵程式庫。

同時被告的還有神經魔法公司（NeuralMagic, Inc.）前員工亞歷山大‧茲拉特斯基（Aleksandar Zlateski），現在是 Facebook 人工智慧研究院科學家。茲拉特斯基被指控違反保密和競業禁止協定。

2020 年 3 月 4 日，美國麻省地區法院公布編號「第 20-10444 號民事訴訟」的起訴書，原告神經魔法公司敘述詳細過程。

神經魔法公司創辦於 2017 年，創始人為 MIT 電氣工程與電腦科學系教授尼爾‧沙維特（Nir Shavit）和電腦科學與人工智慧實驗室科學家亞歷克斯‧馬特維耶夫（Alex Matveev）。

核心技術之一是包在編譯器裡的演算法，演算法有很大潛力，允許複雜數學函數在 CPU 高效執行，不需使用 GPU 這類專門硬體；還允許研究科學家使用大得多的資料集，可用在醫療保健、癌症篩檢、電子商務等方面，讓人工智慧應用降低花費和硬體成本。

茲拉特斯基是 MIT 博士後時第一個正式員工加入神經魔法。2018 年 3 月，他成為技術總監，基本年薪為 16.5 萬美元加期權。擔任技術總監期間，茲拉特斯基有許可權取得公司所有商業機密、專有資訊和商業計畫，關鍵是他能接觸同時也協助編寫編譯器核心演算法的來源碼。

2019 年 7 月，茲拉特斯基離開神經魔法加入 Facebook，並表示不會涉及以前參與的編譯器工作。神經魔法也選擇信任他，因為有保密協定，同時預期的工作內容也不涉及編譯器。

結果證明這種信任是錯的。不到 6 個月，2019 年 12 月，Facebook 向世界宣布並開源一個編譯器，可透過調查揭示，包括和神經魔法相同的專有演算法。Facebook 甚至還在發行公告向茲拉特斯基表示感謝：「團隊認可並高度讚賞茲拉特斯基對稀疏核心和統一程式碼緩衝區的貢獻。」

神經魔法究竟做了什麼

尼爾‧沙維特教授在 MIT 任教 30 多年，主要興趣是設計、達成和推理多處理器演算法技術，尤其是多核機器併發資料架構及控制行為的計算模型數學基礎。

2016 年，沙維特開始新挑戰，開發人工智慧系統重建大腦神經組織的貫通性，稱為「擷取大腦的連線圖」。

當他和馬特維耶夫教授一起在 MIT 實驗室測試時，在大量神經生物學資料的基礎上，發現使用正確演算法，可只使用標準電腦在這些大型神經生物學資料集執行神經網路，不需要專門硬體，且能達到非凡的速度。這促成神經魔法公司兩位教授準備將願景變成現實並推向市場。

這意味著資料科學家可透過 CPU 執行神經網路和推理引擎，不必用 GPU 或 TPU 這類專屬晶片，大大降低機器學習的硬體成本。另外，CPU 還能存取更多記憶體，不像專屬硬體有記憶體限制。神經魔法的技術，僅僅用軟體和演算法，就能代替高成本的 AI 硬體。

投資商也看到此技術的前景，公司進行過兩輪融資，從 Comcast、NEA 等投資人累計募集到 2,000 萬美元的風險投資。

官司之爭

據起訴書稱，2019 年 11 月，Facebook 在 Github 披露神經魔法的演算法。一個月後，在西雅圖 TVM AI 開發者大會，Facebook 公布演算法開源，支援神經網路在 CPU 高效執行。

直到 2020 年 1 月，LinkedIn 文章才提醒到馬特維耶夫教授，Facebook 盜用了神經魔法演算法。Facebook 把開源編譯器稱為「Sparse GEMM JIT」，在相關部分完成神經魔法的演算法。

Github 的修改歷史也表明，最早發表者是 Facebook FBGEMM 套裝軟體負責人 Jongsoo Park，茲拉特斯基則列為第一個程式碼審查人。而 FBGEMM（ Facebook GEneral Matrix Multiplication，矩陣乘法）正是 PyTorch 框架的卷積庫。