在基因檢測資料庫之下,未來我們都不會是無名氏

作者 | 發布日期 2018 年 10 月 19 日 16:27 | 分類 生物科技 , 醫療科技 follow us in feedly

基因檢測過去曾是用來親子鑑定、犯罪偵查的專業工具,如今已成為直接面向消費者的產品。最近一項新研究指出,隨著越來越多人對這項服務感興趣,不久的未來即使你沒有做 DNA 測試,技術仍能透過遠親的 DNA 來找到你的身分。屆時,我們都不會是隨意「無名小卒」。



最近刊登在《科學》(Science)期刊的研究指出,截至 4 月,已有超過 1,500 萬人使用消費者取向的基因測試,由於多數基因測試公司都允許客戶下載原始遺傳訊息文件,這也刺激一些公司推出第三方服務,允許人們上傳原始數據進行額外分析,像是血統搜索或家譜研究。

GEDmatch 便是推出家譜研究的公司之一,最近在美國金州殺手(Golden State Killer)的追蹤發揮了重要作用。金州殺手在 1970~1980 年代犯下一系列強姦和謀殺案,命案發生 30 年後,調查人員運用犯罪現場留下的 DNA 進行家譜研究,並順藤摸瓜找到 72 歲的嫌犯 Joseph James DeAngelo,接著在標準 DNA 測試下證實了他的身分。

傳統的案件調查是,警方能將 DNA 片段與潛在嫌疑人匹配。但這些片段只能在嚴格監管的資料庫中辨識一個人或他們的近親。而在 GEDmatch 的協助下,調查人員分離了犯罪現場可疑 DNA 遺傳物質後,透過在公共資料庫搜尋 DNA 匹配的第三代堂兄弟並收集相關訊息(如報紙訃告),成功創建出嫌疑人祖先和親屬家譜,在這之後,調查人員從 DeAngelo 收集了一份全新 DNA 樣本,並確認與犯罪現場 DNA 完美匹配。

金州殺手一案為消費者基因檢測服務公司 MyHeritage 帶來啟發。為了確認透過遠親 DNA 找到某人身分有多麼容易,MyHeritage 的研究團隊展開了這項研究。查看了超過 120 萬筆上傳自 MyHeritage 測試的匿名數據,並排除資料庫也有直系親屬的人以後,團隊開始試著使用陌生 DNA 來破解身分。

這項調查中團隊也意外發現,數據中的人有一半以上是遠房親戚。對於占樣本 75% 的歐洲人後裔來說,約有 60% 匿名個體可找到第三代或更近的表親,其中 15% 樣本甚至能找到第二代或血緣更近的近親。

團隊後續也在 GEDmatch 重複這個過程,並得到非常相似的結果。與金州調查案非常相似,隨著確認血緣,透過使用這些遠房親戚和其他不太具體的人口統計訊息,像是目標的年齡或可能的居住地,追溯並辨識出對象是可行的。

目前許多美國執法者都將這項技術用於解決懸案,而這確實也協助破獲了不少案件,然而可想見,隨著技術不斷發展,出於非法目的使用這些技術的情況也會出現;包含試圖從其他項目辨別出研究對象的科學家,以及試圖在其他地方利用、出售個人資訊的的公司或個人,以及更嚴重的遺傳歧視問題。

官方的法條制定或許能協助管理。目前包含美國衛生及公共服務部(HHS)等機構對許多涉及人類受試者的研究制定了通用規則,這些指南的修訂版將於 2017 年實施,但直到 2019 年才會完全生效。雖然目前通用規則並不認為人們的基因組是可辨識的訊息,但隨著技術進步,HHS 保留改變這種狀態的可能;這可能會阻止肆無忌憚的科學家,如果他們被抓到試圖竊取人們的身分,他們將失去官方資金投入。

基因檢測服務也可採取像加密簽名的措施來保護消費者。只有在確認查詢來自客戶時,家譜服務才會透過資料庫搜尋。像是 MyHeritage 就不允許研究人員或官員在未經許可的情況下使用他們的家譜服務,根據公司透露,目前還沒有人獲得許可。

只是幾乎可以肯定,即使你我都拒絕出於善意的免費測試 DNA 邀請,只要有約 2% 成年人口將自身 DNA 資訊輸入資料庫,從未知 DNA 樣本追蹤任何人的遠親並發現他們的身分「理論上」就是可行,而我們也越來越接近轉折點了。

哥倫比亞大學的電腦工程師、MyHeritage 首席科學長 Yaniv Erlich 表示,一旦人數達到 2%,大概所有人都會找到第三代表親,而許多人還會找到更親的第二代表親,「我認為對歐洲人後裔來說,我們將在兩三年內達到這個門檻」。

(首圖來源:pixabay