不能讓大數據變成“老大哥”

約翰•加普 — 2013年06月25日

自愛德華•斯諾登(Edward Snowden)揭露美國國家安全局(NSA)是如何從技術公司獲取電話記錄和數據以來，喬治•奧威爾(George Orwell)《一九八四》(Nineteen Eighty-Four)的銷量便一直在上升。迄今為止，為了換取安全保障，即便人們不那麽喜歡“老大哥”，他們也做好了放棄部分隱私權的準備。

英國《金融時報》專欄作家約翰•加普

那麽“大數據”呢？一些公司正憑借手中規模迅速增長的個人信息，利用各種新型數據分析方法和人工智能，來進行產品和服務決策，以及預測客戶的需求。谷歌(Google)首席執行官拉里•佩奇(Larry Page)表示，他眼中的理想技術就像“一名高度智能化的助手，為你做各種事情，免得你自己操心。”

設想一下，你就好像生活在一座虛擬的“唐頓莊園”中，有一臺計算機為你規劃日程，為你推薦最佳出行路線、你可能想看的電影和最理想的航班（甚至幫你預訂）。這種生活確實讓人嚮往。我們都時間緊張，希望能輕松地生活。比起被淹沒在海量信息中且被迫要做出選擇，能享受個性化服務確實不錯。

盡管美國國家安全局監聽活動的曝光讓人們大吃一驚（雖然這項活動已進行了60年），但我懷疑，多數人可能沒有意識到，自己每天製造了多少數據，以及一些大數據企業用以利用這些數據的科技已經發展到了怎樣的地步。技術發展如此迅速，兩年前還不可想象的事情如今已變得稀鬆平常。

現居北京的投資人、前谷歌大中華區總裁李開復(Kai-Fu Lee)表示：“這是一幅既美好又可怕的前景。擁有海量數據的公司會比你自己還瞭解你。它們將能夠預測出你接下來可能要做什麽。”

在最近的一篇專欄中，我將谷歌比作19世紀末的通用電氣(General Electric)——那個創新型工業企業、新技術的“弄潮兒”。而另一方面，谷歌、亞馬遜(Amazon)、微軟(Microsoft)等技術巨擘正在積聚各種必須嚴加管控的力量。

美國國家安全局和那些大數據公司將自己的數據庫和計算能力用於了不同的用途——前者將其用於識別間諜和恐怖分子，後者將其用於為用戶提供合適的服務。它們都使用了超大型數據庫、模式識別以及網絡分析等技術。

這種技術的前沿領域會演變為一種人工智能，例如：在你拼錯的時候猜測到你實際想搜索的關鍵詞，即時語音翻譯（如微軟去年在中國演示過的那樣），或通過瀏覽無數張圖像學習如何識別一張貓的照片。

計算機與類似人類的方式學習的能力被稱為“深度學習”(deep learning)。令人矚目的是，谷歌已聘請多位該領域的先驅人物，包括科學家兼作家雷•庫茲韋爾(Ray Kurzweil)。美國國家安全局提出願意移交給美國私營公司的技術中，有一項是“尖端機器學習技術”。

如美國國家安全局對來自Verizon（或許還有其他運營商）的通話元數據的分析所示，只要零散信息的數量足夠大，此類軟件便可從中推斷出許多事實。美國總統巴拉克•奧巴馬(Barack Obama)向美國人保證“沒有人在偷聽你的電話”，但這個保證本身也意外暴露了一些問題。

哈佛大學(Harvard University)教授拉塔尼婭•斯威尼(Latanya )的研究顯示，只要知道一個人的年齡、性別和郵編，並與公開的數據庫交叉對比，便可識別出87%的人的身份。社交網絡和互聯網公司收集的數據呈現出很強的身份特徵。

大數據公司之所以非常強大，是因為它們能夠將客戶的個人信息與他們的行為特徵結合起來，從他們購買了哪些商品，到他們身在何處（來自從手機上收集的全球定位衛星測量數據）。這可以生成一系列關於客戶可能需求的“推測數據”(inferred data)。

例如，如果我在印度時用一部安卓(Android)手機搜索“泰姬陵”(Taj Mahal)，谷歌將優先顯示位於印度北方邦(Uttar Pradesh)的那座聖地。如果我在東倫敦磚塊街(Brick Lane)進行同樣的搜索，谷歌將列出位於那裡的的孟加拉餐館。當我在黃昏時分漫步在異國城市時，谷歌會根據我對其他餐館的評價為我預訂一家餐館——這樣的事情還要過多久才能變成現實？

一方面，如果谷歌能幫我預定，我會很高興（只要它預定的那家餐館靠譜），因為這將省去我自己來的麻煩。另一方面，正如世界經濟論壇(World Economic Forum)一份關於個人數據的報告所說：“推測數據可能像一個無所不知、盯著監控攝像頭的‘老大哥’。”

這引發的擔憂之一是，擁有這類軟件的大數據公司，將是很難打敗的競爭對手。用戶提供給它們的數據越多，它們就越能預測用戶想要什麽。計算機的“大腦”在使用中會越來越聰明。

另一個問題是信任。社交網絡在保護用戶數據方面一直不力，用戶行為、習慣和意圖方面的信息，只有很小一部分免於被這種新一代網絡服務公諸於眾。難怪NSA會找上它們——NSA有計算能力，而它們有海量信息。

第三個問題是所有權。我們每個人對自己的信息擁有權利，但如果個人信息與其他人的信息混在一起，進入了一個關於用戶意圖的龐大數據庫，會發生什麽？如果我改變主意，我如何能把我的信息消除？

最重要的是，我們都不知道大數據技術意味著什麽，因為大數據時代才剛剛開始。它有許多值得我們驚嘆的地方，但要愛上它，尚需時日。

譯者/徐天辰、方舟

延伸閱讀1：英國《金融時報》「大數據，大責任」

延伸閱讀2：英國《金融時報》「大數據中的市場監管」

引用來源：英國《金融時報》

引用網址： http://big5.ftchinese.com/story/001050911?full=y

個人工具

這個頁面上的內容需要較新版本的 Adobe Flash Player。

區段

不能讓大數據變成“老大哥”