蘋果已秘密加入谷歌亞馬遜行列,使用承包商對其用戶錄音進行分析。在一名舉報人將錄音帶到英國《衛報》(The Guardian)后,蘋果證實了這一做法。這人說,Siri查詢會定期發送給人類聽眾進行更細致的分析,但蘋果在其隱私政策中并未披露。
據報導,這些錄音與蘋果身份認證(Apple ID)無關,但可長達數秒,包含個人性質的內容,并與其它顯示資料如方位、應用程序資料和聯絡人詳細資訊配對。
與其它公司一樣,蘋果說這些資料由真人搜集并分析,以改進其服務,且所有分析均由受保密協定約束的員工在安全設施中完成。而蘋果也沒有自動承認這一做法。
蘋果告訴《衛報》,每天發送的查詢不到1%,但當蘋果于無意之間不斷談論Siri查詢數量時,談到數以億計的設備也經常使用該功能,1%則激增為成千上萬了。
正如舉報人指出的,Siri錄音中包括:醫生和患者之間的私人交談、商業交易、好像是罪犯之間的交易、性接觸等。
Siri的某些錄音是出于偶然,這是為什么需要培訓才能收聽并識別的原因之一。意外錄音有時長達數秒,且包含大量個人資訊,即便不與數位識別碼直接綁定。
語音助理要想「掌握」一門語言,需要解決兩個問題:聲音識別和聲音合成。其中聲音識別是對機器輸入資訊,又分為兩步,分別是:第一步,將語音轉成文字的語音識別;第二步,語義理解,這里就需要用到自然語言處理技術。
但就目前而言,就算各家宣傳把語音助理、智能音箱吹噓得功能強大,它們依然只是初級人工智能。想讓機器聽懂人類語言,并準確「聰明」回應,依然需要大量人工介入。
蘋果并不是第一家被爆語音助理對話錄音會被其他人聽到的科技公司,當然也不會是最后一家。
今年4月,彭博社消息顯示,亞馬遜(Amazon)在全球雇用了數千名合同工,他們會聽到某些來自Echo智能音箱的使用者語音請求,并負責注釋標記這些轉錄語音,以提高Alexa識別人類語言的能力。
7月11日,谷歌(Google)證實于全球各地聘請承包商員工收聽一小部分錄音,并表示搜集的部分音檔用于開發語音識別系統,以更適應各種語言,提升使用者體驗。