阿拉姆語翻譯

柏克萊加州大學(UC Berkeley)兩位電腦科學家應用 AI 開辟出一種針對語音轉文字系統(speech-to-text)的進犯模式,在使用這項手藝時,非論聲音內容聽起來像什麼,輸出的文字都是進犯者想要的內容。

據了解,團隊首要是應用 Mozilla 開源的語音轉文字系統 DeepSpeech 來測試,研究人員默示,不管供給任何音頻波型,透過運用這項技術,團隊都可製造出另外一個類似度高達 99.9% 的音頻,在人耳聽不出差異的情況下,讓 DeepSpeech 辨識成團隊進展的任何字句。

轉換後的音頻能以每秒高達 50 個字元的速度進行,截至今朝為止,團隊進擊的成功率為 100%,不管是本來的音頻內容,或是需要轉換成什麼字句都沒有區分,對語音利用逐步增添的目前來講,這類情形仿佛也十分值得注意。

傳授 Nicholas Carlini、David Wagner 向 TNW 透露表現,過去在與喬治城的研究人員合作的過程當中,他們一同建構了「隱藏語音號令」來試圖攻擊手機語音辨識系統。

簡單來講,這些攻擊的目的是為了讓語音辨識系統對主體與客體的判定轉換,將隱藏在音頻中的訊息視為首要目標,反而將語音華夏先你我的聲音判斷成「隨機噪音」。

今朝團隊的進犯結果仍僅合用於 DeepSpeech,這明顯並非 Siri、Alexa或 Google Assistant 用於轉錄的程式,但研究人員認為這確切證實,對於語音辨識的「進犯」行為是可行的翻譯

Carlini 甚至認為,只要多進行一些研究,一些人乃至可以讓這個音頻對抗手藝也能在 Over-The-Air 的環境下利用。

AI learns how to fool speech-to-text. That’s bad news for voice assistants

arrow
arrow
    文章標籤
    翻譯社
    全站熱搜
    創作者介紹
    創作者 hortonsk3ib0d 的頭像
    hortonsk3ib0d

    hortonsk3ib0d@outlook.com

    hortonsk3ib0d 發表在 痞客邦 留言(0) 人氣()