智慧應用 影音
Microchip
ST Microsite

深度偽造技術

Nikola Tesla(1856~1943)在1890年代預言「21世紀時,機器人將取代古代文明中奴隸勞動所佔據的位置。」

這項預言在當今的人工智慧(AI)技術的發展下似乎正在實現。早期的AI技術已經能夠大致準確地分辨狗和貓的圖片,隨著生成式人工智慧(generative AI)的突破性發展,它逐漸深入我們的生活並引領著社會變革。當AI技術進入深度偽造(DeepFake)的層次,將會加速我們進入元宇宙世界,實現Tesla的預言。

深度偽造是一種透過電腦生成的影片技術,用於創造看似真實的虛假影像。它使用AI技術將一個人的臉替換為另一個人的臉,同時匹配微小的面部表情,從說話到皺眉都能保持一致。

這項技術利用深度學習算法和大量訓練數據生成逼真的影片,使觀眾難以區分真實和偽造的影像。製作一個臉部交換的視頻通常需要以下步驟:首先,使用編碼器處理2個人數百萬張的照片。編碼器是一個AI系統,用於尋找並學習2個臉部之間的相似之處,並將這些相似之處簡化為共同的特徵,並壓縮圖像。

然後,使用一個名為解碼器的第二個AI系統,從壓縮的照片中恢復出臉部。你訓練一個解碼器來恢復第一個人的臉部,另一個解碼器來恢復第二個人的臉部,因為這兩張臉是不同的。當需要進行臉部交換時,只需將編碼的照片輸入「另一個」解碼器。

例如,將某甲的臉部壓縮圖像輸入已經訓練過某乙的解碼器。然後,解碼器使用某甲的表情和面部定位來重建某乙的臉部。為了製作逼真的影片,這個步驟必須處理每一幀畫面。

現今,訓練某甲與某乙臉部的模型,以及在影片中合併臉部的過程,幾乎可以即時完成。

早期有名的深度偽造例子包括2個假影片:美國前總統Barack Obama稱呼川普(Donald Trump)為「完全蠢貨」和Mark Zuckerberg吹噓對數十億人的被盜數據擁有絕對控制。我們在烏克蘭的戰爭中也見證假影片的應用,以及使用知名人物臉孔的成人內容。

然而,深度偽造技術也可能被用於音頻和圖像,大部分國家禁止未經同意且具有邪惡目的的深度偽造使用。

不過,除了潛在危險性,深度偽造技術在一些有趣且輕鬆的應用中也顯示出潛力。例如,將深度偽造應用於教育領域,可以使課堂更有趣。想像一下,在英文課堂上,可以邀請虛構的名人來講解課程,例如劉德華。雖然使用真實人物的深度偽造可能會被視為非法,但是使用不存在的人物則可以避免法律問題。企業也開發並銷售深度偽造服務,以實現自動化新聞播報,甚至減少演員的參與,節省成本。例如,TikTok 上就有一個深度偽造的阿諾史瓦辛格(Arnold Schwarzenegger),使用俄語講話,省去了他學習俄文的功夫。

深度偽造技術的應用範圍廣泛且多樣,但我們必須謹慎使用,以避免濫用和潛在的負面影響。只有在合法、道德且有創意的方式下,才能充分發揮深度偽造技術的潛力。(作者為國立陽明交通大學資工系終身講座教授暨華邦電子講座)
 

Nikola Tesla。

現為國立陽明交通大學資工系終身講座教授暨華邦電子講座,曾任科技部次長,為ACM Fellow、IEEE Fellow、AAAS Fellow及IET Fellow。研究興趣為物聯網、行動計算及系統模擬,發展出一套物聯網系統IoTtalk,廣泛應用於智慧農業、智慧教育、智慧校園等領域/場域。興趣多元,喜好藝術、繪畫、寫作,遨遊於科技與人文間自得其樂,著有<閃文集>、<大橋驟雨>。