林一平
國立陽明交通大學資工系終身講座教授暨華邦電子講座
現為國立陽明交通大學資工系終身講座教授暨華邦電子講座,曾任科技部次長,為ACM Fellow、IEEE Fellow、AAAS Fellow及IET Fellow。研究興趣為物聯網、行動計算及系統模擬,發展出一套物聯網系統IoTtalk,廣泛應用於智慧農業、智慧教育、智慧校園等領域/場域。興趣多元,喜好藝術、繪畫、寫作,遨遊於科技與人文間自得其樂,著有<閃文集>、<大橋驟雨>。
院長說院史(2):台灣第一座國立資訊學院
2007年初,交通大學校長換屆,資訊學院院長林進燈轉任教務長。新任校長吳重雨指示我接任院長,同年2月正式上任。任內我推動3項核心改革:首先,建立原資工與資科教授的共治機制,加速兩系融合;其次,創立聯席會議制度,將傳統三級三審的會議流程簡化為二級,大幅提升行政效率;第三,確立「應用型研究」為學院定位,並與電子資訊中心攜手推動大型產學合作,為學術與產業接軌奠定基礎。我始終強調「可執行性」的管理哲學:決策必須具體明確、務實可行。為消弭系所合併後的本位主義,我邀請前資科系主任簡榮宏出任副院長,曾煜棋為資工系主任,同時賦予各研究所所長副系主任職權,建立責任分明的治理架構。人事安排考量專業能力,同時兼顧系所平衡與長遠發展。在評鑑機制方面,我們選擇不參與IEET認證,僅採教育部評鑑為基準。作為當年全台唯一未參與IEET的工程學院,這項決策避免教研團隊陷入形式化文書作業。我堅信:「教授應將精力投入教學與研究,而非應付評鑑文書。」此理念獲得同仁廣泛認同。學院定位承襲貝爾系統(Bell System)應用型研究精神,強調技術落地與產業價值。當時台灣應用研究多集中在「發展」端,而美國「研用融合」的模式更具啟發性。為此,我邀請工研院資通所所長林寶樹擔任學院的講座教授,其於2009年接掌交大電資中心後,我們共同實踐「電資中心與資訊學院互為延伸」的願景:重大計畫由電資中心統籌、學院教授參與;一般計畫則由教授獨立執行,形成雙向研發循環。在產學合作方面,我主導成立中華電信在交大設立研究中心,並於日後擔任副校長時,將此經驗推廣至全校,創建校級研究中心制度。第一個校級中心是與聯發科共建的平台,接下來則有台積電、廣達、研華、華邦等指標企業相繼進駐。這些中心設有專屬行政窗口,簡化統整智財管理與財務稽核流程,使企業能視研究中心為其研發部門的延伸。同時,我們首創「研究生工作年資認定」制度,強化企業留才誘因,實現產學研三贏。進入AI時代,我認為資訊學院應與台南校區的AI學院深化整合:前者鞏固資通訊核心技術,後者注入AI研究能量。企業如今已從「工具應用」轉向「流程革新」的AI思維。2024年,華邦電子研究中心選擇落腳本院,正是看中AI驅動IC設計的跨界潛力。展望未來,資訊教育須超越技術傳授,著重培養2項AI難以取代的核心能力:批判性思維與原創性。唯有如此,學子方能在智慧浪潮中彰顯人類智慧的真諦,這正是我對學院發展的最終期許。
2025-06-26
院長說院史(1):台灣第一座國立資訊學院
交大友聲雜誌《院長說院史》專訪歷任資訊學院院長。身為2007至2011年間任職的院長,我接受藍麗霞女士訪問,回顧從學院草創至系所整合的關鍵歷程。「故事要從2004年前說起。」我循著時間軸展開敘述。早在1997年擔任資訊工程學系主任時,我便注意到一項結構性矛盾:交大原有資訊工程系(資工)隸屬工學院,資訊科學系(資科)則隸屬理學院。自1994年併入新設的電機學院後,兩系在定位與角色上日漸模糊,不僅反映軟硬體學科間的不當分野,更直接影響招生策略與發展方向。儘管當時已有合併構想,但「電機學院下設大型資訊系」的框架引發疑慮,計畫始終未能實現。為尋求突破,1999年卸任系主任後,我專程拜訪華盛頓大學指導教授Ed Lazowska。該校資訊系的跨域發展模式印證我的想法:「資訊學科不該被動地附屬於電機體系,而應主動建構多元的研究範式。」Prof. Lazowska 更提出資料科學的運作,如何將學院算力放置雲端。這些前瞻見解在當年的台灣是聞所未聞,更進一步重塑我的思維。從2000到2004年,我一直宣揚一所獨立資訊學院的想法。在當時交通大學電機電子主導工程學科的架構下,推動資訊學院獨立無異於挑戰傳統體制。所幸在張俊彥校長與蔡文祥教務長的支持下,學院籌備工作正式啟動,由蔡教務長領銜規劃。受Prof. Lazowska啟發,我建議「一系多所」的創新架構:大學部整合為單一學系,研究所則依應用領域分設。這項打破常規的提案遭質疑,因為資工與資科兩系都怕被對方併吞,淪為二等公民。最終在蔡教務長的關鍵協調下完成合併。2005年8月,交大成立全台首座國立大學資訊學院,原資訊工程系與資訊科學系合併為核心單位「資訊工程學系」。回望當年,「一院一系多所」的設計不僅健全學院體質,也開啟跨領域合作的新路徑。學院成立後,我選擇退居幕後,未參與首任院長遴選。
2025-06-25
軍事通訊—說碼人加密
軍事通訊技不斷精進,操作通訊系統的兵種就愈分愈細,最早只要一個旗兵。進入電子戰後,通訊兵的分工還挺細的。例如話務通訊兵負責發送訊號,而譯電通訊兵負責接收訊號。在體制上雖然是不同功能,但作戰時,可沒有那麼講究排場,話務和電譯就由同一位通訊兵包辦。這個兵種往往腦力操勞,要背誦一堆編碼,防止通訊的內容被竊聽。如何想出讓敵人無法破解的密碼,更是兵家必爭。第二次大戰時,德國使用Enigma加密機,配備於U-boat潛艇,行跡飄忽不定,在大西洋擊沉大量盟軍船隻,急得英國首相邱吉爾(Winston Churchill )直跳腳。今日以自然語言AI技術模擬通訊者的生物特徵及說話特性,成為加密的金鑰,產生AI說碼人系統的發展是一個令人感興趣的領域。模擬通訊者的客製化特性,成為加密的金鑰,軍隊早已採用,是所謂的「說碼人」(Code Talkers)加密。說碼人其實是話務/譯電通訊兵,不同之處是他們像中國以前祕密幫派,會中兄弟談機密時,就說起「幫派切口」,旁人聽不懂。甲午戰爭時清朝曾以溫州話加密;第一次世界大戰時,美國採用巧克陶族(Choctaw)的印第安語傳送機密軍事訊息,成功地攻擊德軍。德、日兩國學到教訓,在第一次大戰後送一堆學生到美國學印第安語如Cherokee、Choctaw,和Comanche。美國軍方發現此一現象後,擔心德、日兩國有能力解碼,曾經考慮放棄「說碼人」制度。此時一位工程師,也是第一次世界大戰的退役軍人江士頓(Philip Johnston)建議以鮮為人知的納瓦荷語言來編碼。江士頓從小生長在納瓦荷印第安保留區,和納瓦荷族人交往,熟悉納瓦荷語言及習俗。納瓦荷的語言結構複雜,較以前的印第安語言更適合用於加密。經過江士頓展示後,美國海軍陸戰隊決定採用這個提案,立即徵召僱用29名納瓦荷族原住民,由他們開始編碼工作,總共使用411個字彙。海軍陸戰隊在第一層編碼上再以字詞取代(Word Substitution),做第二層的加密,例如「Gini」這個納瓦荷字翻成英文是「Chicken Hawk」,而真正的軍事用語是「俯衝轟炸機」(Dive Bomber)。第二次大戰期間美國總共動用400位納瓦荷族的說碼人,這個密碼一直到大戰結束,都未曾被破解。很諷刺的是,1861年時,美國白人將最早的旗語通訊用於和納瓦荷族的作戰,而在第二次大戰期間卻靠納瓦荷族來協助美軍進行作戰通訊,編入美國海軍陸戰隊。2002年電影《獵風行動》敘述1944年,美軍在太平洋塞班島戰場上,納瓦荷族說碼人的故事。這部電影點出很基本的人性問題。軍方必須全力保護「加解密機」,可是當說碼人這個「人肉加解密機」有落入敵人手中的疑慮時,必須先行毀滅。奉命執行毀滅任務的同袍如何下得了手?這個矛盾成為電影詮釋的重點。當前科技發展已經實現加密的自動化和數據化,不再需要人工的介入。然而,利用自然語言人工智慧(AI)技術來模擬通訊者的生物特徵和說話特性,作為加密的金鑰,這是否能夠強化加密的效果呢?AI說碼人系統的發展是一個引人注目的領域。通過應用自然語言處理和機器學習技術,AI能夠模擬通訊者的生物特徵和說話風格,成為加密的關鍵。然而,要建立一個全面且安全的說碼人系統,需要深入瞭解特定語言、方言以及文化背景。此外,發展強大且安全的通訊系統還需要考慮超越僅透過文字互動可以實現的因素。目前,AI說碼人系統的發展仍需更多的研究和努力。
2025-05-27
AI大語言模型無法馴服π
和一個人一生中相關的數字,都可以在圓周率的某一個位數找到。這是因為圓周率(π)是一個無理數,也就是說,它的十進制展開既不終止也不循環,並且其數字序列是隨機的。儘管目前沒有證據能證明圓周率的數字完全隨機,數學家普遍認為圓周率的數字分布沒有任何規律或模式,每個數字序列都有可能在某一位數中隨機出現。這意味著,無論選擇哪個數字組合,包括個人的生日、電話號碼或重要年份等,理論上都能在圓周率的某個位置找到。這些數字可能會在圓周率的某個長段中出現一次或多次,具體位置由數字的隨機分布決定。這種現象與數學中的均勻分布有關,這表示所有數字(0~9)在圓周率的各個位數上出現的機率理論上是相等的。因此,任何有限長度的數字組合都有可能出現在圓周率的某個位置。以最奇特方式運用圓周率的人,應屬高德納(Donald Ervin Knuth)。1969年時他開始發展一種計算機語言,讓使用者能夠以數位方式排版數學公式。接下來高德納花十年功夫,設計一套論文排版系統TeX,並以圓周率來當開發版本編號,由TeX3開始,現在的版本是TeX 3.141592653。人類於四千年前就嘗試找出π,但直到今日,我們仍然只是接近其實際數值。首次對π進行嚴格計算的,是西元前287至212年的希臘古數學家阿基米德Archimedes),他利用畢達哥拉斯定理計算內接於圓的正多邊形與外接於圓的正多邊形的面積,因為圓的實際面積必然介於這兩者之間,因此這些多邊形的面積提供了圓面積的上、下界。他明白這樣只能得到π的近似值,而非其確切數值。透過這種方法,阿基米德推導出π介於3.1429與3.1408之間。2021年8月19日,瑞士格里松應用科技大學(University of Applied Sciences of the Grisons)計算出圓周率最精確的數值達62,831,853,071,796位數。有趣的是,神奇的AI大語言模型無法馴服π。我問7種大語言模型,卻都給我不同答案。我詢問和我相關的4個數字:「May I ask at which digit position 1026 appears in the digits of pi? 」結果每個LLM給我的答案都不同。過去的測試中,總會有幾個LLM給出相同的答案,但這次完全沒有共識。我先試GPT,得到答案6284。接著要求GPT自我驗證:「What is the four-digit sequence starting at position 6284 in the digits of pi?」結果,得到的回覆是7590,而非1026。我試Grok,得到的回覆是1639,反向驗證,也沒得到1026,而是5807。我試Le Chat(Mistral.ai),得到的回覆是176451,反向驗證,得到3141。我試Qwen2.5-Max,得到的回覆是39,反向驗證,得到7169。我試DeepSeek,得到的回覆是8580,反向驗證,得到3099。我試Tulu 3,得到的回覆是2480,反向驗證,得到3282。我再試Gemini,得到的回覆是175319,反向驗證,他不告訴我答案,建議我找數學工具來算出。我最後試Claude,他不告訴我答案。這些大語言模型給錯答案的原因是,它們試圖自行編寫程式來找答案,但程式未能正確運行。我詢問Pi-Search頁面,它回答說:「字串1026出現於位置14678。這個字串在π的前2億位數字中出現20,130次。」這應該是正確答案。我的測試是在2025年2月24日。在告知GTP或Grok網路上特定數學工具可給答案時,它們的確會認錯,並依我建議,運用工具找到正確答案。隨著大語言模型的進化,也許未來能在第一次詢問時給出正確答案。
2025-04-14
AI程式開發助理—Devin與Cursor
蘋果(Apple)創辦人Steve Jobs 曾說:「Everybody should learn to program a computer, because it teaches you how to think.」隨著人工智慧(AI)技術的快速發展,AI撰寫程式的能力已逐漸變強,可擴增人類的能力。許多AI輔助工具開始進入軟體開發領域,幫助開發者提高效率、減少錯誤,甚至自動完成部分重複性任務。終極目標是協助一般人像電腦工程師一樣,利用「 learn to program a computer」來達到「how to think」的理想。目前較為熱門的2款AI程式開發助理是Devin和Cursor,它們各自具備不同的特點與優勢,適合不同的使用情境。Devin由Cognition開發,主要定位為一個自主的AI開發助手,能夠執行完整的軟體開發流程,甚至能夠獨立完成某些開發任務。它具備高度的自主決策能力,可以設定開發環境、重現錯誤並進行修復,甚至執行軟體測試,無需開發者過多干預。使用者與Devin主要透過對話介面進行互動,開發者可以像管理人類工程師一樣,指派任務並監控其進度。此外,它在一個安全的沙盒環境內執行,內建開發工具,能夠與不同的技術堆疊無縫整合。Devin最大的優勢在於高自主性,能夠有效地幫助開發者處理從程式碼撰寫到測試的完整開發流程,適合希望讓 AI 執行較為獨立開發工作的團隊或個人。Cursor則是一款AI強化的程式碼編輯器,設計理念與 Devin不同,主要專注於提供即時AI協助,而非完全獨立執行開發任務。Cursor的AI代理能夠理解開發者的指令,並透過推理與工具整合,執行程式開發相關的任務,減少開發者的負擔。其 AI 代理基於Composer平台運作,使其可以與各種開發工具無縫連接。此外,它允許開發者導入擴充功能、主題、快捷鍵等,使其保持與傳統開發環境一致的使用體驗。同時,它提供隱私模式,確保程式碼不會被遠端儲存,並符合SOC 2安全標準,適合對程式碼隱私有高度要求的開發者。Cursor更適合習慣使用傳統編輯器的開發者,能夠提供即時的AI協助,減少開發過程中的繁瑣工作,提高編碼效率。這兩款工具在自主性、使用方式與環境整合方面存在明顯差異。Devin具備高度自主性,能夠獨立執行完整開發任務,而Cursor則更專注於即時AI輔助,適合需要持續手動操作的開發者。如果需要AI獨立完成開發流程,Devin是更好的選擇。如果希望在程式碼編輯器內獲得 AI 協助,並維持熟悉的開發環境,Cursor 是更理想的選擇。Devin和Cursor代表2種不同的 AI 助理設計理念Devin 偏向於自動化與自主開發,Cursor則著重於輔助開發者完成日常編碼工作。最終的選擇取決於開發者的需求——如果希望 AI 來執行完整的開發任務,Devin 更具優勢;如果更需要一款能夠提高編碼效率的AI編輯器,Cursor會是更合適的選擇。隨著 AI 技術的不斷進步,這兩款工具也將持續發展,未來可能會帶來更多令人期待的功能與應用。
2025-03-21
伊莉莎白女王的虛實整合
2022年6月英國白金禧年(Platinum Jubilee)慶祝女王登基70周年活動中,伊莉莎白二世女王(Elizabeth II;1926~2022)的3D全像(Holography)被投射在金輝燦爛的皇家金馬車(Gold State Coach)窗戶上,這場景迅速吸引全球觀眾的目光,成為當天慶典的亮點之一。透過結合尖端科技與歷史文物,這次盛事展現虛實整合(Cyber-Physical Integration)的非凡潛力。這項技術讓歷史融入現代生活,創新地連結過去與未來,為文化遺產的展示開啟新篇章。虛實整合技術能即時監控、調整並優化現實世界的運作。這一技術已廣泛應用於自動駕駛、智慧城市與醫療等領域,而此次全像投影與金馬車的結合,則將其創意應用拓展到文化與娛樂產業。女王3D影像投射於擁有260年歷史的馬車上,參與白金禧年遊行,展現科技與歷史的完美融合。伊莉莎白二世女王的3D影像取材自1953年女王26歲時加冕典禮的珍貴存檔畫面,經過數位化處理與解析度提升後,這段影像得以在現代投影設備上清晰呈現。經由精密的投影技術,影像被準確映射到馬車窗戶上,營造出女王仿佛親臨現場的真實感。這種虛實結合的手法讓觀眾彷彿回到1953年,見證女王加冕的歷史時刻。金馬車本身是一件藝術與工程的雙重傑作。它於1762年完成,整體以鎏金木材製成,並飾有精美的天使、海神與獅子頭雕刻,象徵英國的國家力量與海上霸權。這輛馬車長約7米、高約3.7米,重達4噸,由8匹馬以步行速度拉動。馬車內部同樣豪華,以絲綢與天鵝絨裝飾。這一歷史文物多次經歷修復,至今仍然完好,成為英國皇室的重要象徵。將3D影像技術與擁有高度歷史價值的金馬車結合,是一項極具挑戰性的技術工程。由於金馬車的歷史價值極高,工程師設計了非侵入性的安裝方式,避免對文物造成損害。輕量化的投影設備被巧妙安裝在馬車內部及其周邊,確保整體視覺效果不受干擾。為確保虛實完美融合,工程師需克服影像穩定性與同步性等技術難題。他們利用高精度追蹤技術,確保影像與馬車移動完美同步,並特別設計投影系統以降低窗戶反光對影像品質的影響。這些技術突破為未來類似應用樹立新標杆。伊莉莎白二世女王3D影像與金馬車的結合,是虛實整合如何重新定義文化遺產的最佳例證。展望未來,虛實整合有望成為文化遺產保存與傳承的核心技術。透過更多元的數位手段,歷史文物可以超越地理與時間的限制,成為全球共享的資產。
2025-03-11
潛艇發展:從傳統到數位時代的轉變
隨著科技的快速發展,潛艇技術也經歷顯著變革。從最早的陽春設計,到現代核動力潛艇(下稱核潛艇)搭載先進的人工智慧(AI)系統,潛艇的發展不僅改變海軍戰術,也推動全球海上安全與作戰方式的變革。美國海軍的首艘潛艇是由霍蘭(John Philip Holland)發明,並於1900年正式服役,命名為「USS Holland;SS-1」。這艘潛艇長54英尺,對外通訊需浮出水面打旗語,雖然並不完美,但成功實現水下航行如魚般的夢想。霍蘭設計這艘潛艇,使其能夠使用內燃機在水面行駛,並在潛水時切換到電動馬達。她還配備艦首魚雷發射管和氣動砲(Dynamite gun,使用壓縮空氣發射砲彈)。最終,霍蘭的設計贏得美國海軍的青睞,並於1900年4月1日被正式購入,成為美國海軍的第一艘實用型潛艇。二戰期間,美國的潛艇部隊發揮巨大的戰鬥潛力,儘管當時僅佔海軍兵力的1.6%,卻成功擊沉日本海軍的3分之1及其近3分之2的商船隊,對日本戰爭能力造成嚴重損害。貓鯊級(Gato class;與水面艦艇不同,彼時美國海軍潛艇命名皆取名自水生動物)潛艇是美國在第二次世界大戰期間首次大量生產的潛艇,生產期間為1941年至1943年。雷達、電子監視技術和通信技術的快速發展改變貓鯊級指揮塔水面部分的設計,以容納新設備的桅杆和天線。戰後,潛艇技術進入數位化的新時代。1950年代,美國海軍推出了以流線型艦體設計的青花魚號潛艇(USS Albacore;AGSS-569),突破水下航速限制。隨後,1955年,美國海軍的鸚鵡螺號(USS Nautilus;SSN-571)以核動力成功突破續航能力的瓶頸,標誌著核潛艇時代的到來。而「移動聲學通訊系統(MACS)」是鸚鵡螺號上的最後一項重大實驗,將潛艇帶入數位資通訊時代。核潛艇發展使得美國海軍能夠長時間保持隱匿行動,並在極深的海域潛行。這些潛艇不僅能在冰層下航行,甚至能在北極點浮出水面。1960年,美國核潛艇「USS Triton」(SSRN/SSN-586)成功完成環繞地球一周的水下航行,為潛艇戰術的未來奠定基礎。Triton的數位資通訊設計具創新性,配備先進的電子監視與通訊技術,176名船員更展示首代核潛艇在不被偵測的情況下,進行長程水下作戰的能力。隨後的洛杉磯級(Los Angeles class;自此級開始,美國海軍潛艇改以城市命名之)攻擊型核潛艇以及後來的戰略核潛艇(指搭載可裝載核彈頭的潛射彈道飛彈的核潛艇),成為美國海軍強大作戰力量的一部分。這些潛艇更安靜,配備更先進的數位資通訊子設備、感測器和降噪技術。進入21世紀,隨著數位化和AI技術的發展,潛艇的操作與戰術也在持續進化。現代潛艇配備先進的自動化系統,從導航到攻擊,都能依賴高效的數位技術來提升作戰精度與反應速度。例如,現代潛艇的聲納系統結合深度學習技術,能精確識別水下目標並作出即時反應。此外,AI技術使潛艇能進行更有效的資料分析與處理,為指揮官提供即時戰場情報,增強決策能力。
2025-02-04
卜瓦松:計數型AI分析的萬靈丹
人工智慧和機器學習中使用到卜瓦松分布(Poisson Distribution)。在貝葉斯推論(Bayesian inference),機率分布經常被用來解決原本難以處理的問題。其中一個具體的應用是卜瓦松迴歸,這是一種專門用於建模計數數據的迴歸分析方法。例如,卜瓦松迴歸可用於估算與搭乘飛機相關的感冒次數,或預測某個事件期間的緊急服務呼叫次數。卜瓦松迴歸是一種廣義線性模型,其使用對數作為(典型)連結函數,並假設反應變數遵循卜瓦松分布作為其機率分布函數。卜瓦松分布提供簡單而有效的數學框架,使得計數型AI分析變得更加精準和可解釋。這個分布以發明者卜瓦松(Siméon Denis Poisson, 1781~1840)命名。我2015年參訪巴黎的法蘭西科學院(Académie des Sciences) 時,意外地看到卜瓦松的手稿。卜瓦松出生於法國的皮蒂維耶,自幼展現出非凡的數學才能,迅速成為19世紀最具影響力的數學家之一。他在機率論和解析力學方面做出突破性貢獻,在數學和物理學界留下深遠影響。他的卓越才能、謙遜和對知識的奉獻繼續激勵著數學家和科學家,改變我們對機率、數理物理和解析力學的理解。1838年,他發表卜瓦松分布,這是一種適合描述單位時間內隨機事件發生次數的機率分布。起初,卜瓦松分布並未有很多實際應用。波特凱維茨(Ladislaus Bortkiewicz, 1868~1931) 利用卜瓦松分布公式計算在20年的期間裡,每年普魯士軍隊每14名騎兵中被馬踢死的人數。這是一個有趣的例子,但並非日常生活中適切的應用。後來,科學家發現卜瓦松分布可以廣泛用於描述隨機離散事件的發生,在物理學、生物學和金融學等領域證明其實用性。例如,在分析電話網路的效能時,卜瓦松分布如同萬靈丹。我在處理單位時間的通話次數時,總是先套用卜瓦松分布,事後驗證,結果總是正確無誤。1798年,卜瓦松以第一名成績考進巴黎綜合理工學院,追隨老師拉普拉斯(Pierre-Simon Laplace) 的足跡,兩人情同父子。卜瓦松和拉普拉斯合作促成開創性的研究論文和各自領域的進一步發展。卜瓦松往往能將拉普拉斯的研究成果加以擴展。例如,我在進行電話系統效能評估時,常會用到拉普拉斯方程式及卜瓦松方程式。拉普拉斯方程式沒有源項(source term),這意味著它是齊次的(homogeneous)。卜瓦松方程式有源項,這意味著拉普拉斯算子(Laplacian) 應用於一個標量值函數(scalar valued function) 時不一定為零。卜瓦松方程式本質上是拉普拉斯方程式的一種廣義形式。儘管擁有巨大的才華和成就,卜瓦松以其謙遜、低調和對工作的奉獻著稱。他保持謙遜,專注於知識的追求。卜瓦松的遺產超越他的數學和科學成就,對學習的熱情和對知識追求的奉獻激勵著全世界有志於數學和科學的人。 人生只有兩樣美好的事情:發現數學和教數學。—卜瓦松
2025-01-08
AI也難突破哥德爾不完備定理
哥德爾(Kurt Friedrich Gödel;1906~1978)在現代邏輯上的成就是獨特而偉大的。事實上,哥德爾的成就不僅是一座學術紀念碑,更是長久屹立於學術歷史中的地標。邏輯學科因為哥德爾的成就而徹底改變其本質與發展可能性。在哥德爾的偉大成就中,他的不完備定理(Incompleteness Theorems)是數理邏輯中的基本結果,宣示形式系統的內在局限性,尤其是那些能夠表達基本算術的系統。第一定理表明,任何足夠強大且一致的形式系統都不可能完備,這意味著該系統內會有無法使用自身證明的真命題。第二定理進一步指出,沒有一個系統能夠證明自身的一致性。大型語言模型(LLM),如GPT-4,可以協助數學定理的證明,但與傳統方法相比,它們仍有明顯的限制。這些模型可以提出想法、建議步驟或提供解釋,這些都可能在證明構建過程中發揮作用。它們能處理某些符號運算並形式化某些證明,特別是那些遵循已知模式或來自數學文獻中的證明。然而,LLM無法從零開始進行複雜或新穎定理的深度推論,因為它們的回應基於數據模式,而非形式邏輯推導。一些專門設計來證明定理的AI系統,如Coq、Lean和Isabelle,依賴嚴格的形式邏輯,並能生成完全形式化的證明,且這些證明可經過驗證確保其正確性。相比之下,大型語言模型缺乏對邏輯和數學結構的形式理解。然而哥德爾的定理表明,某些真理無法由這些AI系統確立,且複雜系統的一致性無法從系統內部證明。AI無法「打破」哥德爾定理,因為這些定理是邏輯學的基本結果。它們適用於任何具有一定複雜性的形式系統,並且已被證明無誤。由於AI運行依賴形式邏輯,它同樣受到哥德爾不完備定理的根本限制。儘管AI無法打破哥德爾的定理,但它能幫助探討這些定理的影響,模擬不同的邏輯系統,並研究這些限制在各類數學框架中的具體表現。然而,AI無法獨立證明複雜或新穎的定理,也無法突破哥德爾不完備定理所設下的限制。哥德爾說:「我只相信先驗的真理。世界的意義在於願望與事實的分離。數學要麼對人類心智而言過於龐大,要麼人類心智不僅僅是一部機器。事物本身與談論事物之間是有區別的(I only believe in a priori truth. The meaning of world is the separation of wish and fact. Either mathematics is too big for the human mind or the human mind is more than a machine. There is a difference between a thing and talking about a thing.)在AI的協助下,我們或許能夠進一步探索數學的深邃領域,擴展人類心智的理解範圍。
2024-11-29
讓MusicTalk訴說敲擊的故事
2024年10月6日,我到國家戲劇院觀賞朱宗慶打擊樂團擊樂劇場《六部曲》。打擊音樂水準極高,讓觀眾感受到洗滌心靈的音樂饗宴。國家戲劇院是一座智慧劇院,舞台背後設有巨型銀幕,能與表演者進行虛實結合的互動。表演過程中,銀幕上出現浮雲、瀑布、抽象光影等動畫。感覺上打擊樂器與銀幕圖像較無即時地關聯。在我腦海中浮現的是各種打擊樂器的即時梅爾頻譜圖 (mel spectrogram)。梅爾頻譜圖是一種變形的頻譜圖,常運用於語音處理和機器學習。它與頻譜圖類似,顯示音頻信號隨時間變化的頻率內容,但其頻率軸不同。我發展一套AI工具MusicTalk,其中一個功能可以即時分辨出一首樂曲中同時演奏的樂器種類。MusicTalk將樂器的聲音轉換為梅爾頻譜,並以特殊AI演算法分析,準確度接近95%,是迄今最準確的方法。我在開發MusicTalk時,研究許多打擊樂器的梅爾頻譜圖,因此在《六部曲》的演奏過程中,各種變化多端的梅爾頻譜圖不斷在我腦海中浮現。將抽象動畫與敲擊聲音連結並不容易,若能將敲擊聲音與科學結合,將更具意義。第一位以科學系統化賦予敲擊聲意義的是奧恩布魯格(Leopold Auenbrugger, 1722~1809)。他是旅館老闆的兒子,在維也納大學接受醫學教育,深受Gerard van Swieten影響。1761年,他出版小書《新發明》(Inventum novum),成為以叩診法(percussion in the diagnosis)診斷胸部疾病的第一人。儘管傳說他的發現靈感來自童年敲打父親酒桶的經歷,但更可能的是他敏銳的音樂耳朵讓他能分辨出胸部病變過程中的音調變化。他描述各種病變如何導致叩診時音調轉變為不同音色,如「高音」(sonus altior 或鼓音)、「低音」(sonus obscurior 或模糊音)、或「鈍音」(sonus carnis percussae 或肉叩音)。這些發現後來得到臨床診斷的實證。奧恩布魯格一生酷愛音樂,經常在家中舉行午後音樂聚會,莫札特 (Wolfgang Amadeus Mozart, 1756~1791) 一家也曾受邀參加。他的2個女兒都很會彈鋼琴,賓客們曾評論說:「她們兩人,尤其是姐姐,彈得非常好,並且極具音樂天賦。」10年後,莫札特為薩爾茨堡(Salzburg)創作一些新歌劇,其中之一是日耳曼喜劇《煙囪清潔工》(Der Rauchfangkehrer)。該劇於1781年首次在維也納國家歌劇院上演,劇本正是由奧恩布魯格撰寫。奧恩布魯格的音樂藝術天分無庸置疑,能以極具創意的方式將器具的敲擊聲賦予科學 (醫學) 的意義。奧恩布魯格的成就,影響我對利用敲擊工具(樂器)解釋科學現象的興趣。我開發出 AI 工具 WatermelonTalk,能將拍打西瓜的聲音分為4類,代表不同的成熟度,準確度高達94%,是迄今最精準的成熟度判定方法。在聆聽《六部曲》時,我期望編劇者能充分利用如MusicTalk這類AI工具,以科學方式利用未來劇院的智慧銀幕,呈現敲擊樂器的特徵,使觀眾更能理解樂器所表達的內涵,進一步促進音樂與科技的深度結合。
2024-10-31
智慧應用 影音