為免AI「越獄」提交有害回答 Anthropic升級防護層級
- 徐畇融/綜合外電
針對部分用戶試圖透過字詞代換、角色扮演或換句話說等各類「越獄」手段,誘使人工智慧(AI)大型語言模型(LLM)提交非法、具有攻擊性、兒少不宜或存在安全疑慮等,理應被禁止生成的回答內容,人工智慧(AI)新創Anthropic展示了一項全新技術,希望大幅提升LL...
會員登入
會員服務申請/試用
申請專線:
+886-02-87125398。
(週一至週五工作日9:00~18:00)
+886-02-87125398。
(週一至週五工作日9:00~18:00)
關鍵字