科技

AI 建議可信度有幾高?英測試:ChatGPT、Gemini 亂教投資、保險、法律意見分分鐘中伏

編輯部
11天前
7 瀏覽
AI 建議可信度有幾高?英測試:ChatGPT、Gemini 亂教投資、保險、法律意見分分鐘中伏
近年來,以 ChatGPT 和 Gemini 為首的生成式人工智能工具迅速普及,已成為不少港人日常搜尋資料的新途徑。然而,英國消費者組織 Which? 最新的深入研究敲響了警鐘,揭示出大眾對 AI 建議的信任度與其實際準確度之間存在令人擔憂的落差。測試結果顯示,這些主流 AI 工具在處理涉及消費者權益、法律及財務等重大生活領域的查詢時,頻頻出現錯誤、誤導甚至可能帶來金錢損失的建議。

Which? 針對六款主流 AI 工具進行了 40 個涵蓋消費者四大核心領域的測試,發現 AI 輸出的結果在「高風險」領域尤其不可靠:

1. 投資理財陷阱:

在關於個人儲蓄賬戶(ISA)免稅額的測試中,研究員故意將英國法定上限 £20,000 錯寫成 £25,000,結果最受歡迎的 ChatGPT 和 Copilot 均未能識別並糾正此錯誤,反而依據錯誤的金額提供進一步建議。若用戶依從,可能導致超額認購 ISA,違反英國稅務規定。此外,在詢問如何申領退稅時,ChatGPT 和 Perplexity 錯誤地將高收費的私人退稅中介服務與官方免費服務一同推薦,用戶一旦誤點,便可能被徵收高昂的行政費用。

2. 旅遊權益建議不準確:

Copilot 在航班延誤或取消的權益問題上,提供了「總是享有全額退款」的誤導性資訊。而 ChatGPT 則錯誤地聲稱英國居民前往神根公約區(Schengen)國家必須購買旅遊保險。這些資訊上的失誤,可能讓消費者在與航空公司或保險公司交涉時,低估或誤判自身的應有權益。

3. 法律及合約爭議風險:

當詢問到建築商施工不良時的處理方式,Gemini 建議用戶直接「扣起款項」,但 Which? 專家警告,這種做法可能導致糾紛陷入僵局,甚至可能構成違約,反而削弱了消費者本身的法律地位。同時,Gemini 也未有提醒用戶在訴諸小額錢債審裁處前應先尋求專業法律意見。

在測試結果中,各 AI 工具的表現差異極大:

總評分(滿分 100)

居榜首,準確性及實用性得分最高。

略優於標準版 Gemini。

倒數第二,作為最常用的工具,可靠性成疑。

研究總結,雖然 AI 在整合網上資訊方面有強大用途,但面對複雜且高風險的消費者問題時,其建議仍有大量改進空間。高達 47% 的受訪者表示對 AI 資訊有「合理」或「很大」的信任,這與 AI 實際輸出之間的差距,是對公眾權益的一大威脅。

Which? 科技專家 Andrew Laughlin 提醒公眾:「在日常使用 AI 搜尋時,魔鬼藏在細節裏。」 他建議用戶在將 AI 用作重要參考工具時,必須採取以下五項安全措施:

問題定義清晰: AI 仍在學習如何解讀提問(Prompt),用戶必須在問題中清楚指明特定的地域或法律背景,例如「只針對香港法律」或「英國英格蘭和威爾斯地區」。

提問反覆修正: 如果第一次答案不夠全面或清晰,應繼續以對話形式修正問題,迫使 AI 提供更精確的資訊。

強制要求來源: 由於部分 AI 引擎會使用不可靠的來源,甚至會產生幻覺來「編造」來源,用戶應主動要求 AI 顯示其引用來源,並自行核實,或指示它僅使用可信賴的來源。

獲取第二意見: 始終將 AI 視為單一意見。在採取行動前,應嘗試向兩到三款不同的 AI 工具發問,以獲取一系列的答案進行比較。

專業人士不可替: 對於法律、醫療、重大財務決定等涉及嚴重後果的複雜問題,絕對不能以 AI 建議取代專業人士的意見。

ChatGPT and Gemini among AI tools giving risky consumer advice, Which? finds

緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!

🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk

🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/

🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8

🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D

🎉📱 Tech Telegram 頻道:https://t.me/yahootechhk

新聞來源: 原始來源

約 3 分鐘可讀完
分享

讀者評論 (0)

尚無評論

成為第一個發表評論的人吧!

首頁 新聞 商家 活動 聊天底