隨著生成式人工智能技術普及,維持知識內容的真確性成為維基百科社群的重大挑戰。為此,維基百科社群近期整理並發佈了《Wikipedia:Signs of AI writing》,旨在協助廣大用戶和編輯識別並處理由 AI 大規模語言模型所生成的內容。
LLM 模型如 ChatGPT、Gemini、Claude 等,雖然能產生語義流暢的文本,但由於其運作邏輯基於統計學的機率預測,因此在寫作風格、格式編排及邏輯表達上,經常會流露出與人類寫作截然不同的「AI 味道」。
AI 內容往往帶有宣傳或廣告的語氣,且會出現「硬塞」進去的空泛分析,過度強調象徵意義、遺產及重要性。例如,將具體的「第一種連接火車裝置的發明者」描述成「工業界的革命性巨頭」。常見詞彙包括 pivotal(關鍵的)、underscores(強調)、indelible mark(不可磨滅的印記)、profound heritage(深遠遺產)。
AI 會試圖透過不斷列舉主題的媒體來源來「證明」其知名度,即使只是瑣碎的報導,也會在內文大肆強調來源。經常使用與維基百科指引相似的措辭,如「獨立報導」,甚至插入對資訊重要性、認可度或影響的膚淺分析。
文章末尾常出現一個僵化的「挑戰」部分,通常以「儘管其 [正面詞彙],[文章主題] 面臨着幾個挑戰」開頭,然後對前景進行模糊樂觀的評估,或猜測未來發展。
維基百科指南列出了一系列 AI 慣用的「詞彙黑名單」。這些詞彙被 AI 頻繁使用,導致其在非正式寫作中的使用率暴增,成為判斷依據:
LLM 傾向於在短時間內大量使用某些詞彙:
例如在 2025 年前極度氾濫的 Delve(深入研究/鑽研)。其他常見詞彙包括 align with(與⋯⋯一致)、pivotal(關鍵的)、testament(見證)、tapestry(織錦/抽象名詞)、showcase(展示)、intricate(錯綜複雜的)、vibrant(充滿活力的)。
否定平行結構(Negative parallelisms):
使用如「Not only X, but also Y」(不僅是X,更是Y)或「It is not just about X, it is about Y」的句型,試圖為平凡的事物賦予深層意義。
使用「From X to Y」(從 X 到 Y)的句型,但 X 和 Y 兩者往往風馬牛不相及,缺乏邏輯聯繫。
對於知識傳播而言,AI 寫作最令人擔憂的威脅,是其對參考文獻的偽造,即「一本正經地胡說八道」。
AI 文章能夠捏造看起來極其逼真的引用來源,包括正確的書名、作者,甚至可能編出真實存在的國際標準書號 ISBN 編號。然而,當用戶試圖循着路徑驗證時,會發現書中根本不存在該引用段落。這種不僅散播錯誤資訊,還偽造驗證資訊路徑的行為,是 AI 寫作對知識準確性的巨大挑戰。
除了文本內容,AI 在格式上也常露出馬腳。由於大多數 LLM 是基於 Markdown 語法訓練,因此在維基百科常用的 Wikitext 語法中,AI 內容經常會出現以下異常:
Markdown 符號殘留,如未清除的 ## 或 **。
過度使用粗體字來強調每一項重點。
大量插入破折號(—)以作補述。
標題大小寫異常(例如全部單字首字母大寫)。
出現「Title: Description」一類的垂直列表與小標格式。
出現 Emoji(例如 🚀🧠📘)等在正式百科文章中異常突出的元素。
AI 殘留其拒絕回答或執行的提示或理由。
可能出現如 [header]、[body] 或 turn0search0 等AI 輸出的內部範本或佔位符文本。
在這個 AI 生成內容日益氾濫的時代,辨識出「人味」,即真實、具體且樸實的知識,已成為讀者最寶貴的能力之一。當看到一篇文章充滿上述「AI 味」時,應多一份警惕;撰寫文章內容的人員在使用 AI 工具協助時,亦應該自己負起校對內容真確性的責任。
Wikipedia:Signs of AI writing
緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!
🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk
🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/
🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8
🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D
🎉📱 Tech Telegram 頻道:https://t.me/yahootechhk
讀者評論 (0)
請登入後發表評論
分享您的觀點,與其他讀者互動
立即登入尚無評論
成為第一個發表評論的人吧!