科技

速度快4倍、價格砍20%!OpenAI推出GPT-Image-1.5圖像模型、正面對決Google Nano Banana

編輯部
1天前
7 瀏覽
速度快4倍、價格砍20%!OpenAI推出GPT-Image-1.5圖像模型、正面對決Google Nano Banana
面對下半年Google Nano Banana在視覺生成領域的強勢逆襲,OpenAI終於坐不住了,稍早宣布推出其最新圖像視覺模型——GPT-Image-1.5。

這次更新並非單純的參數堆疊,而是針對創作者最頭痛的痛點進行改良:速度、可控性與成本。OpenAI執行長Sam Altman更在社群平台上親自「下海」,分享了用新模型生成的性感猛男月曆照,以此證明新模型在人物一致性上的強大實力。

For example: pic.twitter.com/qcEEjfG8g0

— Sam Altman (@sama) December 16, 2025

過去用AI改圖最怕的就是「牽一髮動全身」,想換個髮型結果連臉都跟著改變,而GPT-Image-1.5最大的升級在於對畫面結構的深度理解。

在官方展示的案例中,從一張2000年代風格的派對照片開始,接連進行添加背景人物、改變特定對象畫風 (如左邊變手繪、狗變玩偶)、最後全員換上OpenAI毛衣,整個過程中未被編輯的區域保持了驚人的一致性。這意味AI終於能聽懂「只改這裡,其他別動」的指令,讓修圖不再是碰運氣。

除了畫得準,還要畫得快。GPT-Image-1.5的生成速度較前代提升4倍,幾乎達到了「即時反饋」的等級,大幅降低了試錯的時間成本。

而在商業策略上,OpenAI也祭出了價格戰。透過API呼叫的圖像輸入輸出費用降低20% (每百萬組輸入Token以8美元計價),顯然是為了吸引更多企業用戶 (如Wix、 Canva)導入,構建更穩固的護城河。

為了配合新模型,ChatGPT網頁與App端也新增了獨立的圖像創作入口。

這個介面更像是一個簡易版的修圖軟體,內建了濾鏡庫、熱門提示詞模板,甚至可以上傳個人肖像固定角色臉部特徵。這對於不想反覆輸入落落長咒語 (Prompt) 的一般用戶來說,確實是相當方便。

根據實測,新模型在處理「馬克祖克柏坐在沙灘上看著夕陽,同時頭上配戴著雷朋智慧眼鏡」這類需要精確比例感的指令時,表現相當到位。而將真實照片轉為線稿等處理能力也有顯著提升。

不過,雖然英文能力強悍,但中文理解能力 依然是災難現場。讓它畫個「哈利波特與變形金剛對決」的中文漫畫,出來的文字依然是鬼畫符,顯示在文化與語言的在地化上仍有進步空間。

筆者認為,將版本號定為1.5而非2.0,暗示OpenAI的務實與謹慎。

面對Google Nano Banana Pro在邏輯推理與物理模擬上的領先,OpenAI選擇更貼近商業落地的路徑:極致的效率與可控的工作流。對於大多數用戶而言,能不能解開複雜的數學謎題或許不重要,但能不能快速、便宜地生成一張「剛好能用」的海報素材,才是買單的關鍵。

更多Mashdigi.com報導:

為了高額「營收」睜隻眼閉隻眼?報導踢爆Meta放任中國詐騙廣告流竄、發言人澄清未放棄管制

Ubisoft接手亞馬遜MOBA新作《March of Giants》,《虹彩六號:圍攻行動》開發班底重返老東家

LG開啟CES 2026前哨戰:首款「Micro RGB evo」電視亮相,SIGNATURE系列頂級家電大幅改款

新聞來源: 原始來源

約 2 分鐘可讀完
分享

讀者評論 (0)

尚無評論

成為第一個發表評論的人吧!

首頁 新聞 商家 活動 聊天底