GPT-5,終于來了。
北京時(shí)間8月8日凌晨1點(diǎn),OpenAI CEO Sam Altman 沒有爽約。在發(fā)布會(huì)前一天,他在 X(原 Twitter)上寫道:“明天上午10點(diǎn)(太平洋時(shí)間)發(fā)布 GPT-5,發(fā)布會(huì)會(huì)比以往更長(zhǎng),一個(gè)小時(shí)左右。”

結(jié)果,這場(chǎng)被全網(wǎng)盯緊的發(fā)布整整持續(xù)了 1小時(shí)18分鐘,堪稱“最重頭戲”。
Altman 的造勢(shì)從來不是空喊。這位硅谷最有話語權(quán)的“AI布道者”在會(huì)前甚至自曝:“測(cè)試完 GPT5,我感覺自己一無是處。”看似夸張的說法,卻意外地成為這場(chǎng)發(fā)布的真實(shí)注腳。
在開場(chǎng)介紹GPT-5時(shí),奧特曼簡(jiǎn)單回顧了下從GPT-3到4,再到5的歷程。他自己比喻說,“GPT-3像個(gè)高中生,GPT-4像個(gè)大學(xué)生,而GPT-5則已經(jīng)變成了一名專家,一名各個(gè)領(lǐng)域的專家。”

GPT-5 并沒有讓人失望,它甚至可能讓打工人們開始焦慮,首當(dāng)其沖的就是程序員。
這次發(fā)布會(huì)最大的信息量,不是語言理解能力有多強(qiáng)、創(chuàng)作能力有多豐富,而是它在代碼編寫、調(diào)試、部署上的全新維度:GPT-5 不再是“會(huì)寫代碼的語言模型”,它是一個(gè)工程級(jí)開發(fā)助手。
這場(chǎng)發(fā)布會(huì)上,OpenAI 花了將近一半時(shí)間在“現(xiàn)場(chǎng)寫代碼”。它兩分鐘就可以搭建出一個(gè)完整網(wǎng)站,五分鐘做出一款語言學(xué)習(xí)App,并能精準(zhǔn)識(shí)別并修復(fù) Bug。它不僅聽懂復(fù)雜需求,還能結(jié)構(gòu)清晰地拆解任務(wù)、實(shí)現(xiàn)功能、給出部署建議——這種能力,已不是“輔助編程”,而是直接搶活干了。
對(duì)于熟悉 AI 編程工具的人來說,這意味著什么?意味著 Copilot 要退休了,意味著 Replit 要被重塑,意味著 Cursor 等“AI IDE”要被全面整合。Altman 在現(xiàn)場(chǎng)甚至直接說:“這是我們有史以來最強(qiáng)的編程模型。”
而背后支撐這一切的,是 GPT-5 在推理能力、上下文管理、多模態(tài)理解等多個(gè)維度上的飛躍。OpenAI 此次還發(fā)布了面向不同用戶的模型矩陣,包括:GPT-5 Standard、GPT-5 Mini(輕量版)、GPT-5 Nano(嵌入式和移動(dòng)端使用)。
這三個(gè)版本面向 API 和企業(yè)客戶開放,按百萬 tokens 計(jì)費(fèi)。輸入價(jià)格分別是 1.25 / 0.25 / 0.05 美元,輸出價(jià)格為 10 / 2 / 0.4 美元——極具市場(chǎng)穿透力。對(duì)于開發(fā)者而言,這是“從業(yè)門檻”被再一次降維打擊。

值得一提的是,Altman 雖并未過多談 AGI,但業(yè)內(nèi)都清楚:GPT-5已經(jīng)不局限于在AI大模型的世界里內(nèi)卷,而是不斷突破上限,在AGI的道路上完成大躍進(jìn)。
這不是一次“模型升級(jí)”,而是一次生產(chǎn)力結(jié)構(gòu)的重構(gòu)。
GPT-5 登場(chǎng)的這一刻,AI 世界的天花板,再次被抬高。而我們,是否準(zhǔn)備好面對(duì)它帶來的新范式,還很難說。
接下來,筆者將還原出這場(chǎng)發(fā)布會(huì)最精彩的部分:
在現(xiàn)場(chǎng)演示之前,OpenAI先是一如既往地展示了GPT-5的一連串標(biāo)桿成績(jī)。
首先,GPT-5最驚艷的就是,在編碼能力方面實(shí)現(xiàn)全面碾壓。
SWE?Bench Verified:作為檢測(cè)模型修復(fù)真實(shí)軟件工程問題能力的標(biāo)準(zhǔn),GPT?5 在這一評(píng)測(cè)中取得驚人的 74.9%,領(lǐng)先于 o3 的 69.1%,展現(xiàn)了更高效、更精準(zhǔn)的代碼理解與生成能力。
Aider Polyglot:這是一個(gè)跨語言代碼編輯測(cè)試,GPT?5 成績(jī)飆升至 88%,錯(cuò)誤率相比之前整整降低了三分之一。

其次,GPT-5還極大降低了大模型所產(chǎn)生的幻覺問題,并實(shí)現(xiàn)在可靠性和事實(shí)準(zhǔn)確性方面雙雙提升。
在回答事實(shí)類問題時(shí),GPT?5 的“幻覺”錯(cuò)誤率,相對(duì) GPT?4o減少約 45%,而相對(duì) o3則減少約80%。
在GPT-5發(fā)布會(huì)上,除了代碼能力,奧特曼特別重點(diǎn)強(qiáng)調(diào)的就是GPT-5在健康醫(yī)療領(lǐng)域的表現(xiàn)。在醫(yī)療場(chǎng)景測(cè)試(如 HealthBench Hard Hallucinations),它的生成錯(cuò)誤率僅為 1.6%,遠(yuǎn)低于 GPT?4o 的 12.9% 和 o3 的 15.8%。

程序員馬上要失業(yè)了?
GPT-5最為炸裂的部分,就是代碼能力。
這一次,GPT?5 真的在發(fā)布會(huì)上秀瘋了。幾乎從開始演示到結(jié)束,一共有四個(gè)“全場(chǎng)景、真交互”的代碼能力展示,讓在場(chǎng)開發(fā)者和遠(yuǎn)程觀眾都忍不住感慨:“程序員,真的要慌了。”
1、兩分鐘生成SVG動(dòng)畫
Prompt:讓我迅速了解什么是伯努利效應(yīng)(Bernouli effect)
在這個(gè)prompt下,GPT-5迅速給出了關(guān)于伯努利效應(yīng)的詳細(xì)解釋。而當(dāng)用戶再要求用SVG動(dòng)畫演示時(shí),GPT-5則直接開始進(jìn)入深度思考模式,兩分鐘生成了420行代碼,最終我們看到了這個(gè)可交互的動(dòng)畫。
值得注意的是,用戶可以自由調(diào)整飛行速度和角度,氣流線條也跟著實(shí)時(shí)變動(dòng)。這不僅是可視化的知識(shí)輸出,更是個(gè)性化、具備教學(xué)輔助價(jià)值的模擬系統(tǒng)。

2、五分鐘搭建APP
Prompt:“我是英語母語者,為正在學(xué)法語的搭檔做一個(gè)互動(dòng)式學(xué)習(xí) App,要有卡片、猜詞、游戲,最好做成一只老鼠吃芝士學(xué)單詞。”
GPT?5 不僅“聽懂”了需求,還在五分鐘內(nèi)把需求全量落地:卡片式界面、互動(dòng)功能、學(xué)習(xí)進(jìn)度追蹤全都上線。

而那個(gè)“老鼠吃芝士”的小游戲,更是讓人拍案叫絕——每當(dāng)老鼠吃掉一塊芝士,就會(huì)自動(dòng)播放一個(gè)法語單詞語音,學(xué)習(xí)與娛樂真正無縫融合。
你甚至能看到這個(gè) AI 在用戶沒有明確要求的細(xì)節(jié)上主動(dòng)優(yōu)化交互邏輯,足以說明其理解層級(jí)已經(jīng)躍升。

3、修復(fù)代碼bug
這一幕的設(shè)定就像現(xiàn)實(shí)工作場(chǎng)景:一名工程師把一個(gè)看似正常、實(shí)則問題百出的項(xiàng)目代碼交給 GPT?5,希望它能發(fā)現(xiàn)潛在問題。
過去,AI 模型寫代碼已經(jīng)夠勉強(qiáng),找 bug 更是無從談起。而這次,GPT?5 不僅找出了關(guān)鍵問題,還提出了解決方案,并在模擬運(yùn)行中無誤通過。
要知道,這是第一次,有開發(fā)者把真實(shí)工程任務(wù)直接交給 AI 獨(dú)立完成且成功運(yùn)行。這不僅意味著自動(dòng)化寫代碼,它的下一步,可能是參與整個(gè)軟件生命周期管理。

4、五分鐘創(chuàng)建可視化財(cái)務(wù)看板
Prompt:請(qǐng)為我的AI智能體公司創(chuàng)建一個(gè)財(cái)務(wù)儀表盤,公司已完成D輪融資。
用戶將企業(yè)的各類數(shù)據(jù)一股腦拋給 GPT?5,模型在五分鐘內(nèi)交出了一份堪比創(chuàng)業(yè)公司 CFO 級(jí)別的動(dòng)態(tài)財(cái)務(wù)看板。所有數(shù)據(jù)項(xiàng)都自動(dòng)映射,支持調(diào)整、更新、篩選,UI 也堪稱“即用級(jí)別”。

GPT-5發(fā)布會(huì)的一個(gè)多小時(shí)里,奧特曼還多次強(qiáng)調(diào),“GPT-5是我們做過最強(qiáng)的代碼模型”。
而為了進(jìn)一步實(shí)錘這個(gè)判斷,OpenAI 甚至還請(qǐng)來了 Cursor 的 CEO Michael Truell 站臺(tái)。他在發(fā)布會(huì)上宣布,GPT?5 將在未來幾天內(nèi)正式登陸 Cursor 編輯器。
GPT-5讓AI去“模板化”
如果說前兩個(gè)部分還讓人覺得 GPT?5 是個(gè)優(yōu)秀的“工具人”,那么第三部分,它則徹底展現(xiàn)出 AI 向“智能伴侶”進(jìn)化的潛力。
GPT?5 這次發(fā)布的最大突破之一,就是它極具深度的個(gè)性化能力。
而這種個(gè)性化,不再是表面地更換“主題色”那么簡(jiǎn)單,而是——能參與到你的人生決策中來。

GPT-5現(xiàn)已支持更換聊天框顏色
在現(xiàn)場(chǎng)展示中,GPT?5 首先展示了一個(gè)“超級(jí)個(gè)人助理”的身份:
它可以接入用戶的日歷、郵件,自動(dòng)檢查你漏掉的事務(wù),比如一封未處理的會(huì)議邀請(qǐng),甚至你平時(shí)的健身頻率;并基于這些信息,為你自動(dòng)生成個(gè)性化的日程規(guī)劃。你再也不需要手動(dòng)設(shè)置提醒、記會(huì)議、安排生活了——GPT?5 會(huì)根據(jù)你自己過去的行為模式,像一個(gè)了解你的生活教練一樣來管理一切。
這就好像拆掉了 Chatbot 與 Agent 之間的最后一道墻。
過去半年,海內(nèi)外AI公司紛紛入局Agent,微軟、谷歌、Anthropic 接連發(fā)布自己的 Agent 系統(tǒng);就連 OpenAI 自己也在上個(gè)月小范圍推出首個(gè)原生 Agent。但這一切,在 GPT?5 面前,顯得更像是“預(yù)演”。
不過,GPT-5 的 Agent 化,是基于它本身認(rèn)知能力提升之上的自然進(jìn)化。
它不靠預(yù)設(shè)流程,而是基于理解你、記住你、聯(lián)動(dòng)外部信息,來動(dòng)態(tài)調(diào)整策略、生成建議,真正做到了“定制級(jí)智能體”。

而 GPT?5 最讓人動(dòng)容的演示,也是奧特曼刻意強(qiáng)調(diào)的一個(gè)“終極話題”——GPT-5在健康醫(yī)療領(lǐng)域的應(yīng)用。
來到GPT-5發(fā)布會(huì)現(xiàn)場(chǎng)的這位女士是身患三種癌癥的患者。面對(duì)醫(yī)生發(fā)來的復(fù)雜醫(yī)學(xué)報(bào)告,她一頭霧水,而最終治療方案的選擇又完全壓在她自己身上。
GPT?5 于是登場(chǎng):它不僅將難懂的醫(yī)學(xué)術(shù)語翻譯成日常語言,還就每種治療方案的利弊做出清晰對(duì)比,甚至幫助她從心理與生活角度評(píng)估哪種路徑更適合她的狀態(tài)。

在這場(chǎng)AI競(jìng)技場(chǎng)上,海外已經(jīng)開始卷起來。
一個(gè)晚上,奧特曼連發(fā)12條X;
而就在GPT-5發(fā)布會(huì)期間,在X上刷屏的不止奧特曼,還有馬斯克——他說“Grok在一般推理任務(wù)上已經(jīng)超過GPT-5。”