- 谷歌醒了,新入口大戰(zhàn)開打
- 2025年11月21日來源:中國經(jīng)濟網(wǎng)
提要:11月19日凌晨,谷歌發(fā)布最新一代模型Gemini 3。隨后,Gemini 3系列模型在多模態(tài)、推理、Agent 等三條大模型主線路的多項國際測試上全面“屠榜”。除了在編程能力測試略遜于GPT-5.1和Claude Sonnet 4.5外,在其他國際主流測試項目上,Gemini 3 Pro得分都是斷檔的領(lǐng)先。
段永平:現(xiàn)在市場上的大模型10年后能活下來的不會超過10%。誰會活下來?我會猜Gemini,因為谷歌很強大,而且已經(jīng)醒了。
文|《中國企業(yè)家》記者 王怡潔 見習(xí)記者 孫欣
蟄伏數(shù)月,谷歌再度出手甩出王炸——Gemini 3奇襲大模型圈,交出了一張幾乎“全A”的模型測試成績單。
11月19日凌晨,谷歌發(fā)布最新一代模型Gemini 3。隨后,Gemini 3系列模型在多模態(tài)、推理、Agent 等三條大模型主線路的多項國際測試上全面“屠榜”。除了在編程能力測試略遜于GPT-5.1和Claude Sonnet 4.5外,在其他國際主流測試項目上,Gemini 3 Pro得分都是斷檔的領(lǐng)先。
其中,Humanity's Last Exam (HLE)被認為是衡量AI能否解決人類頂尖難題的試金石,Gemini 3 Pro在此項測試的得分為37.5%。而GPT-5.1、Claude Sonnet 4.5得分分別為26.5%、12.7%。
模型發(fā)布后,谷歌美股股價一度上漲5.8%,市值突破3.5萬億美元創(chuàng)歷史新高。
OpenAI的CEO山姆·阿爾特曼也罕見對谷歌給予贊賞:“這看起來是一個很棒的模型。”短短一年前,谷歌在舉辦2024 I/O開發(fā)者大會時,阿爾特曼還曾直接嘲諷Gemini產(chǎn)品,甚至對發(fā)布會布置提出質(zhì)疑:“我無法不去思考OpenAI和谷歌之間的美學(xué)差異。”
但在今年5月的開發(fā)者大會上,谷歌拿出十余種“AI萬花筒”產(chǎn)品,能力大幅提升,給了阿爾特曼一記回旋鏢。半年后,谷歌再度“炸場”,更表明在多年技術(shù)積累之下,谷歌已經(jīng)重新找回節(jié)奏。
“谷歌已不再把自己視為一家搜索公司,而是要成為下一代計算平臺的創(chuàng)建者。”谷歌CEO皮查伊今年多次強調(diào)。2025年,谷歌的搜索、安卓系統(tǒng)、Chrome瀏覽器、YouTube、硬件乃至手機等核心業(yè)務(wù),都在圍繞基座大模型Gemini進行重構(gòu)。一年高達900億美元的資本開支以及工程資源,也都向模型供電傾斜。
基座模型迭代之際,谷歌也同步披露了一個關(guān)鍵數(shù)據(jù):谷歌瀏覽器的AI模式月活躍用戶已達20億。這意味著,從模型到應(yīng)用,谷歌正利用其龐大的生態(tài)系統(tǒng),重新定義AI上的話語權(quán)。
谷歌全棧布局的示范效應(yīng),也勢必將大模型競爭拉到下一高度。近期,國內(nèi)外圍繞入口的爭奪也不約而同地打響。OpenAI上線桌面瀏覽器,同時強勢進軍搜索功能;阿里千問App近期回歸,高調(diào)瞄準ChatGPT入局AI to C;字節(jié)也在通過豆包探索電商新入口。
幾天前,伯克希爾-哈撒韋公司披露的今年三季度持股報告顯示:巴菲特在退休前,首次建倉買入了谷歌。
近日,段永平在接受采訪時也表示:“現(xiàn)在市場上的大模型很多,10年后能活下來的大概率不會超過10%。大家可以猜猜10年后,大家還在用的主流大模型會是什么?我會猜Gemini,因為背后的谷歌很強大,而且已經(jīng)醒了。”
模型屠榜,應(yīng)用升級
Gemini 3發(fā)布前,谷歌相當?shù)驼{(diào)。
2025年11月初,皮查伊在公司財報電話會議上談及Gemini 3時態(tài)度謹慎:“前沿大模型的開發(fā)需要更多時間,而Gemini 3預(yù)計不會讓人們立刻就看到突破性的進展。”
從結(jié)果看這像是一顆煙霧彈。據(jù)Model Card測試數(shù)據(jù),Gemini 3成績幾乎全面碾壓當前所有主流大模型;在開放評測平臺 LMArena 上,Gemini 3 Pro以1501分位居通用模型榜首。
在博士級科學(xué)問答GPQA Diamond上,Gemini 3 Pro成績?yōu)?1.9%;數(shù)學(xué)難題集MathArena Apex上創(chuàng)造了最新紀錄——23.4%;SimpleQA Verified(強調(diào)事實性與復(fù)雜問答準確度的測試)成績是72.1%,這意味著其幻覺率和知識錯誤率被顯著壓低;在ARC-AGI-2(推理測試)的成績?yōu)?1.1%,而上一代 Gemini 2.5 Pro的該項成績還不到5%。
Gemini 3在多模態(tài)的表現(xiàn)同樣令人驚艷。目前,多模態(tài)模型上有兩項“終極試題”:MMMU-Pro和Video-MMMU,Gemini 3 Pro在這兩項的成績分別為81%和87.6%,創(chuàng)下多模態(tài)模型能力歷史最高紀錄。在Agentic Coding上,Gemini 3 Pro在SWE-Bench Verified的成績比GPT-5.1和Claude Sonnet 4.5分別僅差0.1%、0.9%。
某種程度上,Gemini 3是谷歌第一款給OpenAI構(gòu)成實質(zhì)性威脅的模型——它并非以某一項能力出圈,而是在多模態(tài)、推理、Agent這三條最難突破的線路上,全線抵達行業(yè)天花板。
谷歌的反攻還不止于在基座模型上“血洗”榜單,還有應(yīng)用層的全面爆發(fā)。正是前者的能力跨越,才為應(yīng)用頁面、交互方式的迭代提供了關(guān)鍵基礎(chǔ)。
2022年,ChatGPT把行業(yè)帶入了小助手式“對話優(yōu)先”的交互世界。然而,Gemini新版應(yīng)用不再是單一對話框——用戶發(fā)出自然語言請求,模型并非直接生成答案,而是即時生成一個結(jié)構(gòu)化的、視覺化的界面,用戶可以和AI共同操作。
這也讓AI跳出了“小助手”的角色,不再只是在語言層面輔佐用戶,而是開始和用戶共享一個可操作的工作環(huán)境,向著真正的“工作伙伴”發(fā)展。據(jù)悉,Gemini 3將被整合進Gemini應(yīng)用、谷歌的AI搜索產(chǎn)品AI Mode和AI Overviews,以及企業(yè)級產(chǎn)品。
谷歌如何找回節(jié)奏?
谷歌在AI上的爆發(fā),可以說是“后發(fā)先至”。2022年11月底,ChatGPT燃爆硅谷后,同年12月6日,谷歌推出了Gemini 1.0。此后,谷歌的AI研發(fā)進程一直不溫不火。
模型開發(fā)滯后之下,OpenAI、Perplexity、Anthropic等對谷歌的搜索市場虎視眈眈。2024年底,谷歌搜索市場份額首次跌破90%。
“大企業(yè)病”“掉隊”“落伍”曾是外界詬病谷歌的形容詞。但谷歌通過對關(guān)鍵技術(shù)團隊的成功整合,再度找回了自己的研發(fā)節(jié)奏與產(chǎn)品高度。
2023年4月,谷歌宣布將Google Brain和DeepMind合并,由DeepMind創(chuàng)始人戴米斯·哈薩比斯執(zhí)掌。此前,兩支團隊都做出過驕人戰(zhàn)績:Brain創(chuàng)造了Transformer架構(gòu),DeepMind則拿出過震驚世界的AlphaGo。
“一山不容二虎”的故事沒有在谷歌發(fā)生。團隊合并后,雖然帶頭人是哈薩比斯,但Google Brain的聯(lián)合創(chuàng)始人杰夫·迪恩仍然擔任首席科學(xué)家。2024年底,在團隊的共同努力下,Gemini模型順利完成了迭代。
接下來,谷歌更力出一孔。到2025年5月,皮查伊在I/O開發(fā)者大會上,大膽打破了谷歌搜索的立命之本:“搜索框不重要了,Google要做你的AI助理,直接替你把事辦了。”
大會上,谷歌共宣布了23項功能更新,覆蓋了AI模型、視覺生產(chǎn)、谷歌搜索、Agent系統(tǒng)、AI眼鏡、生態(tài)等幾乎所有與AI相關(guān)的領(lǐng)域。
AI顛覆搜索后,谷歌的野心也被放到了下一代計算平臺:其自研了TPU提供底層算力支持;用安卓與Chrome構(gòu)成交互前臺,Workspace承接具體任務(wù)執(zhí)行;YouTube打造流媒體資產(chǎn),為Gemini在多模態(tài)能力上奠定基礎(chǔ)。此外,Gmail、Google Docs等成熟應(yīng)用也逐步被注入AI功能。
Gemini 3的發(fā)布會上,谷歌宣布其瀏覽器AI模式的月活躍用戶已達20億,其中Gemini應(yīng)用月活用戶達6.5億。皮查伊稱:“令人驚嘆的是,僅僅兩年時間,AI已從單純處理文本和圖像,發(fā)展到能夠讀懂場景。從今天起,Gemini將在谷歌全系產(chǎn)品中全面鋪開。”
入口大戰(zhàn)開打
谷歌的系統(tǒng)性進擊,也意味著AI新入口大戰(zhàn)已經(jīng)打響。AI角逐已從基模大戰(zhàn)、技術(shù)競速,轉(zhuǎn)向了關(guān)乎下一個10年勢力版圖的場景落地競爭。
下一代入口在哪里?在移動互聯(lián)網(wǎng)時代,得流量者勝出。但未來如果把答案擴展到“誰能幫用戶解決問題”的效用之爭,機會又重新在巨頭面前攤平。
某種程度上,谷歌的全棧出擊,也是阿里正在嘗試“復(fù)刻”的道路。周靖人在云棲大會后,對《中國企業(yè)家》等媒體表示:阿里云是全球少數(shù)幾家在大模型和云計算方面都能夠做到全棧自研、聯(lián)合創(chuàng)新的公司。
11月17日,阿里千問App公測版亮相,直接瞄準AI to C入口,計劃打造會聊天、能辦事的個人AI助手,并整合了阿里全生態(tài)的服務(wù)能力。次日,螞蟻集團發(fā)布全模態(tài)通用AI助手“靈光”,用戶可以在30秒內(nèi),生成可交互、可編輯、可分享的“閃應(yīng)用”。這些都昭示著阿里準備抓住“生產(chǎn)力入口”的野心。
在不久前的2025年第三季度財報會上,騰訊集團總裁劉熾平亦明確表示:微信最終將成為一個AI Agent,幫助用戶在微信內(nèi)部完成大量任務(wù)。字節(jié)豆包則在流量加持下,正在從生態(tài)滲透,走向工具賦能,與抖音、剪映深度綁定,將豆包變?yōu)樽止?jié)的生產(chǎn)力引擎。
最近,OpenAI已經(jīng)將更多目光投向了企業(yè)服務(wù)與垂直場景落地。今年上半年,OpenAI實現(xiàn)43億美元營收,其中消費者與企業(yè)訂閱占據(jù)大頭。
一位海外文旅開發(fā)從業(yè)者對《中國企業(yè)家》表示:他在使用了國內(nèi)外多項大模型后,感到GPT-5在上下文理解層面,明顯具備優(yōu)勢。“雖然我們海外數(shù)據(jù)相對匱乏,但因為ChatGPT好用,海外系統(tǒng)反而更容易做。”
不過,靠舊地圖未必能拿到新船票。AI時代的贏家,不只屬于技術(shù)領(lǐng)先者,或者有能力“大水漫灌”的超級App擁有者,更是能理解用戶需求、將技術(shù)轉(zhuǎn)化為解決問題能力,能將AI與行業(yè)場景深度綁定,對AGI有更透徹理解和追求的企業(yè)。
版權(quán)及免責(zé)聲明:
1. 任何單位或個人認為南方企業(yè)新聞網(wǎng)的內(nèi)容可能涉嫌侵犯其合法權(quán)益,應(yīng)及時向南方企業(yè)新聞網(wǎng)書面反饋,并提供相關(guān)證明材料和理由,本網(wǎng)站在收到上述文件并審核后,會采取相應(yīng)處理措施。
2. 南方企業(yè)新聞網(wǎng)對于任何包含、經(jīng)由鏈接、下載或其它途徑所獲得的有關(guān)本網(wǎng)站的任何內(nèi)容、信息或廣告,不聲明或保證其正確性或可靠性。用戶自行承擔使用本網(wǎng)站的風(fēng)險。
3. 如因版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,請在文章刊發(fā)后30日內(nèi)進行。聯(lián)系電話:01083834755 郵箱:news@senn.com.cn




