亚搏中国手机版app下载 接连两位大咖出走, 谷歌到底出了什么BUG?


发布日期:2026-06-20 21:54    点击次数:137


亚搏中国手机版app下载 接连两位大咖出走, 谷歌到底出了什么BUG?

不到一个礼拜,接连两位分量级职工齐离开了谷歌。

前有Google DeepMind工程副总裁诺姆·沙泽尔(Noam Shazeer),后有AlphaFold中枢慎重东谈主约翰·江珀(John Jumper)。

讲的确,我很难不怀疑谷歌当前“出BUG”了。

从Gemini 3问世,到当前齐往日泰半年了,谷歌照旧唯独折柳不大的Gemini 3.1。你再望望Anthropic这边,半年前还只是Opus 4.5,当前Fable 5齐停用一个得体拜了。

不单是模子掉队,产物也随着掉队。如今险些扫数的AI公司齐在发力AI Agent,OpenAI有Codex,Anthropic有Claude Code。

Fable 5加握下的Claude Code,当前齐能自主修bug,自动轮回跑测试直到全绿,还能从运筹帷幄稿顺利生成出产代码,终末封装成好意思满的软件。

而谷歌这边,唯唯独个拿不出手的Antigravity 2.0,不仅后果灾祸,使用体验也说来话长,网上对这个产物唯唯独片骂声。

说到这里就不得不提一件事,伯克希尔从2025年就运转建仓谷歌,到了2026年第一季度,伯克希尔把谷歌的握仓又加了224%。

2026年6月1日,伯克希尔以定向增发的样式向谷歌母公司Alphabet再投了100亿好意思元。

难谈这回巴菲特的确看走眼了?

01

谷歌的全栈上风怎么没了?

2025年11月18日,谷歌发布了Gemini 3。皮查伊亲身出来站台,说这是谷歌“最智能的模子”,领有全球最顶尖的推理才能,多模态融会,还有代码生成才能。

于是在归拢天,谷歌还放出了另外两样东西:一个是Google Antigravity,堪称“agent-first”的斥地平台;一个是Nano Banana Pro,它是谷歌此前爆火的文生图模子Nano Banana的威力加强版。

其时的谷歌有多吓东谈主?这样说吧,在谷歌这场产物发布会终了后两个礼拜,奥特曼向OpenAI里面发出“Code Red(红色警报)”备忘录,称ChatGPT的产物体验与质料上风正在被谷歌快速追近,因此全公司暂停扫数其他业务,逼近全员干涉到ChatGPT当中。

奥特曼惦念的不单是这三个产物,而是谷歌的全栈上风。

在硬件上,谷歌有自研的TPU芯片。谷歌从2015年就运转作念TPU,到今天照旧到了第七代Ironwood,一颗芯片顶往日四颗的算力,液冷散热,一个pod塞进去9216颗芯片,提供42.5 ExaFlops的算力。

和英伟达那种通用的GPU不同,TPU是有益为AI推理任务进行过优化的,资本低,并且性能更好。

再往上一层是DeepMind。

2023年4月,谷歌把Google Brain和DeepMind合并成了一个单元。此前,这两家天然是归拢家公司,但耐久以来是两套体系、两套文化,Brain偏产物和买卖化,DeepMind偏耐久估量。

合并之后,哈萨比斯合资带队,杰夫·迪恩(Jeff Dean)退居首席科学家。也即是说,谷歌的“傍边脑”合一了。

延续往上,还有一层许多东谈主容易忽略的东西:进口。谷歌不是唯独模子,它有Chrome、Android、YouTube、Google Maps、Gmail、Google Workspace、Google Search。

这些东西加起来,日活几十亿。全寰宇莫得任何一家AI公司领有这个量级的用户。它能通过进口去铺产物,再用这些进修的产物拿到用户响应,加速通盘产物的斥地迭代。

比如用户在哪一步退出了,哪种才能被反复调用,哪些生成摒弃被用户改掉了或者顺利撤废了,哪些功能酿成了留存,哪些场景出现弥远报错和投诉。

就拿Nano Banana来说。

这个产物天然体量尽头小,然而它其实是通过谷歌的全栈,领有我方一个好意思满飞轮。

Nano Banana刚刚在LM Arena一类的盲测环境里走红后,谷歌作念的第一件事即是把它坐窝上线到Gemini App、AI Studio、Gemini API当中,致使连有益面向企业的Vertex AI也没放过。

用户不仅能通过各式产物感受Nano Banana,谷歌还能用这些产物采集响应,这也即是为什么Nano Banana产物迭代速率那么快,碾压GPT-4o的作图才能。

那为什么到当前,谷歌的全栈上风没了呢?

文生图是一个低风险、短链路、摒弃坐窝可见的产物。

用户输入一句话,几十秒后取得一张图,不欢跃就重来,欢跃就共享。它不需要耐久顾虑,也不需要调用器用权限,更不需要为一次失实承担施行后果。

然而Agent不一样。它不是“给用户一个摒弃”,它是要透彻驻守进用户的职责环境,握续读取荆棘文、调用器用、履行操作,并对终末的摒弃慎重。

Nano Banana的见效并不可完全复刻到Agent了。

当产物需要跨模子、权限、履行环境、企业系统和耐久包袱时,谷歌那套正本宏大的全栈才能,运转显骄横合营不起来的问题。

02

谷歌确切的病是组织架构太错乱词语

如果你去翻谷歌的斥地者产物线,你会发现一个很诡异的本旨。谷歌同期有好几个器用,齐在帮你用AI写代码,产物功能险些齐调换了。

Gemini CLI,一个号令行器用,不错查代码库、生成欺诈、自动履行复杂进程,2025年底随Gemini 3沿途推出。到了2026年6月,谷歌发了个公告:Gemini CLI行将被Antigravity CLI取代。

Jules,一个异步编码Agent,Google Labs出品,定位是自动帮你修bug、写测试、提Pull Request。它不需要你盯着看,亚搏体育你把任务扔给它,它我方克隆仓库、写代码、开PR,干罢了见知你。

Code Assist,Google Cloud旗下的企业级编程助手,装在VS Code和JetBrains里用,收费22.8到54好意思元一个用户一个月。Firebase Studio,浏览器里的全栈斥地职责台,内置了Gemini,也能帮你生成代码。

然后是恒久扶不上墙的Antigravity,前文也提到了,2026年5月I/O大会上又发了个2.0版块,分了桌面App、CLI、SDK、Managed Agents、企业层五块。

它们齐在作念归拢件,但它们是不同团队作念的,有不同的品牌名,有不同的进口,有不同的收费样貌,致使有的在相互替代。

这种情况根底就不叫产物线丰富,这叫忽地算力。

这件事的根源其实是在组织架构层面。

谷歌的AI Agent关联才能,被拆分在至少几个互不统属的组织手里。每个组织有我方的KPI,颓败的求教线。

比如Google DeepMind,它管的是模子在benchmark上的分数能不可压过GPT和Claude。DeepMind的见效是“咱们作念出了最强的模子”。

它根底不暖热用户在Antigravity里完成一个真实项目的见着力是若干。

到了Google Labs部门,它只管这个东西酷不酷,能不可在莽撞媒体上激发盘考。

Google Labs的产物有CC(Gmail里的AI助理)、Project Genie(无穷寰宇生成)、Pomelli(AI营销器用)、Opal(天然说话作念小欺诈),以及Jules。

实验跑罢了,热渡往日了,团队可能去作念下一个实验了,它不会对产物进行耐久神往。

Google Cloud和Vertex AI管的是模子能不可通过API调用,企业能不可采购,权限和合规有莫得遮蔽,Agent能不可部署到出产环境。

Antigravity更惨,它是从Google DeepMind里面走出来的,当前归Google Labs神往。然而又必须接入Google Cloud的权限、部署和合规体系。

是以谁也不会对它慎重,就这样摆烂。

你可能会问了,那到皮查伊这关可怎么办?

DeepMind说,咱们的模子又刷榜了。Labs说,Jules在莽撞采集上又有10万转发了。然后Google Cloud那边说,Agent Engine又签了若干个企业客户。Gemini App说,这个月的DAU稳住了。Search说,AI Overviews用户破20亿。

各人的饭碗齐保住了,却终末留给Antigravity一地鸡毛。

但莫得东谈主能回话一个最浅易的问题:一个斥地者,今天应该用谷歌的哪一个器用来完成他的职责?如果他当前用的是Codex或者Claude Code,谷歌准备用哪个产物把他抢过来?

03

评测赢了,不等于任务的确委派了

谷歌当前扫数的叙事齐只围绕着评分,但当前各人早就不迷信benchmark了,能委派任务的才是好模子。

模子在benchmark上分数高,比如它推理题能答对,代码能生成,图像能看懂,多轮对话能保握连贯。

这些测试常常是在受控环境下进行的。单轮或有限轮次,输入输出干净,不需要操作外部器用,不需要措置权限,不需要长技术握续运行。

失败了的发挥是什么?谜底分歧。最坏的摒弃,即是重来一遍。

然而到了任务委派这块,模子的价值变了。

用户把一个真实的职责扔给AI,到终末拿到了一个能用的摒弃,中间的链条其实是尽头长的。

什么叫“真实的职责”?是“这个项目的支付模块有个bug,请定位、训导、测试、提交PR”。它波及多个身手,可能要花几十分钟致使几个小时,中间需要调用Git、终局、浏览器、文献系统、API,每一步齐有失败的可能。

失败了的发挥是什么?不是谜底分歧,而是代码改坏了、权限控不住了、进程卡死了、环境崩了、用户不知谈从那处规复。

我举个例子。

假定一个模子在单步判断上的正确率照旧有95%,看起来很强;但一个真实斥地任务若需要畅通完成20个关节身手,全部不出错的概率唯独0.95^20,约等于36%。

哪怕单步正确率升迁到98%,20步全程成功完成的概率也唯独约67%。

金花棋牌娱乐app中国官方版下载

是以Agent产物确切的护城河,不是把benchmark再刷高两分,而是给失实规复、情状保存、权限说明、东谈主工接收、回滚和摒弃考据作念出可靠机制。

然而Antigravity齐2.0了,照旧莫得雷同且好意思满的机制。

你去读Gemini 3的官方博文,皮查伊亲身写的开始,背面随着的全是benchmark对比表。

然而你当前如果去看OpenAI和Anthropic对于新模子的官方博文,里面完全是各式客户对模子的评价。

不是说benchmark没用。benchmark天然有效,它是一个尺子。但如果一个Agent产物的全部叙事齐围绕benchmark张开,那就评释这个模子照实干不了活。

谷歌不可能撤废AI Agent,因为这个板块的确太收获了,不信你望望友商们就懂了。

2026年2月,OpenAI的Codex,颓败桌面App上线后首周下载量进步100万。只是过了两个月,Codex周活用户就达到了400万

Claude Code就更无谓说了,Anthropic在2月份的融资材料中就走漏,该产物的年化收入照旧冲突了20亿好意思元。

Antigravity 2.0发了一个多月了,当前怒放它的官网,你会发现照旧莫得企业版的订价。

Claude Code不错通过Claude Team按东谈主头付费,Codex不错走GPT Business或者ChatGPT Enterprise,相同是按东谈主头收费。

到了谷歌这里,企业如若念念用Antigravity 2.0,你只可走Gemini Enterprise Agent,它会施舍你一些额度让你拿手上玩玩,并不可像OpenAI和Anthropic那样,把它变成一个收费的产物。

是以我猜沙泽尔和江珀离开谷歌亚搏中国手机版app下载,省略亦然因为对这家公司失望了。