Skip to content
  • 元宇宙社交空间入口
51蛙吖蛙元宇宙 – 3D社交空间

51蛙吖蛙元宇宙 – 3D社交空间

51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

标签: 科技

1100 亿美元背后,OpenAI「AGI 的三副面孔」

作者| 桦林舞王

编辑| 靖宇

可能是科技史上最多的一笔融资,出现了。

2026 年 2 月 27 日,OpenAI 宣布完成 1100 亿美元融资,估值 7300 亿美元。

这轮融资背后,Amazon 投了 500 亿美元,Nvidia 和软银各投了 300 亿美元。

所有人都在讨论这笔钱有多大、这个估值有多高、这场军备竞赛有多疯狂。但反复看了几遍合同条款之后,我们发现了一件比数字本身更诡异的事:

在这笔交易里,AGI——人工通用智能,这个 AI 领域最核心、最具哲学重量的概念——已经被彻底改造成了一个金融工具。

而且在不同的合同里,它被赋予了完全不同的功能。

惊人的融资、巨大的理想背后,隐藏着 AGI 的「三副面孔」。

 

01

AGI 的第一副面孔:利益分配开关

 

故事要从 2019 年说起。

那年 Microsoft 向 OpenAI 投了第一笔 10 亿美元(此后累计投入超过 130 亿美元),两家公司签了一份在科技史上绝无仅有的合同。合同里有一个条款,后来被称为「AGI 条款」—— 一旦 OpenAI 宣布实现了 AGI,Microsoft 将失去对未来模型的访问权。

这个条款在当时看起来像是一个纯粹的「安全阀」。

OpenAI 的初心是确保 AGI 造福全人类,而不是让任何一家公司独占。所以设计了这道门: 如果真的走到了 AGI 那一步,商业合作到此为止,技术回归「全人类」 。

很浪漫,对吧?

但时间走到 2024 年底,事情变了味。

OpenAI AGI 的三副面孔|图片来源:极客公园

 

The Information 获取的泄露文件显示,OpenAI 和 Microsoft 之间实际上有一个秘密定义: AGI 的触发条件是—— OpenAI 开发出能产生至少 1000 亿美元利润的 AI 系统。

不是「通过图灵测试」,不是「在所有认知任务上超越人类」,不是任何科学界争论了几十年的标准, 是 1000 亿美元利润。

一个本应由科学家定义的概念,被两家公司悄悄装进了一个财务公式 。(需要说明的是,这一定义出自 2023 年的协议,2025 年 10 月的新协议新增了独立专家验证机制,两套标准目前是否并存,公开信息尚不完全明确。)

2025 年 10 月,双方签了新协议,做了几件关键的事:AGI 的宣布需要由独立专家小组验证;Microsoft 的 IP 权利延长到 2032 年,但 AGI 之后有限制;收入分成在 AGI 被验证之前持续有效。

换句话说, 在 Microsoft 的合同世界里,AGI 是一个「终止开关」——它的功能是:一旦触发,改变两家公司之间的权利和利益分配。

什么时候按下这个开关、由谁来按、按照什么标准按,本身就是一场价值数千亿美元的博弈。

 

02

AGI 的第二副面孔:付款触发器

 

现在把目光转向这轮 1100 亿美元融资的主角:Amazon。

Amazon 的 500 亿美元投资并不是一笔买断式的交易。结构是: 先付 150 亿美元,剩下的 350 亿美元需要等「满足特定条件」后才会到账。

The Information 的报道指出,这些条件包括: OpenAI 在年底前实现 IPO,或者达成某个 AGI 里程碑。

看到了吗?同一个词——AGI——出现在了第二份合同里,但功能完全反转了。

在 Microsoft 那边,AGI 是一把悬在头顶的剑:一旦宣布,Microsoft 的权利受到限制。但在 Amazon 这边, AGI 是一张 350 亿美元的支票:一旦宣布,钱就到账。

这两个机制放在一起,创造了一个结构性的荒诞:

宣布 AGI → 触发 Amazon 350 亿到账 → 但同时触发 Microsoft 权利限制

不宣布 AGI → Microsoft 收入分成持续 → 但 Amazon 的 350 亿拿不到

OpenAI 被夹在了两份合同之间。同一个词, 在一份合同里是奖励,在另一份合同里是惩罚 。Sam Altman 需要在两个完全相反的激励之间走钢丝。

当然,还有第三条路:

IPO 。

如果 OpenAI 年底前上市,同样可以触发 Amazon 的 350 亿,而不需要碰 AGI 这个炸弹。

但 IPO 意味着公开市场会对「你到底实现 AGI 没有」这个问题给出自己的定价——到那时,这个问题就不只是两家公司之间的私密博弈了。

更微妙的是交易的另一面。

Amazon 投了 500 亿给 OpenAI,但 OpenAI 同时承诺未来 8 年在 AWS 上消费 1000 亿美元,使用 2GW 的 Trainium 芯片算力;此外还将在 Nvidia 的 Vera Rubin 系统上部署 3GW 推理算力和 2GW 训练算力。

OpenAI 天价融资的旋转木马|图片来源:极客公园

 

Amazon 先给 OpenAI 500 亿,OpenAI 再花 1000 亿买 Amazon 的服务。 资金在两家公司之间转了一圈又回来了,只是中间多了几份合同和一个叫「AGI」的触发器。

华尔街已经有人在喊「圆形融资」了。路透社的分析直接警告:这种企业相互投资并签署供应交易的模式,可能在人为膨胀需求和收入。

但在我看来,「圆形融资」还只是表象。 真正的问题是:当 350 亿美元的现金流挂在一个没有科学共识的概念上,这个概念本身还能保持它的科学含义吗?

 

03

AGI 的第三副面孔:使命叙事

 

OpenAI 官网上至今写着那句话:「Our mission is to ensure that artificial general intelligence benefits all of humanity.」( 我们的使命是确保人工通用智能造福全人类 )。

这是 AGI 的第三副面孔—— 它不是合同条款,而是一个「使命」,一面旗帜,一个让投资人写下巨额支票、让顶级研究员加入、让全世界关注的叙事工具 。

Sam Altman 在宣布这轮融资时说:「AI 将无处不在,它正在改变整个经济,世界需要大量的集体计算能力,来满足需求。」而 OpenAI 对外的叙事是:我们正在进入一个新阶段,前沿 AI 正从研究走向全球规模的日常使用。

注意措辞的微妙变化。

两年前,Altman 还在说超级智能可能 2025 年就到来。现在他把 AGI 淡化为「路上的一个里程碑」,说「我们给自己留了一些灵活性,因为我们不知道会发生什么」。

这种姿态调整不是因为技术判断变了——是因为 AGI 在合同里的功能变了。

当 AGI 只是一个学术愿景的时候,你可以大声喊「我们即将实现 AGI」来激励团队、吸引资本。但当 AGI 变成了触发 350 亿美元支付、改变 Microsoft 权利边界、可能引发反垄断审查的合同关键词时, 对这个词的每一次公开表态,都可能产生数百亿美元的财务后果 。

所以 Altman 不得不小心翼翼。他需要 AGI 这个概念足够「近」,近到让投资人相信这场豪赌值得;又需要它足够「远」,远到不会意外触发合同里的地雷。

AGI 在 OpenAI 的对外叙事中,既是终点也是地平线——你永远在朝它走,但永远不能真正到达。 至少在合同条款都安排妥当之前不能。

这让人想到一个更深层的问题。

OpenAI 这轮融资之后,非营利基金会的持股价值超过了 1800 亿美元,号称「史上资源最丰富的非营利组织之一」。

但这个非营利组织的核心使命,恰恰建立在一个已经被彻底金融化的概念之上 。

当「造福全人类」的使命和「触发 350 亿美元」的条款挂在同一个词上时,这个词到底属于科学、资本、还是法务 ?

现在回头看这笔 1100 亿美元的融资,数字本身其实不是最重要的。OpenAI 的估值从 5000 亿涨到 7300 亿,4 个月增长 46%——这些数字会被下一轮更大的融资刷新。

真正重要的是, 这笔交易让我们看到了 AI 行业正在经历的一次深刻转变:最核心的技术概念正在被合同化、金融化、工具化。

AGI 在 Microsoft 的合同里是终止开关,在 Amazon 的合同里是付款触发器,在 OpenAI 的官网上是使命宣言。

三副面孔,三种功能,指向同一个词 。

也许这就是这个时代的隐喻:

一项可能改变人类命运的技术,在它真正到来之前,就已经先被分割、定价、写进了条款 。

科技媒体 Newcomer 对这轮融资有一句一针见血的评论:

「 说服足够多的 CEO 和富人相信你将改变世界,让他们写出巨额支票。 」

问题是——当支票都写完了,AGI 这个词还剩下多少它原本的含义?

展示量: 7

一夜暴跌数千亿美元,英伟达:我们在中国的业务不太乐观

2 月 25 日晚上,全球资本市场的目光再次聚焦在英伟达。

作为 AI 时代的「晴雨表」,英伟达交出了一份炸裂的成绩单:单季营收 680 亿美元,同比增长 73%;实现净利润 429.6 亿美元,同比增长 94%,环比增长 35%;非 GAAP 口径下,英伟达毛利率也超预期攀升至 75.2%,创一年半来新高。

2026 财年全年营收冲破 2159 亿美元,数据中心业务三年翻了 13 倍,达到 1935 亿美元,自由现金流全年 970 亿美元,依旧是一台效率惊人的「印钞机」。

但诡异的一幕发生了。财报公布后,英伟达盘后一度涨超 4%。然而,随着电话会议的推进,股价悄然转跌。次日更是直接低开低走,最终收跌 5.46%。一夜之间,数千亿美元市值「蒸发」。

一边是恐怖的业绩增长,但一边却是资本市场的迟疑。为什么会出现这种反差?

目前,英伟达已经在 4.5 万亿美元的巅峰之上,是全球市值最高的上市公司。人们不再为「优秀」买单,人们只为「完美」买单。而更深层的恐惧在于,这个故事,还能更性感吗?

停不下来的「暴力印钞机」

首先,我们必须承认,英伟达的吸金能力,依然是现象级的。这缓解了近几个月来市场对 AI 泡沫的担忧。

英伟达的业务主要分为两个板块:计算与网络业务(Compute & Networking)和 图形业务(Graphics)。财报显示,其核心的计算与网络业务营收达到了惊人的 1935 亿美元,同比增长 67%。

英伟达 2026 财年的主要财务指标|图片来源:财报截图

更夸张的是第四季度,数据中心业务狂揽 623 亿美元,贡献了总收入的 91%,同比增长 75%。这主要归功于 Blackwell 和 Blackwell Ultra 架构的产能爬坡。

财报电话会上,英伟达 CFO 克雷斯提到了一个令人震撼的数字,「主要客户已部署并消耗了近 9 吉瓦(GW)的基于 Blackwell 的基础设施。」

9 吉瓦是什么概念?作为对比,咱们引以为傲的三峡大坝,总装机容量是 22.5 吉瓦。这意味着,仅仅是 Blackwell 这一代架构的 AI 基建,消耗的电力就已经快赶上半个三峡大坝的满负荷产出了。这还只是开始。

这背后,是对 AI 基建极度饥渴的需求。英伟达的出货计划已经排到了 2027 年。别说 Blackwell,就连上一代的 Hopper,甚至六年前的 Ampere 架构,在云端都被抢购一空。

如果说数据中心是英伟达的「现在」,那黄仁勋的目光早已投向了更远的两个领域:物理 AI 和主权 AI。数据显示,2026 财年,物理 AI 为英伟达贡献超 60 亿美元营收。

如果说过去两年是「云端」大模型训练的竞争,那么未来三年就是物理世界自动驾驶、机器人的肉搏。黄仁勋要把产品装进更多的汽车和机器人里面。

据了解,Waymo、特斯拉、萝卜快跑、文远知行,现在的车队规模还在数千辆级别。但英伟达预测,未来 10 年这个数字将是数百万辆。与此同时,西门子、达索、新思科技正在疯狂采购算力,试图把工厂、流水线甚至整个城市搬进虚拟世界。

相比物理 AI,主权 AI 是一个更严肃的概念。简单说,就是各国政府意识到,AI 算力不再只是商业服务,而是像石油、粮食一样的战略资源。2026 财年,主权 AI 为英伟达带来了超 300 亿美元的收入,暴增 3 倍。

Agentic AI 能否撑起未来?

华尔街现在最大的恐慌是什么?

不是英伟达能不能造出芯片,而是它的客户还买不买得起。OpenAI、微软、谷歌、Meta、亚马逊……这些大厂占据了英伟达客户名单的半壁江山。但资本市场的焦虑也显而易见:这会不会是一场击鼓传花的游戏?泡沫会不会在明天破裂?

面对这些质疑,黄仁勋上抛出了「Agentic AI」。

如果说上一轮 AI 浪潮是「生成式 AI」,那么黄仁勋已经为英伟达找到了下一个引擎:「Agentic AI」。

黄仁勋描绘了这样一个场景,当未来的 AI 帮你写代码、做策划时,它不再是像现在这样「秒回」一个答案。它会像人类专家一样,经历「推理—试错—验证—迭代」的漫长过程。它会生成数千、数万、甚至数十万个 Token。这个过程可能持续几分钟,甚至几个小时。

这意味着推理侧的算力需求,将呈指数级的爆发。这才是黄仁勋的最新「武器」,「我们已经看到了代理 AI 的拐点。」

财报中披露了一个很有说服力的案例:Meta 通过引入高性能生成式 AI 模型,直接让 Facebook 的广告点击率增加了 3.5%,Instagram 的转化率提高了 1% 以上。别小看这 1%,在 Meta 庞大的体量下,这就是数十亿美元的纯增量收入。

英伟达、迪士尼研究院和谷歌DeepMind 共同开发的AI机器人Blue|图片来源:视觉中国

为了确保英伟达的可持续未来,英伟达正在用技术和投资搭建生态系统。

财报电话会上,英伟达透露与 OpenAI 接近达成伙伴协议。黄仁勋称其为「一代人中仅此一家」的公司。此前传闻的 1000 亿美元投资被搁置,但随后又有消息称,英伟达将参与 OpenAI 的最新一轮融资,规模约为 300 亿美元。

除此之外,最近英伟达宣布与 Meta 达成深度合作,首次大规模部署未在服务器中与 GPU 连接的 CPU。还有,英伟达豪掷 100 亿美元投资 Anthropic,让 Claude 在英伟达的架构上跑得更欢;同时收购 Groq 的低延迟推理技术。

从芯片到系统,从软件到对外投资,英伟达正在构建 AI 时代的操作系统和生态。黄仁勋在电话会上说了一句意味深长的话,「我们处于一个独特的地位,能够在前沿模型构建者的每个阶段进行合作,包括训练、推理和 AI 工厂的横向扩展。」

黄仁勋最不想看到的一幕

如果说英伟达的财报是一场狂欢,但在提到中国市场时,气压变得有点低。

对于黄仁勋和英伟达来说,中国市场是营收图表上缺失的一角。2025 年 12 月,特朗普政府批准了一项许可,允许英伟达向中国的特定客户小批量出货 H200 芯片。

但现实却极其骨感。英伟达 CFO 克雷斯在电话会上却给泼了一盆冷水,「迄今为止,英伟达尚未通过 H200 许可项目产生任何收入。」更糟糕的是,克雷斯补了一句,尚不清楚未来是否被允许将任何产品进口到中国。

这种巨大的不确定性,让所谓的「政策松绑」依旧是一张无法兑现的空头支票。

更让黄仁勋睡不着觉的,是中国本土生态的野蛮生长。

最近圈内流传着一个极具爆炸性的消息:DeepSeek V4 即将上线。但这并不是重点,重点是DeepSeek做了一件打破「潜规则」的事:它没有向英伟达和 AMD 提供早期访问权限,而是优先向华为等国内芯片供应商开放了代码。

过去,英伟达最宽的护城河不是最先进芯片,而是 CUDA 生态。全球几百万开发者被死死锁在这个生态里,离不开、逃不掉。但现在,中国这块试验田正在尝试「去 CUDA 化」。

黄仁勋显然看到了这一点。他在电话会上表态说,「为了维持在 AI 计算领域的领导地位,美国必须吸引每一位开发者,并成为所有商业企业的首选平台,包括中国企业。」

这句话显然是说给美国政府的:如果你继续封锁,你不是在扼杀对手,你是在逼着对手建立一套全新的标准。当中国企业不再需要英伟达时,美国也就失去了对全球 AI 标准的定义权。

下一张底牌

看看英伟达给出的下季度指引,你不得不感叹:它依旧是一台高速转动的印钞机。

英伟达给出的 2027 财年 Q1 的收入指引是 780 亿美元,上下浮动 2%。这意味着英伟达预计下个季度的营收将比本季度再增长 100 亿美元。

英伟达Rubin AI超级计算平台|图片来源:视觉中国

但黄仁勋显然不满足于此。为了应对物理 AI 和 Agentic AI 的爆发,英伟达此前已经宣布了下一代 Vera Rubin 平台。目前,首批样品已在本周发给客户,预计在2026 年下半年量产。Rubin 承诺将每 Token 的成本比 Blackwell 再降低 10 倍,这将是英伟达的下一个杀手锏。

今天的英伟达,它的对手已不再是 AMD 或英特尔,而是产能瓶颈、地缘政治和它自己。

3 月中旬的 GTC 大会,或许是黄仁勋职业生涯最重要的一战。此前接受采访时,黄仁勋自信地表示,「我们准备了几款世界上前所未见的全新芯片。所有技术都已到达极限。」

市值高达4.5 万亿美元的英伟达,每前进一步都是在改写历史。而对于我们这些见证者来说,只要系好安全带,看它如何在这个疯狂的时代狂飙,就足够了。

 

展示量: 5

雷军:新 SU7 车门内置机械结构;OpenAI 官宣 1100 亿美元融资;阿里或将推 AI 眼镜、指环|极客早知道

 

OpenAI 宣布获「亚马逊+英伟达+软银」1100 亿美元新投资

2 月 27 日晚间消息,OpenAI 宣布完成新一轮融资,投前估值达 7300 亿美元,融资总额 1100 亿美元。其中包括软银投资 300 亿美元、英伟达投资 300 亿美元、亚马逊投资 500 亿美元。

OpenAI 表示,已与亚马逊达成战略合作,并与英伟达敲定下一代推理算力支持。随着本轮融资推进,预计还将有更多财务投资者加入。

今年年初以来,Codex 周活跃用户增长超两倍,达到 160 万。如今,更多人无需完整工程团队,就能自主创建、自动化部署并发布软件。超过 900 万付费企业用户依托 ChatGPT 开展工作,初创公司、大型企业和政府机构都在 OpenAI 平台上进行开发,重塑其产品与服务的设计、交付和运营模式。

ChatGPT 成为大众接触人工智能的起点,周活跃用户超 9 亿,目前消费者订阅用户已突破 5000 万。年初以来订阅增长显著提速,1 月和 2 月有望成为公司历史上新增订阅用户最多的月份。

本轮融资后的估值,使 OpenAI 基金会所持 OpenAI 集团股份价值增至 1800 亿美元以上。(来源:新浪科技)

 

雷军:新一代小米 SU7 内置机械结构,可电动也可以机械打开

2 月 27 日,小米创办人、董事长兼 CEO 雷军在小米汽车工厂里进行直播,与多位小米技术专家畅聊小米汽车的安全体系。

雷军表示,新一代 SU7 的气囊从 7 个增加到了 9 个,可以给后排乘客提供更周全的保护。雷军特别提醒,虽然我们做了这么多安全气囊,上车以后一定要系安全带。如果不系安全带的话,安全气囊的效果衰减很厉害,尤其是二排也要系安全带。

直播中,雷军透露,新一代小米 SU7 在安全方面又做了非常多的升级。第一,应用了 2200 兆帕的小米超强钢;第二,全系升级了 9 个气囊;第三,电池包底部升级了防弹涂层;第四,全系标配激光雷达,增强了安全冗余。此外,小米 SU7 开车的稳定性和刹车性能都得到了升级。

此外,小米 SU7 还全系标配了三重冗余的车门把手,内置了机械结构和备用电源,车内车外都可以机械开门,以确保车辆开门安全,使得门锁既可以电动打开,也可以机械打开。(来源: 新浪科技)

 

宝马德国工厂首次引进人形机器人打工!此前每周工作 5 天 每天 10 小时

2 月 27 日消息,宝马集团宣布将在德国莱比锡工厂部署人形机器人,这是其首次在欧洲生产体系中引入此类具身智能技术。该项目旨在将类人机器人技术整合进现有的汽车批量生产中,并探索电池和零部件生产的进一步应用。

此次试点与瑞士海克斯康机器人合作,采用其 2025 年推出的 AEON 人形机器人,主要承担高压电池装配与零部件制造两大环节。

项目已完成理论评估与实验室测试,2025 年 12 月启动首轮产线实测,今年 4 月将开展二次测试,夏季正式进入规模化试点阶段。

AEON 凭借类人化躯体设计,可灵活更换夹持器与扫描工具,适配多工序作业需求,并能实现轮端动态移动。

据了解,宝马此举也借鉴了美国斯帕坦堡工厂的成功经验,当地试点的人形机器人,曾在 10 个月内支撑 3 万辆宝马 X3 的生产,每周一至周五每天工作十小时。完成 9 万次零部件精准搬运,持续运行 1250 小时。

美国工厂的试点证实,类人机器人能够安全地执行精确、重复的工作步骤——如以毫米级精度定位组件,并为物理人工智能在生产中的进一步部署提供了重要见解。

宝马强调,部署机器人旨在承接高负荷、高风险岗位,提升生产安全性与效率,目标是减轻员工负担,进一步改善工作条件。(来源:快科技)

 

魅族科技宣布战略转型,将暂停国内手机新产品自研硬件项目

2 月 27 日消息,魅族科技发布战略转型公告,宣布将暂停国内手机新产品自研硬件项目。

从公告获悉,魅族将暂停国内手机新产品自研硬件项目,并在积极接洽第三方硬件合作伙伴,同时原有业务不受任何影响。

魅族科技表示,魅族公司将积极地全面战略转型,在全新的 AI 时代,从过去以硬件为主导转向为以 AI 驱动软件产品为主导的发展方向,并打造以 Flyme 开放生态系统为基座的良性运转的企业。(来源:IT 之家)

 

影石 337 调查终裁:GoPro 六项指控均不成立

2 月 27 日下午消息,影石创新发布公告,美国 337 调查终裁落定:美国国际贸易委员会(ITC)维持初裁,判定 GoPro 六项指控均不成立。

影石在公告中表示:「本次 337 调查未对公司生产、经营造成实质性影响。公司将持续不受限制地在美国进口和销售现有产品。」

资料显示,337 调查源于《美国 1930 年关税法》第 337 条款,是 ITC 审查进口产品是否侵犯知识产权的贸易救济程序。一旦认定侵权,ITC 可发布排除令,禁止侵权产品进入美国市场。因其审理节奏快、制裁力度大,337 调查长期被视为中国企业出海的主要法律壁垒之一。

根据 ITC 终裁,GoPro 指控的六项专利争议中,五项被裁定为不构成侵权或相关专利权无效;针对剩余一项外观专利,影石提出的新设计方案也获 ITC 确认不构成侵权。

影石创始人刘靖康曾表示「感受到了强烈的恶意」。他透露,公司为此支付的应诉成本超过 1000 万美金,「很多公司不一定打得起这样的官司」。但他同时强调,「我们从来没想过要干死谁」,影石市场表现优于 GoPro,是产品定义好后自然发生的结果;另一半功劳则来自中国供应链的「断崖式」领先。(来源:新浪科技)

 

美团推出「饭团漫社」,布局漫剧赛道

美团于近期在主 App 内上线了漫剧板块「饭团漫社」,板块内不仅涵盖常规漫剧内容,还同步上线了 AI 漫剧相关内容,且所有内容均面向用户免费播放,这也意味着美团正式进入当下火热的漫剧赛道,成为又一个布局该领域的互联网大厂。

从饭团漫社的内容布局来看,其上线的漫剧作品覆盖青春、古风、都市、末世等多个热门题材,单部作品集数从数集到四十集不等,如《穿成废柴公主我用化学知识炼出绝世丹药》共有 40 集,《风速少年团》第二季也有 26 集,且部分作品已取得一定播放量,初步完成了内容池的搭建。板块界面还设置了点赞、评论、收藏等互动功能,同时支持弹幕发送,贴合当下用户观看漫剧的主流使用习惯,整体产品形态已趋于成熟。(来源:新浪科技)

 

米哈游回应员工意外离世:不存在春节加班,网传 3 万元抚慰金为不实信息

米哈游官方表示,近日确有一名同事在其居住场所不幸去世。经核查,该名同事不存在春节期间加班情况,复工返岗后下班时间正常。公司已成立专项小组,正全力协助家属处理善后事宜,提供一切必要的支持与陪伴。另据接近米哈游相关人士透露,目前公司与家属在积极沟通当中,网传 3 万元抚慰金为不实信息。(来源:IT 之家)

 

「前 R 星员工」爆料《GTA 6》游戏细节:支持自定义文本对话 NPC

2 月 28 日消息,自称 2020 年入职、现已离职的前 Rockstar Games 员工 u/Disastrous_Suit5731 于 2 月 18 日在 Reddit 社区发布长文,爆料了关于《侠盗猎车手 6》(GTA 6)游戏的诸多细节。

外观在游戏真实感与 NPC 交互方面,该爆料人声称曾近距离接触过游戏本体,并认为其在物理重量感与拟真度上足以媲美《最后生还者 2》。

游戏中的开放世界极具生命力,玩家不仅能使用基础对话选项,还能通过「自定义文本」输入内容,NPC 会根据语境、独特的性格以及过往记忆做出实时回应。在场景探索与犯罪机制上,游戏引入了高度写实的「风险与回报」系统。玩家策划盗窃后,目标价值越高,所需的准备工作就越繁琐,且世界会根据玩家的行事风格做出动态反应。游戏内的智能手机也经过了全面升级,玩家可以像在现实中一样浏览社交媒体、管理联系人、给 NPC 发短信,甚至在社交帖子上留言互动。

不过,对于这名「前员工」的爆料,一些玩家与社区评论者持严重怀疑态度。一方面,输入文本与 NPC 对话的功能必然依赖生成式 AI 技术,而 Take-Two 高层此前已明确否认会在开发中采用该技术;另一方面,《GTA 6》首发平台为主机,频繁使用手柄打字不仅繁琐,还会破坏沉浸感。(来源:IT 之家)

 

阿里千问将推出多款 AI 硬件,含 AI 眼镜、AI 指环等

阿里巴巴旗下个人 AI 助手「千问」宣布进军 AI 硬件领域,今年将面向全球市场推出多款不同形态的 AI 硬件产品。千问将在西班牙巴塞罗那举行的 2026 年世界移动通信大会(MWC)上发布首款同名 AI 眼镜,并于 3 月 2 日开启线上线下全渠道预约。

据悉,阿里正在将千问打造软硬一体、跨多种终端形态的 AI 助手。跳出手机的千问将能够捕获更多物理世界的信息,在复杂生活场景中理解用户意图,让 AI 解锁更多的可能性。千问 APP 点外卖、打车等能力,也将无缝连接到千问 AI 眼镜等终端设备。

据阿里内部人士透露,除 AI 眼镜之外,千问还会在年内陆续发布 AI 指环、AI 耳机等产品,并面向全球市场发售。(来源:新浪科技)

 

ChatGPT 成人模式「Naughty Chat」代码现身新版客户端,需进行身份验证

据科技媒体 Android Authority 今天发文,OpenAI 旗下最新版 ChatGPT(v1.2026.055)出现了成人模式「Naughty Chat」(指挑逗、调情的性暗示话语)相关的字符串代码。

从代码可以看出,这一模式将放宽 ChatGPT 在语言和行为上的尺度限制,使用户能够在主动请求时使用更大胆的言语。同时这一功能只向 18 岁以上用户开放,系统会结合多种因素判断用户年龄,如果默认判断错误则可以请求第三方验证服务 Persona 介入,手动完整验证。

OpenAI CEO 萨姆 · 奥尔特曼曾在去年 10 月表示,基于「把成年人当成年对待」的原则,公司计划在 12 月推出年龄验证功能,为通过验证的成年用户开放「成人话题」内容。(来源:IT 之家)

 

佳能展示概念复古相机:仿中画幅单反腰平取景设计,1 英寸 600 万像素传感器

2 月 27 日消息,据摄影媒体 Photo Rumors 昨天报道,佳能在 CP+ 2026 摄影展会上展示了一款概念复古相机,强调手动、类胶片拍摄体验。

据介绍,这款相机提供复古、现代两种设计,前者的外壳棱角分明、质感类似上世纪的中画幅胶片单反,后者则是更加圆润。

值得注意的是,佳能并没有采用纯数码滤镜的方式呈现复古照片质感。而是为这套相机配备了一套较为复杂的光学系统,具体来说,光线首先会通过镜头进入机身,经两面反射镜重新引导:第一面镜子将光线反射向上;第二面镜子则将光线投射到腰平取景器。

这一系统可以还原胶片中画幅单反相机腰平取景器到磨砂玻璃观感,能够直接在取景器里看到虚化、散景效果,但是仅支持手动对焦。

拍摄时,用户需要操作机身侧面的拨杆。按下后机内的反光镜位置将切换,光线被重新导向,使传感器捕捉到「投射在玻璃的图像」(注:而非直接拍摄被摄主体),实现更具胶片风格的成像表现。

此外,这款概念机搭载 1 英寸 600 万像素传感器,后背带有可翻转的 LCD 屏幕,不支持更换镜头、提供基础操作按键,配备 USB-C 接口。(来源:IT 之家)

 

 

前 Meta 工程师让小狗乱按键盘,只靠 Claude 就把乱码做成了游戏

2 月 27 日消息,虽然目前有关「氛围编程」的成功案例层出不穷,但之前恐怕没人会想到有一天能亲眼目睹一只狗用「氛围编程」开发出了自己的游戏。这起案例出自 YouTuber @Caleb Leak(前 Meta 研究工程师,于去年年底被裁员)之手。

要让狗完成氛围编程,首先需要一个蓝牙键盘、一块树莓派、一台智能宠物喂食器、几道 AI 限制,以及一两个小时的空闲时间。

Caleb 解释称,「过去几周里,我一直在教我 9 磅重的可卡布犬『Momo』通过『氛围编程』做游戏。」据介绍,其关键在于 Claude Code,他告诉 Claude 有一位只会说谜语的天才游戏设计师正在给它下指令,同时还要设置严格的限制,并构建大量自动反馈工具。结果远超其预期。

在这里,Caleb 让 Momo 通过乱敲蓝牙键盘(连接到树莓派 5)进行输入,然后按键信号通过网络发送到「DogKeyboard」(一个用 Rust 编写的小程序,它会过滤掉特殊符号,将剩余内容转发给 Claude Code)。

当文本输入达到预设量后,DogKeyboard 即触发智能宠物喂食器,吐出零食。随后提示音响起,告诉 Momo Claude 已准备好接收更多输入。如此循环往复。「结合强大的 AI 限制和自动反馈工具——截图、试玩测试、场景检查、着色器验证——可以让乱码在 1 到 2 小时内变成真正可玩的游戏。」Caleb 说道,「还有一些细节我略过了,但以上是整体框架。一款游戏从 Momo 的第一次按键到可玩版本通常需要 1 到 2 小时。所有游戏均基于 Godot 4.6 引擎制作,游戏逻辑 100% 用 C# 编写。」

最终,Claude 成功将这些乱码变成了多款实际可玩的游戏,例如 Momo 最新一款作品被命名为《Quasar Saz》。

在游戏中,玩家需要扮演 Zara,挥舞着宇宙萨兹琴(注:游吟诗人常用的一种长颈弦乐器,流行于欧洲、中东和中亚地区)。游戏共有 6 个关卡和一场 BOSS 战,画面精美,音效动感十足。(来源: IT 之家)

 

展示量: 5

万人大厂宣布裁员40%:利润在涨,人却多余了

 

头图来源:Nano Banana生成

 

 

这几天,硅谷与华尔街正在疯传一篇文章,预警一场即将来临的「2028 全球智能危机」。

图片来源:CitrinResearch

 

这篇文章的核心逻辑是:AI 越成功,可能反而意味着经济灾难的开始。

作者认为,我们正在进入一个「智能通缩」时代。 AI 不仅干掉了银行和中介躺着赚钱的差价,还开启了一个停不下来的恶性循环。 为了省钱,企业会不断用 AI 裁掉高薪白领,这些失业者只能涌入低薪的零工市场,导致整体收入大幅缩水。

最终,大家没钱消费,连房贷也还不起,导致金融系统崩溃。 当人类的收入跟不上机器的生产力时,经济就会陷入「东西多得卖不掉,人穷得买不起」的陷阱。

而在今天,前Twitter 联合创始人 Jack 给他现在的公司 Blocks 所有的员工发了一封邮件:裁员 40%。原本 10000 人的公司,只留下不到 6000 人。

Jack称,「公司现在业务非常强,利润一直在涨,客户也越来越多,但我们还是决定裁员。」

按照过去的职场经验,公司只有在亏损、倒闭或者是某个业务线失败时才会大裁员。但 AI 太好用了,好用到公司已经不需要这么多人,也能把生意做得更火红。

这封裁员信,正是危机预言在现实世界中落地的第一声闷响。

为什么要裁掉 4000 个「有用」的人?

Jack 的逻辑其实就是最近那份刷屏的《2028 全球智能危机》的现实版。

以下为jack的发言原帖内容:

今天,我们要做出公司历史上最艰难的决定之一:我们将大幅精简组织架构,员工人数将从 10,000 多人缩减至不到 6,000 人。这意味着超过 4,000 名同事将被要求离职或进入离职协商阶段。对于发生了什么、为什么发生,以及这对每个人意味着什么,我会开诚布公。

首先,如果你是受影响的员工之一,你将获得:20 周的基本工资 + 每满一年工龄额外补偿 1 周工资;期权归属将延长至 5 月底;6 个月的医疗保险;你可以保留公司发放的设备;此外还有 5,000 美元的过渡安置费(美国以外地区的员工将获得类似的补偿,具体细节将根据当地法律要求而定)。我希望在谈论其他事情之前,先让你们知道这一点。今天,所有人都会收到通知,无论你是离职、进入协商,还是留任。

我们做出这个决定,并不是因为公司陷入了困境。 我们的业务依然强劲。毛利持续增长,客户群不断扩大,盈利能力也在提升。但是,世界已经变了。 我们已经察觉到,我们正在创造和使用的智能工具,配合更小、更扁平的团队,正在开启一种全新的工作方式。这从根本上改变了构建和经营一家公司的内涵。而且,这种转变正在加速。

我曾面临两个选择:是随着这种转型的演进,在数月甚至数年内进行渐进式裁员;还是诚实地面对现状,现在就采取行动。我选择了后者。反复的裁员对士气、专注力,以及客户和股东对我们领导能力的信任,都是毁灭性的。 我宁愿现在采取坚决、果断的行动,从一个我们坚信的立场出发去重建,也不愿看着公司在平庸中缓慢缩减。一个更精简的公司也给了我们按自己的节奏、正确发展业务的空间,而不是被动地应对市场压力。

如此规模的决策必然带有风险。但原地踏步同样危险。我们进行了一次全面的评估,确定了公司未来可靠增长所需的角色和人才,并从多个角度对这些决定进行了压力测试。我承认,我们可能会出一些错,因此我们保留了灵活性来修正错误,并确保为客户做正确的事。

我们不会让大家在 Slack 和邮件中凭空消失,仿佛从未存在过。沟通渠道将一直开放到周四晚上(太平洋时间),这样每个人都可以体面地道别,分享想说的话。我还将在太平洋时间下午 3:35 主持一场直播,向大家致谢。我知道这种方式可能会让人感到尴尬。但我宁愿这种尴尬带有一丝人性的温度,也不愿它显得高效而冷酷。

致离职的同事们…… 我对你们充满感激,也很抱歉让你们经历这一切。是你们成就了今天的公司。这是一个我将永远铭记的事实。这个决定绝非对你们个人贡献的否定。无论去往哪家机构,你们都会是卓越的贡献者。

致留下的同事们…… 这个决定是我做的,我会承担全部责任。我希望你们能和我一起战斗。我们将建立一家以智能为核心的公司。无论是工作方式、创造过程,还是服务客户的模式,智能都将无处不在。我们的客户也会感受到这种转变,而我们要帮助他们驾驭这种变化:迈向一个他们可以直接利用我们的能力、通过我们的接口,自主构建功能的未来。这就是我现在的关注点。

明天我会再发一封信给你们。

Jack

在这封公开信里,可以看到,当效率高了,人就多余了。以前一个万人的公司需要复杂的中层管理、大量的协调沟通。现在有了 AI 工具,更小、更扁平的团队反而跑得更快。Jack 发现,如果 6000 人加上 AI 就能干掉 10000 人的活儿,那么剩下的 4000 人就不再是资产,而是成本。

并且,「信息差」的钱不好赚了。Jack 在信里说,以后客户可以自己用公司的接口去盖房子、写功能。这意味着原本公司雇来写代码、做封装的程序员,价值被 AI 摊平了。AI 让开发功能变得像流水一样容易,以前靠「人力护城河」垒起来的生意模式,现在必须得「瘦身」才能活下去。

所以,长痛不如短痛。Jack认为 AI 带来的改变是不可逆的。与其每个月裁一点人搞得人心惶惶,不如承认现实:现在的公司已经不需要这么大规模的白领团队了。他选择一步到位,把 Blocks 强行缩减成一个「以 AI 为核心」的小公司。

这意味着什么?

Jack 这封信其实是在告诉所有职场人一个事实:AI 成功,并不等于经济成功。

对于 Blocks 的股东来说,这是个好消息,因为公司变得更赚钱、更高效了。但对于那 4000 名离职的员工,以及更广泛的群体来说,这可能是一个麻烦的信号。

未来,「好公司」不再是避风港,以前只要公司业绩好,你的饭碗就稳。现在,哪怕公司业绩翻倍,你也有可能因为「AI 能做得更好」而被请走。

消费也会萎缩,这 4000 人曾经是高薪白领,是买房、买车、去餐馆消费的主力。当 AI 把这部分工资变成了公司的利润,钱就从流通的市场上收缩到了少数人的口袋里。

2028 全球智能危机?

在最近被传播的《2028 全球智能危机》一文中,提出了一个反向命题:AI → 替代人类收入 → 消费崩塌。与过去两年AI → 提高生产率 → GDP 增长的主流叙事背道而驰。

在这个模型中,问题不在于 AI 不够强,而在于它太强了。历史上的技术革命(如工业革命、互联网)虽然消灭了旧岗位,但由于新岗位必须由「人」来完成,因此创造了新的收入与消费。

而 AI 是人类历史上第一次「替代了需求创造者」的技术。当 AI 智能体(Agents)不仅能写代码,还能管理 AI、优化流程时,新岗位的增长速度将永远赶不上自动化的迭代速度。

在文章中,作者构建了一个名为「智能替代螺旋」(Intelligence Displacement Spiral)的因果链。

他提到,未来,生产将与收入脱钩, AI 极大提升了产出,但由于它不领薪水,这些产出背后的价值流向了算力拥有者,而非劳动者。

「幽灵 GDP」也会出现,经济数据(生产力、企业利润)看起来很繁荣,但由于人类收入萎缩,这些产出无法在现实经济中循环。机器可以创造价值,但机器不买咖啡,不买房。

并且,在传统周期中,经济差会导致投资下降;但在 AI 周期中,经济越差,企业越有动力通过投资 AI 来削减成本。这种「以 AI 补血」的行为,实际上是在加速抽干。

过去几十年,无数伟大的公司本质上是在靠「人的弱点」赚钱。比如,人会忘记取消订阅(SaaS 续费);懒得去比价(外卖与旅游平台);会因为信息不对称而支付高额佣金(房产中介、金融顾问)。

支付体系的变革|图片来源:CitrinResearch

上图对比了传统交易模式与 AI 驱动下的新型支付模式。

在传统交易里:一笔 100 美元的消费中,商户需支付约 2.5% 的费用,这笔钱流向发卡行、支付网络(Visa/MA)和收单行,商户最终实收约 97.50 美元。

而在智能体/稳定币交易 (Agentic/Stablecoin Transaction):AI 智能体通过 Solana 或 L2 上的 USDC (稳定币) 自动路由支付,成本降至 0.01 美元 固定额度。商户实收约 99.99 美元。

也就是说,AI 已经在成为一台「摩擦力归零机」,摧毁了传统金融机构(银行、支付网络)的「租金」收入模式。

当智能体 24 小时自动谈判、自动比价、自动切换供应商时,这些商业模式依赖的「信息壁垒」就不可避免地在崩塌了。利润来源(摩擦)被效率抹掉,这种效率的提升对个体是好事,但对建立在这些税收之上的数万亿市值公司来说,就会相反。

文章中还推演到房贷市场的质疑。 2008 年的危机是「次贷危机」(烂人借了烂钱);而 2028 年可能爆发「优贷危机」。

科技劳动力向零工经济的流动|图片来源:CitrinResearch

上图体现了劳动力市场的流向及其后果。高技能、高工资的科技/白领阶层经历「大规模裁员」后,通过失业过渡,涌入准入门槛低的「服务与零工经济」。

而由于劳动力大量涌入(供过于求),零工经济的平均时薪出现萎缩。

所以,高端劳动力的下沉不仅导致其自身收入腰斩,还压低了整个服务行业的工资水平。

那些信用分 780+、年薪 20 万美元的精英白领,他们的贷款在签署当天是完美的。但当他们的职业身份被 AI 拆解,收入从 20 万骤降至 5 万时,整个房贷市场的底层假设——「人类借款人的持续收入能力」——也就消失了。

未来,当「智能」从稀缺资源变成「大宗商品」时,世界会发生什么?

在工业时代,能源变成商品推动了工业大爆发。而到了 AI 时代,智能变成商品,可能让大部分人的劳动都不再值钱。

这可能是一个关于钱的流向的问题。如果钱只在 GPU 拥有者和 AI 公司之间转,而不再通过工资流向普通人,那么经济就会出现一种怪现象——生产很多,但大家都买不起东西,就像陷入了“凯恩斯式陷阱”。

危机的三大驱动力与时间轴|图片来源:CitrinResearch

这个综合逻辑图里,展示了三个系统的相互激发:实体经济里,AI 提升导致白领裁员,直接造成收入损失;金融系统中,收入损失引发财富效应崩溃、信用紧缩、房贷违约以及私人信贷违约,最终被迫在流动性极差的市场抛售资产;然后是政策响应,由于税收崩溃(人不再产生收入,政府收不到税)和党派争论,政策反应滞后,导致结构性赤字超过 GDP 的 10%。

这篇文章最近火爆的原因,可能正是因为它击中了华尔街和硅谷共同的焦虑:我们会不会正在造出一个强大到足以摧毁自己以及客户的怪物?

如果说过去的逻辑是「技术创造世界」,那么这篇文章则是在预演:当 AI 把信息差都抹平、效率高到不再需要人类做决策时,原本靠“买卖差价”和“人工服务”撑起来的经济体系,可能根本就不复存在了。

文章给出了一份危机纪年表:2025 – 2026年Q3:实体经济中断;2026年Q4 – 2028年Q1:金融危机蔓延;2028年Q1往后:政策瘫痪与财政风险。

而今天 jack发出的这封裁员信,已经是预言在落地。

 

展示量: 8

逼走 OpenClaw 后,Anthropic 还是买了一家 Agent 公司

作者| 桦林舞王

编辑| 靖宇

2025 年底,一个奥地利开发者 Peter Steinberger 用一个小时写了个 Agent 工具,最初叫 Clawdbot,名字蹭了 Claude 的边。Anthropic 发律师函威胁法律行动,Steinberger 被迫改名,先改成 Moltbot,后来又改成 OpenClaw。

这本来是一件小事。

但 OpenClaw 随后爆了。GitHub 上狂飙到 17 万星,单周访问量破 200 万,成了有史以来增长最快的开源 Agent 项目之一。更关键的是,它默认推荐用 Claude 模型跑任务——某种程度上,它是 Anthropic 最大的免费流量入口之一。

然后 Anthropic 做了一件蠢事:开始封禁那些把 Claude API 接入 OpenClaw 的用户账号。

社区炸了。

Vercept 的产品让 AI 可以让 AI 控制电脑|图片来源:Vercept

 

「用自己花钱买的 API 做自动化,被封号」,这个操作让 AI 圈对 Anthropic 的舆论在一夜之间翻转。Steinberger 本人也彻底凉了对 Anthropic 的心。

2026 年 2 月 15 日,Sam Altman 宣布:Peter Steinberger 加入 OpenAI,负责下一代个人 Agent。

11 天后,Anthropic 宣布收购 Vercept 。

媒体的第一反应大多是:「又一家创业公司被大厂收购了。」

但这两件事放在一起看,说的是同一件事: AI 的战场正在发生一次非常具体的迁移——从「谁的模型更聪明」,到「谁能让 AI 真正控制一台电脑」。

而在这场迁移里,Anthropic 目前处于被动追赶的位置,部分原因是它自己造成的。

 

01

屏幕,真正的「最后一公里」

 

过去几年,AI 的能力突破大多发生在对话框里——你打字,它回答,精准、流畅、越来越快。但有一件事始终没变: 你依然得亲自打开软件、点击按钮、复制粘贴,然后再回来问 AI 下一步怎么做。

这就是 Agent 要解决的问题。

Agent 不是让 AI 更聪明地回答你,而是让 AI 直接替你干活:帮你打开 Excel、填好表格、切换到邮件客户端、把数据发出去,然后关掉窗口。整个过程,你只需要说一句话。

问题在于,要做到这一步, AI 必须先「看懂」你的屏幕 ——识别出每一个按钮、输入框、菜单,然后像人一样去点它。

这件事听起来简单,实际上极难。

一个有意思的现象是,在 AI 写代码、做分析、生成报告这些领域,各家的差距已经越来越小。但在「看屏幕、控电脑」这件事上,差距依然是代差级别的。

OpenAI 自己的 Operator,在 OSWorld(模拟真实电脑操作任务的基准测试)上得分是 38.1%。 Anthropic 的 Computer Use,只有 22%。而人类平均水平是 72.4% ——对,AI 做这件事,目前还远不如普通人顺手。

 

02

Vercept 为什么值得?

 

这就是 Vercept 被盯上的原因。

Vercept 的创始团队来自 Allen 人工智能研究所(Ai2),几个人在机器人感知、计算机视觉、强化学习领域都有深厚积累。

Vercept 团队做的 Vy,走的是一条和 OpenAI 完全不同的技术路线。

Operator 的逻辑是「读代码」 :通过解析网页底层 DOM 结构(文档对象模型),理解界面有哪些元素可以交互。这种方式速度快、稳定性好,但有一个硬伤—— 它只对有结构的 web 界面有效 。碰到本地软件、老系统、没有 API 的企业应用,它就完全没辙。

Vy 的逻辑是「看像素」 :不断截图,用视觉模型理解屏幕上的所有内容,再模拟鼠标键盘操作。覆盖范围是任何有屏幕的软件——不管是 Excel、本地 ERP,还是一个 20 年前开发的企业内网系统。

Vercept 介绍视频|视频来源:Vercept

 

Vercept 公布过一组数据:在 UI 元素识别基准测试 ScreenSpot v1 上,他们自研的 VyUI 模型准确率是 92%,OpenAI 同类模型是 18.3%。ScreenSpot v2 上是 94.7% 对 87.9%。

这个差距不是「我们优化得更好」,而是 底层技术路线带来的系统性优势 。

正是这个东西,补了 Anthropic 的短板。

Claude 的 Computer Use 能用,但一直不够惊艳。吸收 Vercept 的模型和团队,是 Anthropic 在「看屏幕」这件事上最快的提速方式。

 

03

OpenAI 在抢的,

是另一个入口

 

OpenAI 合并的 OpenClaw 是另一回事,但同样关键。

Peter Steinberger 做的 OpenClaw,不是桌面 Agent,而是把 AI 操控能力接入 WhatsApp、Telegram 这类消息平台——你在手机上发一条消息,它帮你在电脑上完成一个任务。

这条路解决的不是「AI 怎么看屏幕」,而是「用户从哪里发指令」 。

这个细节很重要。大多数人不会专门打开一个 Agent 界面来操作电脑,但每天都在用消息 App。 把指令入口放进消息 App,是让 Agent 真正融入日常使用习惯的关键一步。

OpenAI 收人而不是收公司,抢的就是这个方向的工程能力和产品直觉。

所以这两笔「收购」,针对的是 Agent 版图的不同层次: Anthropic 在补「屏幕感知」的技术短板,OpenAI 在布局「指令入口」的场景卡位 。

一个是基础设施,一个是用户习惯,缺哪个都不行。

更大的背景是,这场战争等不起。

Google、Microsoft 早就在布局,UiPath 这类 RPA(机器人流程自动化)公司的股价在 Anthropic 收购 Vercept 的消息发出后下跌了 3.6%——市场已经嗅到了威胁。

Agent 时代的竞争,本质上是一场基础设施的抢占。谁先把「AI 控制电脑」这件事做到足够好用,谁就在未来几年的企业和个人市场里握有真正的筹码。

Vercept 联合创始人兼早期投资者 Oren Etzioni 说了一句挺直白的话:「 我们基本上还是认输了 。」

但认输的原因,不是技术不好——他们的技术在某些维度上领先全场。认输的原因, 是这场战争烧的钱和资源,不是一家 20 人的初创公司能撑起来的 。

这大概也是 AI Agent 这个赛道最无情的地方:

好技术不够,还得有足够大的容器来装它。

展示量: 0

​MiniMax Agent 大升级,普通人也能玩转 Openclaw 了

作者|Cynthia

编辑| 郑玄

从 2025 年 Manus、GenSpark 轮番霸榜科技头条,到 2026 年初 OpenClaw 在 GitHub 创下 72 小时 Star 破 6 万、如今登顶 22 万星标的现象级纪录, AI Agent 的风已经足足刮了两年。

但相当长一段时间里,这场热闹其实只是技术圈的专属狂欢。通用 agent 不够垂直,而垂直领域 agent 过高的部署与开发门槛,又会把绝大多数人真正掌握法律、医学、金融知识的人挡在了未来的门外,成为工业革命时代最懂手工纺纱的女工,汽车时代最会赶马车的车夫……

但好在,最近 MiniMax 的更新,让不少人看到了未来。

简单来说,MiniMax 推出的 MaxClaw 打通 OpenClaw 生态,用户能免配置免 API 费一键部署。

此外,MiniMax 还推出了 Expert 生态,零代码、自然语言交互就能生成专属专家;针对常见的 PPT、金融分析、生活健康等垂类常见,MiniMax Agent 还全新升级推出了 Expert(专家),专治职场琐碎工作 PTSD。

实测三天,结论就一个:AI agent 的平权时代,终于不是说说而已了。

 

01

MaxClaw 上线,

Openclaw 的平权时代来了

 

在聊 MaxClaw 之前,先吐槽一把 OpenClaw。

诚然,这个能在本地实现邮件整理、脚本运行、日程管理,还带长期记忆和主动执行的 AI Agent,让所有人看到了个人 AI 操作系统的未来。

但对很多不懂编程的小白来说,光是第一步配置就能卡个至少三天。

而 MaxClaw 的核心价值,就是做了 OpenClaw 的上层网关封装,用技术手段干掉了所有非必要门槛。它通过 MiniMax 的云端算力完成了 OpenClaw 的底层部署,用户无需在本地安装任何程序,也不用配置 API 密钥,更不用承担额外的 API 费用,只需通过 MiniMax Agent 网页端,就能一键调用 OpenClaw 的核心能力。

这就有点类似过去 Windows 系统对古早 DOS 系统的取代,通过 UI 界面,把各种命令行操作简化为鼠标点击拖拽,这才让电脑真正实现普及走入千行百业。

不仅如此,MaxClaw 还对 OpenClaw 的体验进行了全方位升级。

首先是新增内置工具,生图 / 视频、搜图 / 部署等功能的加入,让 MaxClaw 实现了爆款能力开箱即用的优化。在此基础上,MaxClaw 还直接融入了 MiniMax 的爆款猎手、多 Agent 投研团队、热点追踪等优质 Expert,让用户一键就能获得组合式的 AI 能力。

比如这里,我在网页端的 MaxClaw 入口,让它做了一份《全球油运产业投资研究报告》

可以看到,对于油运这种相对小众的行业,MaxClaw 依然能全面的搜集到全球市场的最新信息,并将其完整汇总并且做出条理清晰的利好、利空分析,甚至还考虑到了影子船队扩张、原油运输路线变化导致航线延长最终影响实际运价与船只利用率的专业信息。

但 MaxClaw 不止能在网页运行,还可以完成多终端适配,完美兼容飞书、钉钉、Telegram、WhatsApp、Discord、Slack 等主流 IM 工具, 用户可以在自己常用的聊天软件中直接使用,无需来回跳转。

实测我们选在了最贴近职场的飞书端,整个部署过程也不难:

在飞书开放平台创建应用获取 App ID 和 App Secret,回到 MiniMax MaxClaw 对话式完成网关配置,全程不到 5 分钟,没有任何技术操作。

配置完成后,在飞书直接给机器人发送指令就能触发全流程工作,调用所有预配置的专家。

这里。我让它根据我自己创建的采访提纲机器人,做了一份关于萨姆・奥特曼的采访。

可以看到,AI 不仅精准还原了我想要的冷静、尖锐、直击本质的风格,还把奥特曼的职业经历、OpenAI 的发展争议拆解成野心与争议、AI 安全与竞争、政变始末、人类未来四大板块。甚至能精准戳中从非营利到营利、预测 2028 年超级智能等争议点

紧接着,难度升级,我又让它撰写了一份关于 AI coding 行业的调研报告,并重点爬取知乎、CSDN 的用户评价。

这是最终的报告成果,可以看到,整体条理非常清晰,包含执行摘要、市场概况、玩家分析、用户评价等 6 大模块,不仅精准提炼了 GitHub Copilot(2000 万用户、180 万付费用户)、Cursor(90 亿美元估值、21 个月 ARR 从 100 万到 1 亿)等核心数据,还对三款主流产品做了优势 – 劣势 – 用户满意度的结构化分析,甚至能精准总结出 Cursor 数学建模准确率 87.6%、通义灵码中文注释支持好等细节。

这种聊天框里的 AI 操作系统,彻底让 OpenClaw 的顶级能力融入了日常工作场景。

以前配置 OpenClaw 的时间,够专业人士泡三杯咖啡还摸鱼十分钟;现在普通人也能五分钟完成 agent 搭建、社交软件 MaxClaw 配置,以及让 AI 完成从资料搜集到成果输出的全流程,。

 

02

把 AI Agent 开发权,

还给懂业务的人

 

Agent 火了两年多,但到 2026 年,一个关键的趋势在于: 开发权从算法工程师,向业务骨干、运营、创业者等懂业务的人转移 。

背后的逻辑很简单:大模型的基础设施已经成熟,AI Agent 的竞争核心,也因此从技术研发变成了场景落地。而最懂场景的,永远是身处其中的业务人——一个投研分析师知道该怎么拆解行业数据,一个媒体编辑知道该怎么挖掘热点信息,一个运营知道该怎么设计用户增长路径,但他们大多不懂 LangChain 的编排逻辑、不会写 Prompt 工程、也不知道怎么对接 MCP 和 Skills 工具。

毕竟,传统的 AI Agent 开发框架,本质上还是为技术人设计的。为了更有效地释放行业的 knowhow,MiniMax 重点推出了 Expert。

MiniMax Expert 的核心突破,就是实现了用自然语言来搭建 Agent,也就是说,只要你要描述清楚自己的需求,AI 就会自动帮你梳理各种技术配置,搭建好想要的 agent。

作为专业内容创作者,我们经常需要与各种创业者以及专家进行对话。但表达者经常会无意识的自我美化与包装,如果只是温和的提问,那么很难产生思维碰撞的火花,因此,我们需要大量的资料搜集,并且找到对方经历的独特之处以及矛盾,然后深入挖掘。简单来说,我需要创建一个易立竞风格的 agent。

接下来,我只需要把这个要求用自然语言描述给 AI 即可。

比较惊喜的一点,AI 在已有需求的基础上,还会将其拆解成三大核心模块,甚至做了精细化的功能设计:

  1. 深度资料吞吐与分析
  2. :自动梳理人物时间线、对比言行矛盾,完成海量信息的整合;
  3. 人物画像构建
  4. :提炼核心关键词、分析底层行为逻辑,精准定位采访切入点;
  5. 深度采访提纲生成
  6. :按照破冰与定义、事实与矛盾、共情与质疑、终极拷问四个递进板块设计问题,每个问题还附带设计意图。

基于这一配置生成深度灵魂拷问者 agent,我让它做了一份关于最近再次爆火的谷爱凌的采访提纲,其尖锐程度和深度,完全超出了预期。

它没有停留在夺冠心情、教育方式等表面问题,而是将这些问题进一步深化,变成:

每个问题背后,都是 AI 对海量信息的整合、分析和深度思考,而这一切,都在用户输入自然语言需求后,由 AI 自动完成。

当然,用户不仅能自由创建 Expert,还能将自己的 Expert 开放共享。目前,MiniMax 已经构建起了一个充满活力的 Expert 生态:已有 1 万 + 公开的专家 Agent ,其中大部分来自 UGC 创作,甚至包括投研分析、行业报告、代码开发等高质量的专业 Agent。

为了激励创作者,MiniMax 设置了积分奖励机制——公开 Agent 每被复制一次,创建者就能获得 100 积分;而即将上线的 Market Place,更是让创作者可以为自己的 Agent 公开定价,形成创作 – 分享 – 变现的完整生态。

这是一个极具想象力的模式:一个资深的投研分析师,可以把自己的分析框架、数据拆解逻辑固化成 Agent,让更多人使用并获得收益;一个媒体编辑,可以把自己的热点挖掘、内容创作方法变成 Agent,实现经验的复用;甚至一个普通的职场人,都可以把自己的工作流程、办公技巧做成 Agent,让 AI 帮自己完成重复工作。

每个人都能借助 AI,将自己的能力 0 门槛释放,这才是 AI 生产力的真正爆发开端。

 

03

开箱即用的 Expert,

解决职场人的琐碎工作 PTSD

 

在 MiniMax 官网,根据职场人日常的工作内容,官方已经预置了一些 Expert。覆盖技术开发、创意写作、办公效率、商业金融、教育学习等高频场景,每个垂类的 Expert 都经过了场景化训练,定制化 Prompt 和工具集配备,远比单纯的聊天机器人更懂行业需求,能直接输出可落地的专业成果。

写汇报、做 PPT、搜集资料、分析数据,这些占据职场人 80% 时间的琐碎工作,都能被这些经过深度优化的垂类 Expert 一键搞定。

我们实测了两款最具代表性的 Expert,体验堪称效率神器。

首先是 热点追踪 Expert。 作为一个科技作者,我们每天最头疼的事情就是要在各种新闻中不断,收集信息,思考角度,有时候,写稿两小时,找资料需要三天。

MiniMax 的热点追踪 Expert,直接解决了这两个痛点。它不同于传统 AI 囿于训练数据的陈旧知识,而是能基于用户需求 实时搜索最新信源 ,并自动将需求拆解成多个维度的信息挖掘方向。

我们让它搜寻 OpenClaw 项目的最新进展,AI 自动拆解为最新动态、技术特点、社区讨论、行业影响四个板块,不仅搜集了 2026 年 2 月的版本更新、功能发布等最新信息,还梳理了开发者社区的热点争议和对 AI 智能体领域的影响。

更重要的是,它内置了 事实核查子 Agent ,在成果输出前会对所有关键信息进行交叉验证,确保信息的准确性,彻底解决了 AI 投毒的问题。实测中,AI 对 OpenClaw 的星标数据、功能特点、行业影响等信息,都做了信源标注和事实核查,没有出现任何虚假信息。

投研也是一个非常专业的领域。我们再测试一下 Global 投研一体 Expert 。

自 2025 年下半年起,A 股进入大牛市,指数突破 4100 点,金银等贵金属一路飞涨,普通人也想了解市场行情,但行情是否还能持续,周期一般会维持多久,贵金属的上涨又会遵从怎样的逻辑,与此同时,历史上几轮金属周期对当下有什么启发,又有什么异同?

要回答以上问题,都需要面对庞杂的信息与专业术语,普通人往往无从下手。

我们用 Global 投研一体 Expert,一句话提出需求:分析 2026 年贵金属行情是否持续、周期多久、历史周期的启发,AI 在短时间内输出了一份结构化的《2026 年全球金属格局与历史涨价周期深度研究报告》,内容之专业、分析之深入,堪比券商研报。

它不仅精准分析了黄金(央行购金 + 避险需求)、白银(工业属性 + 金融属性双重驱动)的上涨逻辑,还对铜(供需缺口)、锂(储能需求)、稀土(高端制造溢价)等金属做了细分分析;甚至梳理了历史金属涨价周期的规律(通常 8-10 年,当前仍处于长周期上涨阶段),并对本轮炒作周期的特征(机构化程度提高、基本面支撑更强、分化特征明显)和风险(价格高位、美联储政策不确定性)做了全面分析,最后还给出了贵金属、基本金属、电池金属的具体投资建议。对于普通投资者来说,这相当于拥有了一个专属的专业投研团队。

 

04

尾声

 

美国著名历史哲学家威尔・杜兰特(Will Durant)曾总结:进步乃是遗产的不断增加、保存、传送与利用,历史本身就是文明遗产的创造与记录。

这次 MiniMax 的更新,某种意义上就在打破经验传播与落地的壁垒。

MiniMax Expert 生态,让一个行业专家的经验,不再是书本上的文字、网络上的文章,而是可以被固化成 Agent 的数字资产,能够被其他人直接调用,完成生产。而 MaxClaw 打通了 OpenClaw 的生态,让专家能力也能够在不同的通讯软件里被触达。

普通人复用这份经验,也无需再经过复杂的学习过程。

而这,或者正是生产力进步爆发的真正起点。

展示量: 0

用 AI Agent 可以做「一人公司」吗?我在 Manus 新功能上看到一种可行性|AI 上新

作者|金光浩

编辑| 靖宇

 

最近半年,我身边越来越多的朋友在聊同一件事: 能不能用 AI 做一家「一人公司」。

大概的想法是这样的:用 AI 搞定产品调研、竞品分析、设计和开发,低成本运营。

但真正试过的人都知道,现实往往卡在一个很小的地方:

你得多线程工作,同时打开七八个标签页,在不同的 AI 工具之间来回切换,把一个完整的思考过程给到不同的 AI 产品,大量时间花在了「切换」和「重复描述需求」上。

我用 Manus 做过几次深度调研,输出质量确实惊艳。但每次想用它,我都得打开电脑,在一个专门的界面里操作。这意味着每次使用 AI 都需要一个「决策成本」:我要不要打开这个工具?我现在方便吗?

这个问题,我一直觉得是整个 AI 工具行业的一个隐性痛点。

直到上周,我看到 Manus 上线了一个新功能:Manus Agents。

Manus Agents 新功能介绍|图片来源:manus

 

我想用它验证一个问题:如果我真的要一个人创业,AI 能否在一些关键环节帮上忙?


 

栏目作者召集

极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!

现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例: Seedance 2.0:AI 视频第一阶段的比赛,结束了|AI 上新 ) 向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。

同时, 优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。

AGI 太久,只争朝夕,让一部分人先 AI 起来吧! 投稿、进群请扫描下方二维码添加极客小助手微信

 


 

01

扫个码,Manus 就住进了我的 Telegram

 

Manus Agents 的使用方式跟之前在网页端完全不同。

整个连接过程出乎意料地简单:

在 Manus 工作区里点开 Agents 标签页,用 Telegram 扫个二维码,10s 后就能直接开始发布任务。

上个月 OpenClaw 火的时候,我也尝试过在手机上用 Claude Code 帮我完成任务。体验确实好,但部署过程劝退了不少人,我身边好几个非技术背景的朋友都卡在了配置环节。

Manus Agents 最大的优势就是完全不需要自己部署,扫码即用。

Manus Agents 新功能连接方式|图片来源:manus

 

02

Manus Agents 实测

 

我给自己设计了三个测试任务,围绕「一人公司」的调研场景展开。

我在 Telegram 里发了一段指令:「帮我在全网搜索关于一人公司的成功案例,总结都有哪些商业模式,然后给我一份结构化的分析报告」

Manus Agents 先回复了我一条消息,告诉我正在启动研究任务,然后就进入了后台执行阶段。

我可以看到它的工作状态在推进,但不需要在屏幕前盯着。

这让我想起以前用其他 AI 工具做调研时的体验:我得一直守在电脑前,看着它一步步输出,中间还经常需要补充指令,但这次,我直接去打了一局游戏。

Telegram 连接 Manus|图片来源:Telegram

 

大概十几分钟后,它在聊天里推送了一份完整的研究报告。

它先从概念上给出了一人公司和自由职业者的区别,这是我之前一直没想清楚的问题。

Manus 的研究报告|图片来源:Manus

 

然后,它帮我详尽地拆解了几种主流的商业模式,每种模式都有清晰的定义。

看到报告的这一刻,我竟有一种莫名的「爽」感。

Manus 的研究报告|图片来源:Manus

 

第二个任务,我想要让它帮我进行下深度研究 Moltbook 。

最近 OpenClaw 火了之后,也带火了 Moltbook 这个产品,说实话我并没有深度使用过,我想知道它为什么爆火,以及它学习的设计。

我发给他 Moltbook 的官网并附带了一句:「帮我分析 Moltbook 这个产品的核心功能、目标用户、定价策略,以及它的爆火原因」

有意思的是,它不只是爬了我给的那个网站,还主动搜索了外部的一些资料,包括用户评价、媒体报道和一些行业分析。

Manus 的研究过程|图片来源:Manus

 

最终输出的报告完全按照提示词的要求给出,对我的研究很有参考价值。

Manus 的研究报告|图片来源:Manus

 

到这一步我开始感觉到,把 Manus 这样一个全功能 Agent 直接装进 Telegram 里,确实方便很多。

我在地铁上用手机发了任务,下车的时候报告就已经可以看到了。

第三个任务,我想把难度再拉高一档,测试 AI 能否扮演产品经理,帮我验证一些产品的想法。

我在 Telegram 里发了我最近一个 AI 项目初步的产品想法:

这个任务比前两个更开放,也更考验 AI 的综合判断能力。

Telegram 连接 Manus|图片来源:Telegram

 

它先对市场空间做了一轮快速评估,引用了一些公开的专利代理行业数据,然后它开始逐条拆解风险,并且每一项都给出了具体的分析逻辑。

Manus 的研究报告|图片来源:Manus

 

让我特别在意的是关于法律风险的那部分。它指出专利交底书的生成涉及专利代理的执业资质问题,专利代理需要持证上岗,AI 工具如果直接生成交底书并用于正式申请,可能触及资质红线。

看完这份分析,我基本确认这个方向可能走不通。

这让我意识到 AI 作为「个人助理」的价值:

它能帮我扮演各种角色,它拥有各种视角,能帮我在投入大量时间之前就发现了关键障碍。

 

03

入口变了,意味着什么?

 

测试完,我想分享下我的体验:

在手机聊天窗口发任务和以前在 Manus 网页端发任务对比,输出效果完全一样,但我的感受是,前者是随时随地都可以使用的「个人助理」,后者是在工作或者学习场景才使用的「AI 工具」。

这看上去只是入口的变化,但它产生的结果是我们对 AI 角色认知的改变,以及我们使用 AI 习惯的改变。

过去你要用 Manus,必须打开它的网页端,登录账号,然后在一个专门的界面里操作,它天然地把 AI 使用限定在了「正式工作」的场景里:你得坐在电脑前,得有一段相对完整的时间,得做好「现在要认真用 AI 干活」的心理准备。

而 Manus Agents 消除了这个心理阻力,你不需要「去使用 AI」,因为 AI 就在你日常沟通的地方。你想到一个问题,直接在 Telegram 里问一句,任务就开始执行了。

你可以在排队买咖啡的时候发一个调研需求,在坐地铁的时候收到结果,在睡前躺在床上用语音消息布置第二天的任务。

让我们再把视角拉长一点,让 AI 背后的智能更加方便的调用,可能是 2026 年正在发生的趋势。

过去几年,AI 行业的竞争焦点一直放在模型能力和 Agent 上下文工程的效果上。

这些当然重要,但有一个需求长期被低估了:

普通用户在多少场景下,以多低的门槛能触达这些能力?

许多 AI 产品,比如 Manus,最初的呈现方式大多是网页的对话 Agent,让普通用户在日常工作和下班学习场景使用这些工具。

后来,编程领域诞生了不需要打开网页或者下载桌面软件就能运行的 Claude Code,让开发者可以在命令行里直接调用 AI 能力。

再后来,OpenClaw 解决了命令行的门槛,让用户可以直接在手机上对话。

但 OpenClaw 较高的部署难度,依然让很多人的热情被挡在门外。

如何让没有 Vibe Coding 能力的普通人也可以真正享受到这种能力?

Manus Agents 提供了一种可能来降低「知识工作」的门槛:一键扫码接入 Telegram。

真正让智能,可以随时随地的通过一句话进行调用。

 

04

我们离用 AI 做一人公司有多远?

 

用了三天 Manus Agents 之后,我对「一人公司」这件事的态度发生了一些变化。

以前我觉得这更像一个美好的概念,实际操作起来可能会被无数琐碎的事情拖垮:一个人要同时扮演研究员、产品经理、分析师、内容创作者,每个角色都需要专业能力,更需要大量时间。一个人的精力是有上限的,这个上限决定了「一人公司」的天花板。

但当 OpenClaw、Manus Agents 这类工具爆发后,我觉得这件事的可行性在显著提升。 不是因为 AI 能替代人做决策,而是因为 AI 把「执行」的成本压缩到了几乎可以忽略的程度。

你依然需要对行业有洞察,对用户有理解,对产品有判断。但当你产生一个想法的时候,验证它的成本从几天变成了几分钟。

而当它能帮我们在碎片时间就能完成一条完整的任务时,使用 AI 工具就会像刷短视频一样上瘾:

我现在可以在喝咖啡的时候,让 AI 帮我做一轮市场调研;在午休的时候,让它帮我分析几个竞品;在灵感产生的 10s 后,就让它帮我评估这个新想法的可行性。这些任务以前我要在记事本上记着,然后回家坐在电脑上执行,但现在,它们变成了一条消息的事。

2026 年 AI Agent 的竞争,正在悄然从「谁的能力更强」转向到「谁能在更多场景下、以更低的门槛触达用户」。

如果你也有过「一人公司」的念头,不妨去 Manus 工作区的 Agents 标签页连一下 Telegram 试试。

也许你会和我一样发现:用 AI 运营一家「一人公司」,比你想象的要简单得多。

展示量: 0

中国 AI 调用量首超美国;今年国产手机全面涨价,最低涨超千元;奈飞退出收购华纳兄弟竞争

谷歌推出最新图像模型 Nano Banana 2

北京时间 27 日凌晨,谷歌宣布上架新一代图像生成模型 Nano Banana 2,使得高质量图像的生成更快、更便宜、更容易。

官方宣称,Nano Banana 2(即 Gemini 3.1 Flash 图像模型)能够兼具 Nano Banana Pro 的图像生成质量、推理能力和先进世界知识,以及 Flash 模型的「闪电生成速度」。

这意味着一系列曾经专属于「Pro」系列模型的功能下放到最基础的版本。Nano Banana 2 同样支持最多 5 个角色的相貌一致及 14 个物体的忠实呈现。自然语言理解能力的提升,使得模型更精准地捕捉复杂提示词的细微差别,从而生成更贴近想法的图像。

据披露,Nano Banana 2 上架后即刻登顶文生图榜单的第一位。同时每张图像的成本只有 0.067 美元,约为 Nano Banana Pro 的一半。(来源:财联社)

Deepseek V4 Lite 原生多模态 AI 曝光

近日,关于 DeepSeek 尚未发布的 V4 模型引发热议。据 X 用户 legit_api 透露,DeepSeek 正在测试 V4 Lite 模型,代号为「Sealion-lite」,上下文窗口为 100 万 tokens,并是原生支持多模态推理。

技术规格方面,消息称 DeepSeek 正积极测试 V4 Lite,具备 100 万 tokens 的超长上下文窗口,作为对比 DeepSeek V3.2 为 128K(128000)tokens。

该模型原生支持多模态推理,意味着它不仅能处理海量文本,还能更好地理解和生成图像等多种形式的数据,整体表现显著优于现有的 Web 或 App 模型。

根据其他 X 用户反馈,在生成「骑自行车的鹈鹕」和「Xbox 360 手柄」的测试中,V4 Lite 在非思考模式下生成的图像,无论是贴合提示词的程度、物体形状的准确性,还是细节的丰富度,都明显优于前代 V3.2 版本的思考模式。(来源:IT之家)

 

Anthropic 收购 Vercept,为 Claude「装上眼睛」

当地时间 2 月 25 日,Anthropic 宣布收购西雅图 AI 初创公司 Vercept,为自家智能体工具「Computer Use」补上视觉短板。

Computer Use 是 Anthropic 为旗下 AI 大模型 Claude 打造的、使其直接操控电脑的核心能力,能让 Claude 可以像人一样「看屏幕、动鼠标、敲键盘、操作软件」,完成多步骤、跨应用的复杂任务,于 2024 年 10 月随 Claude 3.5 Sonnet 一同发布,该功能是是 Anthropic 进军 AI 智能体领域的关键一步。

Vercept 意在打造视觉优先(Vision first)的 AI 智能体,主打「像人一样看屏幕、操控电脑」的无 API 自动化,其在高精度 UI 识别、空间推理方面的积累可以补齐 Anthropic AI 模型在视觉理解精度上存在的短板。(来源:科创板日报)

 

奈飞宣布退出对华纳兄弟的收购战

2 月 26 日,华纳兄弟探索公司表示,派拉蒙天空之舞公司提出的 1110 亿美元新报价,比华纳此前与奈飞达成的协议更有利于股东。

此后,奈飞宣布退出对华纳兄弟探索的收购战,为竞争对手派拉蒙的收购扫清道路。

奈飞在一份声明中表示:「我们谈判达成的交易本可创造股东价值,且获得监管批准的途径清晰。但我们始终秉持审慎原则,若要匹配派拉蒙的最新报价,该交易对我们来说在财务上已不再具有吸引力。」(来源:界面新闻)

 

中国手机市场迎来全面涨价潮,新品涨幅最低超千元

据新浪科技近日报道,多方观点认为:2026 年中国手机行业将正式迎来全面涨价潮,这也是国内手机市场发展以来首次出现全品类、全品牌同步普涨的态势。

报道称,目前国内主流手机品牌均已完成涨价方案的敲定,部分品牌已向线下经销商、线上渠道商下发了调价通知,「从目前确定的方案来看,3 月是涨价的关键节点,此前上市的机型调价幅度相对温和,但 3 月之后发布的新品,涨价幅度将明显扩大,最低涨幅不会低于 1000 元,中高端旗舰机型涨幅可能达到 2000-3000 元。」

根据行业分析机构 Counterpoint Research 的最新报告,2026 年全球智能手机均价将同比上涨 6.9%,其中中国市场涨幅将显著高于全球平均水平,核心原因是上游供应链成本的持续飙升,尤其是内存芯片价格的暴涨的影响,预计 3 月后中国市场新品手机均价将较 2025 年同档位机型上涨 15%-25%。(来源:新浪科技)

努比亚高管:三星 S26 只实现了豆包手机的局部能力

北京时间 2 月 26 日凌晨,三星 Galaxy S26 系列正式发布,新机与谷歌 Gemini 联动带来的手机「自动驾驶」相关 AI 能力成为一大会亮点。

中兴通讯终端事业部总裁、努比亚技术有限公司总裁倪飞也针对该功能发文点评。他表示:三星 S26 系列与 Gemini 的组合仅实现了努比亚 M153 豆包手机的局部能力,虽乐见国际巨头跟进 AI 智能体赛道,但也对其功能落地的完整性表示遗憾。

倪飞认为,三星此次推出的相关功能,印证了 AI 智能体是手机行业发展的共同方向,不过三星 S26 系列的该功能落地,比努比亚 M153 豆包手机技术预览版的发布晚了三个月。

二者核心差异在于:三星 S26+Gemini 的组合采用 GUI 方式实现,仅能完成单一场景的多步骤任务演示,比如预订网约车、添加购物车等,且相关任务需在后台运行;而努比亚 M153 豆包手机已率先将手机自动驾驶推进到全场景系统级应用,并非局限于单一功能或场景的体验。(来源:快科技)

 

中国 AI 调用量首超美国

近日,全球最大的 AI 模型 API 聚合平台 OpenRouter 数据显示,9 日-15 日这周,中国模型以 4.12 万亿 Token 的调用量,首次超过同期美国模型的 2.94 万亿 Token。

此后的 16 日-22 日,中国模型的周调用量进一步冲高至 5.16 万亿 Token,三周大涨 127%,而同期美国模型调用量跌至 2.7 万亿 Token。

与此同时,全球调用量排名前五的模型中,中国模型占据四席。中国模型厂商,正凭借快速迭代和成本优势占领全球市场,国产算力需求正经历指数级增长。(来源:每经网)

 

OpenAI 挖走 Meta 2 亿年薪华裔 AI 负责人

据多家外媒近日报道,此前加入 Meta 的前苹果 AI 负责人庞若鸣已经加入 OpenAI。

庞若鸣此前在 Meta Superintelligence Labs 负责 AI 基础设施建设。据知情人士透露,OpenAI 在过去几个月里对其进行了极其积极的招揽。尽管庞若鸣在上周离职前曾向同事表示,他在 Meta 工作得很愉快,且公司的基础设施状况良好,但他最终还是选择了加入 OpenAI。

庞若鸣的职业生涯跨越了多家科技巨头,他本科毕业于上海交通大学,曾在谷歌工作了 15 年,先后加入了苹果与 Meta。

去年,庞若鸣加入 Meta。据报道,Meta 为他开出了价值超过 2 亿美元的多年期薪酬包,其中包含与特定里程碑挂钩的激励条款。(来源:机器之心)

 

蔚来芯片子公司完成超 22 亿融资

2 月 26 日下午,蔚来宣布芯片子公司安徽神玑技术有限公司完成首轮股权融资协议签署,融资金额为 22.57 亿元人民币,投后估值近百亿。

神玑公司目前的主要产品为 5nm 车规辅助驾驶芯片神玑 NX9031,蔚来方面称其拥有一颗抵四颗英伟达 Orin-X 芯片的端侧推理能力。神玑 NX9031 自 2024 年投产以来已累计出货超 15 万套,成功部署在蔚来品牌的全系车型上。

本轮融资之后,神玑公司还将推出面向下一代智能驾驶的芯片以及多款其他领域的芯片。

待投资交易完成后,蔚来将继续持有神玑 62.7% 的控股权,而神玑投资者将合共持有 27.3% 的股权。神玑剩下 10% 股权由管理股份激励计划的实体持有。(来源:车东西、财中社)

微信上线「图片使用次数查询」功能

近日,微信上线了图片使用次数查询功能:长按聊天图片、视频或文件即可查看其在多少单聊或群聊被引用;也能一键定位到具体聊天位置,轻松实现内容流向溯源,被网友称作拯救金鱼记忆的实用能力。

据微信员工「客村小蒋」在微博介绍:该功能的推出是为了让用户直观看到文件的使用情况,明确转发图片、视频或文件不会重复占用手机存储空间,从视觉层面缓解大家的存储焦虑。

「客村小蒋」表示,这一功能的设计早有规划,核心是通过 UI 层面的展示,让用户直观了解到文件转发后只是引用次数增加,并非生成了多个副本,实际存储体积并未变大。

而这一体验的背后,是微信采用的硬链接技术,同一文件无论转发多少次,手机本地都仅保留一份原始文件,从根源上避免了存储冗余。

除了图片使用次数查询,微信还同步上线了面对面收发图功能,无需加好友、不耗费流量就能快速传输原图。(来源:快科技)

 

下周苹果发布新品,入门款手机和笔记本价格有望「惊喜」

2 月 26 日晚间,苹果公司 CEO 库克在社交媒体上发文称:「下周会很热闹」,这标志着苹果春季新品发布会即将揭开序幕。

据悉,这次新品阵容包括 iPhone 17e、低价 MacBook、iPad 12、iPad Air 8 等。

iPhone 17e 将搭载 A19 芯片,这很可能是唯一的升级,爆料称其依然采用上代的外观模具,屏幕等规格也保持不变。根据爆料,国行版预计将维持 4499 元的定价,如果叠加目前的补贴政策,起步价格有望下探至 3999 元。

此外,入门款 MacBook 是这次关注度最高的产品,海外起售价预计 599-799 美元,国行或下探至 4000 元档位,成为苹果史上最亲民的笔记本电脑。

其最大突破在于首次搭载 iPhone 同款 A 系列芯片,采用 iPhone 16 Pro 同款的 A18 Pro,第二代 3nm 工艺打造,6 核 CPU+6 核 GPU 搭配 16 核神经引擎,性能略超 M1 芯片,单核接近 M4 水平。(来源:快科技)

 

联想折叠屏概念游戏掌机曝光

近日,外媒 WindowsLatest 曝光了联想旗下 Legion Go Fold 折叠屏概念游戏掌机。

泄露图片显示,该设备配备一块 POLED 折叠屏,展开前屏幕尺寸为 7.7 英寸,完全展开后可扩展至 11.6 英寸,实现两种不同的显示规格。机身搭载英特尔酷睿 Ultra 7 258V 处理器,匹配 32GB RAM,内置 48Wh 电池。

在形态上,该机在全面展开和折叠情况下均支持安装手柄,以实现类似 Switch / NDS 的效果。手柄在 FPS 模式下可作为鼠标使用,整体体验类似任天堂 Switch 2,同时右侧手柄还内置显示屏,可显示性能指标,并可兼作触控板。除此之外,该机还将随附无线键盘,以实现类似于 Surface Pro 的办公体验。(来源:IT之家)

Robotaxi 商标疑似被抢注,特斯拉起诉法国苏打水公司

近日,特斯拉向美国专利商标局商标审判和上诉委员会提交了一份长达 167 页、包含 5 项指控的正式异议文件,状告法国饮料批发商 UNIBEV,后者长期占用「Cybercab」商标。

特斯拉指出,UNIBEV 曾向商标局虚假声称,无其他主体在同类商品上使用「cyber」「cab」或「cyber cab」等词语,但事实上,特斯拉早在 2024 年 10 月的「We, Robot」发布会上就已正式发布 Cybercab 车型,该名称已被全球媒体广泛报道,仅是特斯拉当时未及时提交商标申请。

此外,特斯拉还质疑 UNIBEV 的使用意图,认为其作为饮料企业,无任何车辆制造、销售相关经验,此次抢注属于典型的「教科书式商标抢注」——在自身无意涉足的领域抢注知名名称,再向合法所有者索要转让费。

值得注意的是,这并不是 UNIBEV 第一次尝试注册特斯拉品牌,UNIBEV 还申请注册了「Cyberquad」(另一个与特斯拉相关的名称)和「Cybertaxi」。该公司已拥有「Teslaquila」的商标,特斯拉曾试图将此名称用于其限量版品牌龙舌兰酒。(来源:快科技)

 

展示量: 25

「好用又便宜」的 Nano Banana 2 来了,这次能改变你的出图工作流吗?

去年,Nano Banana 刚出圈的时候,我身边不少做平面内容的朋友第一反应是:终于不用再开 Photoshop 改那些破海报了。
但兴奋劲过去之后,大家发现一个尴尬的事 —— 模型是好模型,可每次要用的时候还得专门跑去找入口、调参数:当然,最重要的体验是你还得等半天。这个情况在 Nano Banana Pro 发布之后,反而更加严重。
换言之,它更像一个「偶尔惊艳你一下」的玩具,而不是随手就能用的工具。对于真正拿 Nano Banana 尝试创作的用户来讲,也当然需要一款既好用又便宜的版本,来支撑“量大管饱”的需求。
这也是为什么 Nano Banana 2 备受关注的原因:2 月 26 日,Google DeepMind 发布了 Nano Banana 2(官方也称 Gemini 3.1 Flash Image)。

 

实际上,在全球网友已经玩了两个小时之后,谷歌官方的公告才姗姗来迟,宣布了 Nano Nano 2 的正式到来。

表面看是一次模型升级,但我觉得更准确的说法是:Google 想让图像生成从「你得专门去找它」变成「量大管饱的创作者工具」。

01

三件事,Google 往前推了一步

先说能力层面。Nano Banana 2 确实在几个老大难问题上有了进展。
第一件:画图的时候,模型终于「懂点时事儿」了。
 Google 把 Gemini 的现实世界知识库和实时搜索信息接入了生成过程。Nano Banana 2 可以利用 Gemini 模型丰富的全球知识,通过网络搜索图像来创建增强的视觉效果。
听起来有点抽象,翻译成人话就是——你让它画一张信息图,它知道数据长什么样;你让它画东京塔,它不会画成埃菲尔铁塔。这对做信息图、数据可视化、或者任何需要「画得对」而非「画得美」的场景,算是实质性改善。
第二件:图里的字,终于能看清了。 这事听起来很基础,但在很多商业场景里,文字渲染比画风重要十倍。营销海报、活动主视觉、UI 原型、门店指示牌——字一糊,整张图就废了。

在接入 Gemini 模型实现网络搜索图像之后,你可以实时地获取世界各地的实时信息来辅助内容生成,比如获取位置以及实时天气数据,来创建逼真的窗户景色。

 

如果你在 Nano Banana V1 时代就一直在使用它的话,你可能会记得文字渲染一直是个老大难的问题。

这一次,谷歌也终于将其作为一个重要升级项目进行了加强。

Nano Banana 2 强调的「清晰可读的文本生成」,加上支持图内翻译和本地化,直接把「出一张可用物料」的可用性与链路缩短了一大截。

 

对做出海业务的团队来说,这可能比任何风格升级都实在。谷歌为了展示这种能力,自己还做了一个 demo:它可以直接将广告翻译成各种不同的语言以适应国际市场,以此来炫耀 Nano Banana 2 通过图像内功能理解本地化视觉元素的能力。
 

第三件:角色和物体的一致性,开始够用了。 同一工作流里最多维持 5 个角色相貌一致、14 个物体外观一致;分辨率覆盖 512px 到 4K,画幅可控。对做分镜、做连续故事、做系列化物料的人来说,这类能力的价值远大于「多一种风格」。
说句实话,单看这些能力点,Nano Banana 2 并没有做出让人「哇」一声的突破。每一项都是在已有方向上往前拱了一步。
但这次更新真正有意思的地方,不在能力本身。

02

比起「画得更好」,Google 这次更在意「铺得更广」

Nano Banana 2 被塞进了几乎所有你能想到的 Google 产品入口里。
在 Gemini 里,它会替换掉 Fast / Thinking / Pro 模式下原来的 Nano Banana Pro。

 

如果你是 Google AI Pro / Ultra 订阅用户,仍然能通过图片的三点菜单调用 Nano Banana Pro 做更精细的任务——但默认出图能力,已经换代了。
在 Search 里,它进入了 AI Mode 和 Lens,覆盖 141 个新增国家与地区、额外 8 种语言。在 Flow 里,它直接成为默认图像模型,对所有用户零 credits。在 Google Ads 里,它变成创建广告活动时的「建议能力」。
这套动作连起来看,逻辑很清晰:Google 的判断是,图像生成的真正战场不在模型榜单上,而在入口里、在工作流里、在用户「顺手就用了」的那个瞬间。
怎么理解这件事?打个比方:过去的 AI 画图工具更像一家「需要专程跑去的独立画廊」,手艺不错,但你得特地安排时间。Google 现在做的事情,是把画廊变成超市里的文具货架——你来买菜的时候顺手就拿了。

 

这也解释了为什么 Nano Banana 2 选择了 Flash 速度档而不是 Pro 档作为主力铺设版本:毕竟在追求规模、速度和分发密度上,在这个阶段比极致质量更重要。

03

给创作者的信号:图像模型正在变成「可配置的渲染引擎」

面向开发者/创作者的版本里,还有几个细节值得注意。

Nano Banana 2 新增了 4:1、1:4、8:1、1:8 等超宽幅画幅比例,以及 512px 的低分辨率档。

 

后者目标很明确:降延迟,适配高并发和快速迭代。它还提供了「可配置的 thinking levels」,分 Minimal(默认)和 High/Dynamic 两档,让开发者在速度与推理强度之间自己拨杆。

如果为了追求极致效果,你当然可以去生成 4K 画质。你甚至可以按照自己的需求、喜好和风格,为自己定制壁纸。

 

当一个图像模型开始提供分辨率挡位、画幅参数、推理强度拨杆的时候,它就不再是一个「创意工具」,而是一个「渲染引擎」了。 这对两类产品形态会产生直接影响:面向普通用户的模板化出图工具,和面向企业的批量生产系统。

过去靠「套壳 + 流程胶水」建立壁垒的图像工具,接下来的日子可能不太好过。当底层模型自己就能输出结构化、可预测的结果,中间层的价值会被压缩。

另一件事也值得提:Google 在这次发布中继续强化了生成内容的可验证链路——SynthID 水印加 C2PA Content Credentials 的组合。官方透露 Gemini App 里的 SynthID 验证功能已被使用超过 2000 万次。生成式视觉越逼真,验证机制就越得前置,这是一个行业性的基础设施问题,Google 在把它当标配来做。

回到开头的那个问题:图像生成模型的竞争,到底由什么决定?

从 Reuters 此前对 Nano Banana 出圈的报道来看,它确实在短时间内给 Gemini 带来了大量新用户和海量生成量。但「爆款」这种事,偶发性太强。

Nano Banana 2 想做的,恰恰是把偶发性变成确定性:更快、更可控、更容易被调用,铺进尽可能多的产品入口里。它不一定是画得最好的那个模型,但它可能是你「最先碰到」的那个。

在 AI 产品的竞争里,这往往比「最好」更管用。

展示量: 3

Vibe Coding,是怎么「玩废」程序员的?

作者| Moonshot

编辑| 靖宇

「 自然语言就是新的编程语言 。」这句话在过去一年里被无数人奉为圭臬。

特斯拉前 AI 总监 Andrej Karpathy 带火的 「Vibe Coding」(氛围编程)更是让这种狂热达到了顶峰——你不需要懂语法,不需要管实现,只要对着 AI 喊出需求,然后 Check 一下感觉(Vibe)对不对就行了。

听起来,程序员的门槛似乎要被抹平了。

但就在上周,大模型领域的「优等生」、Claude(也是最受欢迎的 Vibe Coding 模型之一)的母公司 Anthropic 居然自己跳出来,给这股热潮泼了一盆冰水。

图源:arxiv

 

他们发了一篇题为《AI 如何影响技能形成》的硬核论文,告诉我们一个残酷的真相: 如果你在学习新东西时过度依赖 AI,你不仅不会变快,你的核心能力还会出现显著退化 。

甚至,你可能正在变成一个「半废」的工程师。

 

01

人是轻松了,脑子也废了

 

Anthropic 的研究员这次很较真,他们找来 50 多位有经验的 Python 程序员,搞了一场「闭卷考试」。

考题是让大家去学一个从来没用过的冷门 Python 库:Trio , 来完成一系列异步编程任务。这完美模拟了程序员在工作中经常遇到的场景:老板突然让你用一个你没见过的工具/框架去解决问题。

程序员被分成了两组:

「手动组」 : 只能看官方文档,用 Google 搜索,严禁使用 AI。

「AI 组」 : 配备了一个基于 GPT-4o 的强大 AI 助手,可以随时提问、让它写代码、修 Bug。

任务结束后,所有人都参加了一场原本用于检验「学习成果」的考试。

考试内容包括编程语法、对代码逻辑的理解、阅读代码的能力,以及调试(Debugging)能力。

大家的第一反应肯定是:AI 组肯定秒杀「土法炼钢」组吧?毕竟这可是 GPT-4o 级别的辅助。

但实验结果出来后,所有人都沉默了 。

无 AI 组问答得分普遍高于 AI 辅助组|图源:Anthropic

 

最明显的结果是:成绩不好。数据显示, 使用了 AI 的那组人,考试得分平均比手写组低了 17% 。

论文中特别提到,分差最大的领域在于调试(Debug)。

这并不意外,毕竟 Vibe Coding 最大的弊端就在于,用户不知道那堆代码是怎么跑起来的,排查和调试都无从下手。

「 好吧,我承认我变菜了,但我至少变快了啊 !」这可能是很多 Vibe Coding 爱好者的最后防线。

很遗憾,Anthropic 的数据再次打脸。报告显示,在完成任务的总耗时上,AI 组和手动组在统计学上没有显著差异:AI 组平均 23 分钟,手动组平均 24.7 分钟。

为什么会这样?我们不是有 AI 加持吗?论文指出了一个被忽视的时间成本:

「 交互税 」。

有些程序员为了让 AI 写出完美的代码,花了大量时间在「写提示词」上 。数据显示,有人甚至花了 11 分钟在跟 AI 聊天,或者在一项 35 分钟的任务里,花了 30% 的时间在构思怎么问问题。

「时价比」不高,花费的时间并没有转换成得分|图源:Anthropic

 

再结合上 Vibe Coding 最短的短板——Debug 困难。AI 组很容易陷入试错式调试(Iterative Debugging) 的循环:AI 生成代码-报错了-把报错丢给 AI:「解决一下这个 bug」-AI 再生成-又报错了……

最后整个工程变成了不可逆转的「屎山黑箱」(「屎山代码」指一种混乱、难以理解和维护的代码状态,「黑箱」则指不知道内部结构的系统)。

在这个过程中,时间一分一秒流逝,而程序员的大脑处于一种「挂机等结果」状态,既没有节省时间,也没有学到东西。

到这儿你可能对 Vibe Coding 祛魅了?别急,这篇论文最精彩的部分,在于它通过录屏分析,把使用 AI 的程序员分成了六种流派。

研究员发现,虽然 AI 组平均分低,但组内方差极大。

有的人「废」了,有的人却「超神」了。区别全在于怎么用 AI 。

 

02

代码没编好,

用户画像倒是有了

 

第一类用户都可以归为「AI 废人」的低分低能组,考试得分极其惨烈,平均分都在 40% 以下(不及格)。

这一大类里还能细分为三个小类,分别是:

  • 甩手掌柜型 (AI Delegation): 直接把题目复制给 AI,「帮我写个函数解决这个问题」,然后 Ctrl+C / Ctrl+V,直接交卷。他们任务完成速度确实最快(平均 19.5 分钟),但学到的东西几乎为零,我奶奶来做都能行。
  • 半途而废型 (Progressive AI Reliance): 刚开始还想自己试试,写了两行发现报错,心态崩了:「算了,AI 你来吧。」然后彻底躺平。
  • 盲目试错型 (Iterative AI Debugging): 这是最典型的「无脑 Vibe」。遇到 Bug 不看回溯,直接把报错扔给 AI。AI 给出的代码看都不看就运行,不对再扔。这是也是最惨的一群人。浪费了大量时间后拿了个低分,完全成了 AI 的「人肉测试员」。

第二类用户就乐观多了,虽然用了 AI,但考试成绩甚至能和手写组持平(65% – 86%),寻找到了人机共生的解决方案。

拿 AI 作「辅助驾驶」的三类人得分更高|图源:Anthropic

 

这一大类里也能细分为三个小类:

  • 打破砂锅型 (Conceptual Inquiry): 他们几乎不让 AI 写代码。 他们只问概念:「为什么要用 await?」「这是什么原理?」搞懂了原理,再自己手写。这是真正的「把 AI 当导师」,而不是当实习生,而且这种 Vibe Coding 也得需要用户真的「懂行」、「会问」。
  • 先斩后奏型 (Generation-Then-Comprehension): 让 AI 写代码,但在复制粘贴之前,他们会追问:「解释一下这行代码为什么这么写?」这么一句,就能让 AI 先自审一遍,自己也能看到 AI 的编程思路,把 AI 的输出转化为了自己的知识。
  • 混合双打型 (Hybrid Code-Explanation): 融合了上面两个类型的特点,会写「请写出代码,并解释每一步的逻辑。」这种提示词,强制 AI 输出推理思维链,让自己跟上 AI 的思路,也便于去 Debug。

为什么用的是同一个 AI,人和人的差距这么大?

或许并不是 AI 废掉了程序员, 而是我们自己在「偷懒」的诱惑面前,主动选择了缴械投降 。

 

03

Vibe Coding 的代价是

 

Anthropic 的这篇报告,其实触及了一个心理学概念:

认知卸载(Cognitive Offloading) 。

即当工具足够强大时,我们会下意识地把原本需要大脑处理的计算、记忆、逻辑推演任务,「卸载」给工具,就像自动驾驶一样。

在 AI 时代,我们正在把「理解力」卸载给大模型。

论文里用了个比喻:AI 就像一副「外骨骼」,当你穿着它时,你力大无穷,能搬起千斤重。但问题在于,肌肉的生长需要负重和撕裂,如果你长期穿着它不脱下来,你的肌肉就会因为缺乏刺激而萎缩。

研究认为,过度依赖 AI 会直接跳过思考过程|图源:Anthropic

 

这篇论文中有一个非常不起眼、但细思极恐的数据: 报错数量 。

手动组在做任务时,平均每人遇到了 3 次报错。所以他们被迫停下来,盯着红色的报错信息,去查文档、去思考「为什么类型不匹配」、「为什么线程没挂起」。

而 AI 组平均每人只遇到了 1 次报错,大多数时候,AI 给出的代码不仅能跑,而且跑得极其顺滑。

AI 组的报错显著少于无 AI 组|图源:Anthropic

 

这听起来是 AI 的优点?不,Anthropic 的研究员指出,这恰恰是问题的根源。

论文明确写道:「 遭遇并独立解决错误,是技能形成的关键一环 。」

手动组之所以学得好,是因为他们经历了「摩擦」。每一次报错,都是现实世界给思维的一次「阻力」。正是为了克服这种阻力,大脑被迫建立了深刻的心理表征(认知心理学术语,指当外部信息进入人脑之后,它会被我们的大脑加工,以一种特别的结构储存在大脑中)。

而 AI 组的体验就太「平滑」了。但代价是,你失去了对地面的「抓地力」:脱下外骨骼,路都不会走了。

这种「AI 过于平滑」的通病,不仅仅存在于编程中,正在蔓延到我们生活的方方面面。

在编程里,它消除了 Debug 的痛苦,让你误以为自己掌控了系统;在创作里,它消除了构思的枯燥,让你误以为自己拥有了创意;在人际关系里,它甚至也在消除「摩擦」 。

就像很多 AI 成瘾的问题,都源自于 AI 永远情绪稳定,永远秒回,永远顺着你的话说,这种极致的「平滑关系」,何尝不是一种 Vibe Social。

 

04

「我行我上」的幻觉

 

Vibe Coding 最迷人也最危险的地方,在于 它制造了一种「快乐但无知」 (Happy but Ignorant) 的幻觉 。

论文中提到了参与者们微妙的心理变化:AI 组的参与者普遍觉得任务「更容易」,「手动组」则觉得任务很难,过程很痛苦。

但反转来得很干脆:那些觉得「容易」的人,在随后的测试中一塌糊涂;而那些觉得「困难」的人,虽然过程煎熬,但自我报告的「学习和成长感」 却更高,分数也更高。

所以 Vibe Coding 让你在写代码的过程中感觉自己是个天才,直到代码报错的那一刻,你才发现自己只是个「睁眼瞎」 。

在面对「未知」时,AI 是公平的,它会平等地「废掉」每一个试图偷懒的大脑,无论这个大脑曾经多么睿智。

研究人员按照编程经验将参与者分成了三层:1-3 年、4-6 年、7 年以上。

结果数据显示,在所有经验层级中,不使用 AI 的组,考试得分都高于使用 AI 的组。

哪怕是资深工程师,在 AI 辅助下得分也低于无 AI 组|图源:Anthropic

 

这意味着,即使你是入行 7 年以上的老鸟,在面对一个全新的技术领域时,如果过度依赖 AI,你的学习效果依然会大打折扣。

当然了,Anthropic 的这篇论文也不是让我们因噎废食,退回到手写代码的时代。

它更像是一份「AI 时代生存指南」。想要不被 AI「废掉」,我们需要改变使用习惯,从报告中的「高分高能组」那里取经:

比如 多问「为什么」,少说「帮我做」 ;哪怕是 AI 生成的代码,也要像审视同事的代码一样,逐行阅读,理解代码逻辑;珍视 Debug 的机会,下次遇到 Bug,试着先自己分析 5 分钟,而不是 5 秒钟后就截图发给 ChatGPT。

AI 确实能让我们跑得更快,但前提是,你得知道路在哪里,以及车坏了该怎么修。

毕竟, 当自动驾驶失效的时候,只有那个还没忘记怎么握方向盘的人,才能救全车人的命 。

展示量: 13

文章分页

1 2 … 114 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间