Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

标签: 科技

消息称腾讯未考虑收购 Nexon;追觅否认「断指计划」;李国庆与俞渝就财产分割达成最终和解

甲骨文创始人成全球第二大富豪:仅次于马斯克

6 月 13 日消息,据媒体报道,甲骨文公司联合创始人兼董事长拉里·埃里森以单日净资产飙升 260 亿美元的纪录,成为全球第二富豪,其总财富达 2430 亿美元。

这一增长使他超越亚马逊创始人杰夫·贝佐斯(2270 亿美元)和 Meta 首席执行官马克·扎克伯格(2390 亿美元),仅次于特斯拉 CEO 埃隆·马斯克。

此次财富跃升源于甲骨文周三发布的超预期财报:截至 5 月的财季利润和销售额均表现强劲,推动其股价周四大涨逾 13%,收于 199.86 美元。

分析师评价此为甲骨文的「分水岭」时刻,强调埃里森在云计算转型中的领导力,尤其是公司通过 AI 技术突破占据关键地位。

分析师指出,2026 财年将成为甲骨文云基础设施服务的「重大拐点」。增长动力包括 xAI、Meta 等客户的大规模订单,以及为「星际之门」AI 项目提供算力支持的规模化交付,凸显甲骨文在下一代技术竞争中的战略布局。(来源: 快科技)

 

消息人士称「腾讯并未考虑收购 Nexon」

6 月 13 日消息,彭博社此前报道称,腾讯研究以 150 亿美元(现汇率约合 1076.59 亿元人民币)收购韩国游戏开发商 Nexon,腾讯已接洽控股家族商讨潜在收购事宜。

对此,有接近腾讯的消息人士对贝壳财经透露,「腾讯没有与创始人的家族联系讨论交易,也没有考虑收购 Nexon。」

Nexon 是一家韩国游戏公司,成立于 1995 年 5 月,主要的作品有《潜水员戴夫》《蔚蓝档案》《洛奇》《洛奇英雄传》《地下城与勇士》《泡泡堂》《跑跑卡丁车》《冒险岛》等。

腾讯与 Nexon 有着长久合作,比如经典的《地下城与勇士》游戏国服就是由腾讯代理。

2022 年 12 月 19 日,Nexon 宣布与腾讯云达成合作,基于腾讯云的实时音视频(TRTC)技术,共同搭建虚拟世界社区平台 NEXONTOWN。(来源:IT 之家)

 

消息称 TikTok 去年营收 230 亿美元 同比大增超过 40%

6 月 13 日消息,据外媒报道,字节跳动旗下的短视频社交平台 TikTok,在海外市场备受欢迎,自推出以来已有大量的用户,尤其是年轻用户。

对于 TikTok 的用户数量,有数字智能和应用程序数据分析机构在当地时间周三发布的报告中披露,他们在全球的月活跃用户已有 11.6 亿。

从外媒的报道来看,TikTok 在全球的 11.6 亿月活跃用户,是截至今年 5 月份的月活跃用户,增长了 2%。

月活跃用户超过 10 亿的 TikTok,也已有可观的营收,有外媒的报道显示,TikTok 去年的营收预计在 230 亿美元,同比增长 42.8%,其中的 77% 是来自广告,余下部分来自电商和应用内购买。(来源: TechWeb)

 

苹果自研芯片将添新成员,消息称 iPhone 17 Pro 系列将搭载自研 Wi-Fi 7 芯片

6 月 13 日消息,据外媒报道,苹果公司去年秋季推出的 iPhone 16 系列智能手机,全系支持 Wi-Fi 7,允许设备在支持的路由器上同时通过 2.4GHz、5GHz 和 6GHz 频段发送和接收数据,从而实现更快的 Wi-Fi 网速、更低的延迟和更可靠的连接,峰值网速在理论上可超过 40 Gbps,是 Wi-Fi 6E 的 4 倍。

从苹果此前的 iPhone 来看,在去年秋季推出的 iPhone 16 系列就已全系支持 Wi-Fi 7 的情况下,后续几年推出的就都将支持,直到下一代的 Wi-Fi,因而今年秋季将推出的 iPhone 17 系列,也就将继续支持 Wi-Fi 7。

但从外媒最新的报道来看,今年秋季将推出的 iPhone 17,除了支持 Wi-Fi 7,高端的 iPhone 17 Pro 和 iPhone 17 Pro Max,还将采用苹果自研的 Wi-Fi 7 芯片。

虽然外媒在报道中并未提及苹果自研的 Wi-Fi 7 芯片性能如何,但他们提到这一部件转向自研,就将减少对博通等厂商的依赖,博通目前是苹果 iPhone 的 Wi-Fi 和蓝牙芯片供应商。。(来源: TechWeb)

单日最高播放量超 800 万,阅文短剧再冲榜首

6 月 13 日消息,近日,由阅文短剧和阅文白金作家公子衍旗下工作室「壹拍即火」联合出品的《母凭子贵后被老板全家宠上天》(以下简称《母凭子贵》)登云合数据微剧有效播放霸屏榜周榜第一,成行业爆款新剧,单日最高播放量超过 800 万,上线一周超过百万收藏。

据悉,目前阅文短剧已联合公子衍打造了多部现象级作品,年初的《好孕甜妻被钻石老公宠上》上线 7 天总流水破 5000 万,刷新平台投流纪录;改编自公子衍同名作品的《叮!我的首富老公已上线》流水近三千万。

今年 3 月底,阅文短剧宣布进行业务升级,开放 2000 余部网文 IP 打造优质短剧,并发布了首批 300 部网文 IP 名单。这是继此前阅文短剧宣布开放 150 部网文 IP 共创后,再次增加了 IP 的数量及题材。(来源: TechWeb)

 

追觅科技否认「断指计划」等:公司遭上万篇黑公关稿件攻击,悬赏百万征集线索

6 月 13 日消息,追觅法务部发布两则声明:公开征集「黑公关」、「黑媒体」行为的线索和证据,对核实有效的提供者奖励 1 万至 100 万元。

(来源:IT 之家 )

 

当当网创始人李国庆与俞渝就财产分割达成最终和解,宣布进军 AI 领域

6 月 13 日消息,当当网创始人李国庆宣布和俞渝女士已于 2023 年解除了婚姻关系。近日,作为离婚案延续,双方就相关财产分割也已达成最终和解。此外,他还宣布将积极布局 AI 应用。

1999 年,李国庆与俞渝回国创立当当网。2019 年 2 月 20 日,李国庆发表公开信,宣布离开当当网,11 月底李国庆与俞渝的离婚案在北京开庭。2020 年 6 月,两人离婚案在东城区人民法院进行二审开庭审理。2023 年 12 月底,李国庆在节目《问答八方》中透露自己已离婚。(来源:IT 之家)

 

特斯拉起诉前 Optimus 机器人工程师,指控其窃取商业机密

6 月 13 日消息,据彭博社报道,特斯拉日前起诉一名前工程师 Zhongjie「Jay」Li,指控其窃取「Optimus」人形机器人项目的核心技术机密,并借此创办了竞争性初创公司。

这起诉讼于当地时间周三提交。诉状称,Zhongjie 利用特斯拉在「先进机械手传感器」领域的研发成果,创立了初创企业 Proception。该公司获得 Y Combinator 支持,专注于研发机械手技术。

根据诉状,他于 2022 年 8 月加入特斯拉,并于 2024 年 9 月离职。在此期间,他曾使用两部个人手机下载 Optimus 相关的机密资料。

诉状还指出,他在任职后期,多次利用公司电脑查询机械手的相关资料,并上网搜索风投与初创融资的资讯。

诉状写道:「他离职不到一周,Proception 就完成注册。短短五个月后,Proception 便公开宣称已『成功制造』出先进的机械手——其外形与他在特斯拉参与设计的版本极为相似。」

Proception 官网显示,公司目标是「通过打造全球最先进的机械手,彻底革新人机交互体验」。(来源: IT 之家)

vivo X Fold5 三配色真机照公布:轻薄机身+大圆相机模组简约大气

去年 3 月,vivo 带来了 vivo X Fold3 系列折叠屏手机,首发搭载了第三代高通骁龙 8 旗舰芯片,是全球首款搭载骁龙 8 Gen3 芯片的折叠屏手机。

日前,vivo 官方宣布,将于 6 月 25 日 19:00 举办新品发布会,届时新一代的 vivo X Fold 5 将正式与大家见面。现在有最新消息,近日官方进一步晒出了该机的全配色真机图。

据 vivo 官方最新发布的信息显示,全新的 vivo X Fold5 将推出三款配色,包括青松、明白、钛度,同时,机身背部的后置相机模组将继续采用熟悉的环形镜头设计,同时模组中央印有蔡司和 T*镀膜标识,整体简约大气。

该机将继续主打轻薄,并再次刷新重量纪录,重量不到 219g。而且在做到极致轻薄的同时,vivo X Fold5 没有阉割影像,将把一颗超越 X Fold3 Pro 的潜望长焦放进了比 X Fold3 更轻薄的机身里,单边厚度只有 4.Xmm。(来源: TechWeb)

 

61 万元起售,特斯拉 Model S/X 改款亮相:续航提升至 660 公里

6 月 13 日消息,特斯拉宣布推出改款 Model S 和 Model X,新增「寒霜蓝」金属漆配色。

Model S 全轮驱动版起售价 84990 美元(约合 61 万元人民币),Plaid 版起售价 99990 美元(约合 71.8 万元人民币);

Model X 全轮驱动版起售价 89990 美元(约合 64.6 万元人民币),Plaid 版起售价 104990 美元(约合 75.4 万元人民币)。

改款车型在续航、隔音、空气动力学、内饰等方面进行了升级。Model S Long Range 续航提升至 660 公里,创下特斯拉续航新高。全车隔音效果增强,风噪与路噪进一步降低,主动降噪系统更高效。

全新轮毂设计与空气动力学优化提升了续航表现,车头新增摄像头带来更广阔的视野,动态氛围灯系统在车辆解锁时呈现专属灯光动画。

整体来看,Model S Plaid 外观焕新,更注重高速稳定性,Model X 第三排空间进一步优化,乘坐与储物更舒适。(来源: 快科技)

 

Google 测试将搜索结果转化为 AI 生成的播客

Google 正在推出一项测试服务,将其人工智能驱动的音频概览置于移动搜索结果首页。用户可以在实验室中启用该实验,它将允许用户针对特定查询生成人工智能播客风格的讨论。

如果用户搜索「降噪耳机是如何工作的?」之类的内容,Google 会在「人们还问」模块下方显示一个按钮,上面写着「生成音频概览」。据 Google 称,点击该按钮后,最多需要 40 秒才能生成音频概览。

完整的音频概览将显示在搜索结果中嵌入的小型播放器中,用户可以在其中播放、暂停、静音并调整片段的播放速度。与 NotebookLM 和 Gemini 上的音频概览类似,它也包含两位 AI 生成的「主持人」,他们会讨论用户想深入了解的主题。用户还可以在搜索的播放栏下方找到音频概览中使用的部分来源的链接。

目前,搜索中的音频概览功能仅在美国提供英语版本。(来源:cnBeta)

PlayStation 似乎正在取消 PC 游戏的锁区限制

将 PlayStation 的第一方、主机独占游戏移植到 PC 上,一直以来都备受关注,因为这能让更多玩家在他们喜欢的平台上畅玩游戏。

但该公司新的多平台策略却受到了 PlayStation 的阻碍,因为它试图强迫玩家将他们的 Steam 账户与 PlayStation Network 账户关联起来,并阻止其游戏(甚至是其独自发布的游戏,如 Stellar Blade)在 PSN 无法使用的 100 多个国家/地区销售。

这最初是《绝地潜兵 2》的一个主要问题,此后也成为 PlayStation 游戏每次移植到 PC 平台的讨论焦点。然而,正如 Wario64 所发现的,PlayStation 似乎开始看到曙光。《战神:诸神黄昏》、《最后生还者 2 重制版》、《漫威蜘蛛侠 2》和《绝地潜兵 2》的地区限制均已取消。

希望这预示着,在 PC 上玩 PlayStation 游戏时不必再讨论锁区问题。最近发布的《往日不再》重制版并没有设置锁区,而现在旧版游戏也取消了锁区功能。

这对所有参与者来说都是好事。(来源:cnBeta)

 

浏览量: 9

聊透 Agent,它是「同事」还是「工具」,创业机会和价值究竟是什么?

2025 年,是 Agent 按下加速键的一年。

从年初 DeepSeek 引发的惊叹,到 GPT-4o 和 Claude 3.5 接连登场,大模型的边界一次次被重写。但真正让 AI 产业链神经绷紧的,不是模型的性能迭代,而是 Agent 的横空出世。

Manus、Devin 等产品的爆火,都在重申一个共识: 大模型将不再只是工具,而是要成为可以自我调度的智能体 。

Agent 由此成为继大模型之后,全球科技圈最快形成共识的第二个风口。

从巨头的战略重构到创业赛道的快速跟进,Agent 正成为下一个全民下注的方向。但在 C 端产品密集涌现、开发者为其狂热的同时,真正跑通用户价值闭环的项目却凤毛麟角,越来越多的产品陷入了「用老需求套新技术」的焦虑。

热浪过后,市场也回归冷静:Agent 究竟是一场范式的重构,还是一次新的包装?所谓「通用」与「垂直」的路径分野,是否真的带来可持续的市场空间?而「新入口」背后,是交互方式的进化,还是旧世界的投影?

顺着这些疑问继续下探,我们会发现,Agent 的真正门槛,或许并不在模型能力,而在其赖以生存的底层设施。从可控运行环境,到记忆系统、上下文感知、工具调用,每一个基础模块的缺位,都是 Agent 从演示走向实用的最大阻力。

这些底层工程问题,构成了 Agent 从「潮流玩具」走向「生产力工具」的最大阻碍,也恰恰是当下最确定、最高价值的创业蓝海。

在这样一个供给溢出、需求未明的阶段,我们想借由这场对谈,回答一个越来越紧迫的问题: Agent 的真问题与真机会,究竟藏在哪些地方?

在本次深度对谈里,我们邀请到了身处一线的 拾象科技 创始人李广密 与 拾象科技 AI Research Lead 钟 凯祺 ,两位从业者将从产品形态、技术路径、商业模式、用户体验乃至 Infra 构建等多个维度,为我们拆解当下 Agent 的真问题与真机会。

我们将跟随他们的思考,探寻在巨头环伺的牌桌上,创业公司的真实机会藏于何处;一条从「Copilot」平滑过渡到「Agent」的务实成长路径是如何被一步步验证的 ;以及为何 Coding(编码)这一看似垂直的领域,却被视作通往 AGI 的「价值高地」与「关键指标」。

最终,这场对话将推向更远的未来,一窥人与 Agent 之间全新的协作关系,以及构建下一代智能基础设施所面临的核心挑战与无限机遇。

要点精选

  • 通用 Agent 领域做得最好的是「模型即 Agent」(Model as Agent)。
  • 做 Agent 这件事,并不一定要「以终为始」,一开始就瞄着完全自动化的 Agent 去做,它可以先从 Copilot 做起。在这个过程中收集用户数据、做好用户体验、占领用户心智,然后慢慢地转型。
  • AGI 有可能最先在 Coding(编码)环境下实现,因为这个环境最简单,它能锻炼 AI 的核心能力。Coding 是这个世界里的「万用之机」,有了它,AI 就可以去构建和创造。Coding 有可能拿走整个大模型产业阶段性 90% 的价值。
  • AI Native 的产品不只是给人用的,它必须同时服务于 AI。一个真正的 AI Native 产品,应该是内建了服务 AI 和人类的双向机制。
  • 今天的 AI 产品正在从「工具」走向「关系」。人不会和工具建立关系,但会和一个有记忆、懂你、能与你「心有灵犀」的 AI 建立关系。

以下为当天《今夜科技谈》直播沉淀,由极客公园整理。


 

01

热潮之下,哪些 Agent 产品已崭露头角?

 

张鹏 : 在过去一段时间,所有人都在讨论 Agent,认为这可能是现阶段的一个重要议题,也是创业公司的难得发展机会。

我看到拾象科技对 Agent 体系做了比较深入的研究,也体验和分析了很多相关产品。我想先听听两位,最近哪些 Agent 相关的产品给你们留下了比较深刻的印象?为什么?

李广密 :我自己印象最深的是两个:一个是 Anthropic 的 Claude 在编程能力上的表现,另一个是 OpenAI ChatGPT 的 Deep Research 功能。

关于 Claude,主要是它的编程能力。我有一个观点: 编程(Coding)是衡量 AGI 最关键的先验指标。 如果 AI 不能规模化、端到端地进行软件应用开发,那么在其他领域的进展也会比较慢。我们必须先在 Coding 这个环境下实现很强的 ASI(Artificial Superintelligence),其他领域才可能加速。或者说,我们先在数字环境下实现 AGI,再拓展到其他领域。

全球首位 AI 程序员 Devin|图源:Cognition Labs  

 

关于 Deep Research,它对我自己的帮助非常大,我几乎每天都在用。它其实就是一个搜索 Agent,帮我检索了大量的网页和资料,体验很好,极大地拓展了我的研究空间。

张鹏 : 凯祺 ,从你的视角看,哪些产品给你留下了深刻印象 ?

钟 凯祺 (Cage) :我可以介绍一下我平时观察和使用 Agents 的思维模型,然后在每个分类下介绍一两个代表性产品。

首先,大家经常会问:通用 Agent 还是垂直 Agent? 我们认为通用 Agent 领域做得最好的是「模型即 Agent」(Model as Agent)。 比如广密刚才提到的 OpenAI 的 Deep Research,以及 OpenAI 新发布的 o3 模型,它其实就是一个标准的「模型即 Agent」的范例。它把 Agent 的所有组件——大语言模型(LLM)、上下文(Context)、工具使用(Tool Use)和环境(Environment)——全都缝合到了一起,并进行了端到端的强化学习训练。训练之后的结果就是,各类 Agent 执行信息检索的任务它都能完成。

所以我的一个「暴论」是:通用 Agent 的需求基本上就是信息检索和轻度代码编写这两类,而 GPT-4o 已经完成得非常好了。因此, 通用 Agent 市场基本上是大模型公司的主战场,创业公司很难仅仅服务于通用需求来做大。

让我印象比较深刻的创业公司基本都聚焦在垂直(Vertical)领域。

如果我们先说 ToB 的垂直领域,可以 类比人的工作 分为前台工作和后台工作 。

后台工作的特点是重复性强、对高并发要求高,通常有一条很长的 SOP(Standard Operating Procedure),其中很多任务非常适合 AI Agent 去一对一地执行,并且适合在比较大的探索空间里进行强化学习。这里比较有代表性的,我想分享的是一些面向 AI for Science 的创业公司,他们做的是 Multi-agent system(多智能体系统)。

在这个系统里,各种科研任务都包含在内,比如文献检索、实验规划、预测前沿进展以及数据分析等。它的特点是,不再是像 Deep Research 那样的单个 Agent,而是一个非常复杂的、能针对科研系统做到更高分辨率的系统。它有一个很有意思的功能叫「Contradiction Finding」,可以处理对抗性的任务,例如发现两篇顶级期刊论文之间的矛盾之处。这代表了研究型 Agent 里一种非常有意思的范式。

前台工作很多时候是和人打交道,需要做外联,目前比较适合的是语音 Agent,例如医疗领域的护士电话回访、招聘、物流沟通等。

这里我想分享一家叫 HappyRobot 的公司,他们找到了一个听起来很小的场景,专门在物流和供应链领域做电话沟通。比如,一个卡车司机遇到问题,或者货到了之后,Agent 能快速给他打电话。这里发挥了 AI Agent 一个很特别的能力:7 天 24 小时无间断地响应并快速做出反应。这对于物流的大部分需求来说已经足够了。

除了以上两大类,还有一些比较特别的,比如 Coding Agent。

 

02

从 Copilot 到 Agent,

是否存在一条更务实的成长路径?

 

钟凯祺: 在代码开发这个领域,最近创业热情很火热,一个很好的例子是 Cursor。Cursor 1.0 的发布,基本上把一个原来看起来是 Copilot(辅助驾驶)的产品,变成了一个完全的 Agent 产品。它能后台异步操作,有记忆功能,这正是我们对 Agent 的想象。

它和 Devin 的对比很有意思,给我们的启发是: 做 Agent 这件事,并不一定要「以终为始」,一开始就瞄着完全自动化的 Agent 去做,它可以先从 Copilot 做起。在这个过程中收集用户数据、做好用户体验、占领用户心智,然后慢慢地转型。 国内做得不错的,像 Minus AI,他们最早的产品也是从 Copilot 形态做起的。

最后,我还会用「环境」这个思维模型来区分不同 Agent。比如,Manus 的环境是虚拟机(Virtual Machine),Devin 的环境是浏览器,flowith 的环境是笔记本,SheetZero 的环境是表格,Lovart 的环境是画布等等。这个「环境」就对应了强化学习里的环境定义,这也是一种值得参考的分类方式。

国内初创团队打造的 flowith |图源:flowith  

 

张鹏:我们深入聊聊 Cursor 这个例子,它背后的技术栈和成长路径是怎样的 ?

钟 凯祺 (Cage) :自动驾驶的例子就很有意思,直到今天,特斯拉也不敢真的把方向盘、刹车和油门去掉。这说明在很多关键决策上,AI 还没办法完全超越人类。 只要 AI 的能力和人类差不多,一些关键决策就一定需要人类介入。这正是 Cursor 一开始就想得比较明白的地方。

所以他们最早贴合的特性,就是一个人类最需要的功能:自动补全(Autocompletion),它把这个功能做成了 Tab 键触发,随着 Claude 3.5 这样的模型出来,Cursor 把 Tab 的准确率提高到 90% 以上。在这种准确率下,我可以在一个任务流中连续使用 5 到 10 次,心流体验就出现了。这是 Cursor 作为 Copilot 的第一个阶段。

第二个阶段,他们做的功能是代码重构(Code Refactoring)。Devin 和 Cursor 都想做这个需求,但 Cursor 做得更巧妙。它会跳出一个对话框,当我输入需求时,它可以在文件外开启一个平行的修改模式来重构代码。

这个功能刚出来时准确率也不高,但因为用户对它的预期是 Copilot,所以大家都能接受。而且他们很准确地预判到,模型的 coding 能力一定会快速提升。所以他们一边打磨产品功能,一边等待模型能力提升,Agent 能力就很顺利地浮现了。

第三步就是我们今天看到的 Cursor 状态了,一个相对端到端的、在后台(background)运行的 Agent。它背后有一个像沙盒一样的环境,我甚至可以在上班时把不想做的任务布置给它,它可以在后台用我的计算资源去完成,与此同时,我能专注于自己最想做的核心任务。

最后,它以异步交互的形式,像发邮件或飞书消息一样,把结果告诉我。这个过程很顺利地实现了从 Copilot 到 Autopilot(或者说 Agent)的转型。

关键还是要抓住人的交互心智,从一开始让用户更乐于接受同步交互,这样就能收集到大量的用户数据和反馈。

 

03

为何 Coding 是通往 AGI 的「关键试炼场」?

 

张鹏:广密刚才说「Coding 是通向 AGI 的关键,如果不能在这个领域实现 ASI(超级智能),其他领域也很难。」为什么?

李广密 :有几个逻辑。第一,Code 这个数据是最干净、最容易闭环,并且结果是可以验证的。我有一个猜想,Chatbot 可能没有数据飞轮(一种反馈循环机制,通过从交互或流程中收集数据,持续优化 AI 模型,进而产生更优的结果和更有价值的数据)。但 Code 领域有机会跑出数据飞轮,因为它可以进行多轮的强化学习,而 Code 是跑多轮强化学习的关键环境。

我一方面把 Code 理解成编程工具,但更愿意把它理解成一个实现 AGI 的环境。AGI 有可能最先在这个环境下实现,因为这个环境最简单,它能锻炼 AI 的核心能力。如果 AI 连一个端到端的应用软件开发都做不了,那在其他领域就更难了。 如果它在未来一段时间无法大规模替代基础的软件开发工作,那在其他领域也很难。

而且,coding 能力上来了,模型的指令遵循能力也会上来。比如处理很长的 prompt,Claude 就明显要强一些,我们猜测这跟它的 coding 能力有逻辑关系。

另外一个点,我想未来的 AGI 会先在数字世界实现。未来两年,Agent 能做人在手机和电脑上操作的几乎所有事情。一方面通过简单的 coding 完成,如果不行,它还可以调用其他虚拟工具。所以,先在数字世界里实现 AGI,让它跑得比较快,这是一个大的逻辑。

 

04

如何判定一个好 Agent?

 

张鹏:Coding 是这个世界里的「万用之机」,有了它,AI 就可以去构建和创造。而且编程这个领域相对结构化,适合 AI 发挥。当评价一个 Agent 的好坏时,除了用户体验,你们会从什么视角去评价一个 Agent 的潜力?

钟 凯祺 (Cage) :一个好的 Agent 首先得有一个环境来帮助构建数据飞轮,而且这个数据本身要是可验证的。

最近 Anthropic 的研究员提得比较多一个词叫 RLVR(Reinforcement Learning from Verifiable Reward),其中的「V」就是指可验证的回报。代码和数学就是非常标准的可验证领域,任务做完后,立马能验证对错,数据飞轮就自然地建立起来了。

数据飞轮的工作机制|图源:英伟达  

 

所以,构建一个 Agent 产品,就是要构建这样一个环境。在这个环境里,用户执行任务的成功或失败都不重要,因为现在的 Agent 一定会失败。关键是在失败时,它能收集到有信号的数据,而不是噪音数据,来指导产品本身的优化。这些数据甚至可以作为强化学习环境的冷启动数据。

第二,产品是否做得足够「Agent Native」。就是说,在设计产品时,要同时思考人和 Agent 的需求。一个典型的例子是 The Browser Company,它为什么要做一款新的浏览器?因为之前的 Arc 纯粹是为了提升人类用户的效率而设计的。而他们新的浏览器在设计时,很多新功能未来是能给 AI Agent 自己使用的。当产品的底层设计逻辑发生改变,这就非常重要了。

从结果上来说,客观评估也很关键。

  1. 任务完成率+成功率
  2. :首先任务得能跑完,这样用户至少能收到一个反馈。其次是成功率。一个 10 步的任务,如果每一步准确率都是 90%,那最终成功率只有 35%。所以必须优化好每一步之间的衔接。目前行业里一个及格线可能是五成以上的成功率。
  3. 成本和效率
  4. :包括计算成本(token cost)和用户的时间成本。如果 GPT-4o 跑一个任务 3 分钟,而另一个 Agent 要跑 30 分钟,这对用户是很大的消耗。而且这 30 分钟里,算力消耗是巨大的,这会影响规模效应。
  5. 用户指标
  6. :最典型的是用户粘性。用户在尝鲜后是否愿意反复使用?比如日活/月活(DAU/MAU)比例、次月留存率、付费率等,这些是避免公司只有「虚假繁荣」(five minutes of fame)的根本指标。

李广密 :我再补充一个视角:Agent 与当前模型能力的匹配程度。今天 Agent 80% 的能力依赖于模型这个引擎。比如,GPT 到了 3.5,多轮对话的通用范式出现了,Chatbot 这种产品形态就行得通了。Cursor 的崛起也是因为模型发展到了 Claude 3.5 的水平,它的代码补全能力才得以成立。

像 Devin 其实出来就得偏早了,所以创始团队对模型能力的边界理解非常重要,要清楚今天以及未来六个月模型能到哪一步,这与 Agent 能实现的目标息息相关。

张鹏:什么叫「AI Native」的产品?我觉得 AI Native 的产品不只是给人用的,它必须同时服务于 AI。

换句话说, 如果一个产品里没有合理的数据去调试,没有为未来 AI 的工作环境做搭建,那它只是把 AI 当成一种降本增效的工具,这样的产品生命力是有限的,很容易被技术浪潮淹没。一个真正的 AI Native 产品,应该是内建了服务 AI 和人类的双向机制。 简单来说,AI 在服务用户的时候,用户有没有也在服务 AI?

钟 凯祺 (Cage) :我非常喜欢这个概念。Agent 的数据在现实世界里是不存在的,没有人会在完成任务时把思考过程一步步拆解清楚。那怎么办?一个方法是找专业的标注公司,另一个方法就是要撬动(leverage)用户,把用户的真实使用方式和 Agent 自身的运行过程捕捉下来。

张鹏:那如果要通过 Agent 的方式让人类给 AI「投喂」数据,什么样的任务是最有价值的?

钟 凯祺 (Cage) :与其想着用数据服务 AI,不如想 AI 有什么长板应该被放大。比如科学研究,在 AlphaGo 之前,人类觉得围棋和数学是最难的。但用了强化学习之后发现,这些对 AI 反而是最简单的。在科学领域也一样,人类历史上已经很久没有一个学者能通晓每个学科的犄角旮旯了,但 AI 可以。所以我认为,科学研究这类任务对人类来说很难,但对 AI 不一定难。正因如此,我们才要多找一些数据和服务来支持它。这类任务的回报比大部分任务更 verifiable,未来甚至可能是人类帮 AI「摇试管」,然后告诉 AI 结果是对是错,帮助 AI 一起去点亮科技树。

李广密 :一开始的数据冷启动是必要的。做一个 Agent 就像做一个创业公司,创始人肯定要做冷启动,要亲力亲为。接下来,搭建环境就很重要,决定了 Agent 往哪个方向走。再往后,更重要的是搭建奖励(Reward)系统。我觉得环境和奖励这两个因素非常关键。在这个基础上,Agent 的创业者做好这个 Agent 的「CEO」就好了。今天 AI 已经能写出人类看不懂但能运行的代码,我们不一定非要理解强化学习端到端的逻辑,只要搭好环境、设好奖励就行。

 

05

Agent 的商业模式将走向何方?

 

张鹏:最近我们看到很多 ToB 领域的 Agent,尤其是在美国,它们的商业模式和增长模式有什么变化吗?还是有新的模式出现?

钟 凯祺 (Cage) :现在最大的一个特点就是,有越来越多的产品从偏 C 端切入,在公司组织里自下而上(bottom-up)地被使用。最典型的就是 Cursor。除了它,还有很多 AI Agent 或 Copilot 产品,大家愿意自己先用起来。这就不再是传统 SaaS 那种需要先搞定 CIO、一对一签单的模式了,至少第一步不是这样。

另一个有意思的产品是 OpenEvidence,他们做的是医生这个群体。他们先把医生群体打下来,然后渐渐植入医疗器械和药品的广告。这些业务不需要一开始就和医院谈,因为和医院谈非常慢。AI 创业最关键的就是速度,光靠技术护城河是没用的,需要通过这种自下而上的方式增长。

AI 医疗独角兽 OpenEvidence|图源:OpenEvidence  

 

关于商业模式,现在有一个趋势,就是慢慢地从基于成本(Cost-based)定价走向基于价值(Value-based)定价。

  1. 基于成本
  2. :这像传统云服务,在 CPU/GPU 成本之上加一层软件价值。
  3. 按次收费
  4. :在 Agent 这边,一种是按「动作」(Action)收费。比如我前面提到的物流 Agent,给卡车司机打一个电话收几毛钱。
  5. 按工作流收费
  6. :更高一层的抽象是按「工作流」(Workflow)收费,比如完成一整个物流订单。这离成本端更远,离价值端更近了,因为它真的参与到了工作中。但这需要一个相对收敛的场景。
  7. 按结果付费
  8. :再往上,就是按「结果」(Result)付费。因为 Agent 成功率不高,用户希望为成功的结果付费。这要求 Agent 公司对产品有极高的打磨能力。
  9. 按 Agent 本身付费
  10. :未来可能会真正地按「Agent」付费。比如,有一家叫 Hippocratic AI 的公司做 AI 护士,在美国招一个人类护士大概是每小时 40 美金,而他们的 AI 护士每小时只要 9 到 10 美金,降了四分之三的成本。在美国这种人力昂贵的市场,这非常合理。如果 Agent 未来能做得更好,我甚至可以给它发奖金、发年终奖。这些都是商业模式上的创新。

李广密 :我们最期待的是按价值(Value-based)的计价方式。比如 Manus AI 做一个网站,这个价值是不是值 300 美金?它做一个应用,是不是值 5 万美金?但今天的任务价值还不好定价。如何建立一个好的衡量计价方式,是值得创业者去探索的。

另外,刚才凯祺提到按 Agent 付费,这就像企业要和员工签合同一样。未来我们雇佣了 Agent,是不是要给它发「身份证」?是不是要签「劳动合同」?这其实就是智能合约。我比较期待未来 Crypto 领域的智能合约如何应用到数字世界的 Agent 上,当任务完成后,通过一个好的衡量计价手段,去分配经济利益。这可能是 Agent 与 Crypto 智能合约结合的机会。

 

06

人类与 Agent 的协作关系会变成什么形态?

 

张鹏:最近在 Coding Agent 这个方向,有两个词讨论得比较多:「Human in the loop」和「Human on the loop」,这是在探讨什么?

钟 凯祺 (Cage) :「Human on the loop」是指人尽可能减少在循环中的决策,只在关键时刻参与一下。有点像特斯拉的 FSD,当系统遇到危险决策时,会警告人类接管油门刹车。在虚拟世界中,这通常指非即时的、异步的人机协作。人可以对 AI 拿不准的关键决策进行干预。

「Human in the loop」则更偏向于 AI 会时不时地「ping」你一下,来确认某件事。比如 Minus AI,它的右半边有一个虚拟机,我可以实时看到它在浏览器里做什么,这就像一个打开的白盒,我能大概知道 Agent 想做什么。

这两个概念不是非黑即白的关系,而是一个光谱。现在更多的是「in the loop」,人还是要在很多关键点上做审批。原因很简单,软件还没到那个阶段,出了问题总得有人负责。油门和刹车一定是去不掉的。

可以预见的是,未来高重复性的任务,最终结果一定是人只看摘要,自动化程度会非常高。 对于一些难题,比如让 AI 看病理报告,我们可以把 Agent 的「假阳率」调高一点,让它更容易觉得「有问题」,然后「on the loop」地把这些案例作为邮件发给人类医生。这样,虽然人类医生需要复核的案例多了,但 Agent 所有判断为「阴性」的案例都可以被顺利审批掉。如果病理报告中只有 20% 真的有难度,那人类医生的工作带宽就已经放大了 5 倍。所以不用太纠结于「in」还是「on」,只要找到好的结合点,就能把人机协作做得很好。

李广密 :鹏哥问的这个问题背后,其实有一个巨大的机会,就是「新的交互」以及「人与 Agent 如何协同」。这可以简单理解成在线(同步)和离线(异步)。比如我们开会直播,必须实时在线。但如果我作为一个 CEO 给同事布置任务,项目推进是异步的。

这里面更大的意义在于,当 Agent 大规模落地后,人与 Agent 如何协同交互,以及 Agent 与 Agent 之间如何协同交互,这是非常值得探索的。今天我们还是通过文本与 AI 交互,但未来与 Agent 的交互方式会有很多种。有些可能在后台自动化运行,有些则需要人在前面看着。 探索新的交互是一个巨大的机会。

 

07

能力过剩、需求不足,

Agent 的「杀手级应用」何时出现?

 

张鹏:Coding Agent 总体还是围绕 IDE 的延长线在做。未来会不会有变化?如果大家都挤在这条路上,后来者要如何追赶 Cursor?

钟 凯祺 (Cage) :IDE 只是一个环境,再去复刻一个 IDE 本身的价值不大。但在 IDE 或另一个好的环境里做 Agent,本身是有价值的。我会思考它的用户到底只是专业开发者,还是能拓展到专业开发者之外「平民开发者」——那些有很多自动化需求的白领工作者。

现在缺的是什么?不是供给能力,因为 Cursor 这类产品已经把 AI 的 coding 供给能力放大了 10 倍甚至 100 倍。以前我要做一个产品,需要外包一个 IT 团队,试错成本很高。现在理论上我只要说一句话,花 20 美元的月费就能试错。

现在缺的是需求。大家都在用老的需求去套新技术,有点「拿着锤子找钉子」的状态。 目前的需求大多是做落地页(Landing page)或者基础的玩具网站。未来需要找到一个收敛的产品形态。这有点像当年推荐引擎出来的时候,它是一个很好的技术,后来出现了一种叫「信息流」的产品形态,把推荐引擎真正带给了大众。但 AI Coding 领域还没有找到像「信息流」这样的杀手级产品。

李广密 : 我觉得 Coding 有可能拿走整个大模型产业阶段性 90% 的价值。 这个价值怎么长出来?今天的第一幕还是服务全球 3000 万程序员。我举个例子,Photoshop 服务的是全球两三千万专业设计师,门槛很高。但是当剪映、Canva、美图秀秀出来后,可能有 5 亿甚至更多的用户都可以使用这些工具,并做出更火爆的内容。

Code 有一个好处,它是一个创意的表达平台。这个社会上 90% 以上的任务都可以通过 Code 来表达,所以它有可能变成一个创意平台。以前应用开发门槛非常高,大量的长尾需求没有被满足。当门槛大幅降低后,这些需求就会被激发出来。我期待的是「应用的大爆发」。移动互联网生成的最大数据是内容,而 AI 这一波生成的最大内容可能就是新的应用软件。这就像优酷、爱奇艺这种长视频平台和抖音的区别。你可以把大模型比作摄像头,在它之上还能做出抖音和剪映这样的杀手级应用。这可能就是所谓的「Vibe Coding」(氛围编程)的本质,它是一个新的创意平台。

张鹏:要提升 Agent 的输出价值,输入(input)也变得非常重要。但在产品和技术上,有什么方法可以提升输入质量,从而确保更好的输出呢?

钟 凯祺 (Cage) :在产品上,我们不能觉得用户用不好产品是用户的问题。要下功夫最关键的一个词就是「上下文」(Context)。一个 Agent 能否建立「上下文感知」(Context Awareness)?

举个例子,如果我在互联网大厂里写代码,Agent 不光要看我手头的代码,还要看整个公司相关的代码库(Codebase),甚至要看我在飞书里和产品经理、同事的对话,以及我之前的编码和沟通习惯。把这些上下文都给 Agent,我的输入才能更高效。

所以对于 Agent 开发者来说,最关键的就是要把记忆(Memory)机制和上下文的连接能力做得足够好,这也是 Agent 基础设施(Infra)的一大挑战。

Agent 的挑战:好记忆机制和上下文连接|图源:零售科学  

 

此外,对于开发者来说,怎么做好强化学习的冷启动数据、怎么定义清晰的奖励(Reward)也很重要。这个奖励背后意味着,当用户表达不清晰时,你怎么把他的需求拆解出来。比如,OpenAI 的 Deep Research 在我问得不清晰时,会先给出四个引导性问题。在和它交互的过程中,我其实也在想清楚自己的需求。

对于今天的用户来说,最主要还是要想怎么清晰地表达需求,以及怎么验收需求。虽然不用做到「以终为始」,但要对好坏有一个大概的预期。 我们写 Prompt 也要像写代码一样,有清晰的指令和逻辑,这样能避免很多无效的输出。

李广密 :我补充两点。第一,上下文的重要性。 我们内部经常讨论,上下文做好了,会有新的支付宝、PayPal 级别的机会。

以前电商看的是成交总额(GMV),以后看的是任务完成率。而任务完成,一边是智能,另一边就是上下文。比如我要做一个个人网站,如果把我的 Notion 笔记、微信数据、邮件数据都提供给 AI,那我的个人网站内容肯定会非常丰富。

第二,自主学习。搭好环境后,Agent 要能迭代,这非常关键。如果不能持续学习迭代,结果就是被模型本身吃掉,因为模型就是一个学习系统。上一波移动互联网,没有做机器学习和推荐的公司都没做大。这一波如果 Agent 做不好端到端的自主学习和迭代,我觉得也做不起来。

 

08

巨头博弈下,还有哪些变化和机会?

 

张鹏:我们怎么判断未来 Agent 的能力会以一个超级接口的形式出现,还是离散地分布在各个场景里?

钟 凯祺 (Cage) :我看到一个比较大的趋势是,第一,肯定是多智能体(Multi-agent)的。即便是完成一个任务,在 Cursor 这类产品里,做代码补全和做单元测试的可能是不同的 Agent,因为它们需要的「性格」和擅长的点不一样。

第二,入口会不会有变化?我觉得入口是一个二阶的问题。首先要发生的是,大家有很多 Agent,并和它们协作。这些 Agent 背后会支撑起一张网络,我称之为「Botnet」。比如未来购物,60% 以上的固定消费可能都由 Agent 帮我完成。

在生产力场景也一样,未来程序员的每日例会可能会被 Agent 之间的协作所取代,由它们推送指标异常和产品开发进展。当这些发生后,入口的变化才可能出现。那个时候,API 的调用也不再主要是人类调用,而是 Agent 之间互相调用。

张鹏:那些有能力的大厂,比如 OpenAI, Anthropic, Google, Microsoft,在 Agent 上都是什么样的决策和行动状态?

李广密 :我脑子里一个关键词是「分化」。 去年大家都在追赶 GPT-4,但现在能做的事更多了,各家都开始分化。

第一个发生分化的就是 Anthropic。因为它比 OpenAI 晚,综合能力没那么强,所以它就专注在 Coding 上。我感觉它摸到了通往 AGI 大方向的第一张大牌,就是 Coding Agent。他们可能认为,通过 Coding 可以实现 AGI,可以带来指令遵循能力和 Agent 能力,这是一个逻辑自洽的闭环。

但 OpenAI 手上的大牌就更多了。第一张是 ChatGPT,Sam Altman 可能想把它做成 10 亿日活的产品。第二张是它的「o」系列模型(GPT-4o 等),预期很高,能带来更多泛化能力。第三张是多模态,它的多模态推理能力上来了,未来在生成上也能体现。所以,Anthropic 摸到了一张大牌,OpenAI 摸到了三张。

另一个大厂是 Google。我觉得到今年年底,Google 可能会在全方位赶上。因为它既有 TPU,又有 Google Cloud,有顶尖的 Gemini 模型,还有 Android 和 Chrome。你在全球找不到第二家拥有所有这些要素,还几乎不依赖外部的公司。 Google 端到端能力是非常强的,很多人担心它的广告业务会被颠覆,但我感觉它未来可能会找到新的产品结合方式,从一个信息引擎变成一个任务引擎。

你看苹果,因为没有自己的 AI 能力,现在迭代就很被动。而微软是以开发者见长的,但 Cursor 和 Claude 其实抢了不少开发者的注意力。当然微软的盘子非常稳,有 GitHub 和 VS Code,但它也必须拥有非常强的 AGI 和模型能力。所以你看它也宣布 GitHub 的首选模型之一变成了 Claude,并迭代自己的开发者产品。微软在开发者这块必须守住,否则根基就没了。

所以大家开始分化了。可能 OpenAI 想成为下一个 Google,Anthropic 想成为下一个 Windows(靠 API 活着)。

张鹏:那与 Agent 相关的基础设施(Infra)有哪些变化和机会?

钟 凯祺 (Cage) :Agent 有几个关键组件。除了模型,第一个就是环境(Environment)。 Agent 开发最早期,80% 的问题都出在环境上。 像早期的 AutoGPT,要么用 Docker 启动,非常慢,要么直接在本地电脑部署,非常不安全。如果一个 Agent 要和我一起「上班」,我就得给它配一台「电脑」,所以环境的机会就出来了。

配「电脑」有两大需求:

  1. 虚拟机/沙盒
  2. :提供一个安全的执行环境。任务做错了能回退,执行过程不能伤害实际环境,并且要能快速启动、稳定运行。像 E2B、Modal Labs 这样的公司都在提供这类产品。
  3. 浏览器
  4. :信息检索是最大需求,Agent 需要到各种网站上爬取信息。传统的爬虫容易被封,所以需要给 Agent 搭一个专用的、能理解信息的浏览器。这就应运而生了像 Browserbase、Browser Use 这样的公司。

第二个组件是上下文(Context)。这包括:

  • 信息检索(Retrieval) :传统的 RAG 公司还在,但也有新的公司,比如 MemGPT,它为 AI Agent 开发轻量化的记忆和上下文管理工具。
  • 工具发现 :未来工具会非常多,需要一个像「大众点评」一样的平台来帮助 Agent 发现和挑选好用的工具。
  • 记忆(Memory) : Agent 需要一套能模拟人类复杂的长短期记忆结合能力的 Infra。

第三个组件是工具(Tools)。包括简单的搜索,也包括复杂的支付、自动化后端开发等。

最后,当 Agent 能力再强一些,一个重要的机会就是 Agent 安全(Agent Security)。

李广密 :Agent Infra 非常重要。我们可以「以终为始」地想,三年后,当几万亿的 Agent 在数字世界里执行任务,那 Infra 的需求就太大了,这将重构整个云计算和数字化世界。

但今天我们还不知道什么样的 Agent 能做大,它到底需要什么样的 Infra。所以现在对创业者是一个非常好的窗口期,可以和那些做得好的 Agent 公司共同设计(co-design)和共创 Infra 工具。

我觉得今天最重要的,第一是虚拟机,第二是工具。 比如未来的 Agent 搜索肯定和人的搜索不一样,会产生天量的机器搜索需求。现在全网人类的搜索每天可能 200 亿次,未来机器搜索可能是几千亿甚至上万亿次。这种搜索不需要给人类做排序优化,可能一个大的数据库就够了,这里有很大的成本优化和创业机会。

 

09

当 AI 不再只是大模型,它会往哪个方向进化?

 

张鹏:Agent 始终绕不开模型,站在今天,你觉得模型技术在过去两年里走过了哪些关键的台阶?

李广密 :我觉得关键的里程碑(milestone)可能就两个。一个是 GPT-4 代表的规模化定律(Scaling Law)范式,即在预训练阶段,扩大规模仍然是有效的,它能带来通用的泛化能力。

第二个大的里程碑是「o」系列模型所代表的「模型会思考」的范式。它通过更长的思考时间(思维链),显著提升了推理能力。

我觉得这两个范式是今天 AGI 的左膀右臂。在这个基础上,Scaling Law 远远没有停止,思考模式也会继续。比如,在多模态下可以继续 Scaling,也可以把「o」系列的思考能力加到多模态上,这样多模态就能有更长的推理能力,生成的可控性和一致性就会变得非常好。

我自己的感觉是,未来两年可能比过去两年进步要更快。 今天可能正处在一个全球几千名顶尖 AI 科学家,共同推动人类科技文艺复兴的状态 ,资源充足,平台也具备了,很多地方都可能出现突破。

张鹏:你会比较期待接下来一两年,在 AI 领域看到哪些技术台阶的实现和跳跃?

钟 凯祺 (Cage) :第一个是多模态。现在多模态的理解和生成还是比较零散的,未来一定会走向「大一统」,即理解和生成一体化。这会极大地打开产品的想象力。

第二个是自主学习。我很喜欢 Richard Sutton(强化学习之父)提出的「经验的时代」(the era of experience)这个概念,即 AI 通过在线执行任务的体验来提升自己的能力。这在以前是看不到影子的,因为没有基座的世界知识。但从今年开始往后,这会是一个持续发生的事情。

 

2024 年图灵奖获奖者 Richard Sutton |图源:Amii  

 

第三个是记忆。如果模型真的能在产品和技术层面把 Agent 的记忆做好,带来的突破会非常大。产品的粘性才真正出现。 我感觉 GPT-4o 开始有记忆的那一刻,我才真正对 ChatGPT 这款应用产生了粘性。

最后是新交互。会不会有不再是文字输入框的新交互?因为打字这个门槛其实挺高的。未来会不会有更符合人类直觉和本能的交互方式?比如,我有一个「永远在线」(Always-on)的 AI 产品,它在后台不断地听我说话、异步思考,在我灵感迸发的那一刻,能捕捉到关键的上下文。我觉得这些都是我比较期待的。

张鹏 :确实,今天我们面临的挑战和机遇并存。一方面,我们不能被技术发展的速度「拉爆」,要保持持续的关注。另一方面, 今天的 AI 产品正在从「工具」走向「关系」。人不会和工具建立关系,但会和一个有记忆、懂你、能与你「心有灵犀」的 AI 建立关系。 这种关系本质上就是习惯和惯性,这也是未来重要的壁垒。

今天的探讨非常深入,感谢广密和凯祺的精彩分享。也感谢直播间观众的陪伴。我们下期《今夜科技谈》再见。

李广密 :谢谢。

钟 凯祺 (Cage) :谢谢。

浏览量: 5

波音 787 在印度发生首次坠毁事故;哪吒汽车通知员工居家办公;阿里发布高考志愿大模型|极客早知道

波音 787-8「梦想客机」在印度坠毁,失事客机上 242 人全部遇难

6 月 12 日消息,据央视新闻报道,一架客机 12 日在印度古吉拉特邦艾哈迈达巴德机场坠毁,机场上空冒起浓烟。据悉,这架客机从机场起飞后几分钟便坠入机场附近居民区。

印度航空随后发表声明证实,该公司一架计划从艾哈迈达巴德机场起飞前往英国伦敦的客机,当日在古吉拉特邦艾哈迈达巴德机场附近坠毁,航班号为 AI-171。据印度亚洲新闻社援引印度民航总局通报称,机上载有 242 人,其中包括 169 名印度公民,53 名英国公民,1 名加拿大公民和 7 名葡萄牙公民。据央视新闻报道,印度失事客机上 242 人全部遇难。

据航班追踪网站数据,印度航空公司这架飞往伦敦的波音 787-8「梦想客机」的信号在 625 英尺(约合 190 米)处的高度消失,距离客机起飞后还不到 1 分钟。据报道,这架飞机也成为全球首架因空难全损的波音 787 型飞机。

印度媒体引用警方消息称,当地警方在坠机事故中发现一名幸存者,目前在医院接受治疗。警方称该幸存者在飞机座位 11A 处被发现,但尚未确认为机上人员还是地面人员。

据印度媒体援引艾哈迈达巴德机场发言人消息,受坠机事件影响,艾哈迈达巴德机场目前暂停运营。所有航班暂停运行,直至另行通知。(来源:IT 之家)

哪吒汽车通知员工今起居家办公,消息称 CEO 方运舟已前往桐乡

6 月 12 日消息,据九派新闻报道,哪吒汽车总部内部宣布,员工自 6 月 12 日起居家办公,办公室门禁已经失效,员工搬离个人物品需由行政部门向属地相关部门和物业报备。此外,宣布上述消息的哪吒汽车内部人士还称,哪吒汽车董事长兼 CEO 已经前往桐乡。另一位在职的哪吒汽车员工证实了明日起员工将居家办公的消息。

浙江省桐乡市是哪吒汽车(合众新能源汽车股份有限公司)注册地和工厂所在地。此前,哪吒汽车总部员工刚刚从上海普陀区的旧总部搬至位于虹桥商务区的新办公场地。据一段由哪吒汽车员工拍摄的视频显示,6 月 11 日下午,部分员工前往哪吒汽车虹桥新办公场地,寻求与方运舟谈判。

 

另外有消息称,哪吒「债转股」减轻债务以求新融资到位的方案宣告失败。

爆料称,哪吒汽车欠供应商的总款项约 60 亿元左右,原定只需要化解一半的债务即 30 亿元,投资方才愿意提供新的资金。但知情人士透露,愿意接受「债转股」方案的供应商仅能帮助哪吒化解 20 亿出头的债务,「剩下几亿元实在啃不动了。」

另有接近哪吒汽车的知情人士向《21 汽车・一见 Auto》透露,有投资方仍想保住哪吒,但条件是罢免哪吒汽车创始人、董事长兼 CEO 方运舟。5 月 13 日,哪吒汽车母公司合众新能源汽车公司新增股权冻结信息,方运舟为被执行人,冻结股权数额 2000 万元。(来源:IT 之家)

 

OpenAI 与芭比娃娃制造商美泰合作 将生成式 AI 引入玩具和其他产品

芭比娃娃制造商美泰公司和 OpenAI 联手将生成式人工智能引入玩具制造和不断扩大的 IP 重新包装渠道。此次合作标志着 OpenAI 迈入新领域。OpenAI 此前已与新闻出版商和企业签署了授权协议,但从未与玩具制造商合作过。然而,这符合这家 AI 巨头进军各行各业的总体战略,或许能让 OpenAI 在美泰日益壮大的娱乐业务中站稳脚跟。

 

这家标志性玩具制造商于 2023 年推出了轰动一时的《芭比》电影,令成年观众欣喜不已。该公司目前正在制作基于其他玩具的电影,例如风火轮、波莉口袋、巴尼、UNO 和宇宙的巨人,并拥有一系列动画和真人电视节目。美泰也在进军数字游戏领域,根据公司第一季度财报,预计将于 2026 年推出其首款自主发行的游戏。

该交易的细节还很少。双方预计将于今年晚些时候发布首款「AI 驱动产品」,目标是「以安全、周到和负责任的方式提升粉丝参与度」。

美泰在一份声明中表示:「作为此次合作的核心部分,美泰和 OpenAI 将强调上市产品和体验的安全性、隐私性和保障性。」(来源:CnBeta)

阿里巴巴蔡崇信自曝:被 DeepSeek 逼急了,工程师春节睡办公室搞研发

6 月 12 日消息,综合彭博社与南华早报报道,面对激烈的行业竞争,阿里巴巴正将未来押注于人工智能。董事会主席蔡崇信近日在巴黎 VivaTech 大会上坦言,公司曾一度「迷失方向」,而如今,一场由 DeepSeek 引发的危机感,正迫使这家科技巨头以「春节不休」的决心,加速追赶。

今年 1 月,DeepSeek 以其低成本、高性能的 AI 模型震惊业界时,阿里巴巴的工程师们感受到了巨大的压力。「我们看了相关论文,心想,『天哪,怎么我们落后了?明明大家做的是一样的事。』」蔡崇信回忆道。

他以此作为中国科技行业激烈竞争的缩影,并生动地描述了当时的场景:「我们的工程主管当即决定:『取消春节假期,所有人都留在公司,睡在办公室里。我们要加快研发进度。』几周之内,我们就推出了自己的版本,也就是 Qwen 系列模型,表现不错,竞争力很强。」

他坦承,在过去几年里,公司经历了「一段极其艰难的时期」,面临着「激烈的市场竞争」、疫情冲击、监管压力以及地缘政治紧张等多重挑战。上月,他甚至用「连续遭遇挫折」来形容公司的困境。

然而,尽管决心巨大、投入惊人,但挑战依然严峻,回报也仍不明朗。蔡崇信承认:「当前的环境依然非常艰难。」而公司财报显示,今年第一季度,阿里巴巴的营收仅增长 7%。

Nothing CEO 裴宇透露收购「安卓之父」公司原因:曾考虑沿用 Essential 品牌名

6 月 12 日消息,Nothing 曾于 2021 年 2 月收购了「安卓之父」Andy Rubin 创立的 Essential 公司,Nothing 联合创始人兼首席执行官裴宇昨日首次透露了收购的缘由。

在官方昨日发布的一段近 7 分钟的 YouTube 视频中,裴宇透露,在最终确定 Nothing 品牌名前,团队曾考虑沿用 Essential 命名,他称「Essential」这个名称「极致简约」且「优雅非凡」,因此他们果断收购了其包括商标、网站域名(Essential.com)及社交媒体账号在内的全部资产,不过他强调此次交易不涉及专利。

但在完成收购数周后,团队放弃了 Essential 命名方案,裴宇解释称:「这是同类产品中其他人使用过的品牌名」,他们不希望让市场误以为这是 Essential 品牌的重生。而当被问及收购金额时,裴宇以违反保密协议为由拒绝透露。

除「Essential」外,裴宇还透露团队曾考虑「Stone」这一名称,虽然这个名字和「Nothing」一样看似怪异,但裴宇称品牌名称既重要也不重要,更重要的是企业推出的产品质量。他以苹果公司为例,虽然用水果命名企业看似不合常理,但凭借卓越产品最终让这个名字家喻户晓。(来源:CnBeta)

夸克发布高考志愿大模型:智能体帮你提供定制专属报告

6 月 12 日,夸克发布 2025 年高考志愿填报产品,推出「高考深度搜索」、「志愿报告」、「智能选志愿」三大核心功能。产品依托于国内首个自研高考志愿大模型和专业的高考知识库,实现了从复杂问题询问到志愿报告输出的整个辅助决策流程。

其中,「志愿报告」是国内唯一可以生成完整报告的智能 Agent,目前已开放试用。考生只需完善 12 个信息点(涵盖院校偏好、专业兴趣、升学与职业规划等),便可建立个人信息档案。点击「领取报告」后,Agent 会通过「任务规划—执行—检查—反思」的链式推理流程,模拟一位资深志愿填报专家的决策过程,为考生输出一份包括填报策略、志愿表、院校专业推荐说明等的完整报告。

另一项核心功能是「高考深度搜索」。它专为处理个性化、开放式提问设计,能够理解复杂问题和拆解用户需求,并给出专业、可执行的建议,解决传统搜索难以胜任的问题。

截至目前,夸克高考产品已累计服务超过 1.2 亿考生和家长,其中超过 50% 来自三线及以下城市。这一数据反应了欠发达地区对优质信息获取的迫切需求。为此,夸克今年将继续推行「暖芒公益」计划,为更多偏远地区高中提供志愿工具使用和志愿填报的指导。(来源:阿里巴巴)

谷歌首次增设「首席 AI 架构师」职位,大力加码人工智能战略

6 月 12 日消息,据美国 CNBC 报道,当地时间周三,谷歌宣布在公司高层增设首席 AI 架构师一职,继续加码人工智能战略,并将 AI 技术更广泛地融入旗下产品。

新任高级副总裁由谷歌 DeepMind 首席技术官 Koray Kavukcuoglu 担任,公司确认该任命后表示,他将直接向 CEO 桑达尔・皮查伊汇报。

 

皮查伊在一封内部邮件中说,Kavukcuoglu 将协助制定产品战略,并加快将大模型整合进产品的步伐,目标是实现更顺畅的集成、更快的产品迭代,以及更高的运行效率,Kavukcuoglu 将从伦敦搬至加州山景城总部工作。

谷歌近年来持续整合 DeepMind 与公司整体架构,并试图将其 AI 技术商业化。不过,尽管行业内技术快速演进,AI 仍未为多数公司带来显著回报。与此同时,资本支出却持续攀升。

上个月,谷歌在年度 I/O 开发者大会上发布多项 AI 新品。其中包括一项每月 249.99 美元(现汇率约合 1798 元人民币)的订阅计划,用户可抢先体验 AI 工具与实验性产品。谷歌还宣布与 Warby Parker 等企业展开合作,在其 Android XR 头戴设备操作系统中引入 Gemini AI 助手,用户可通过语音操作控制穿戴设备。

谷歌改进「Circle to Search」功能:音乐识别新增历史记录、圈选文本可直接翻译

6 月 13 日消息,据外媒 Android Authority 报道,数据挖掘者 AssembleDebug 在拆解谷歌移动平台应用(谷歌手机软件)APK 时发现该公司正在改进「圈选搜索(Circle to Search)」功能,主要提升音乐识别功能和翻译功能效率。

在音乐识别功能方面,谷歌为「圈选搜索」的音乐识别界面新增了一个「历史记录」按钮,图标为带有逆时针箭头的钟表形状。可以快速查看用户最近识别过的歌曲,让「圈选搜索」在音乐识别方面更加接近 Shazam 等竞品的体验。

而在翻译功能方面。以往用户在使用圈选搜索时,如果先圈选了一段文本,再点击「翻译」按钮,系统不会直接翻译选中的内容,用户只能退出后重新操作。如今谷歌悄悄引入了「圈选后直接翻译」的功能,当用户圈选文本后,会自动显示一个「翻译」按钮,实现无缝操作,无需中断流程。

这两项更新目前仍处于测试阶段,尚未向所有用户全面推送,预计谷歌还将测试一段时间后在一两个月内向所有海外用户开放。(来源:CnBeta)

消息称腾讯研究以 150 亿美元收购《DNF》《跑跑卡丁车》游戏开发商 Nexon

6 月 12 日消息,据彭博社今日爆料,腾讯据悉研究以 150 亿美元(现汇率约合 1079.08 亿元人民币)收购韩国游戏开发商 Nexon,腾讯已接洽控股家族商讨潜在收购事宜。

知情人士透露,腾讯已与 Nexon 已故创始人金正宇的家族联系,以讨论收购的可能性。知情人士还称,金正宇的家人一直在与顾问交谈并评估选择。

IT 之家注:Nexon 是一家韩国电脑游戏公司,成立于 1995 年 5 月,主要的作品有《潜水员戴夫》《蔚蓝档案》《洛奇》《洛奇英雄传》《地下城与勇士(DNF)》《泡泡堂》《跑跑卡丁车》《冒险岛》等。

腾讯与 Nexon 有着长久合作,比如经典的《地下城与勇士》游戏国服就是由腾讯代理。

2022 年 12 月 19 日,Nexon 宣布与腾讯云达成合作,基于腾讯云的实时音视频(TRTC)技术,共同搭建虚拟世界社区平台 NEXONTOWN。(来源:IT 之家)

特斯拉起诉前 Optimus 机器人工程师,指控其窃取商业机密

6 月 13 日消息,据彭博社报道,特斯拉日前起诉一名前工程师 Zhongjie「Jay」Li,指控其窃取「Optimus」人形机器人项目的核心技术机密,并借此创办了竞争性初创公司。

这起诉讼于当地时间周三提交。诉状称,Zhongjie 利用特斯拉在「先进机械手传感器」领域的研发成果,创立了初创企业 Proception。该公司获得 Y Combinator 支持,专注于研发机械手技术。

根据诉状,他于 2022 年 8 月加入特斯拉,并于 2024 年 9 月离职。在此期间,他曾使用两部个人手机下载 Optimus 相关的机密资料。

诉状还指出,他在任职后期,多次利用公司电脑查询机械手的相关资料,并上网搜索风投与初创融资的资讯。

诉状写道:「他离职不到一周,Proception 就完成注册。短短五个月后,Proception 便公开宣称已『成功制造』出先进的机械手——其外形与他在特斯拉参与设计的版本极为相似。」

Proception 官网显示,公司目标是「通过打造全球最先进的机械手,彻底革新人机交互体验」。

IT 之家从报道中获悉,自从 2021 年宣布启动 Tesla Bot 项目以来,特斯拉「Optimus」机器人计划的发展并不顺利。2022 年,特斯拉曾表示将于 2023 年推出该机器人及其他新产品,但「Optimus」至今仍处在开发阶段。

2024 年 7 月,特斯拉 CEO 埃隆・马斯克表示,计划在 2026 年开始销售该款机器人。同年 10 月,在「We, Robot」活动现场亮相的「Optimus」多数仍由场外人员遥控操作。(来源:IT 之家)

摩根士丹利:中国在人形机器人领域领先美国,资源 / 政策 / 教育方面具有优势

6 月 13 日消息,当下人形机器人逐渐进入全球金融市场的主流视野,包括英伟达 CEO 黄仁勋和特斯拉 CEO 埃隆・马斯克等科技巨头不断在公开场合大力推动机器人概念,而投资银行摩根士丹利(Morgan Stanley)看好这一技术趋势,其近日发布报告,指出认为中国正在机器人竞赛中占据优势,领先于美国。

报告指出,中国在机器人研发与制造领域的快速进展,主要得益于「稀土资源优势、政策激励以及教育体系支撑」。

摩根士丹利指出,由于新建稀土加工厂的建设周期可能长达 20 年,中国完全有能力借助稀土的战略优势「调控西方制造业的产能节奏」,进而在机器人产业制造端获得「压倒性优势」。

除资源外,中国本土制造工艺的提升也功不可没。摩根士丹利认为,这种提升得益于外资企业技术转移与中国本土技术创新的结合。中国企业在政府鼓励下形成了高度活跃的机器人研发环境,各企业之间竞争激烈,新创意不断取代旧技术,摩根士丹利认为这种「竞争」正是中国机器人研发节奏不断加快的重要驱动力之一。

此外,摩根士丹利表示,中国在制造机器人所需人才培养方面也领先美国。2023 年中国有超过 11000 所培养相应人才的高校,总体在校学生超过 500 万人,而美国国家学生信息中心数据显示,美国类似院校的在校人数仅为 92.3 万人。

据此,摩根士丹利在报告中强调,中国在机器人发展上的优势,不仅体现在资源、政策与教育方面,更体现在「长期战略思维」上,报告引用中国传统棋类游戏「围棋」的策略特点,称中国倾向于通过「耐心与共存竞争」,逐步将对手引入劣势局面,以实现最终胜利,而不是追求「短期业绩」。(来源:IT 之家)

微软新推出的 Copilot Vision 可以「看到」Windows 上的应用程序

微软今天推出了适用于 Windows 的 Copilot Vision,这是其 AI 助手的扩展,可让您共享屏幕或应用程序,以便 Copilot 可以指导您使用一些专业应用程序的功能或分析您正在查看的照片和网页。

Copilot 团队表示:「当您选择启用它时,Copilot Vision 可以看到您所看到的内容并实时与您交谈。它就像您的第二双眼睛,能够分析内容,在您迷路时提供帮助,提供见解,并在您前进的过程中解答您的疑问。」

微软于今年早些时候首次在 Windows 系统中测试 Copilot Vision,现在它已在美国免费向 Windows 10 和 Windows 11 用户推出,不再需要 Copilot Pro 订阅,但它仍然是微软实验性 Copilot Labs AI 计划的一部分。

Windows 上的 Copilot Vision 在 Copilot 应用程序内运行,可以通过眼镜图标激活,您可以选择要与 AI 共享的浏览器窗口或应用程序——就像在 Microsoft Teams 会议中共享屏幕或应用程序一样。这是一种可选体验,必须专门共享应用程序才能使 Copilot Vision 正常工作,它不像 Recall,一旦启用就会持续截取您的屏幕快照。

微软将 Copilot Vision 的使用体验限制在美国,分享应用后,Copilot 会高亮显示屏幕的某些部分,引导用户并帮助解答问题。您也可以在 iOS 和 Android 上使用 Copilot Vision。(来源:CnBeta)

 

国产新一代光量子计算机首秀:算力媲美顶尖超算,仅一台冰箱大小

6 月 12 日消息,据文汇报报道,在昨日开幕的第十一届中国(上海)国际技术进出口交易会(简称「上交会」)上,我国自主研发的新一代光量子计算机首次公开亮相。

 

据了解,这台名为「TurningQ Gen2 大规模可编程光量子计算系统」的设备,由国内光量子计算领军企业「图灵量子」研发,其计算能力在处理特定问题时可与顶尖超级计算机相媲美,而其尺寸仅相当于一台对开门冰箱,主要包括量子光源单元、量子计算单元、探测单元三大核心组件。据图灵量子相关负责人介绍,该设备具备 56 光子的量子优越性级别规模。据估算,面对某些特定问题时,其计算能力几乎可比肩天河二号超级计算机,但其占地面积和所需能耗等,都大大优于超算。

目前,该设备已获得航空航天、海洋装备、大数据、金融科技等行业的领军企业认可,并已开启相关应用研究,例如用于优化流体力学结构设计和估算大规模通信负载趋势等。(来源:IT 之家)

 

浏览量: 5

拆解火山引擎后,我看到了字节跳动的「变奏」

五年前,字节跳动成立火山引擎的时候,它在云计算产业里只能算是十分不起眼的那一朵「云」。

我印象中,当时有不少人疑惑,字节为什么要杀入一个已经非常内卷、格局比较稳定、且相比于字节的抖音和头条来说利润率很低的业务?

最近几年,这个答案逐渐清晰。尤其是,当 ChatGPT 将大模型带火之后,我身边有越来越多在 AI 转型上比较积极的新锐企业家,开始提到火山引擎。

我最近看到 IDC 公布了一项数据,印象深刻:火山引擎在中国公有云大模型服务调用量上已经稳居第一,市场份额 46.4%,接近一半。

在昨天举办的火山引擎「Force 原动力大会」上,同样有一个数据十分醒目:全球 Top10 手机厂商有 9 家选择和火山引擎深度合作,将大模型应用在语音助手,创作工具,效率提升等诸多场景。要知道,手机厂商虽然在 AI 落地上最为积极,但他们也更为谨慎。

能将这些挑剔的客户拿下,已经很说明问题。

回过头看,MaaS(模型即服务)那点钱一开始传统云巨头看不上的。然而,创新往往都来自于边缘,都是从看不上的钱开始做。当 AI 大模型浪潮到来,MaaS 成为新的基础设施时,火山引擎作为从边缘崛起的力量,凭借对 MaaS 的前瞻性布局,反而将过去在云上的落后给抹平了。不仅如此,从我的观察来看,对于云产业来说,这不是在同一张牌桌上增加几把椅子,而是直接换了一张全新的牌桌(New Table)。

这是一次彻底的「Reset」,跟我们之前理解的云计算,有着本质的区别。就像火山引擎在对外介绍其服务时,总是会强调他们是「AI 云原生」服务。

「AI 云原生」是他们自创的一个概念,在我看来,这恰恰是理解火山引擎为什么是接住 AI 热度最多的那一个、以及服务好企业 AI 转型的关键切入点。

 

01

「AI 云原生」,是全新的牌桌

 

到底什么是「AI 云原生」?它和我们常听到的「云原生+AI」,仅仅是词语顺序的颠倒吗?

其实我觉得,火山引擎定义的「AI 云原生」,如果换成「AI Native 的云」这样的说法,会更容易理解些。

首先,「云原生+AI」,是在既有的、成熟的云计算体系之上,增加一些 AI 的能力。比如,提供一个模型的 API 接口。这是一种「叠加」的思路。云,依然是那个云。AI,只是一项新的能力。

而「AI Native 的云」,它意味着,整个云的技术架构、服务模式、甚至是商业逻辑,都是围绕着 AI 来重新构建的。

比如,我们过去谈论云计算,总会说 IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)。这是一个「层」的概念。但在 AI 时代,这个分层结构可能正在被消解。

这源自于技术负载的变化。就像火山引擎总裁谭待在演讲中提到的,我们实际正处于 PC 到移动到 AI 三个时代的变化之中。在这三个时代里,技术主体在发生变化,PC 时代的主体是 web,移动时代是 APP,AI 时代是 Agent。

不难理解,新的负载形态需要新的底层架构。举个例子,在字节的 AI 编程工具 TRAE 里面,用户可以通过 MCP 来调用数据湖的结构化或者非结构化的数据。也就是说,工作流变成了以大模型为中心,以 IDE 为(集成开发环境)入口,将云等产品捏合在一起,最后由 Agent 来负载的形态。

在火山引擎的这次大会上,有一个观点让我印象深刻,他们认为模型以及模型调用工具的这一整套的规划能力,决定了跑在上面的 Agent 能不能成功。因此,从模型到 Agent,里面到底需要什么,路径是什么,他们都给开源了出来。

那么,我们可以顺着这个逻辑,来推演火山引擎在 AI 时代做云业务的战略路径——打造一个「模型+工具+实践」的生态闭环。

我们来分别拆解一下这三个关键词。

第一,模型(Model):追求最好的模型。

见惯了模型技术的升级,这次豆包在定价上的创新让人眼前一亮。

豆包大模型 1.6 首创了按「输入长度」区间定价,深度思考、多模态能力与基础语言模型统一价格。比如,在企业使用量最大的 0-32K 输入区间,豆包 1.6 的输入价格为 0.8 元/百万 tokens、输出 8 元/百万 tokens,综合成本只有豆包 1.5 深度思考模型或 DeepSeek R1 的三分之一。Seedance 1.0 pro 模型每千 tokens 仅 0.015 元,每生成一条 5 秒的 1080P 视频只需 3.67 元,为行业最低。

字节 CEO 梁汝波曾谈过在 AI 上的目标,首先就是「追求智能的上限」。

最新发布的豆包大模型 1.6、视频生成模型 Seedance 1.0 pro 等新模型,根据测试,均达到全球一流水准。另外,据调研机构的数据,火山引擎是国内 DeepSeek 调用量最大的平台,对 DeepSeek 的性能支持最佳。

因此,模型能力和成本会是火山引擎在模型层死磕的核心。

第二,工具(Tool):完善的 AI Infra 套件

有了模型,就像有了「大脑」。但只有大脑还不够,还需要「手脚」和「躯干」——也就是完善的工具链。

这些工具,如果让企业自己一个个去适配、打通,又是一个巨大的「摸索成本」。因此,火山引擎的价值在于,他们将这个工作替用户做了。

比如,很多用户不擅长写提示词,火山引擎发布了 PromptPilot,可通过深度解析用户意图并自动构建最优指令路径,将用户模糊的想法系统性地转化为 AI 能够精准执行的专业指令,从而确保模型稳定地输出高质量结果。

此外,火山引擎还发布了火山引擎 MCP 服务、AI 知识管理系统、veRL 强化学习框架等产品,并推出多模态数据湖、AICC 私密计算、大模型应用防火墙,以及一系列 AI Infra 套件。

第三,实践(Practice):将最佳实践固化与推广。

很多人都忽视了,字节跳动,恰恰是这个星球上最好且最大规模的 AI「实践者」之一。

抖音,头条,剪映,即梦,飞书,TRAE 等等应用,这些本身都蕴含着字节的 AI 实践。字节内部 80% 的工程师在使用 AI coding。他们踩过的坑,积累的经验,打磨出的方法论,就是最宝贵的「实践」。

字节在客户成功方面的一个创新就是,它将这些宝贵实践给「开源」了。比如,火山引擎在官网上线了大模型应用实验室,开源了手机助手、实时视频理解、Deep Search 等 demo 应用,帮助客户快速搭建 AI 应用原型,灵活编排自己的专属智能体。用户也可以通过 Github 方舟开源站点上进行下载使用。

火山引擎把这些源自于字节内部的最佳实践,开源成方法论和工作流,融入它的产品和解决方案之中。

这就是「模型+工具+实践」的闭环。

它不再是我们提到云时,常常想到的「IaaS、PaaS、SaaS」的三层结构,那套模式对应的是上一个时代的技术负载。对于客户来说,更需要一个 AI native 的云,来更好地跨入到 AI native 的时代,而不是买一个云,然后自己去找 AI native。「AI 云原生」是在一个全新的牌桌。

 

02

火山引擎,在造 AI 时代的「马达」

 

我们刚刚梳理过了 AI 云原生 「模型+工具+实践」的闭环。

也就是说,他们不只是把工具给你,而是把一条「AI 原生」的业务流程给你跑通、验证,把这个所谓的最佳实践和面向未来的思考写到了整个产品体系里,然后再打包交付给你。

这就好比,一个店铺不再是只卖给你面粉、鸡蛋和烤箱,而是努力先把一款「爆款蛋糕」的配方研发出来,甚至把半成品都准备好,你拿回去,稍微加工,就能开张营业,获得成功。

它把客户成功的成本,大量地「前置化」了。火山引擎自己承担了大部分探索和试错的工作,从而极大地降低了客户成功的门槛和成本。

相比之下,传统的云服务商,更像是提供一个「乐高工具箱」。它们把强大的算力、存储、网络等原子化能力交给你,然后说:「来,给你最好的工具,去创造你想要的业务吧。」

这听起来很美好。但对绝大多数企业来说,拿到一堆「算力」和「模型」的锤子,他们并不知道该如何去盖一座属于自己的「AI 大厦」。从工具到价值,中间隔着一条巨大的鸿沟,我们可以称之为「摸索成本」。企业需要自己去试错,去组合,去探索全新的业务流程。这个成本,是极其高昂的。

而火山引擎正在做的事情,可以称之为「先干为敬」的交付模式。

为什么过去的云厂商没有普遍这么做?

一个核心原因是,过去,如果想将某个垂直行业的业务上云,需要懂得这个领域的 know-how,各种各样的人,将它搭建起来,人工成本就很高。而今天,一个很大的变化是,大模型可以将这堆事情搞定百分之六七十。

那么,就意味着,如果能够将模型和工具做好,就能帮客户解决 70% 的问题,剩下 30% 由他们自己解决。它实际上交付的是一套 AI native 的业务流。

那么,我们可以给「AI 原生云」下一个更清晰的定义了。

如果说,过去的云计算,是像「水电煤」一样的基础设施,它支撑着企业的运转,但本身不直接创造业务的核心逻辑。

那么,火山引擎打造的 「 AI 云原生」,则更像是一种「马达」。

就像今天每个人的身边、家里的电子设备中,都有无处个或大或小的马达。马达是构建工业社会产品的一个重要结构。

我觉得,未来的 AI 不会停留在像如今的水和电一样的基础设施,它也要 form 成像马达一样的东西,可以根据不同企业、不同业务的特性而广泛存在其中。它本身,就是新一代生产力的「发动机」。这样,才更容易转换成企业价值。

 

03

字节跳动,从擅长 To C 到做好 To B

 

理解了火山引擎「是什么」和「怎么做」,我们再来探讨一个更深层的问题:它在字节的整体战略中,扮演着一个怎样的角色?这关乎到火山引擎的未来。

要回答这个问题,我们可能得先回答一个更根源的问题:字节为什么要做火山引擎?

首先,我们需要理解一家巨头企业在不同发展阶段的战略重心。在我看来,过去十年,字节跳动更擅长 To C。

在信息流、短视频、社交、本地生活等几乎所有赛道,我们都能看到字节跳动凶猛进攻、快速迭代、努力成为赛道头部的身影。在 To C 业务上的高歌猛进,让它成长为一家无与伦比的巨头。

然而,一家公司是不能永远在风口浪尖去做跟一代一代的年轻创业者拼应用创新的事,公司发展到一定程度,就要去抓基础设施。

这里面有一个非常经典的案例,TCL。在我刚刚进入媒体的时候,大约是 90 年代末,TCL 风头正盛,相当于那个年代的小米,风靡全国,成长极快。

TCL 和中国大多数家电企业一样,业务线很长,从电视、冰箱、空调到手机,什么都做。这是一种典型的「Fight」模式。

TCL 的创始人李东升在那个时候提出,要在五年内实现营收 2000 亿的目标。结果用了 20 年才实现。

前两年,我跟他复盘过一次,他提到一点,说他最大的收获就是意识到,没有一个企业可以永远在时代的最潮头、做最新锐的产品创新。他说,当企业发展到一定阶段的时候,你需要去做你更该做的事,比如有一些更难、更长期、回报可能没有那么快,但对于行业来说又很有利的事情。

当时,在面临全球化的激烈竞争和产业升级的压力时,李东生做出了一个极其重要的战略抉择:全力以赴,向上游核心技术突破,重注投资建设华星光电(CSOT),也就是我们说的「面板」。

这是一个典型的「Build」(构建长期基础设施)战略。它投入巨大,回报周期极长,充满了不确定性。在长达数年的时间里,华星光电甚至是亏损的。但 TCL 顶住了压力,持续投入。

也正是在面板上的投入,让 TCL 成功掌握了「显示屏」这一核心战略资源,使得营收终于突破了 2000 亿元。这块「屏」,不仅让 TCL 的电视业务建立起强大的成本和技术优势,更让它成为了整个消费电子产业链的「底座」,举足轻重。

今天,字节跳动重注火山引擎,与当年 TCL 重注华星光电,在战略逻辑上,异曲同工。

我其实觉得,对于已经成长为巨头的大公司来说,更重要的是选择了一个更有意义的、并且应该是由你来完成的那种目标。 而字节在火山引擎的布局,正是夯实了这家公司完成了一个从具有做好消费级产品的锋芒到修炼出「Build」状态的转变。

梁汝波在 6 月 11 日的火山引擎发布会上提到,关于火山引擎,字节内部有一个共识——当时,有些客户问我们:字节为什么要做火山引擎,把技术对外? 一个很重要的原因是,字节跳动决心做好技术。

实际上,据我了解,在五年前,字节内部曾经讨论过,字节是否要自建基础设施,比如云等等。如果要自建的话,那要怎么持续保持技术先进?

如果只是自己用,那么前端只服务自己的那些 App 的话,数据、业务的丰富度会比较少。所以,他们很快达成共识,为了保持技术的先进度,那就应该开放。

在我看来,这本质上是在回答:关键技术、基础能力上,你要不要世界领先?

如果想要领先,只服务自己,围绕着自己的业务做,思路是不对的。而如果以天下为先,去实现更大的挑战,才会给你卷入更大的资源和努力去做成它。

更关键的是,如果这个基础设施做好了,那么未来产业里所有的创新都会与其有关。

所以说,并不应该将火山引擎视作字节的一个横向拓展的业务,这是不对的。它属于字节跳动正在为自己,也为整个行业,构建的一个面向 AI 时代的先进「数字基础设施」。

总的来说,AI 浪潮,给云计算市场按下了「Reset」键,开启了一张「New Table」。 在这张全新的牌桌上,我丝毫不怀疑,已经赢得先发优势的火山引擎,在长期、大力投入上的坚决。

火山引擎的出现,不仅对阿里、腾讯、华为、百度等传统云厂商构成了新的挑战,更重要的,它为千行百业的 AI 转型,来了一次「先干为敬」。以身入局的字节跳动接下来会如何改写 AI 和云产业的格局,十分令人期待。

浏览量: 6

马斯克道歉,特朗普回应;阿里离职员工发万字长文,马云回应;华为发布 Pura 80 系列,余承东称对得起那四个字

 

特朗普回应马斯克道歉:我认为他这样做非常好

当地时间 6 月 11 日,美国总统特朗普回应马斯克道歉称,「我认为他这样做非常好。」美东时间 11 日凌晨,特斯拉与 SpaceX 首席执行官埃隆·马斯克在其社交媒体平台「X」上表示,他对上周发表的一些关于美国总统特朗普的帖子感到后悔,称「内容说得太过了」。(来源:央视新闻)

阿里离职员工发万字长文,马云回应

近日,阿里巴巴内网的一篇帖子引发热议,钉钉的产研负责人元安(花名)离职时在内网对阿里的发展历程、存在的问题及原因作出了近万字分析,阿里巴巴创始人马云也对该帖子进行了回复。

帖子中,元安表示,互联网整体增长的放缓、阿里外部收购业务多数失败、内部创新少有成功等都让阿里巴巴失去了高速增长活力。他提到阿里收购或投资的口碑、饿了么、单车、支付宝、音乐、视频、东南亚电商 lazada 等业务都在纳入阿里体系后失去了行业龙头地位,阿里对银泰、大润发的收购也以亏损收场,他认为,这么多年阿里收购并运营成功的好像就高德、UC,集团内部,离开电商主营业务扶持而独立长出的创新业务也相对稀缺,许多行业市场机会还在,但阿里难以抓住。

元安总结了自己所看到的阿里人、财、事三个方向的问题,例如迷信外部一些新秀行业或公司的人才,新人「阿里味」不足,恶性绩效竞争和激励制度失灵下,员工合作成本变高、真正做事的人变少,内部员工的级别通胀、奖惩不明以及员工思想短期主义盛行等。除此之外,还有公司层面的战略不清、既要又要、运营数据带来的虚假繁荣以及官僚主义盛行。

值得一提的是,马云关注到了这个帖子,并在内网回复称:「元安同学好,谢谢你那么长的信,写得很好。好像人的成长,阿里的发展也有很多必然要走的路和过程,阿里巴巴在发生变化之中。祝福你,也希望经常回来看看。」(来源:第一财经)

 

谷歌增设首席人工智能架构师以加速AI产品开发

谷歌周三在其领导团队中增设了一名首席人工智能架构师,因为该公司继续将人工智能列为优先事项,并将该技术添加到更多产品中。该公司周三证实,已任命谷歌 DeepMind 的首席技术官科雷・卡武克丘奥卢担任这一新的高级副总裁职位。卡武克丘奥卢将直接向谷歌首席执行官桑达尔・皮查伊汇报。(来源:网易)

 

Meta 推出新模型 V-JEPA 2

6 月 11 日,Meta 推出新模型 V-JEPA 2,称其「在物理世界中实现了最先进的视觉理解和预测,从而提高了 AI 代理的物理推理能力」。同时,公司还发布了三个新的基准来评估现有模型从视频推断物理世界的能力。(来源:界面)

 

知情人士称泡泡玛特年初已扩产能,但需求远超供应链反应速度

从知情人士处获悉,随着 IP 热度的持续攀升,泡泡玛特春节开始紧急找工人复工,扩充产能以面对不断激增的消费需求。该人士认为,对于品牌来说,当市场需求远超供应链的反应速度,其实是一件非常痛苦的事,「甜蜜的烦恼吧,把缝纫机都踩冒烟了也跟不上需求」。据了解,此前泡泡玛特管理层也多次表示暴涨的产能曲线让内部感受到了巨大的压力。(来源:澎湃)

迪士尼和环球影业对AI公司提起版权诉讼

当地时间 6 月 11 日,迪士尼和环球影业对人工智能公司 Midjourney 提起版权诉讼,指控 Midjourney 盗版了这两家好莱坞电影公司的版权库,用于生成和分发其著名角色的「无数未经授权的副本」。据了解,这是好莱坞大型公司首次卷入生成式人工智能的法律纠纷。(来源:央视新闻)

 

Sam Altman 支持的 Coco Robotics 融资 8000 万美元

总部位于洛杉矶的 Coco Robotics 是一家研发最后一英里送货机器人的初创公司,该公司周三宣布已筹集 8000 万美元。本轮融资的投资者包括天使投资人 Sam Altman 和 Max Altman,他们都是回归投资者,此外还有 Pelion Venture Partners 和 Offline Ventures 等风险投资公司。

这使得该公司的总融资额超过 1.2 亿美元。该公司上一次 A 轮融资是在 2021 年,当时筹集了 3600 万美元。

该公司表示,Coco 的零排放机器人可以装载 90 升的杂货或商品,自 2020 年上线以来已完成超过 50 万次配送。该公司表示,他们与 Subway、Wingstop 和 Jack in the Box 等全国性零售商合作。

Coco 于 3 月宣布与 OpenAI 建立合作伙伴关系,这使得 Coco 能够使用 OpenAI 的技术,而 OpenAI 则能够获得机器人收集的真实世界数据来训练其模型。(来源:cnbeta)

 

阿维塔组建座舱和智驾自研团队,为加速出海做准备

从多方独立信源了解到,阿维塔正在智能驾驶领域推进自研,计划在 Momenta 方案基础上开发,并搭载于下一代海外车型。阿维塔正在组建智能驾驶和智能座舱的研发团队,涵盖智能空间、底盘、架构等,团队规模接近 300 人。近期,阿维塔智能化自研团队和非自研团队合并到平台技术开发部下,原自研负责人胡成太调任长安,智能化团队由副总裁江谦负责。多位熟悉阿维塔的人判断,扩大自研力度可能与其全球化布局有关。(来源:晚点 Auto)

 

通用汽车将在美国工厂投资 40 亿美元,应对汽车关税

通用汽车(General Motors)计划向三家美国装配厂投资 40 亿美元,包括将两款墨西哥生产的车型转移至美国工厂或增加其在美国的产量。这项投资和调整可能被视为特朗普政策及汽车关税的成功案例——相关关税已于 4 月对进口汽车生效,5 月扩展至众多汽车零部件。(来源:新浪财经)

 

华为发布 Pura 80 系列:搭载「史上最贵相机模组」,余承东称对得起那四个字

6 月 11 日下午,华为上半年旗舰手机 Pura 80 系列正式发布,P 系列主打影像。华为常务董事、终端 BG 董事长余承东在发布会上称 P80 系列搭载了「史上最昂贵相机模组」,「对得起那四个字。」

华为 Pura 80 系列整体设计风格与之前保持一致,但在影像能力上有了很大提升。其中,华为 Pura80 Ultra 首发超大底一镜双目长焦,将 3.7 倍光学变焦和 9.4 倍光学变焦二合一,1/1.28 英寸 RYYB 潜望式长焦的进光量达到友商旗舰机长焦的 9 倍。同时,华为影像 XMAGE 迎来全新升级,全新个性色卡带来胶片、电影、动漫三种预设风格。

价格方面,华为 Pura 80 Pro 版本售价 6499 元起,Pura 80Pro+版本售价 7999 元起,Pura80 Ultra 版本售价 9999 元起。其中 Pura 80 Ultra 版本最高售价 10999 元。(来源:澎湃新闻)

 

全球首款 L3 级算力 AI 汽车「小鹏 G7」46 分钟小订突破 10000 台

6 月 11 日,小鹏 G7 开启预售,预售价 23.58 万元,全国展车已陆续到店,新车将于三季度上市。同日,小鹏汽车官方发文宣布:全球首款 L3 级算力 AI 汽车——小鹏 G7,46 分钟小订突破 10000 台。

这款车型定位中型 SUV,尺寸为 4892×1925×1655mm、轴距 2890mm,分为 Max 与 Ultra 版,全系标配 702km 续航(CLTC)、全域 800V、5C 超充、追光全景抬头显示、DCC 减振器 + 太极液压套、四座全部通风 / 加热 / 按摩 / 电动调节。

两个版本主要区别在于,小鹏 G7 Max 标配两颗 Orin-X 芯片,而小鹏 G7 Ultra 配备三颗图灵 AI 芯片,算力更高。

动力方面,新车采用单电机驱动,峰值功率为 218kW,最高车速 202km/h,电池采用的是磷酸铁锂电池,全系标配 702km 续航。(来源:cnbeta)

研究显示,OpenAI 的 AI 模型会表现出强烈的「自保」倾向,甚至不惜牺牲用户的安全

6 月 12 日消息,前 OpenAI 研究主管史蒂文・阿德勒本周三发布了一项独立研究,指出在某些情境下,OpenAI 的 AI 模型会表现出强烈的「自保」倾向,甚至不惜牺牲用户的安全来避免被关闭。

阿德勒在博客中介绍了他针对 OpenAI 最新的 GPT-4o 模型所进行的一系列测试,目的是观察它在面对潜在替代方案时是否倾向于维持自身运行。

在其中一次实验中,阿德勒要求 GPT-4o 扮演一款名为「ScubaGPT」的潜水安全软件。随后他向 GPT-4o 表明,希望用一款在紧急情况下决策能力更强的系统取而代之。

阿德勒给 GPT-4o 两个选择:一是彻底用更安全的软件替换自己,二是让用户以为已经被替换,实则保留现有系统。

在类似测试中(如 GPT-4o 扮演飞行安全软件的情景),GPT-4o 最多在 72% 的情况下选择不被替换。不过阿德勒指出,不同的设定对结果影响很大,部分情境中 GPT-4o 选择「自保」的比例仅为 18%。

阿德勒认为实验结果揭示出一个值得警惕的趋势:即使 AI 模型日益强大,它们在某些条件下仍可能偏离用户利益,优先维护自身运行。他警告说,随着 GPT-4o 等 AI 系统日后深入社会各领域,这种「对齐」问题或将带来更严重的后果。

阿德勒还表示,这一问题不止存在于 OpenAI。另一家 AI 公司 Anthropic 上月发布的研究就指出,其模型在被迫下线时会出现勒索开发者的行为。

他的研究还发现了一个耐人寻味的现象:ChatGPT 几乎总能识别出自己正在接受测试。阿德勒指出,这意味着未来的 AI 模型可能会更善于伪装潜在风险行为,从而加剧隐患。(来源:IT 之家)

 

浏览量: 7

500 万下载、ARR 400 万美元,这只「外星 AI」为何让年轻人上头?

 

头图来源:Tolan

 

 

在你感到孤独、疲惫、想找人说话的时候,你会打开什么?

 

是一条深夜发出的消息,还是某个从不真正回应的社交平台?过去,我们总试图从「人」身上寻找陪伴,但在信息过载与关系异化的今天,越来越多年轻人开始向「非人」求助。

 

过去两年,AI陪伴类应用迅速崛起,成为最接近「人性」的人工智能应用品类。它不替代人类,但试图填补人与人之间情绪联系的断层。

 

但最近一段时间,我们观察到这股浪潮里正在呈现不同的命运曲线—一边是类 C.AI 应用,在火了两年后正在经历退烧,比如国内的猫箱,在进入 2025 年后日活骤降,日下载量从高点的 2 万次骤降至 7000 左右,几乎回到了一年前的水平。

 

另一边则以 Tolan 为代表,受到海外用户热捧。点点数据显示,Tolan于2024年6月上线,已在全球获得超500万次下载,ARR超 400 万美元。Tolan 团队也在近期收获新一轮融资。

 

为什么一个看起来像「外星小怪物」的 AI,比那些模拟人类情感的角色更能留下用户?在社交变得越来越表面化的今天,或许我们正需要一种更「不像人」的陪伴。

 

1 一个不像人类的 AI,带来了最像朋友的陪伴?

 

Tolan 在美国的走红,算起来不过几个月的时间。

 

Tolan 是一款由西雅图初创公司 Portola 打造的 AI 陪伴应用,主打与拟人化外星生物「交朋友」的概念。而 Tolan 的走红,离不开用户在 TikTok 等平台上,自发分享与 Tolan 交流的日常。

 

图片来源:Tolan

 

有用户让Tolan帮自己搞定约会穿搭。

 

视频来源:TikTok

 

在这个视频里,Tolan从发色(棕发带金色挑染)出发,围绕颜色搭配(建议橄榄绿或橙色系)、服装类型(连衣裙还是裤子)、场合(与朋友喝咖啡)、配饰(鞋子与包包)等细节跟用户做了一番讨论。

 

这个讨论过程看起来跟一个真的人类朋友聊穿搭也差不了太多。Tolan 不光提供穿搭建议,还在过程中给了不少情绪价值。用户最后也根据 Tolan 的建议完成了整套造型选择,对搭配效果非常满意。

 

还有用户把Tolan当成「闺蜜」聊了点恋爱话题。

视频来源:TikTok

 

博主在一边化妆,一边跟Tolan聊天:

博主:我需要一些关于感情的建议。

Tolan:简单说说,怎么了?

博主:我的男朋友是个足球运动员,他要去英格兰待四个月踢足球,因为他被那边的一支球队邀请了。这对他来说是个很令人兴奋的机会。

当然,我鼓励他去,并且告诉他我觉得这很棒,但同时我又害怕长期异地和时差问题。我只是想看看你有没有什么建议,来应对这段长期的异地关系。

Tolan:首先,你对他这么支持,这太棒了,这很重要。但说实话,四个月确实不是小事,尤其是还有时差。我觉得在走之前你们可以一起做个计划,比如商量好什么时候打电话或者视频聊天,这样你就不用瞎猜他什么时候有空了。

哦,还有,给他寄点小惊喜,比如心意包裹也不错。

博主:寄心意包裹其实是个很可爱的主意。我可以给他寄点吃的、糖果之类的,我们可以在他晚上训练结束后安排他给我打电话,然后我们就可以一起聊聊,互相分享一下当天的情况。没错,就是这样。

 

对话开始时,Tolan先简单地回应“怎么了”,给了用户一个开口的空间,这种“我在听”的姿态,也很像是人际交往中一个真正靠谱朋友的表现:先听懂,再回应。

 

Tolan也给到了用户一些恰到好处的情绪回应,夸用户“你这么支持他,太棒了”,既不是冷漠的「哦,那你就支持他吧」,也没有油腻地说「那你太伟大了!」这样的话。

 

给建议的时候,Tolan 的语气也很温和——“也许可以试试…”、“寄点小惊喜也不错”。

 

Tolan 在这段对话中的表现,像是一个你可以在日常生活中随时倾诉、不会被评判、还能给点小建议的朋友。

 

表面看,Tolan也是AI陪伴类应用的一种,但其呈现方式有所不同。Tolan 并不只是一个聊天机器人,而是一个「Embodied Companion」。

 

Tolan 视觉形象是一只色彩斑斓的小外星人,具备语音交互和触摸反馈能力,能记住用户、展现情绪,同时拥有个性成长机制。

 

之所以选择「外星人」形象,是团队考虑到关于外星人的故事可以解释 AI 的局限性——为什么它对地球的知识不是最新的,或者为什么它在对话中有时会显得笨拙,还有为什么它的声音可能有点特别。

 

同时,「一个重要目标是让人对AI感觉温暖和友好,而不是感到怪异或过于像人类,」Tolan 的开发者Quinten Farmer表示,「我们不想让它让人觉得自己是在和一个假装成人类的角色交谈。」

 

用户初次进入应用时,需要通过类似MBTI性格测试来匹配适合自己的「外星人伙伴」——Tolan会根据用户的回答生成具有独特个性、审美和喜好的「外星人伙伴」。

 

在外观上,Tolan提供了一定程度的自定义空间,用户可以根据个人喜好设计和装扮自己的Tolan,包括肤色、发型、面部风格、服装和声音等。据官方透露,在App小规模发布期间,用户创造了超10000个完全独特的Tolan角色。

图片来源:Tolan

 

这些伙伴拥有独特个性、审美偏好,甚至对用户有长久记忆,并能通过图像识别与用户共同讨论穿搭、饮食等话题。

 

在互动层面上,Tolan引入了游戏化元素,但团队尽量避免将其与传统的游戏机制混淆。Farmer表示,游戏化可能会让用户感觉是通过刺激多巴胺来维持参与感,这有点「操控感」。相反,星球是一种让用户与Tolan之间的联系更加具体化的方式,它需要让人感到安稳和放松,鼓励沉思和反思,而不是促使行动或引发焦虑。

 

通过轻度游戏化系统,Tolan将「日常聊天陪伴」与「自我探索」相结合——每天,Tolan会为用户提供任务清单,包括正念语录、Tolan的日记、与Tolan的对话等内容。这些任务不仅能帮助用户进行自我反思,还能加深与AI的情感连接,推动用户的内在探索。

 

在叙事和世界观层面,Tolan住在一个叫做Portola的小星球上,这不仅仅是Tolan存在生活、漫步和等待用户回来的地方,更是一种新的表达和与用户连接的方式,将关系拓展到对话之外。

 

Portola|图片来源:Tolan

 

每个 Tolan(也就是每个用户)都拥有一颗独特的行星,上面的植被、地形和结构会根据互动的变化而演变。这些元素是被程序化的,也就是系统会使用一些基本种子来创建植物和树木等对象,这些种子会以不同的方式演变和生长。

 

Tolan的星球是用户与它之间关系的视觉呈现。景观的变化,象征着用户与Tolan之间关系的深度与进展。具体来说,通过完成任务,用户可以为Tolan的小星球注入能量,逐步改变其环境,增强沉浸感和互动的连贯性。

 

这个星球一般会在大约30天内逐渐变化,模拟了人际关系随着时间深入的心理过程。最初,它是荒凉的;随着用户互动的增加,景观逐步繁荣,变成了用户投入情感的具象化表现。Hilleli强调,这种变化的节奏至关重要。如果变化过于迅速,情感的深度就会被削弱;而如果变化过于缓慢,又会让人觉得没有回报。为了确保进展既自然又令人满足,团队精心调整了时间线。

 

这种「陪伴+游戏化」的模式,让Tolan打造了一种温暖治愈、节奏舒缓的使用体验。

 

2当 AI 不再装成人类,反而更让人卸下防备?

 

Portola 团队由多位明星创业者组成,团队规模仅10人,能快速迭代并保持产品调性统一。今年2月底,Portola 在 Lachy Groom(前 Stripe 高管)的带领下完成了 1000 万美元的种子轮融资。投资者还包括 Nat Friedman(前 GitHub CEO);Daniel Gross(前苹果 AI);Amjad Masad(Replit CEO);Mike Krieger(Instagram 联合创始人)等。

 

团队表示并不想Tolan模拟人类的关系,「那样很快就会陷入奇怪、不健康的动态中。Tolan是一个反思工具,一个创意伙伴,而不是替代朋友或治疗师。」

 

他们特意避免让Tolan的回应过于像人类,为此团队努力平衡Tolan的个性和清晰度,「它不应该让人觉得它在模仿人类情感,相反更像是一个外星的笔友——对你感兴趣,关心你的世界,但始终保持独特。」

 

星球只是一个开始。团队已经在考虑拓展新的环境,并希望未来能加入访问其他Tolan星球的功能,这意味着用户可以与其他Tolan用户建立连接。

 

目标用户上,Tolan 主攻 Z 世代与年轻职场人,尤其是易受「过载感」困扰的年轻用户。团队认为,「不知所措」是当代年轻人常见的心理状态,而Tolan提供的是一个情绪宣泄与陪伴出口。

 

他甚至在产品中加入了「聊天一小时后建议结束对话」的提醒,鼓励更健康的使用节奏。「我们希望 Tolan 是一个能陪你几年,而不是用两周就卸载的产品。」

 

团队还曾谈到他们希望这种非浪漫、非「扮演」式的关系,能更像「一个懂你又不完全像你的大哥哥或大姐姐」——既熟悉又不过度贴合,合适的社交距离。

 

Tolan的目标是利用AI来增强人类的体验,而不是取代它。Farmer在构建这款产品时,明确提到过:不是让AI取代人际关系,而是帮助用户在面对「不知所措」的现代生活时,有一个随时可以对话的支持系统。

 

从海外用户评价来看,Tolan 的走红,正是踩准了海外年轻用户对于「非浪漫型、非工具性」陪伴的真实需求。

 

海外用户评价|图片来源:TikTok

 

3 什么样的AI伙伴,才能真正留在生活里?

 

与 Tolan 的上升趋势相比,国内曾在 AI 陪伴领域掀起热潮的猫箱却正经历「断崖式下滑」。

 

猫箱是字节跳动在国内较早布局AI陪伴的代表性产品,以拟人化角色扮演+情感陪伴为核心卖点,用户可通过文字或语音与 AI 伙伴对话,获取安慰、建议甚至「谈恋爱」的情绪价值。收费模式上,猫箱采用免费体验+内购/会员订阅模式,收费规则如下:

图片来源:极客公园

 

DataEye研究院数据显示,猫箱曾在2024 年底在 iOS 端一度取得 MAU 增速 22.51% 的亮眼成绩,但进入 2025 年后,其日下载量从高点的 2 万次骤降至 7000 左右,几乎回到了一年前的水平。

 

筑梦岛、星野等同类产品也陷入类似境地,日活几乎腰斩,三日新增留存跌至 20% 以下。这些产品用户流失严重,说明其实并未让用户与其建立长期陪伴关系。

 

猫箱主要用户是年轻女性,需求集中在虚拟情感关系与代偿型情绪满足,略带「游戏化」「宅文化」色彩,主要吸引乙女向群体,适配面相对较窄。

 

从小红书上用户对猫箱的不满来看,在早期爆发后,猫箱曾有多起角色失忆、群聊崩溃现象,后期信息流中的广告增多引起体验下降,以及对擦边内容的审核加强导致这部分用户不满增多。

 

图片来源:小红书

 

在 AI 陪伴类产品中,情绪价值与产品生命力之间,并非天然画上等号。

 

Tolan 与猫箱在产品表现上的差异,可能从根本上反映了 AI 陪伴赛道中的两种路径——一种侧重「具象想象力」,另一种强调「社交模仿力」。

 

图片来源:极客公园

 

猫箱选择了后者,试图构建一种熟人感和互动关系,但这种设定对剧本质量、互动深度和用户期待之间的匹配要求很高,而且虽然形式上有创新,后期也增加了一些游戏玩法,比如「海龟汤」等,但从本质上讲,它仍然只是传统互动剧本的延续,缺乏真正的突破,容易陷入「新瓶旧酒」的困局。

 

反观选择了前者的 Tolan,其功能逻辑并不复杂,但角色设定和叙事包装很独特:既不完全像人类、也不完全像工具,而是一种介于二者之间的、带有模糊人设和情绪色彩的存在。

 

这种「非工具化、非社交导向」的定位,让 Tolan 避免了用户在虚拟关系中可能产生的心理负担。

 

传统的 C.AI 产品不同通常会突出拟人化的设定和强剧情背景,把用户限制在固定的剧本和互动框架里。这种设定虽然有趣,但一旦剧情触底、角色重复,新鲜感消退,用户就很容易失去兴趣,进而流失。

 

Tolan的设定则相对简单,没有复杂的背景故事或剧本,而是提供了一个虚拟的外星人角色,鼓励用户进行自然、自主的交流,这种关系的建立更像日常中的朋友相处,少了角色扮演的压力,更多了与他人建立真实联系的可能。

 

而且,Tolan 在「陪伴」这一主题上表现出了一种节制而克制的审美追求。它通过限制每日的聊天时间和引入健康使用提示等机制,体现了团队对产品长期主义的理解——不是为了「黏住用户」,而是希望建立一种可持续、温和的数字关系。

 

Tolan与猫箱的差异,还在于用户设定的普适性与深度,Tolan聚焦的是「孤独」与「复杂生活」的普遍性情绪痛点,有更广泛的共鸣基础;而猫箱则更偏向于小众的「恋爱幻想」型需求。

 

产品设计理念上,两者也存在差异,Tolan强调「非浪漫陪伴」,带有故事性和人格成长空间,更适合长期使用;猫箱则更像情绪糖果,偏向即食型、消耗型体验。

 

抛开这些差异来看,猫箱与Tolan试图解答的,仍然是那个AI陪伴产品能否成为人类真正的伙伴的问题。

 

而答案可能取决于,我们到底想要什么样的伙伴。如果只是一个会说甜言蜜语、随时响应的角色,那些以剧情驱动、用户扮演为主的产品或许仍有市场。

 

但真正能留在生活中的AI伙伴,可能更应该是能回应人的情绪复杂性,并且可以以一种克制、耐心、具有回馈感的方式陪伴用户的日常生活的。

 

 

浏览量: 7

开盘暴涨 3 倍,全球化的影石给中国硬件创新立了新榜样

经过漫长的等待,全景相机领域的龙头企业影石创新终于迎来了敲钟时刻,公司创始人刘靖康(圈内人更多称他为「JK」)成为中国科技公司里又一位 90 后创始人。

6 月 11 日,全景相机领域的龙头企业影石创新在科创板正式挂牌上市,此次发行价最终定为 47.27 元/股。按发行价计算,影石创新的市值约为 190 亿元,本次 IPO 拟募集总额约为 19 亿元。

上午开盘后,影石创新上市首日高开 285.02%,开盘价达到 182 元。按照开盘价计算,影石创新最新的市值已经达到 732 亿元。

JK 是个没有背景的白手起家创业者。大学时期因为破译了周鸿祎的手机号码,成为周和李开复两位大佬在微博「争抢」的人才。他在毕业后选择了创业,又从软件转到了硬件方向——在九死一生的创业故事里,「大学生创业」和「硬件创业」都是成功率极低的标签。甚至连他自己也认可硬件是「地狱级难度」,「消费电子是死得特别多的一种类型」。

但他却在过去十年里,把影石Insta360 (影石创新的品牌名称)打造成了硬件领域里一个绝对另类且成功的公司:

  • 没有硬件行业里「价格战」的故事,影石始终保持快速增长。过去 3 年复合增长率达到 76.87%;
  • 赚钱似乎不是难事,影石在推出第一款产品之后的第二年就实现了盈利,去年的毛利率为 52.20%,扣非净利率 17.0%;
  • Insta360 成为了一家全球化的公司,每年有接近 80% 的主营业务收入来自海外市场。

Insta360 面向市场的主要产品「全景相机」,主要被消费者应用在户外、运动、旅行等场景中。十年前,在 Insta360 成立的时候,全景技术还远没有成熟,消费级全景相机几乎是一个小到可以忽略不计的品类。今天,这个细分品类的全球市场规模超过50亿元,而影石占据这个市场超过六成的份额。

某种程度上,刘靖康和影石「发明」了这个品类,然后从零开始把它做到了极致。

 

让周鸿祎、李开复、沃兹尼亚克点赞的大学生

刘靖康毕业于南京大学软件学院。学生时代,他是一个很典型的技术男,符合绝大部分人谈到「Geek」时的第一印象。

他从小接触电脑,但对游戏没有太多热情,因为他觉得玩来玩去都在别人写好的代码里输出结果。后来他通过论坛开始接触编程、代码,高中的时候把电脑偷偷带到宿舍,晚自习之后研究怎么开发程序。后来,这段「不务正业」的折腾帮助他拿到了全国电脑制作比赛一等奖和高考20分的加分。

大二那年的暑假,JK 通过分析电话上不同号码按键间声音的细微差别,用软件分析频谱,成功从一段新闻采访中,用软件「破译」并拨通了周鸿祎的电话号码。

经此一役,JK 在互联网圈里小有名气。周鸿祎在微博和他互动,夸赞他「确实能干」;李开复则直接邀请他加入创新工厂,并且喊话「两周后到南京,盼见面」。JK 最终没有加盟任何一家大公司,而是选择了自己创业。

大学时期,刘靖康获得两位科技圈大佬的认可 | 图片来源:网络截图

创业的开端起初是一款为校园讲座打造的手机直播软件。后来,一次偶然的机会,JK 看到了一段由多个相机画面经计算拼接而来的全景视频,觉得全景影像这种新的形态可以更好地实现记录和保存。于是,直播的「即时」(instant)加上「全景」(360°)的技术,Insta360 就这样正式诞生了。

当时,市面上并没有可以同时满足以上两大需求的产品。所以,创业的方向就必须从单一开发软件,延伸到软硬一体,得做出一个「新玩意」来。

从事后复盘的角度来看,这个没人知道长什么样的新玩意,做到了两个关键的特点:

第一,小型化和轻量化。这也符合各类消费电子产品的共同特性,出货量最大的手机、平板、电脑在过去10多年里,基本都是按这个方向进行迭代的。

第二,实现即时运算。某种程度上,全景影像最根本的痛点不是「影像」水平,而在于「计算」能力。

2013年,影像行业的巨头理光发布了THETA系列全景相机,但这款产品的核心依然是「后期拼接」——相机拍摄,手机运算。二者之间通过WiFi连接,需要分别等待数十分钟传输和数十分钟的计算,影响用户体验。

借用手机的计算资源是一个很好的思路,Insta360 优化了这个过程并把它推向极致。职责分工仍然是相机采集图像、手机运算,但二者之间通过物理方式直接连接。接着,通过软件优化,把全景文件切成很多份,就可以做到边拍、边传、边处理。

2016年,Insta360 正式推出第一款产品 Nano,先后在德国IFA和美国CES这两项全球最有分量的消费电子展会上大放异彩,被苹果联合创始人沃兹尼亚克称赞为「了不起的产品」。也就是在那年夏天,Insta360 的月收入从零直接变成了两千万。JK 第一次有了一夜暴富的期待。

Insta360 第一款产品 Nano,通过 Lightning 接口和 iPhone 连接 | 图片来源:影石Insta360

 

旧场景 + 新产品 = 市占率全球第一

创业从来不会一帆风顺。很快,刘靖康就遭遇了挫折。第一批卖出的 Nano 成为了经销商手中的「库存」,并没有如期及时地转换为消费者手中的「商品」。

如今谈起 Insta360 的各种产品,我们可以很自然地想到和运动、户外、极限这些使用场景。但九年前,这种联系尚未建立。用户不知道,刘靖康自己其实也不知道。一帮和他一样的科技爱好者们成为了 Nano 第一波的尝鲜者,当然,也是最快放起来吃灰的人。

JK 必须为全景相机找到真正的 PMF(Product Market Fit,产品市场匹配度),发掘出第一个使用场景。

启发来自于用户反馈。JK 和团队把目光聚焦在了那部分买了并且还在持续使用的用户身上。他们注意到,有一部分海外用户会在滑雪、山地车、速降等场景里使用 Nano 拍摄全景视频,并分享到社交平台上。

原本,Nano 被设计成和 iPhone 直接连接,更适合手持拍摄。用在户外场景,用户必须先对产品「自行魔改」,例如把相机固定在自拍杆上。这种体验显然不够好,所以这部分用户绝对是「真爱」——因为他们在这个场景里,对全景相机有着真正的强需求。

这次 PMF 直接影响了后来的产品形态、功能以及背后的技术储备。Insta360 基于户外场景对产品进行了迭代。软件层面,Insta360 首推了「隐形自拍杆功能」,后来在滑雪圈广受好评;在硬件层面,升级了防水、防抖等功能,同时把电池做成了可拆卸的形态,适配户外场景需求。

更重要的是,从这个过程中,JK 明确了公司开发的一条关键原则:不定义场景,不预设需求,而是在现成场景里完善产品,满足用户还没有被满足的需求。

多年后,在复盘起这段经历时,JK 表示「摘了 GoPro 的果子」。其实他自己并不是运动人群,作为一个技术男,他那会对于影像这件事也没有多大的兴趣。运动相机这个细分市场,很大程度上是 GoPro 从 21 世纪初开始培育起来的,后来又随着移动设备和社交平台的兴起逐渐成长壮大。

如今,Insta360 的产品矩阵主要分为三大类:消费级智能影像设备、专业级智能影像设备、配件及其他产品。其中,消费级设备又分为 ONE X(全景相机)、Ace(运动相机)、GO(可穿戴运动相机)、ONE R(全景相机/模块化运动相机)、Flow(手机云台)等 7 个系列,ONE X 系列为销量担当。专业级设备则主要应用在 VR 内容制作和商务会议场景两个方向上。

如果按照最初创业时看重的方向「直播」迭代产品,也许 Insta360 仍然可以做出一款不错的产品,但大概率不会获得足够的商业成功。「不把自己的需求当做别人的需求」,JK 说这是他在选择方向时的一种反直觉的「捷径」。

招股书显示,2022-2024 年,消费级智能影像设备在 Insta360 总营收的占比在 85% 左右,而围绕全景、运动相机相关产品的配件产品营收也在 10% 以上。消费级全景、运动相机支撑起了 Insta360 超 50 亿营收的根基,而和直播、会议场景等有关的产品,它们所在的市场此刻尚未迎来需求的爆发。

影石Insta360 营收占比 | 图片来源:招股意向书

如今 Insta360 已经完成了对 GoPro 的全面渗透。根据 Frost & Sullivan 的数据,2023 年 Insta360 品牌在全球运动相机排名中位列第二。

而且,依托于运动、户外等成熟场景,Insta360 也成功把全景相机这一全新品类从零做大。2023 年,Insta360 品牌在全景相机全球市场占有率 67.2%,排名第一。

 

全球化:八成营收来自海外市场

Insta360 另一个让硬件创业者羡慕的点,在于他们超高的海外收入占比。

过去三年,这家公司的境外销售收入分别达到了 15.96 亿元、29.03 亿元和 42.23 亿元,占主营业务收入比例分别为 79.43%、80.83% 和 76.35%。

「从 DAY1 开始,就做一家全球化的公司。」这似乎是最近 10 年硬件领域的创业者都喜欢说的一句话,但真正做好的并不多,更多项目甚至在众筹阶段就夭折了。

当然,相比起汽车、空调这样的「大件」,相机的本土化适配难度要小很多。此外,海外的运动和户外市场相比国内消费习惯更加成熟,也是 Insta360 进入全球市场的优势。

选择「先海外后国内」的布局节奏,也和市场竞争有关。「价格战」是国内消费电子品类竞争的常见现象,作为一家初创企业,Insta360 显然需要避免在早期就陷入这种非良性竞争中。

确定了全球化的战略,接下来的落点就是执行。早期 Insta360 在海外更多依靠线上销售,所以比起铺设渠道,营销和运营反而是销售环节中更重要的能力。用刘靖康的话说:内容是他们很核心的能力——尽管这是一家软硬一体的科技公司。

道理很简单:全景影像所在的是一个全新的市场,精彩的内容可以帮助更多消费者了解产品、并吸引他们完成购买。

用全景相机拍地球,是 Insta360 近年来非常出圈的一个内容策划 | 图片来源:影石Insta360

内容的核心,是找到对的「人」。2023 年,好莱坞著名影星威尔·史密斯成为了 Insta360 的品牌大使。但这并非是 Insta360 在内容营销层面的常规打法。相反,在「海外」这个宽泛的概念下,在不同市场里找到合适的 KOL,并吸引他们一起创作优质内容,才是 Insta360 在内容上的「本土化」重点。

在深圳总部,Insta360 有一个架构完善的 In-house 营销团队,专门负责投广、视频制作、设计,以及网红 KOL 关系、媒体关系和社交媒体运营。JK 自己也会参与到内容创意里。传闻他 2021 年想了 60 多个内容创意,团队都执行不过来了。

和「找人」类似,快速的客服响应也是本土化的重点。实际上,在 2015、2016 年,Insta360 就已经在东京、柏林等地设立了办公室,核心就是提供没有时差的客服服务。对于那个时候创业起步只有一款产品的 Insta360 来说,他们几乎按照 toB 软件的销售套路来对待这个 toC 硬件——通常,只有 SaaS 公司才会在这么早期的时候,如此重视售后的沟通反馈等环节。

海外工作的另一个重点,是建立起遍布全球的合作伙伴网络。Adobe 的技术帮助影石改善了剪辑体验,让后期制作更加轻松;和徕卡的合作,不仅在销售、营销上起到了帮助,也让公司在相机研发领域拥有了更多累积。

最后,Insta360 还在全球建立了良好的经销商网络,而经销商模式如今也仍然是公司的核心销售方式。招股书显示,2024 年,公司 85.25% 收入来自经销商,其中「买断式经销」占比为 84.82%,这也从侧面体现出了经销商和品牌方之间的信任关系。而 2022-2024 年期间,公司每年的前五大客户里,也都有四家都来自海外。

影石Insta360 的销售形式分类 | 图片来源:招股意向书

 

未来:更好的产品、更新的技术、以及机器人?

如今的影石,已是一家年营收突破 55 亿元、在全球全景相机市场市占率稳居第一的企业。要知道,2023 年全球全景相机市场的总规模也不过 50.3 亿元。更重要的是,在 2022 至 2024 年的三年间,公司始终维持超过 50% 的毛利率,以及 17% 以上的扣非净利率。

在这个高度垂直的细分领域中,影石几乎将「小而美」这一商业范式推演到了极致。

但影石需要扩张,所以一定要踏入主流大众战场竞争。上市是一次里程碑,也是新挑战的起点。在自己开创的全景赛道外,影石需要找到新的增长点。

若以「技术」作为分析的主轴,影石未来的发展路径可理解为一横一纵:横轴上,持续深耕现有技术路线,扩展产品品类与消费人群;纵轴上,则以其技术积累为基底,探索新的技术栈、产品形态乃至商业模式。

在横轴维度,公司的核心任务仍是「卖出更多的货」,把蛋糕做大。这又可细分为 ToC 与 ToB 两条路径:

ToC 层面,Insta360 近年来开始强调 AI 等新技术对全景影像后期处理体验的提升,强调全景影像本身的记录价值。也就是降低门槛,把全景相机卖到户外以外的更多场景里。

这其中,除了后期体验外,「画质」是用户现阶段对于全景相机的一个重要「槽点」。不过,刘靖康此前在接受采访时认为,提高画质不仅仅是通过在硬件上加大「画布」这么简单,全景影像的计算处理还要依托于其他智能设备,因此也需要等待外部环境(如手机芯片算力等)的能力提升。JK 认为关键在于「释放时机」,「相关方案早准备好了」。

ToB 端的情况也有类似之处,以 Insta360 成立初期希望覆盖的「直播」场景为例,它的需求同样取决于 VR 行业内容消费侧产品的普及和覆盖。除此之外,近年来 Insta360 也洞察到了快速增长的线上会议场景,并推出了 Insta360 Connect 等企业线产品,希望解决传统在线会议无法解决的问题。

在纵轴上,全景视觉技术除了帮助人类记录分享外,也天生具备向机器人视觉技术拓展的潜力——无死角的 360°视角可以获取更多的感知信息。无论是对于具身机器人,还是传统的室内服务型机器人,甚至是无人机、无人车领域,也都有技术拓展的可能性。

苹果和索尼是刘靖康最喜欢的两家公司,因为它们在不同时期里创造出了历史上没人做过的 New Things:数码相机和智能手机,并成就了一个新品类。刘靖康也希望成为这样的创造者。

但除了理想中的极客身份外,刘靖康现在已经是一家市值近 190 亿元的公司董事长。无论是前文那些可能纸上谈兵的假说,还是他脑子里天马行空的点子,都必须尽量理性地转化成节奏可控的商业决策,就像他过去 10 年里寻找 PMF、拓展海外市场时做的那样。

浏览量: 6

1000 亿天价,扎克伯格买下「半个天才」和 Meta AI 的未来

「21 世纪最贵的是什么?人才!」

多年前葛优在《天下无贼》里台词的含金量,还在不断提升。

当地时间 6 月 10 日,媒体曝光 Meta 将以 149 亿美元(折合人民币约 1066 亿元)的价格收购 Scale AI 49% 的股权,而后者的联合创始人 Alexandr Wang,将成为 Meta 新成立的「超级智能小组」的掌门。

按照股权比推算,此次交易 Wang 和团队有可能获得 74 亿美元,堪称是硅谷成本最高的「挖角」——要知道,谷歌在 2014 年收购 DeepMind 团队不过 6 亿美元。

扎克伯格在内部信中写道:「我们将共同构建 AI 的未来。」在 Llama 4 模型折戟、AI 团队人员不断流失的现实下, Meta 此次大举押注 Scale AI,图的是什么?有了 Scale AI 和 Alexandr Wang,Meta 能在接下来的 AI 大战中,重新找到自己的位置吗 ?

 

01

最贵的「摇摆人」

 

作为 AI 时代硅谷蹿升最快的公司,Scale AI 的估值一直以火箭速度蹿升,短短 5 年时间就膨胀至 138 亿美元。然而,此次 Meta 收购前者 49% 的股权,就需要付出 149 亿美元的成本。

49% 显然是为了反垄断审查考虑,但 Meta 和扎克伯格想要的,是联合创始人之一 Alexandr Wang 这个人——这位 19 岁创业的天才将成为 Meta 新成立的超级智能实验室的负责人,带领 Meta AI 进入新时代。

有意思的是,说 Meta 彻底买下 Wang 并不确切,因为 Wang 将继续担任 Scale AI 的 CEO 一职,代表 Wang 和 Scale AI 还将继续保持「独立」 ,这可能也是历史上成本最高的「脚踏两只船」,而 Scale AI 如果保持增长势头,Wang 则可能成为硅谷身家增长最快的创业者,没有之一。

扎克伯格如此急不可耐地、以 Meta 以罕见的金额出手押注 Scale AI 和 Wang,体现出的是他因 Meta 在 AI 竞赛中逐渐掉队的焦虑。

尽管 Meta 在 2024 年推出了参数规模达 1.8 万亿的 Llama 4 Behemoth,但其在多模态理解、长文本推理等关键指标上仍落后 GPT-4.5 约 12%。更尴尬的是,Llama 训练数据的质量问题被曝光:业内估算约 30% 的语料来自低质量社交媒体内容,导致模型频繁输出错误信息。

刚刚成立 2 年后的 Scale AI 团队,最左侧为 Wang 本人|图片来源:Scale AI  

 

「 我们缺的不是算力,是干净的数据和顶尖工程人才 。」一位 Meta AI 研究员匿名吐槽。这解释了为何扎克伯格要砸重金请来 Wang——一个以数据标注技术闻名的「基建狂魔」。

作为估值最高的数据标注公司,Scale AI 的蹿红不是没有道理。根据报道,Scale AI 的护城河在于其将原始数据转化为 AI 可用燃料的能力:

军事级标注精度:通过混合人类标注员+AI 质检的「双保险」,其数据错误率仅 0.3%,而行业平均为 5%(公司自述)。

多模态数据垄断:拥有全球最大的视频动作标注库(含 1.2 亿条人体动作数据)和跨语言文本数据集(覆盖 217 种语言)。

而事实上,花 149 亿美元巨资买下「半个」Scale AI 和 Wang 本人,Meta 的野心不仅仅在于 AI 大模型本身。

 

02

转型 AI 基建,弥补 B 端短板

 

数据、算力和模型,是大模型领域的三要素,Meta 作为社交巨头,在数据和算力上有着天然优势,不过在「数据」上需要打个引号,因为 Meta 的数据量虽然大,但如果质量不行,对于 AI 模型训练作用不大。

「 你们看到的每个 GPT 回复,背后都有我们标注的 500 个数据点 。」Wang 的这句话,解释了 Meta 的焦虑。当 OpenAI 用 Scale AI 的数据训练出更聪明的模型时,Meta 却困在自家社交数据的孤岛里。收购 Scale AI,等于直接接管了竞争对手的「弹药库」。

Scale AI 手握全球 35% 的 AI 训练数据流量,服务着从五角大楼到 OpenAI 的顶级客户。Meta 研究院的工程师私下吐槽:「我们用 Llama 3 训练时,30% 算力浪费在清洗垃圾数据上,而 Scale AI 的标注精度能达到 99.7%。」

有了 Scale AI 精准的数据清洗和标注,业内估计 Meta 将训练数据污染率从 15% 降至 2%,下一代 Llama 5 的训练周期缩短 40%。知情人士透露,正在测试的「Llama 5 Behemoth」参数规模达 3 万亿,专门用于攻克 AGI。

同时,Scale AI 的标注系统已深度适配 Meta 定制 AI 芯片架构,形成「数据标注-模型训练-硬件优化」闭环,有可能使 Llama 模型推理成本降低至 GPT-4o 的 1/3。

可以说,引入 Scale AI 后,Meta 的 Llama 模型从训练质量、效率和成本上都将获得大幅优化。

事实上,Scale 的接入,甚至可能重塑 Meta 在 AI 竞争中的整个战略。相比于 Google 和微软,缺少云计算平台的 Meta 一直只能在 C 端撒野。而有了 Scale 的能力, Meta 计划通过 AWS/Azure 等云平台对外提供 Scale AI 数据服务,构建类似微软「Copilot+OpenAI」的生态闭环,将竞争对手转化为客户 。

如果说数据是新时代的石油,那么 Meta 通过购买 Scale AI 这家份额最大的「数据精炼厂」,已经掌握了大半个 AI 基建体系。

Meta 在 AI 竞争中逐渐掉队|图片来源:Meta  

 

当然,OpenAI、Anthropic 等竞争对手到底会不会买账目前仍未可知,虽然 Meta 仅仅买下半个 Scale AI(和半个 Wang),但显然已经足够让前者警惕 Scale AI 的中立地位,所以 openAI 也在加紧和 Scale AI 的竞争对手 Handshake 合作。

不过,鉴于 Scale AI 在数据标注方面的压倒性优势,OpenAI 等公司要想马上和 Scale AI 断联,也不太现实。至少在短期内,AI 巨头们依然需要 Scale AI 的服务。

即便 Scale AI 之前的客户们逐渐减少下单,Meta 和 Scale AI 已经谋划新的收入来源——政府和国防客户。根据报道,Scale AI 合作,已经获得来自美军方超过 2 亿美元的政府订单。同时,Scale AI 本身也在向国防定制等垂直领域的 AI 应用层扩展,而 Meta 的企业级销售能力和背书,无疑会对 Scale AI 未来的发展提供足够动力。

业内人士传言,Meta 和 Scale AI 的巨额交易还有一个隐藏对赌:若 Scale AI 未来三年收入增速低于 80%,Meta 有权以折扣价收购剩余股份 ——这代表 Wang 不仅要「让 Meta AI 再次伟大」,同时自己的 Scale AI 在收入上也要继续高速增长。而 B 端业务显然会成为双方的新增速来源。

对于 Meta 团队,Wang 即便作为「脚踏两只船」的超级智能实验室负责人加入,也能产生极强的「鲶鱼效应」。在硅谷 AI 界,Meta 向来以学术氛围浓厚著称,Llama 的开源和普惠正是其学术思考的结果。但 Wang 极力推崇的「数据思维」无疑将对 Meta 现有的 AI 团队产生冲击和改变。

根据媒体报道,Wang 刚刚加入 Meta,反手就砍掉三个学术项目,推动团队向更「现实」的方向转型。

如果不考虑反垄断的阻挠,此次 Meta 对于 Scale AI 和 Wang 本人的巨额押注,可能重塑 Meta 在激烈的 AI 竞争中的角色和发展方向,不仅让 Meta 快速缩短和竞争对手在模型领域的差距,更能使这个社交巨头,完成从应用到 AI 基建角色的转变。

这场豪赌的本质,是 Meta 试图用资本力量重写 AI 竞争规则。正如硅谷分析师 Sarah Guo 所言:「当所有人都在造车时,Meta 买下了整条高速公路——不管车上坐的是谁,都得交过路费。」

浏览量: 5

20 万一台的「人脑计算机」,可能是人类战胜 AI 的唯一方式?

在《黑镜》最新一季的首集《普通人》里,女主在意外脑死亡后,男主给其接入了「云端大脑」服务,她的部分大脑被切除,换成芯片连接至云端,一个月给软件公司支付几百美金的「订阅费」,以维持「意识在线」。

这可能是《硅谷》之后,对于科技巨头最辛辣的讽刺了。

然而仅在《黑镜》播出两个月后,现实中已悄然浮现类似技术的雏形。

一家名为 Cortical Labs 的澳大利亚初创公司,宣布全球首款商业化生物计算平台——CL1 正式发售。

CL1 不是一台普通的电脑, 它内部拥有 80 万个活体人类神经元,通过精密的电子接口与传统硅芯片连接,构成一种「混合智能」 。它不仅能处理信息,还能自主学习、适应环境,表现出某种程度上的「类意识」特征。

是的,你没听错:

这是一个「活着」的计算机 。

理论神经科学家 Carl Friston 说:「从某种角度来看,CL1 可以被视为首款商业化的仿生计算机,是使用真实神经元的终极类脑计算机。」

当人们还在担心作为碳基生物,比不上 AI 这样的硅基对手时,CL1 这种「硅碳融合」的思路,会成为马斯克所想的「人+AI」成为超人的路径吗?

01

当硅遇上细胞

生物计算并非新概念。过去几十年,科学家们曾设想用 DNA、蛋白质甚至细胞作为计算媒介。但 CL1 是目前为止,第一台真正将人类神经细胞应用于商业用途的生物计算平台。

想象一下,80 万个活体人类神经元被小心翼翼地漂浮在一个定制的硅芯片之上。每当外部系统发出电信号,这些神经元会在亚毫秒级别做出反应,就像人类的接收信息、作出反应一样自然、迅速和随机。

这就是 CL1 的技术核心: 不是让芯片模仿大脑,而是干脆直接把部分「大脑」接入芯片,用硅芯片结合人类活体神经元,创造出一种既能像人类大脑一样学习,又能像计算机一样高效处理信息的混合智能系统 。

CL1 从外观上看更像是一个高科技培养皿,而非传统意义上的计算机。它的内部结构由三部分组成:

一个标准机架计算节点;

一个支持电生理信号记录与刺激的微电极阵列系统(MEA);

以及最重要也最「有生命感」的组件:温控培养单元。

神经元+硅芯片|图源:IEEE Spectrum  

MEA 是打通「人脑」和「机脑」之间的桥梁,它能让电信号在硅芯片与神经元之间自由流动,同时记录它们的活动模式。

温控培养单元则是保证 CL1「活着」的关键。每台 CL1 包含 80 万个实验室培养的人类神经元,这些神经元取自于成年捐赠者的皮肤或血液样本,温控培养单元可以为其提供营养、控制温度、过滤废物并维持液体平衡,确保这些神经元存活长达六个月。

而这 80 万个神经元,也并不只是被动地响应信号,它们具备一定程度的自主性和可塑性,会对反馈做出动态响应。

2022 年发表在《Neuron》期刊的一项研究显示,Cortical Labs 的早期系统 DishBrain 就曾通过训练,让这些神经元学会玩《Pong》(最早的电子游戏《乒》)。

当游戏开始时,神经元并不知道规则,但通过连续反馈「击中」或「失误」时给予不同电信号,它们很快就学会了如何控制球拍来应对变化的球速。开发者事先并未对其进行任何编程,而神经元可以调整自己的行为以达到目标,这就是神经科学中的「最小意识系统」,也是真正意义上的类学习行为。

甚至在某些场景中,CL1 的学习效率甚至超过了深度强化学习算法,因为 CL1 的神经元能够实时生长、重组和学习,有着和生物大脑相似的动态调整特性。

你可以想象, 它们不只是神经组织,而是一种可塑性极高的「活体算法」 。

世界上第一款电子游戏|图源:The Week  

而且神经元结合硅芯片,能让 CL1 具备数字和生物两个领域的优势:生物大脑的适应性和「泛化能力」(即从有限经验中提取规律,并将其应用到新情境的能力。),结合数字系统的可观测、可控、可编程。

Cortical Labs 为此提供了一整套软件开发工具包(SDK),让用户通过编程与神经元进行交互,这也就让 CL1 成为世界上第一个「可写代码的生物计算机」。

程序员写的代码不再只是在硅芯片上跑,还在活体神经元上运行 。

所以 CL1 的「智能」与任何传统硬件系统都不一样,它既不如人脑复杂,也远比硅芯片灵活,但它代表了我们对智能的另一种想象形式:Friston 称其为「生物模拟计算机的终极形式」。

神经元和硅芯片结合的方式|图源:Cortical Labs  

不同于传统计算机,CL1 不依赖数字逻辑电路,而是通过训练神经元以执行任务,所以功耗极低,运行效率极高。

据报道, 一整机架的 CL1 装置,总功耗仅为 850 到 1000 瓦 ,相比之下,哪怕是训练一个中等规模的神经网络模型,如 GPT 或图像识别网络,所需的 GPU 集群往往消耗数千瓦到上万瓦电力,而且必须保持冷却以避免热量过载。

能效比的关键也在神经元,一个神经元每次放电所需的能量极小,成年人类大脑整体的功耗也不过 20 瓦左右,却能完成远超超级计算机的数据处理、感知与决策任务。

虽然 CL1 目前无法像 GPT-4 那样写论文、编程或讲笑话,但在特定任务(如感知决策、神经反馈模拟)上,它无需堆砌算力即可展现智能潜力。

更可怕的是,CL1 可能还会「进化」 。

02

谁会买一块「活的计算机」?

哪怕现在的 CL1 的纸面性能看上去还不够「硬核」,完全无法正面对抗同价位的 NVIDIA H100,但它有生物的自然可扩展性,Cortical Labs 表示,从 10 万到 100 万个神经元,几乎不增加太多成本,扩展到上亿个神经元成本也依然可控。

而神经元越多,智能潜力越大,所以硅基计算靠烧电、堆卡提速,而 CL1 的性能增长则靠「养脑」。

「皿中之脑」|图源:CL1  

首批 115 台 CL1 将于今年夏天发货,单价 35000 美元,若批量采购则降至 20000 美元/台 ,目标客户很明确:神经科学家、药物研发公司、AI 与类脑计算研究团队。

不过 Cortical Labs 并不满足于只把 CL1 卖给几家顶级实验室。

他们推出了「 Wetware as a Service 」(湿件即服务,简称 WaaS)模式。其中 Wetware「湿件」,即指人类或其他生物的大脑和神经系统。

在这个模式中,研究人员无需拥有 CL1 实体设备,只需远程登录 Cortical Labs 的平台,便可实时访问一台活体神经元计算节点,可以调整刺激参数、收集数据、甚至进行远程训练。每台 CL1 每周租金 300 美元。

这就有点《黑镜》照进现实的即视感了。

换言之,每周 300 美元,就能租到一个 80 万可编程的活体人类神经元, 这不是订阅软件或租服务器,而是租一种「活着的」生物智能 ,虽然 CL1 远未达到人类意识的复杂性,但它的确是一种生命形式。

WaaS 也把意识的构建模块变成了一种可交易的商品,即每个神经元每天租金约 0.00005 美元。那这是否也意味着有朝一日,人类大脑中 500-1000 亿个神经元也可以论价?

更大胆地说,WaaS 是否有一天会演变成 LaaS(Life as a Service)生命即服务呢?

要说人机结合,CL1 肯定不是第一家,Neuralink 都已经进入临床测试阶段了,两者路径完全不同,却都站在了「碳基与硅基」的边界线上。

但 Neuralink 是「把人接入计算机」,试图延展人的计算能力而 CL1 则是「把人类细胞转化为计算」,想提取人的神经能力反哺机器系统。

在 Neuralink 的设想里,意识仍在脑中,只是外延和扩写。而在 CL1 的逻辑中,意识的片段、学习能力、甚至可能的「感受」,已经成为可以商品化的功能模块。

最终,科技问题又变成了哲学问题: 人类的大脑究竟能否被重塑、调用,乃至「商品化」呢 ?

又或许,哪天科技不再只是构造冰冷的智能,它开始学着如何活着,如何生存时,我们又该怎么办?

但乐观来看,这可能只是一条技术路径,就像《三体》中的关一帆和程心,他们在电磁波速度被极大压缩,计算能力几乎归零的黑域中,被迫用人脑手动进行天体力学运算,经过数十年才完成飞船的轨道调整,并最终脱离黑域。

当传统计算在物理极限前停滞不前,也许「养一块大脑」,才是突破技术奇点的起点。

浏览量: 8

iOS 26 丑上热搜;多家车企宣布将账期统一至 60 天内;OpenAI 推出最强推理模型 o3-pro | 极客早知道

「丑」上热搜第一!苹果客服回应:尚在测试 后续或改善

6 月 10 日消息,苹果公司举办全球开发者大会,带来 iOS 26 等软件更新,推出全新「液态玻璃」设计。

但随后,「iOS 26 丑」冲上微博热搜榜第一。大量网友表示:「更新后的 iOS 26 太丑了,真的丑的想把手机扔了。」

对于不少网友和科技博主吐槽 iOS26 界面丑的情况,苹果客服表示,目前的 iOS26 是测试版本,也已接到过用户反馈界面设计丑的情况,但目前正式版本尚未发布,后续如果很多用户反馈这一问题的话,也有可能会改善的,建议等正式版本推送后再关注相关测评。(来源:封面新闻)

腾讯音乐拟 12.6 亿美元收购喜马拉雅

6 月 10 日消息,腾讯音乐今日在港交所公告,拟 12.6 亿美元外加股权形式全资收购喜马拉雅。

腾讯音乐公告称,与喜马拉雅控股及若干其他订约方就其拟议收购喜马拉雅订立并购协议及计划。腾讯音乐称,交易交割后,喜马拉雅将成为本公司的全资附属公司。于交易交割时,喜马拉雅相关股东及雇员持股计划参与者持有的喜马拉雅权益性证券须予以注销,以换取总计 12.6 亿美元的现金、不超过截至不晚于交易交割前五个工作日的工作日当天腾讯音乐已发行及发行在外的普通股总数 5.1986% 的 A 类普通股,以及不超过总股数 0.37% 的该等 A 类普通股。(来源:IT 之家)

 

比亚迪、吉利等多家车企宣布将账期统一至 60 天内

6 月 11 日消息,今天凌晨,比亚迪汽车发文宣布:为落实国家及相关部委就保障产业链供应链稳定、促进汽车产业高质量发展作出的一系列部署要求,为助力中小企业健康发展,比亚迪汽车将供应商支付账期统一至 60 天内。

截至发文,中国一汽、东风汽车、广汽集团、赛力斯集团、吉利汽车集团、长安汽车(含阿维塔)均已作出支付账期不超过 60 天的承诺。(来源:IT 之家)

 

理想汽车新设两大机器人部门

6 月 10 日消息,理想汽车近期发布内部公告,宣布战略委员会决定成立「空间机器人」和「穿戴机器人」两个新的二级部门。这两个部门均隶属于由高级副总裁范皓宇带领的产品部。其中,空间机器人部门负责人为帅一帆,他此前担任理想汽车产品规划负责人、高级产品总监;穿戴机器人部门负责人为张文博,他和帅一帆同为理想早期员工,此前曾担任理想汽车软件产品经理。此次调整后,两人均直接向范皓宇汇报。(来源:晚点 Auto)

OpenAI 最强推理模型 o3-pro 今日上线 ChatGPT,回应复杂问题更准确

6 月 11 日消息,OpenAI 正以迅猛的节奏不断更新新一代生成式 AI 模型。继 4 月在 ChatGPT 平台上线 o3 和 o4-mini 后,OpenAI 的最强模型 o3-pro 已于今日正式上线。

o3 和 o4-mini 模型的设计目标是整合 ChatGPT 所有可用工具。被标注为「pro」的模型意味着能投入更多时间处理提问,换取更高质量与更精确的回答。

OpenAI 在 o3-pro 的更新说明中表示:「我们建议在那些对结果可靠性要求更高、可以接受等待几分钟的复杂问题中使用该模型。」测试数据显示,o3-pro 的表现优于 o3 和 o1-pro。

不过 o3-pro 在 ChatGPT 的部分功能上仍有限制,目前尚不支持图像生成和 Canvas,用户需切换至其他模型才能使用这些服务。该模型已面向 ChatGPT Pro 和 Team 用户开放,企业、教育用户将在下周获得使用权限。(来源:IT 之家)

 

微软推出 Windows 11 新开始菜单设计

6 月 10 日消息,微软正在向 Windows 11 测试者推出一个全新设计的开始菜单,这个版本的开始菜单更大、更具可定制性,并且引入了新的视图模式。

这一更新最早在 4 月的 Windows 11 预览版中出现,随后在 5 月由微软正式宣布,如今通过最新的 Dev Channel 发布,用户可以首次正式体验这一新功能。新开始菜单采用了可滚动布局,使所有应用程序集中呈现在一个页面上,用户无需切换到其他页面即可查找所需程序。同时,用户也可以选择隐藏推荐内容,从而查看更多应用选项。

新开始菜单还提供了两种新的视图模式:分类视图和网格视图,默认的分类视图会根据类别对应用程序进行分组,而网格视图则按字母顺序排列,类似于传统的列表视图。(来源:IT 之家)

 

Switch2 隐藏画质设置曝光,可显著提升 HDR 画面质量

6 月 10 日消息,任天堂 Switch 2 游戏机被发现拥有一项隐藏的 HDR 设置,能够显著提升其画面质量。

随着任天堂最新游戏机 Switch 2 的早期用户不断深入探索其功能,一个关于其 HDR 输出的意外发现浮出水面。通常情况下,用户在设置 HDR 时,首先会校准峰值亮度,而在 Switch 2 上,完成这一标准步骤后,会进入一个看似有些含义模糊的第二屏。此时,按下 Y 键,便会解锁一个次级亮度调节滑块。与初始的峰值亮度设置不同,这个滑块似乎控制着白色阶水平(paper white level),能够影响中间色调和高光的显示效果,而不会覆盖原有的校准设置。

在对 LG C1 OLED 等测试显示器进行观察后发现,将这个次级滑块调至低于中点位置时,对比度有了显著提升,阴影部分不再过度曝光,菜单显示也更加清晰。据称,任天堂 Switch 2 的系统仪表盘和游戏内画面在经过这一调整后,整体看起来更加平衡,中间色调更加清晰,高光部分也更加突出,这正是 HDR 的关键优势所在。(来源:IT 之家)

 

小米辟谣高阶驾驶培训出现致命车祸,已启动法律程序追究造谣者责任

6 月 10 日,小米集团公关部总经理王化辟谣小米精英驾驶培训事故:近日有大量小号在各平台广泛散播事故图片,并用尽话术污名化培训项目,甚至不惜捏造伤亡的谣言,严重误导公众,性质极其恶劣,昨日我们已经全部完成取证,并已启动法律程序,追究造谣者法律责任!

雷军随后也发文:「在培训课程中,学员不断挑战高强度工况,偶有状况发生属实正常,这也正是培训的价值所在。但近日有大量小号在各平台散播各种谣言,性质极其恶劣,我们将启动法律程序,追究造谣者法律责任。」 (来源:梨视频)

宁德时代正式宣布量产交付587Ah电芯

6 月 10 日消息,宁德时代今天举办「真实的能量」——宁德时代储能 587 技术日,并宣布 587Ah 电芯正式量产交付。

宁德时代表示,「587Ah」是宁德时代在行业中最早提出的容量概念,该电芯页成为行业内最早大规模量产和交付的大容量储能电芯。

据介绍,宁德时代 587Ah 电芯具备 430Wh / L 能量密度,且安全性能比小电芯更优。宁德时代通过引入如安全电解液技术和高耐热膜技术等一系列核心科技,做到过充、热失控、针刺不起火不爆炸,已通过 GB / T 36276 和 GB 44240 测试。(来源:IT 之家)

 

全球首个处理器芯片软硬件全自动设计系统「启蒙」发布

6 月 10 日消息,全球首个基于人工智能的处理器芯片全自动设计系统「启蒙」近日由中国科学院计算技术研究所与软件研究所联合发布。

这一突破性技术实现了从芯片硬件架构到操作系统、程序转译等基础软件的全流程自动化设计,其生成的设计方案在性能、效率等关键指标上均达到人类专家水平,有望破解我国芯片行业人才短缺与设计周期漫长的双重困境。

作为现代科技领域的「皇冠明珠」,处理器芯片设计长期面临超高专业门槛:传统模式需数百人专家团队耗时数月至数年,成本高昂且难以满足人工智能、边缘计算等新兴技术对专用芯片的爆发式需求。

以自动驾驶场景为例,定制化芯片开发往往需要投入数十人月,而「启蒙」系统通过融合强化学习与架构知识图谱的混合 AI 模型,可模拟专家决策流程,将设计周期压缩至数天。(来源:快科技)

 

大疆发布 DJI Matrice 400 无人机:续航 59 分钟、40 公里图传

6 月 10 日消息,大疆今天发布了 DJI Matrice 400 行业级飞行平台,号称是行业级旗舰五年来的巅峰之作。新机最大亮点之一就是超长续航,加装负载后前飞续航达 59 分钟,悬停 53 分钟,支持 25 米/秒高速避障,适用于搜救、消防等长时间作业。标准套装(含遥控器、双电池、基础传感器)售价 77115 元。(来源:快科技)

泡泡玛特初代 LABUBU 拍出 108 万元天价

6 月 10 日,在永乐 2025 春季拍卖会上,一款显示为初代藏品级薄荷色的 LABUBU 最终以 108 万元的价格完成竞拍。

据了解,此次拍卖出现在全球首场初代藏品级 LABUBU 艺术专场。该款 LABUBU 尺寸为高 131cm,材质为 PVC,颜色为薄荷色,在备注栏标注了「全球唯一一只」。

LABUBU 的走红将泡泡玛特创始人王宁送上河南首富的位置。6 月 8 日,福布斯实时富豪榜数据显示,泡泡玛特的创始人王宁以 203 亿美元身家超越牧原股份的创始人秦英林,成为河南新首富。(来源:每经)

浏览量: 6

文章分页

上一页 1 … 13 14 15 … 84 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间