Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

分类: 科技

WPeMatico Campaign中添加的类别

小米 SU7 Ultra 车主签安全承诺书;iPhone 16e 销量曝光;网信办:AI 生成内容需显著标识|极客早知道

国家网信办印发《人工智能生成合成内容标识办法》,AI 生成合成内容需显著标识

3 月 14 日,国家互联网信息办公室、工业和信息化部、公安部和国家广播电视总局联合制定了《人工智能生成合成内容标识办法》。这一新规的发布,旨在应对当前 AI 生成内容泛滥带来的社会问题,特别是一些不实信息的传播,影响到公众的知情权和合法权益。

该办法明确规定,所有 AI 生成的文本、音频、图片和视频等合成内容,必须在适当位置进行显著标识。这一措施将有效保护公民、法人及其他组织的合法权益,并维护社会的公共利益。新规从 2025 年 9 月 1 日开始执行。(来源:aiBase)

英伟达将下一代 AI 芯片命名为 Rubin

3 月 14 日,据报道,英伟达下一代 AI 芯片根据 Vera Rubin 来命名,天文学家薇拉·鲁宾(Vera Rubin)发现了暗物质。黄仁勋料将在 GTC 会议上揭晓其细节信息。

这种命名方式,也标志着英伟达持续通过产品命名向科技界多元群体致敬,这已是英伟达连续第四代采用女性及少数族裔科学家命名架构。此前 Hopper 架构致敬编程语言先驱格蕾丝·霍珀,Ada Lovelace 纪念首位计算机算法作者,Black Blackwell 则取自首位黑人美国国家科学院院士大卫·布莱克威尔。命名策略正从辅助营销升格为核心技术标识——去年发布的 Blackwell 已涵盖 GB200 芯片到 DGX 服务器整机产品线。(来源:界面)

 

苹果 iPhone 16e 手机中国初期销量曝光:比 SE3 高出 60%

3 月 14 日,研究公司 IDC 指出,苹果推出的 iPhone 16e 的销量已经超越几年前发布的 iPhone SE3 的初期销量。根据 IDC 的统计,iPhone 16e 上市首三天的销量较 2022 年推出的 iPhone SE3 高出 60%,但不足以改变苹果今年在中国整体销量下滑约 2% 的预测。

IDC 高级总监 Nabila Popal 表示:「来自安卓阵营的竞争将更加激烈,安卓品牌在『国补』政策下的竞争力远超苹果。」

报告还提到,iPhone 16e 的售价涨到了 4499 元,高于售价 3499 元的 iPhone SE3,这使得苹果在中国市场更难对抗实惠的各大安卓手机品牌。另外,iPhone 16e 仅配备了 60Hz 的屏幕、单颗后置摄像头且 AI 功能尚未落地,降低了 iPhone 16e 在中国市场的吸引力,销售难度加大。(来源:IT之家)

 

美国股市市值三周内缩水 5 万亿美元

3 月 14 日,标准普尔 500 指数从创纪录高点迅速下跌 10%,进入回调区间,蒸发了数万亿美元的市值。

根据 FactSet 的数据,标准普尔 500 指数在 2 月 19 日达到峰值时的市值为 52.06 万亿美元。周四的下跌使该指数的市值降至 46.78 万亿美元。这意味着在大约三周的时间里,总损失约为 5.28 万亿美元。标准普尔 500 指数在不到一个月的时间里从创纪录高点下跌了 10%。(来源:新浪财经)

 

特斯拉回应「与百度合作提升智驾」:不属实

3 月 14 日午间消息,特斯拉对新浪科技表示,特斯拉和百度的合作仅限于地图导航层面,网传信息「特斯拉与百度合作提升其在中国市场的智能辅助驾驶系统的性能」不属实。

之前有报道称,特斯拉正与百度展开深度合作,以借助百度领先的地图技术,解决其全自动驾驶技术 FSD 在中国的水土不服问题。(来源:新浪科技)

沈阳排查小米 SU7 Ultra 引热议,交警:安全宣传不针对特定品牌

近日,网络上流传着一则消息,声称沈阳市正在全面排查小米 SU7 Ultra 车型,并要求车主签署安全承诺书。这一消息迅速在网络上发酵,引发了广泛讨论。

3 月 14 日,据相关媒体报道,沈阳交警局工作人员对此事进行了回应。他们表示,此次行动并非针对小米 SU7 Ultra 这一特定车型,而是对高性能车辆车主进行的一次安全宣传。交警局一直在严厉打击飙车炸街等交通违法行为,而高性能车辆由于速度快、动力强,往往更容易成为飙车行为的主体。因此,交管部门决定对这部分车主进行重点宣传,并要求他们签署承诺书。(来源:ITBears)

 

日经:中国 Z 世代驱动数码相机市场复苏,去年全球出货额回升至近 9 年新高

3 月 14 日,日本经济新闻根据 CIPA(相机和影像产品协会)的数据发布报告。报告指出:全球数码相机的出货额预计在 2024 年回升至近 9 年来的最高水平。这次市场复苏的核心驱动力源自于中国 Z 世代(通常指 1995 年至 2009 年出生的一代人)年轻群体对「ins 风出片神器」的旺盛需求——不满足于手机拍摄效果的年轻人,正纷纷购入数码相机等设备以满足需求。

CPIA 于本月 3 日公布的数据显示,2024 年全球数码相机出货额达 8247 亿日元(当前约 403.86 亿元人民币),较 2023 年增长 15%,实现连续四年增长,创下自 2015 年以来的最高值。

相机性能的持续提高推进了产品的溢价。2024 年全球市场平均单价约 9.7 万日元(当前约 4750 元人民币),较十年前增长四倍。智能手机无法企及的拍摄能力在各大社交媒体展现出来,使数码相机市场成功扭转了此前的萎缩态势。(来源:IT之家)

 

Anthropic CEO 阿莫代伊:未来 AI 或有自我决定权,可拒绝「不爽」的任务

3 月 14 日,据外媒 Ars Technica 报道,Anthropic 首席执行官达里奥·阿莫代伊提出了一个令人吃惊的观点,暗示未来的高级 AI 模型可能会被赋予一种「按钮」,让它们能够在遇到不愉快的任务时选择退出。

阿莫代伊在采访中表示:「这是另一个让我看起来像是疯了的话题。我认为我们至少应该考虑一个问题:如果我们正在构建这些系统,它们能够像人类一样执行各种任务,并且似乎拥有许多人类的认知能力。如果它像鸭子一样叫、像鸭子一样走,也许它就是鸭子。」

阿莫代伊的言论是回应数据科学家卡门·多明格斯提出的一个问题,多明格斯询问为何 Anthropic 公司在 2024 年底聘请了 AI 福利研究员凯尔・费什(Kyle Fish),让他研究未来的 AI 模型是否可能具备感知能力,或是否应该在未来获得道德上的考虑和保护。

阿莫代伊解释说:「我们正在考虑的一项可能的做法是,当我们将模型部署到实际环境中时,给它们一个按钮,上面写着『我放弃这项工作』,这样模型就可以按下这个按钮。」(来源:IT之家)

鸿蒙智行官宣:问界新 M5 Ultra 车型 3 月 20 日登场

3 月 14 日,鸿蒙智行官宣,高颜都市智能 SUV 问界新 M5Ultra 即将登场,问界新 M5 Ultra 此前已开启预订,预售价 23.8 万元起,官方表示,新车是「史上最强」的问界 M5,拥有五大升级。

相比现款车型,新 M5 Ultra 外观配色新增零度白、幻影紫,内饰配色新增赤茶橘,并采用怀挡设计、副驾座椅无缝四向腿托;配置上带来 192 线激光雷达、4D 毫米波雷达、舒适制动,安全上支持 AEB 全向防碰撞、eAES 自动紧急转向,支持边刹边让。

华为 Pura 先锋盛典及鸿蒙智行新品发布会将于 2025 年 3 月 20 日 14:30 举行,官方宣称「先锋瞩目,大开想象,原生鸿蒙大有不同」。余承东在上月透露,华为 3 月将发布一款「别人想不到的」产品,这是第一款为原生鸿蒙而生的新形态手机。

除华为新形态手机外,发布会还将带来问界新 M5 Ultra、2025 款问界 M9 等一系列新车。(来源:IT之家)

 

理想今年将发布两款纯电 SUV,7 月推出 i8 / 下半年推出 i6

3 月 14 日,在理想汽车 2024 年 Q4 财报电话会上,理想汽车创始人李想表示,理想汽车今年发布两款纯电 SUV。理想 i8 将在 7 月发布,理想 i6 将在今年下半年发布。

李想透露,理想汽车正在研发下一代 VLA 智驾大模型,计划与纯电 SUV 理想 i8 同时发布。其称,理想未来在 AI 的投资会显著增加,将依靠自身造血能力来解决。

本月早些时候,理想汽车宣布 i8 的轻伪装车开启全国范围实地测试,产品已经进入「最后打磨阶段」。上市前卸下重伪装,有助于为理想 i8 完成驾乘、风噪、续航、外饰等最终调校。

理想 i8 定位中大型 SUV(纯电动车型),采用 6 座布局。官图显示该车内饰延续了家族式设计,配备双联屏、AR-HUD 抬头显示和方向盘小尺寸仪表屏。(来源:IT之家)

 

苹果计划在 AirPods 上配备实时对话翻译功能

3 月 14 日,据知情人士透露,苹果 公司正在计划推出一项新的 AirPods 功能,可以让耳机将面对面的对话实时翻译成另一种语言。

由于事未公开而要求匿名的知情人士说,这项功能将作为今年晚些时候 AirPods 软件升级的一部分推出,将与即将推出的苹果移动设备操作系统 iOS 19 捆绑在一起。

该功能的运作方式如下:如果一个说英语的人听一个讲西班牙语的人说话,iPhone 会将西班牙翻译成英语并发送到他的 AirPods 上。与此同时,他所说的英语会被翻译成西班牙语并由 iPhone 播放。(来源:新浪财经)

一男子因利用 AI 撰写色情小说被判刑十个月,非法获利超两万元

近期,湖北省大冶市人民法院对一起首例利用人工智能(AI)技术撰写色情小说并进行牟利的案件作出判决。被告人柯某因制作、贩卖、传播淫秽物品牟利罪,被判处有期徒刑十个月,并处罚金人民币五千元,退还违法所得。

根据公诉机关的指控,柯某在 2022 年 11 月至 2023 年 3 月期间,作为一名大专文化的网络文学作者,利用 AI 程序撰写色情小说,并通过在境外黄色网站上发布,同时在其他网站进行销售。

在短短五个月的时间内,柯某发布了数十篇色情小说,非法获利超过两万元。检方送检的七篇小说均被认定为淫秽物品。案件发生后,柯某的家属代为退还了违法所得。(来源:aibase)

浏览量: 9

传特斯拉国内推减配「低价 Model Y」;英伟达新 AI 芯片命名「Rubin」;新款小鹏 G6 17.68 万起

应对中国价格战,消息称特斯拉国内团队主导开发一款低价「Model Y」

3 月 13 日消息,据 36 氪今日晚间爆料,从产业处获悉,为应对激烈的市场竞争,特斯拉中国团队主导开发了一款新车型。

知情人士透露,新车型是一款「更低价的 Model Y」。相较现售 Model Y,新车电池、动力与底盘等部分基本没有太大改动。

知情人士透露,该车型「是通过 depop 的方式开发」。depop 是特斯拉内部的一个开发思路,就是在主体功能不变的情况,通过简化配置实现产品的快速推出。(来源:IT 之家)

英伟达 CEO 黄仁勋将于 GTC 2025 揭晓新一代 AI 芯片 Rubin,以杰出女性科学家、暗物质先驱命名

3 月 14 日消息,经 CNBC 确认,英伟达 CEO 黄仁勋计划在 3 月 19 日的 GTC 大会上正式揭晓新一代 AI 芯片平台「Rubin」的技术细节。

英伟达下一代 AI 芯片将以「证实暗物质存在」的女性科学先驱薇拉・鲁宾(Vera Rubin,1928–2016,婚前姓 Cooper)来命名,延续了该公司以杰出科学家命名芯片架构的传统。薇拉・鲁宾在暗物质研究领域取得突破性发现,并为女性从事科学事业作出了倡导和示范,且终身致力于推动科学界性别平等。

黄仁勋预计将在 GTC 主题演讲中重点阐述「Rubin」平台的性能参数、配置方案及量产时间规划。市场关注焦点集中在「Rubin」能否延续 Hopper 和 Blackwell 的成功。(来源:IT 之家)

 

英特尔新 CEO 陈立武:全力打造世界一流产品公司与代工厂

英特尔近日宣布了一项重大人事任命,现年 65 岁的陈立武将出任公司下一任首席执行官,该决定将于 3 月 18 日正式生效。陈立武的加入标志着英特尔历史上首次迎来华人担任这一重要职务。

在正式上任之际,陈立武向全体员工发表了一封名为《重塑英特尔,共创未来》的内部信件。他在信中坦诚地指出,过去几年对英特尔及其员工来说都充满了挑战。但他强调,自己从不畏惧挑战,反而将挑战视为解决问题的动力。他相信,英特尔正处于一个可以在关键时刻重塑自身的独特机遇中。

「我全心全意地相信我们有能力赢得胜利。」陈立武在信中写道,「英特尔在全球技术生态系统中扮演着举足轻重的角色。只要我们团结一心,就能扭转局势,再创辉煌。」

在陈立武的领导下,英特尔将回归工程为核心的本源。他承诺,公司将致力于开发最优质的产品,倾听客户的反馈,并履行承诺以建立信任。他提出了一个简单的理念:保持谦逊、努力工作、取悦客户。他坚信,只要坚守这三个核心信念,就能迎来成功。(来源:ITBEAR)

 

FSD 在中国「水土不服」,消息称特斯拉正与百度合作解决该问题 

3 月 13 日消息,据报道,知情人士透露,特斯拉正在与中国科技巨头百度合作,以提升其在中国市场的高级驾驶辅助系统(ADAS)的性能。上个月,特斯拉在中国推出的 FSD 系统引发了一些客户的批评,此次合作旨在解决相关问题。

消息人士称,百度近期派遣了一支工程师团队前往特斯拉北京办公室,专注于将百度的导航地图信息,如车道标线和交通信号灯等数据,更好地整合到特斯拉的 FSD V13 软件中。此举的目标是通过更准确、更及时的地图信息,增强 FSD V13 对中国道路的适应性。

此次合作的背景是特斯拉在中国市场面临的数据和监管限制。由于中美两国的政策限制,特斯拉在将完整的 Autopilot 和 FSD 系统引入中国市场时面临诸多挑战。在美国,特斯拉的 FSD 系统无需依赖精确或最新的导航地图,因为当地的人工智能训练能够帮助车辆更好地行驶。然而,在中国,特斯拉无法利用其在中国的 200 万辆电动汽车收集的数据来训练系统,这导致 FSD V13 在中国道路上的表现不尽如人意。据消息人士称,FSD V13 在中国市场的训练不足,导致驾驶员在使用过程中频繁出现交通违规行为,如误入错误车道或闯红灯。(来源:IT 之家)

Adobe「AI 变现」能力受市场质疑,股价跌至 2023 年 5 月以来最低水平 

3 月 13 日消息,Adobe 股价今日下跌 8.6%,达到 2023 年 5 月以来的最低水平。当地时间周三,Adobe 公布了第二财季营收指引,预计在 57.7 亿至 58.2 亿美元(当前约 417.91 亿至 421.53 亿元人民币)之间,与市场预期一致。(来源:IT 之家)

 

AI 视频创业公司「鹿影科技」将被 MiniMax 收购 

据蓝鲸新闻,AI 视频创业公司「鹿影科技(Avolution.ai)」将被 MiniMax 收购,双方目前已经敲定收购意向,相关流程还在持续进行。就上述信息,截至发稿前,MiniMax 尚未回复。

根据同一信息源,2024 年,鹿影科技在天使轮融资时估值水平没有超过 2000 万美金,约在 1 亿人民币左右。知情人士称,去年以来,鹿影科技一直在持续寻求第二轮融资,但过程中并没有很顺利,团队本身在 Ai 视频领域方面有一定的经验,最终选择和 MiniMax 合作属于共赢。(来源:蓝鲸新闻)

 

谷歌联合创始人成立新公司,或将利用 AI 技术改善制造业 

3 月 13 日,据 The Information 报道,谷歌联合创始人 Larry Page 近日宣布创立全新 AI 公司 Dynatomics,将把 AI 技术应用到制造业中。

据悉,Page 已联系了一批工程师,正合作开发能够优化物体制造任务的 AI。他们的计划是通过 AI 来优化产品设计,之后将其交由工厂生产。

报道称,此项目由 Page 旗下电动飞机公司 Kittyhawk 的首席技术官 Chris Anderson 领导。(来源:品玩)

夸克升级搭载「AI 超级框」,阿里通义模型最新成果都将第一时间接入 

3 月 13 日消息,阿里巴巴今日宣布,全新夸克基于阿里通义领先的推理及多模态大模型,全面升级为无边界的「AI 超级框」。

与对话式 AI 不同,夸克将 AI 对话、深度思考、深度搜索、深度研究、深度执行整合到一个极简「AI 超级框」内,一站式满足用户需求。

作为「AI 全能助手」,用户可以直接在「AI 超级框」输入指令,夸克智能中枢系统将自动识别意图并进行深度思考、规划和完成 AI 搜索、AI 写作、AI 生图、AI PPT、学术研究、AI 搜题、AI 健康问答、旅行计划等,做到不同场景下的问题解答与任务达成。

阿里巴巴透露,未来通义系列模型的最新成果都将第一时间接入夸克。(来源:IT 之家)

 

小鹏汽车:2025 款小鹏 G6 起售价 17.68 万元,2025 款小鹏 G9 SUV 起售价为 24.88 万元 

3 月 13 日消息,2025 款小鹏 G6 轿跑 SUV 起售价为 17.68 万元,2025 款小鹏 G9 SUV 起售价为 24.88 万元。3 月 13 日晚,小鹏汽车 CEO 何小鹏表示,2025 款 G6 新车上市 7 分钟后收获 5000 台大定。

小鹏 G6 超智驾轿跑 SUV|图片来源:小鹏官网

小鹏汽车董事长何小鹏表示,「今年小鹏汽车在算力上的投入是小几十亿,小鹏更愿意把成本省下来去『卷算力』,来满足用户 10 年周期的用车。」(来源:36 氪、财联社)

比尔・盖茨展望 AI 未来:「人手一个」智能体,帮你优先处理最重要的事 

3 月 13 日消息,据外媒 Windows Central 今日报道,微软联合创始人比尔・盖茨在 Reid Hoffman 主持的播客节目中,展望了 AI 逐步融入我们生活各个方面的愿景。盖茨表示,AI 的普及将类似于计算机刚刚问世时的情景。

如今,大多数家庭都拥有至少一台电脑。盖茨认为,AI 将沿着类似的轨迹发展,最终每个人都会拥有一个专属的 AI 助手来满足个人需求。

「未来,我们每个人都会有一个 AI 智能体,它将成为我们完成任务的得力助手…… 它会帮你判断哪些事项值得花时间去了解。」比尔・盖茨如此说道。(来源:IT 之家)

 

浏览量: 6

小米成为 Ultra,零跑要当「小米」

「淘汰赛」是中国新能源汽车市场上几乎所有玩家的共识。

有人认为最终只能剩下 5 家车企,也有稍微乐观一点的觉得能剩下 8 家或者 10 家。但总之,当每个人掰起手指头开始数最终能拿到决赛阶段入场券的企业时,相比于比亚迪、华为、小米、蔚小理,「零跑」应该是很难被最先想到的名字。

但正是这样一家存在感不强的车企,成为了 2024 年中国新能源汽车市场最大的黑马。全年,零跑共交付近 30 万辆新车,同期翻了整整一倍,总销量排在了所有造车新势力的第 3 名。而过去一年里,零跑的股价上涨了超过 80%,市值超过 600 亿港元。

同时,最新一期财报数据显示,零跑汽车在 2024 年第四季度实现了单季度扭亏为盈,比集团原本提出的扭亏目标提早了一年,也成为了继理想、赛力斯之后,第 3 家成功扭亏的新势力车企。

即便如此,大部分人依然不了解零跑是一家怎样的企业。甚至提到零跑的产品,往往还要用一个和友商强关联的绰号「半价理想」才好贴上标签。

种种现象,都让人觉得这家企业非常「不新势力」——没有创始人的金句,没有和自动驾驶等新技术有关的种种宏伟愿景,甚至没有和烧钱有关的新闻和故事——这家号称「全栈自研」的车企,2024 年只花了不到 30 亿元的研发经费,只有其他新势力的 1/3 或更少。

我们非常好奇,到底零跑是一家怎样的车企,以及它为什么可以跑在诸多明星对手们前面。

 

「半价理想」?没那么简单

零跑目前的销售核心基本盘,是靠「增程 SUV」支撑起来的。

在 2024 全年近 30 万的交付总量里,C 系列占比达到 76.6%,其中又以 C10、C11、C16 三款提供增程动力选择的 SUV 车型贡献了核心的销量。

从结果来看,推动零跑销量翻倍增长的车型,符合目前中国新能源市场中「增程+SUV=爆款」的产品公式。在新势力销量上,排在零跑前面的第一、第二名理想和问界,也都是以这样的车型作为市场主力。

最大的不同在于,零跑的车要比他们便宜,而且还便宜不少。根据财报数据计算,2024 年零跑单车售价约为 10.8 万元,其中旗舰六座 SUV C16 的官方顶配售价,比同为六座 SUV 的理想 L9 入门款便宜了 23 万,比问界 M9 便宜了整整 29 万。

也正是如此,零跑才在社交媒体上得到了「半价理想」的调侃。

零跑主力车型之一 C10 | 来源:零跑

但实际上,布局增程的决定早在 2020 年 4 月就已经做出了。

那时的环境和此刻大不相同:理想还没有成为新势力的销冠,市场上并没有爆款作业可抄;增程被视作是「落后技术」;零跑第一款双门纯电轿跑 S01 上市一年只卖出了几千台,公司老板朱江明甚至要自掏腰包给员工发工资。

所以,朱江明认为零跑在 2024 年实现翻倍增长的关键,不在于押中了某道压轴题,而是在于能为消费者提供「好而不贵」的产品——这是他一直以来希望给零跑打上的价格亲民的品牌标签。财报显示,2024 年零跑毛利率为 8.4%。相比之下,理想在 2023 年的毛利达到了 22.2%,而其他新势力普遍也都在 10% 以上。

实际上,不光只有毛利率,其实零跑的经营思路和同期成立的大部分新势力车企都有着相当大的差异。

零跑成立于 2015 年 12 月,同期成立的新造车势力里,创始人大多来自互联网行业,而零跑创始人朱江明是一位技术背景出身的 60 后。创立零跑之前,他在 IT 产业里工作了超过 30 年,把大华股份做到了全球安防监控行业的第二,对研发和技术都非常了解。

零跑科技创始人、董事长、CEO 朱江明 | 图片来源:零跑

如果说李想是一位超级产品经理,可以打造出「移动的家」这种互联网气息浓厚的概念和产品,那朱江明就是一个典型的传统工程师。他说过一句很有名的话:

「电动车就是一个电子产品,其中 70% 是电子器件。」

对他而言,最大的机遇就是把在电子行业里三十多年的积累,复用到整车 70% 的零部件身上,从而以更少的花费造出相同的产品。

从这个角度看,无论是技术背景,还是平民化的产品路线,朱江明都更像是比亚迪创始人王传福。只是在具体技术方向上,两人略有不同。毕业于有色金属研究院的王传福,从电池开始突破,拿到新能源汽车的关键技术;而来自 IT 硬件行业的朱江明,则打算通过软硬件一体化、电子集成等方式,趟出一条属于零跑的技术道路。

 

全域自研和降本狂魔

零跑成立之后,朱江明很快就明确了一条原则:和三电有关的核心部件,零跑要做到「全域自研」。

其实,「全域自研」是如今大部分新能源车企在对外传播时都会使用的一个话术,目的是突出各自的技术优势。一般情况下,硬件以及底层的驱动算法,车企会直接采购供应商成熟的方案,然后在上层进行应用软件的开发,例如智能驾驶、主动悬架、智能座舱等新功能。

所以,通常情况下「全域自研」对应的技术和功能,都是前沿的,也是可以产生产品溢价的。

但零跑的「全域自研」却恰恰相反,它的重点并不在于追求那些最前沿的功能。就像零跑的产品一样,显得有些中庸甚至无趣。但通过自研实现的软硬一体集成和平台化优势,对降低售价又有着非常关键的作用。更贵不是零跑自研的目标,更便宜才是。

大到电驱、电池包(和比亚迪不同的是,零跑不参与电芯的研发)等新能源车最关键的部件,小到车门甚至车灯,零跑都要自研,还要自造。

自研自造带来的最显著成果,就是平台化优势,也就是手机行业里戏称的「套娃」。套娃有两个好处,一个是可以加快不同车型的开发周期,另一个就是不同型号的产品可以复用相同的零部件。在采购过程中,主机厂就可以凭借更大的出货量,获得更高的议价权。

零跑去年最畅销的两款车型,C10 和 C16 就是典型的「套娃产品」。据说,朱江明在 22 年看到理想 L9(理想的三排六座 SUV 车型)大卖之后,临时决定加快零跑 C16 的上市进度——原本这款车要等 2026 年才会上市——比计划中提早了近两年。和两排五座版的 C10 相比,两款车有超过 80% 的零部件是通用的,而且两台车的研发费用只比单车贵了 1.2-1.3 倍。

自研的另一个方向,就是通过做集成降本,也就是用更少更经济的资源达到同样的效果。这是很典型的工程师思维。2024 年零跑发布的「四叶草」架构,就实现了智能汽车除底盘域外的四域融合,有点像拿着造芯片的方式造车了。

另一个比较极致的例子是:通过把控制电动门把手的控制器集成在域控制器上,零跑成功省下了一个通常电子车门都需要的独立控制器,价值约为 100 元。

据零跑官方透露,占整车成本 65% 的部件,零跑都是自研自造的。也正是靠这种自研自造的模式,零跑实现了新能源汽车行业里一种另类的「垂直整合」——一家主机厂,几乎自己就能把 Tier 1(一级供应商)的活全都干了。

既是整车厂,又是 Tier 1 | 图片来源:零跑

专做汽车产品拆解对标的行业机构博奇数据,曾经给出过这样一组数据:零跑 C01 车型中,占 BOM 成本 80% 的高价值零部件,只有 7% 是直接采购的国际供应商成品;而大众 ID.6 占比为 66%,小鹏 P7+的占比是 47%。

对外,零跑自研自造的三电零部件,也得到了广泛认可。零跑官方表示,目前已经收到了全球 10 个客户的项目定点。既包括全球第四大车企 Stellantis,也包括国内的一汽集团。根据备忘录,零跑将和一汽共同开展新能源乘用车联合开发及零部件合作。

 

新卷法

用技术创新控制 BOM 成本,加上「好而不贵」的低毛利定价理念,让零跑的产品在 10-20 万这个最卷同时又最大的市场里,分到了 30 万台市场份额。这是零跑扭亏为盈的销售基本盘。

赚钱的另一头,在于管理层对成本「该花花,该省省」的态度和选择。

众所周知,汽车是一个长周期且重投入的行业,过去一般都把百亿作为造车的基本门槛。而对于强调「全栈自研」的新势力们来说,研发上花的钱自然更不会少。数据显示,2023 年,理想和蔚来全年研发投入都超过了 100 亿,小鹏的研发支出也超过了 50 亿元。

但零跑又成了例外。即便把「全域自研」的技术标签贴在身上,但从 2015 年到 2024 年,它们累计的研发支出却只有大约 50 亿元!

零跑 2024 年年报,研发投入为 28.96 亿元 | 来源:财报

这其中有两个重要原因。一是相比互联网背景进入汽车行业的创始人来说,从 IT 电子行业里转型的朱江明可以少踩很多「硬件」的坑;第二则是他很清楚研发的边界在哪里,比起规模,他更在意研发的效率。

所以,比起三电方面的研发,零跑前些年在智能驾驶有关的前沿技术上,采取了一种跟随的打法。朱江明认为,智驾的算法还在快速迭代期间,即使早期靠堆人头取得了领先,也未必是一种长期且高效的优势,所以还不如在技术收敛时再快速跟进。

或者说,零跑在智能化有关的研发方向上,并不是要探寻某种新的范式,更多的努力依然是工程优化:用更小的资源获得同样的效果。3 月 10 日的零跑技术发布会上,零跑就宣布在将来的 LEAP 3.5 平台上,把所有的英伟达 Orin 芯片替换成高通 8650 芯片,并表示后续依然可以实现在 Orin 芯片上已经跑通的城区 NOA 等智驾功能。

2025 年,零跑给自己定下了 50 万的销售目标,并实现年度盈利。这并不是一个轻松的目标,他们需要全新 B 系列所在的细分市场里,用全新的纯电产品参与竞争;同时,还要依托和 Stellantis 集团的合作,布局在欧洲的销售以及谋划本地化生产相关的事宜。

入局汽车行业之初,朱江明曾经用「车圈小米」来描述过零跑。后来雷军带队造车后,这个词就被换成了「车圈优衣库」。

最近,朱江明在谈到零跑未来的毛利目标时,强调零跑要做「好而不贵」的产品,毛利上限是 10%——雷军在小米初期也说过,小米手机的毛利不超过 5%。

现在,小米已经摆脱了性价比标签,成为了一个可以支撑起豪华性能车产品的高端科技品牌。而朱江明依然坚定地希望,用技术创新在越来越卷的新能源汽车市场上,为市场提供一个反内卷的零跑解法。

浏览量: 17

谷歌曝两款「机器人 AI 模型」;英特尔任命新 CEO,股价大涨11%;253 亿!《宝可梦 Go》出售

谷歌 DeepMind 推出新 AI 模型,机器人未经训练也能执行现实任务

3 月 12 日消息,北京时间晚间,谷歌 DeepMind 推出两款新型 AI 模型,旨在帮助机器人完成更多现实世界中的任务。

其中一款名为 Gemini Robotics,是一款视觉语言行动模型,能够使机器人在没有进行过专门训练的情况下理解新的情境。

Gemini Robotics 基于谷歌最新版本的 AI 旗舰模型——Gemini 2.0。谷歌 DeepMind 机器人部门高级总监 Carolina Parada 曾表示,Gemini Robotics 依托 Gemini 的多模态世界理解能力,通过加入物理行动的新模态,将其应用到现实世界中。

另一款则是 Gemini Robotics-ER(具象推理)模型,公司称其为一种先进的视觉语言模型,能够「理解复杂且动态的世界」。

据外媒 The Verge,谷歌 DeepMind 与 Apptronik 合作,共同致力于「打造下一代人形机器人」。此外,谷歌还向包括 Agile Robots、Agility Robotics、波士顿动力和 Enchanted Tools 在内的「受信任的测试者」开放了 Gemini Robotics-ER 模型。(来源:IT 之家)

英特尔宣布任命陈立武为新任 CEO:3 月 18 日起生效,股价应声涨超 11%

3 月 13 日消息,当地时间周三,英特尔宣布任命现年 65 岁的陈立武为下一任首席执行官,自 3 月 18 日起生效。

值得一提的是,陈立武与前任 CEO 基辛格在扭亏为盈的策略上发生冲突,于去年 8 月卸任英特尔董事会成员,意见相左之处包括员工规模、代工策略和官僚主义文化。后续,他将重新加入英特尔董事会。

英特尔表示,陈立武是一位经验丰富的技术领导者,拥有 20 多年的半导体和软件经验。他将接替临时联席首席执行官 David Zinsner 和 Michelle (MJ) Johnston Holthaus。

据英特尔介绍,陈立武曾于 2009 年至 2021 年担任益华电脑(Cadence Design)CEO,领导公司进行重塑,并推动以客户为中心的创新文化转型。在他担任 CEO 期间,益华营收翻倍且利润率也显著增长,股价上涨了 3200% 以上。在 Cadence 任职期间,他还与整个半导体行业建立了关系,从代工厂到芯片设计公司。(来源:IT 之家)

 

苹果确认 Siri 新功能延期,官网 iPhone 16 页面添加相关声明

3 月 12 日消息,苹果公司备受期待的 Apple Intelligence 中针对 Siri 的新功能已被无限期推迟,这些新功能原被认为是 iPhone 16 系列的一大亮点,但苹果在上周末已悄然撤下了一则展示 Siri「个人上下文」功能的 YouTube 广告。如今,苹果在其官网的 iPhone 营销页面上新增了一则免责声明,针对尚未发布的 Siri 功能进行了说明。

此前有传言称这些功能的开发遇到了困难,而苹果上周五通过一份官方声明正式确认这些功能将被推迟。声明中表示:「我们需要比预期更长的时间来实现这些功能,预计将在未来一年逐步推出。」尽管如此,苹果并未给出具体时间表。

与此同时,苹果官网上针对消费者的最新提示虽措辞不同,但同样模糊。该声明写道:「Siri 的个人上下文理解、屏幕感知及应用内操作功能正在开发中,将在未来的软件更新中提供。」

这一免责声明现已出现在 iPhone 16e、iPhone 16、iPhone 16 Pro 以及 iPad 等多个产品页面上。此前,这些功能在宣传中甚至未标注其尚未推出的状态,如今苹果显然意在纠正此前的宣传方式。(来源:IT 之家)

 

马斯克:承诺两年内将特斯拉在美国的汽车产量翻倍

3 月 12 日消息,在美国总统特朗普于周二在白宫购买特斯拉汽车后,特斯拉首席执行官埃隆・马斯克承诺将大幅提高特斯拉在美国的汽车生产能力。

白宫官方照片

马斯克在社交媒体平台 X 上表示:「为支持特朗普总统的政策,并展示我们对美国未来发展的信心,特斯拉承诺将在两年内将美国的汽车产量翻倍!」特斯拉目前在美国的年产能约为 100 万辆,其中弗里蒙特工厂的年产能超过 65 万辆,而得克萨斯州超级工厂(Giga Texas)的年产能为 37.5 万辆。

特斯拉弗里蒙特工厂已经处于满负荷运转状态,马斯克可能计划通过扩大得克萨斯州超级工厂的产能来实现这一目标。据马斯克去年 10 月的说法,特斯拉计划通过 Cybercab 项目来实现这一产能增长。(来源:IT 之家)

谷歌联合创始人,正在秘密研究用 AI 3D 打印飞机

3 月 12 日,商业内幕报道,当谷歌联合创始人拉里·佩奇的飞行汽车初创公司 Kittyhawk 在 2022 年底逐渐停运时,其首席技术官克里斯·安德森召集了几名员工,开始着手新项目——一家名为 Dynatomics 的新创公司。

据知情人士透露,该公司致力于通过人工智能与增材制造技术革新飞机制造。这一项目由佩奇资助,由前 Kittyhawk 首席技术官克里斯·安德森负责运营,相关工作在加州帕洛阿尔托的初创公司 Dynatomics 进行。Dynatomics 成立于 2023 年 6 月,专注于通过 AI 优化 3D 打印流程,以革新飞机制造。

安德森长期关注增材制造(3D 打印)的潜力,而佩奇在 Kittyhawk 时期就推动团队探索 3D 打印在飞行器部件制造中的应用,认为该技术能大幅降低成本。Dynatomics 的核心团队成员包括斯坦福大学航空机器人专业毕业生,他们正在开发一个融合 AI 与先进制造的隐秘项目。

安德森曾表示,如果飞机能像汽车一样廉价并实现大规模生产,将彻底改变交通和世界格局。(来源:凤凰网)

 

微信送礼物推出筛选功能,可选择送女生、送男生,设置价格区间等

3 月 12 日消息,微信送礼物推出筛选功能,用户通过聊天框、搜索以及主页进入「礼物」入口,点击右上角图标即可筛选。

该功能可筛选送礼对象,如:送女生、送男生、送长辈以及送孩子;用户还可根据预算筛选礼品价格,在官方设置的 6 个价格区间中,前 4 个区间均在 200 元以内。

微信小店于 2024 年 12 月 17 日发布了送礼物相关使用指南。据了解,除了珠宝首饰、教育培训类目外,其余微信小店商品将默认支持「送礼物」功能,且商品款式原价不得高于 1 万元。(来源:IT 之家)

传 iPhone 17 Air 包括摄像头凸起的机身厚度为 9.5 毫米

在即将推出的 iPhone 17 系列中,苹果有望用全新的超薄 iPhone 17 Air 取代 iPhone”Plus”机型,因此有关该设备的许多传言自然都与厚度有关。

The Information 称 iPhone 17 Air 的厚度将 6 毫米左右,而 Jeff Pu 的看法也是一样的,郭明錤则认为,iPhone 17 Air 最薄处的厚度将 5.5 毫米,这很可能意味着它将采用 5.5 毫米的机身,后置摄像头凸起区域更厚。

来自中国的 Ice Universe 声称,iPhone 17 Air 的摄像头凸起为 4.00mm 厚,该设备最厚处的总厚度为 9.5mm。

根据泄露和渲染图,iPhone 17 Air 的左侧为单个后置摄像头,右侧为麦克风和 LED 闪光灯,所有这些都位于一个拉长的凸起内,类似于 Google Pixel 手机上的跑道式横杠。

其他传闻称,iPhone 17 Air 配备了 6.6 英寸至 6.7 英寸显示屏,这意味着它将比 iPhone 17(6.3 英寸)大,但比 iPhone 17 Pro Max(6.9 英寸)小。值得注意的是,Ice Universe 上周称 Air 机型除厚度外,其余尺寸均与 Pro Max 机型相同,但这与迄今为止的大多数传闻不一致。(来源:cnBeta)

 

丰田推出微型纯电「小头乐」14 岁就能开

丰田发布了一款全新的纯电动微型车 FT-Me Concept,专为城市出行设计。这款概念车车长仅 2.5 米,适合狭窄街道路况,采用双门双座布局,车尾造型立体,尾灯与车头呼应。

内饰简洁且具科幻感,配备圆角矩形方向盘和全液晶仪表盘,座椅采用织物材质,支持可移动设计。

FT-Me Concept 采用纯电驱动,续航里程约 100 公里,最高车速 45 公里/小时,车顶配备太阳能电池板,每天可补充约 30 公里续航。

该车量产版「很快」推出,外观与概念车一致,将衍生更多车型,价格预计与 Citroën Ami 相近(约 7.2 万元人民币),主要面向第二辆车用户及青少年。

按照欧洲 L6e 标准,多数国家允许 14 岁及以上人群驾驶,但英国除外。FT-Me 取消传统车钥匙,采用手机控制,家长可限制子女用车时间,车内副驾座椅可拆卸,腾出 1.6 米储物空间。

丰田称 FT-Me「价格亲民,维护成本低」,量产版将在同级车型中拥有最佳保值率。(来源:快科技)

 

优必选联合北京人形机器人创新中心发布「天工行者」科研机器人,29.9 万元

3 月 12 日消息,优必选科技联合北京人形机器人创新中心发布了全尺寸科研教育人形机器人「天工行者」,售价 29.9 万元,将在今年 Q2 开始交付。官方表示,「天工行者」是业内首款 30 万元以内的科研级人形机器人,具备高仿生、高强度、高性能、高稳定、高拓展、高开放的 6 高特性。

其身高为 170cm,拥有高度仿生的躯干构型和拟人化的运动控制能力,全身具备 20 个自由度,能以 10km/h 的速度稳定奔跑,具备在山坡、台阶、沙地、雪地等复杂泛化地形平稳移动、抗冲击干扰等运动功能。同时,它还搭载了创新中心「慧思开物」通用具身智能平台,能为高校及科研机构提供完整的人形机器人研究解决方案。

其机器主体可以自由拓展,可装配深度相机、激光雷达、NVIDIA Orin 算力板、六维力传感器、七自由度协作双臂、五指灵巧手等人形机器人核心零部件。同时,天工行者完整开放了底层电机接口、传感器接口及运动控制接口,配套开发指南与示例代码,可满足具身智能本体控制、高精度运动控制等领域科研用户的二次开发需求。(来源:IT 之家)

《宝可梦 Go》易主,Niantic 游戏业务以 35 亿美元售予 Scopely

3 月 12 日消息,知名游戏开发商 Niantic 旗下的《宝可梦 Go》《怪物猎人 Now》等游戏业务,已正式被《大富翁 Go》的开发商 Scopely 收购。

此次交易价值高达 35 亿美元(当前约 253.17 亿元),Niantic 旗下游戏工作室的两位长期领导者——Kei Kawai 和 Ed Wu 也将加入 Scopely,继续负责相关项目的开发与运营。

Niantic 凭借《宝可梦 Go》的巨大成功而声名鹊起,如今旗下多款游戏,包括《宝可梦 Go》《怪物猎人 Now》《皮克敏 Bloom》等,每月活跃用户已超过 3000 万。

此次合并完成后,Scopely 将管理全球两大顶级移动游戏 IP——《大富翁 Go》和《宝可梦 Go》。(来源:IT 之家)

浏览量: 12

Manus 合作阿里千问,意味着什么?

最近国内最受关注的两家 AI 公司,悄然走到了一起。

 

3月11日晚间,Manus 官方宣布与阿里通义千问团队正式达成战略合作。Manus 在公告中称,双方将给予通义千问系列开源模型,在国产模型和算力平台上实现 Manus 的全部功能。

 

据极客公园了解,双方接触时间并不太长,但却在接触后快速达成合作意向。事实上,就在上周五,极客公园刚推荐了Manus团队前去与阿里巴巴集团相关人士建联交流——基于对阿里云将能够为Manus这一创业团队提供重要支持的判断。事实上,阿里对于创新项目一直非常重视,「他们也清楚自己的能力能够帮助到创业者」。

 

阿里此次可以说行动非常之迅速,从后续Manus团队朋友圈的分享来看,甚至阿里巴巴集团CEO吴泳铭都很可能都参与了进来,现在,双方已经开始有了明确的下一步计划。而这件事也体现了阿里过去一直秉持的开放心态,以及在开源领域中所展现出的重要力量。

 

恰逢其时的合作

 

在Manus上线后,除了对其独立解决复杂任务的惊叹,关于其使用的基础模型引发了广泛的猜测。

 

此前,Manus联合创始人季逸超就在社交平台透露过,Manus产品使用了 Claude 和不同的基于 Qwen 的微调模型。

图片来源:X

 

而通义千问推理模型QwQ-32B确实也是这段时间最受关注的 AI 大模型之一。

 

在Manus发布的同一天,通义千问推理模型QwQ-32B发布并开源。阿里技术的官方报告称,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1:

 

在一系列权威基准测试中,千问QwQ-32B 模型表现出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1:在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型;在由Meta首席科学家杨立昆领衔的「最难LLMs评测榜」LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。

 

此前有消息称Manus每次调用的成本达2美元,拆解、解决一次复杂任务或消耗百万token,随着用户的增加,任务排队延迟的问题也已经开始出现——在仅采用邀请码制,只有少数人可以使用到的情况下。

 

Manus的多智能体架构和全链路自主执行能力,意味着它需要处理更复杂的任务和更多的数据,这自然会增加算力的消耗。而且,每个任务在独立的云端虚拟机中运行,虽然保证了任务的独立性和安全性,但也意味着每个虚拟机都需要分配一定的算力资源,也加剧了整体的算力消耗。

 

在这样的背景下,Manus与通义千问团队的合作尤为重要。通义千问的QwQ-32B模型凭借其出色的推理和执行能力,可以为Manus提供强大的技术支持;同时,QwQ-32B的高效性也有助于降低Manus在算力消耗方面的压力,提升响应速度和处理效率,以应对增长的用户需求。

 

图片来源:微博

 

这份声明里可以看出Manus 与通义千问团队的合作主要聚焦于几个关键点:基于通义千问系列开源模型、在国产模型和算力平台上实现 Manus 功能、为中文用户提供服务。

 

「基于通义千问系列开源模型、在国产模型和算力平台上实现 Manus 功能」表明这次合作的核心是技术层面的深度融合。

 

尤其「国产算力平台」可能指的是阿里云的云计算基础设施。Manus 原有的独立云端虚拟机架构虽然保证了任务隔离和安全性,但算力消耗巨大。

 

阿里云可以提供分布式计算资源和更高的算力效率,帮助 Manus 在维持功能完整性的同时降低成本。此外,使用国产算力还能满足中国市场的合规性要求(比如数据本地化)。

 

考虑到 Manus 每次调用可能消耗百万 token,如何在国产模型和算力上实现同等性能,同时控制成本,将是双方团队面临的挑战之一。

 

尽管更多细节尚未完全公开,但Manus与阿里的合作已经让人惊喜,这次合作不仅展现了AI行业在竞争之外的合作潜力,也为推动行业的发展提供了新的思路和动力。

 

合作千问后,Manus 开源?

 

上周三,Manus 发布后迅速在国内科技媒体和社交网络上刷屏,成为全网热议焦点,研发团队展示了Manus在简历筛选、房产研究、股票分析等任务中的应用案例,显示了在复杂任务处理中的潜力,非常接近理想中的AI Agent。

 

到了周末,Manus的影响力开始扩展到海外,一些海外媒体和科技博主开始测评和讨论。Hugging Face的产品负责人称其为令人印象深刻的AI工具,Twitter上的科技大佬杰克·多西也对其表示赞赏。

 

Manus背后的团队是Monica.im,创始人肖弘是一名连续创业者。肖弘在一次访谈中提到「新时代的安迪比尔定律」,模型能力外溢,应用公司可以抓住机会。

 

在模型公司和应用公司的分工上,肖弘认为垂直领域、特定领域和脏活累活可能是原厂不愿做的,应用公司有机会抓住这个窗口期,提供更专业的解决方案;关于即将推出的Manus,定位是一个消费级产品、大众产品,定价策略倾向于消费级市场,一个对比是,主打编程市场的AI agent 产品Devin每个月定价500美元、ChatGPT Operator定价200美元一个月。

 

从这个角度来看,Manus 与阿里通义千问的合作本质上或许正是在填补「脏活累活」这一市场。阿里通义千问的模型可以为 Manus 提供强大的技术支撑,使得 Manus 能够将这种复杂技术转化为对普通消费者友好的产品,同时满足行业需求的多样性与特定领域的精准解决方案。

 

与通义千问团队的合作,或许能帮Manus更好地实现这个定位。

 

另外,阿里一直在提升其人工智能能力,并通过开源推动行业进步,从2023年至今,通义团队已开源200多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,囊括0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态,多次登上国内外权威榜单,已成为全球开源社区最重要的模型系列。

 

3月6日,在Manus发布的同一天,通义千问推理模型QwQ-32B发布并开源。而3月10日,在Manus被意外「开盒」后,Manus 联合创始人 @peakji(季逸超)回应称开源是团队的传统,「近期会有不少好东西开源」。

 

 

合作两方都有开源的传统,未来或许可以期待Manus在开源上有更多动作。

 

浏览量: 8

稚晖君和机器人,离不开自行车

2021 年 6 月,稚晖君在 B 站上发布了一条「自动驾驶自行车」的视频,一经推出迅速火爆,也让他后来成为人们口中的「华为天才少年」。

4 年后,已经成为创业者的他,再次用「自行车」成功出圈。不过,这次自行车上有了「人」。

2025 年 3 月 11 日,在曝光机器人基座大模型 GO-1 之后,智元机器人曝光了最新的产品灵犀 X2 机器人。和大家预想的一样,灵犀 2 在视频中既能跳科目三,也能用灵巧的双手「缝葡萄」,当然,还有稚晖君赖以出名的自行车,灵犀 X2 在自行车上的骑行,再次证明自行车,才是稚晖君的「魂器」。

灵犀 X2 的运动能力不仅出众,而且还有自己的「性格」,会耍宝,也会撒娇。

智元的灵犀 X2,到底能不能走进普通人的家庭?成为人们的萌宠或者伙伴?

 

亦动亦静,运动能力出众

又是自行车!

在鸽了大家两年之后,那个曾经以自动驾驶自行车圈粉无数的「野生钢铁侠」的稚晖君先是在3 月 10 日发布了 ViLLA 架构和大模型 GO-1,今天又整了个大活儿,只不过这次骑在自行车上的是他的灵犀 X2 机器人,它具备自主平衡+踏板力度控制,转弯时还会倾斜车身防摔倒,动作十分丝滑:‌

灵犀 X2 骑自行车|图片来源:智元机器人

 

而这得益于灵犀 X2 的 28 个自由度设计,而且没有使用任何并联结构。并联结构通常需要复杂的传动系统和多关节联动控制,而灵犀 X2 采用纯串联构型,避免了并联机构中常见的机械干涉问题,降低了系统设计复杂度。

这样的自由度要是不用来跳舞就可惜了。果然,它跳起了科目三:

灵犀 X2 大跳科目三|图片来源:智元机器人

 

串联结构减少了关节间的耦合依赖,降低了故障风险,提升了整体运动稳定性结合深度强化学习与模仿算法,它就可以像人一样,能轻松完成走路、奔跑、骑自行车这些高难度动作。

不过骑自行车这件事情可不仅是需要灵活的手脚,还需要小脑的协调。于是智元机器人就自研了「小脑控制器 Xyber-Edge」,加上「智能电源管理系统 Xyber-BMS」,在运控算法层面实现了突破,让灵犀 X2 具有更好的协调性。而且在舍弃并联结构后, 「小脑控制器 Xyber-Edge」和深度强化学习算法,实现了高精度动态平衡控制。

智元团队在视频中还曝光了一些元件|图片来源:智元机器人

 

在运动控制算法领域,灵犀 X2 机器人摒弃了传统的模型依赖控制手段,转而运用学习为主导的强化学习策略。它的基于扩散模型的生成式动作引擎,能够通过深度整合强化学习与模仿学习算法的长处,让机器人快速掌握复杂运动技能。于是 X2 就玩起了平衡车、滑板车:

灵犀 X2 能玩滑板车|图片来源:智元机器人

 

此外,模块化关节(PowerFlow)和标准化接口设计,也使得机器人的维护和部件更换更便捷,降低了长期使用成本。零部件的模块化设计使得人们可以像攒无人机那样去攒一台机器人。

值得一提的是,核心关节模组 Powerflow 经过迭代,灵巧手的自由度也得到了提升,并且引入了触觉感知与力控技术。这使得它在执行任务时,能够更加精准地控制自己的力量和动作,减少误差和损耗,甚至可以用针线缝葡萄:

灵犀 X2 缝葡萄|图片来源:智元机器人

 

机器人「长脑子了」

不仅运动能力超群,智元机器人的智商和情商,都有大幅提升。

当面对「如果你和我的狗都掉到水里,你让我先救谁?」这样的问题时,灵犀 X2 回答到:

「先救狗狗吧,它需要帮助,我没事的。」

别的 LLM 也能够做出这样的回答,不过灵犀 X2 所搭载的多模态交互大模型「硅光动语」,支持毫秒级的反应速度。这就意味着,你跟它聊天,它几乎能立刻回应你。而且,它不仅能听懂你的自然语言指令,还能结合动作模态,实现精准的人机互动。除了能说会道,基于 VLM 的硅光动语大模型还可以让 X2 通过视觉来理解和认知世界,比如读懂药品说明书:

灵犀 X2 正在「阅读」药品说明书|图片来源:智元机器人

 

还会辨别物体的包装,并根据常识告诉你晚上睡不好应该喝牛奶,而不是咖啡。

为了更好地与人互动,包括肢体接触,X2 还使用了柔性材料,这样不但让它更抗摔,也在与人接触时更安全。为了让更像人,它甚至发展出了一些抽象的能力,比如有小脾气,爱踩人脚。甚至还有一些特有的小动作:

灵犀 X2 坐着晃腿|图片来源:智元机器人

 

你再仔细看 X2 胸口微微起伏的「呼吸灯」,这不是装饰,它用动态光影模拟人类呼吸节奏,配合肢体语言,瞬间打破「冰冷机器」的刻板印象:

灵犀 X2 的呼吸灯模拟人类呼吸| 图片来源:智元机器人

 

而最抽象的是它可以让你通过远程裸眼 3D 交流:

这个画面多少有些吓人的|图片来源:智元机器人

 

在未来,结合 Reaction-agent 情感计算引擎,机器人将具有更强的情绪表达能力。

另外,智元机器人还在预研基于自然语言指令驱动的技能编排技术,这将使得灵犀 X2 能够适配不同的机器人本体,提升任务执行的泛化能力。这意味着,未来它可能会在不同的场景下,发挥出更加出色的表现。

 

视频过于美好?

在过去一年,智元机器人初步找到了一条通往泛化作业智能的路径,结合已开源的数据集和框架,灵犀 X2 目前已具备简单任务的零样本泛化能力。

智元团队在视频中介绍了如何训练机器人|图片来源:智元机器人

 

在视频中,智元介绍灵犀 X2 机器人有望成为「吉祥三保」——保安、保姆、保洁的完美结合体。其卓越的运动能力、先进的交互技术和精细的作业能力,将使其在各个领域展现出广泛的应用前景。

例如,在康养领域,灵犀 X2 可以作为陪伴机器人,为老年人提供生活照料和情感陪伴;在服务领域,灵犀 X2 可以作为接待机器人,为客人提供信息咨询和引导服务;在家庭陪伴方面,灵犀 X2 可以作为孩子的玩伴和教育伙伴,陪伴孩子成长和学习。

此外,灵犀 X2 的轻量化设计、可模块化拓展以及完备的二次开发接口等特点,也使得用户可以根据需求自由探索,为其打造更多应用场景。随着技术的不断进步和应用场景的不断拓展,灵犀 X2 有望成为人类生活的重要助手,为未来智能生活带来更多可能性。

灵犀 X2 视频已经有超过 56 万观看|图片来源:B 站

 

智元将这段视频上传到 B 站几个小时后,浏览量已经超过 56 万——智元创始人稚晖君的光环依然耀眼。

当然,相比于网友的兴奋,业内人士看来,也许需要更多的视频和资料,才能真正判断灵犀 X2 的实力。就例如「骑自行车」的视频,只有机器人在车上骑车的片段,而没有上下车的连贯镜头,毕竟稚晖君赖以成名的正是自动驾驶自行车,质疑自行车本身就可以「不倒」也就情有可原。

但无论如何,作为 AI 推进的另一个风口,机器人行业现在无疑已经是重要赛道。智元的机器人骑自行车,宇树的机器人做「回旋踢」,无疑都会让现在这股「机器人热潮」的热度,再上一层楼。

但是,距离灵犀 X2 真正进入到人们的家庭之中,端茶倒水照顾大家,可能还有一段距离。我们希望这段距离能够加速缩短。

浏览量: 28

完整复盘:Manus 是怎么诞生的?

去年获得最多精神养分的创业故事,来自 Dify 创始人张路宇。

第一次见到他是在 2023 年「西溪论道」活动上,现场一众星光熠熠的名字中,张路宇三个字并不起眼。2024 年再次见到,Dify 已经是另一个故事了——一位没有光鲜背景的创业者,愣是在所有人都问商业模式的质疑声中,做出了全球最成功的 AI 开源产品之一。

一年的时间里在这家公司上发生的,比如意外在「因循守旧、易守难攻」的日本市场大受欢迎等故事,让我进一步理解「创业」。多的是意外,更需要运气,最终是要有本事在持续变化与事与愿违中摸出一条道路。

现在,相似的故事发生在另一位备受关注的创业者——Manus.im 肖弘和他的团队身上。

4 个月前,肖弘提过一个困惑,「团队擅长从 0 到 1,抓机会的能力很强,一旦开始 1 到 N,状态就没有那么好」。

在他过往的经历中,创业项目大都获得了相对稳定、可观的营收,上一家公司也被成功收购。2023 年,他的新公司「蝴蝶效应」更是以一款浏览器插件 Monica.im,在百模大战的 AI 叙事中错位竞争,成为增长最快、产品体验极佳的 AI 应用之一。看上去,他是一路很顺的创业者。做到这些事情,也才 32 岁。

但实际上,他并没有太多爽感。在肖弘看来,所谓「连续退出创业者」、所谓不断从 0 到 1 的爽感,像是围城——从 0 到 1 抓机会的能力很强、很爽,但是反过来,也担心会不会又需要再来一次。

2024 年,行业人士认为,像 Monica.im 这样带有记忆功能的 AI 助手,会面临来自比如豆包这样的强劲对手的压力,做起来并不会像 2023 年那样容易。Monica.im 有一个很好的从 0 到 1,但未必能冲击 1 到 N。

而他之所以会困惑,也是因为「团队接下来真的要做更难的事情、天花板更高的事情」,探索能够跨越 1 到 N 的事情。

更早之前,很多关注 Monica.im 的声音都假定这件「更难、天花板更高的事」是指传了很久、但团队迟迟未发布的 AI 浏览器。

现在看,确实,猜错了。

这段更难的探索其实是:放弃已经达到发布状态的AI浏览器、寻找下一个「ChatGPT 时刻」的 AI 产品、找到了通用型 agent 这个目标、做出了最新发布的 Manus.im。

Manus 是什么程度的创新、未来能做到什么水平,现在已经是一聊就炸了的话题。但值得看的,依旧是在「事与愿违」中找到的方向和找到方向的过程。Manus.im 未必就能让这支团队做成 1 到 N 的事情,甚至未必会复刻 Monica.im 的势头,但就像这家公司的名字——「蝴蝶效应」,许多小的动作和决定无意间对未来竟有深远的影响,「Connect the Dots」,明天的路会藏在今天的经历里。

 

01 Manus 的独特产品体验,源自做「AI 浏览器」的教训

去年中下旬以来,「蝴蝶效应」团队做 AI 浏览器成为行业「半公开」的秘密。正式对外亮相的产品,是引发失控般关注度的 Manus。

如果你亲自上手体验过 Manus,或者看过演示视频,你会感觉到它和聊天机器人或一些类 agent 应用相比,有一个明显的不同:Manus 可以异步、并行执行任务。

当你打开比如豆包、Kimi 或者类 Computer Use 等应用,向它发一个问题,你要等它回复完。否则在它回复或者做任务的过程中跟它说话,上一段回复/任务就中断了,你和它只能是 A-B-A-B 接力式的对话。

但是,在 Manus.im 里,尽管看着还是聊天机器人的产品形态,你却可以提出比如 20 个问题让它同步执行任务。一旁的你可以在电脑上做其他任何事情,看视频、写文档、打游戏等等,都不耽误它工作。一旦这些任务有完成的或者执行过程遇到问题,Manus 可以通知你。如果在执行任务中途,你看到它的思考出现了偏差,也可以随时在对话框补充提示词,它会带着新的上下文接着思考和执行任务。

体验是异步的、可以并行的,确实像有了一支可以帮你干活的真人实习生团队。

事实上,Manus 对异步体验的产品架构设计,源自团队在上一个未公开的产品——AI 浏览器中学到的一课。同时这也是团队投入了很大精力、但在去年 10 月决定终止做浏览器的原因。

The Browser Company 于 2024 年 10 月 25 日宣布停止对 Arc 浏览器的新功能开发,决定将资源转移到一款新浏览器 Dia 上,旨在打造一个更简洁、更易用的 AI 浏览器。|来源:Arc 官网

「在 AI 浏览器里,AI 在不断打断用户。」因为它是为单用户设计的场景,AI 用了,你就用不了了,当 AI 开始工作,你只能看着 AI 工作,很难上手。看着 AI 抢走了你的鼠标、电脑,你不仅不敢抢过来,而且还怕一不小心碰到键盘、鼠标导致它的整个流程崩掉需要再来一次。

这让团队做出两个判断:

  1. 直接用电脑去做 Computer Use,短时间内不太可行。

  2. AI 应该用浏览器,但不是在你的浏览器里用,它应该有自己的浏览器,这个浏览器最好在云端,最后把结果反馈给你。

在和腾讯科技张小珺的采访对话中,肖弘提到团队在总结从 Jasper 到 ChatGPT 到 Monica 到 Cursor 到 Devin 的产品形态时,发现「人类程序员」Devin 就很符合这个异步体验的架构。

它不像用 Windsurf 时,有时要让你确认你的电脑要不要装这个库;或者它执行一个命令行操作,让你填 yes or no,因为它可能真会把你的电脑搞坏,或者是某个东西冲突——它让你填「yes」才能到执行下一步,但要甩锅。

所以在 Manus 团队看来,「Chatbot 应该在云上有个电脑,把它写的代码、要通过浏览器查的东西都在那台电脑上执行。因为是虚拟服务器,坏了无所谓,可以再来一台。它甚至可以在当前任务执行完之后释放掉那个服务器。」

值得注意的是,相比 Devin 选择了垂直领域、硬核的工程师,Manus 团队则选择了通用型、消费级的 AI 助手,有 Web,也会有 App。它是一个可以根据指令,调用工具、完成与工作与生活中的各类任务的一款通用型 AI 助手,未来也会以一个消费级可负担得起的价格交付任务结果。

 

02 Less Structure,More Intelligence

有了明确的思路和目标,下一步就是实现这个想法。Manus 到底是怎么做到的?

在其产品合伙人张涛看来,这需要给大模型配一台电脑,同时也给它配系统权限(接入代码仓库、专业数据查询网站等私有 API),并给予一定的培训。

这样一来,AI 可以自己用这台电脑打开浏览器,做动作去调度工具,再根据工具产生的反馈观察它的动作对真实世界造成的影响,再思考下一步,再做动作,再观察……这是 AI 在探索和调研中完成任务的过程。期间,Manus 也会在你的「调教」下越来越懂你的要求,未来即便你没有清晰定义需求,它也可以根据一个个任务中沉淀下来的知识「揣摩圣意」。

华为天才少年、Logenic AI 创始人李博杰认为 Manus 有一眼不同于其他产品的厉害之处:以极客程序员的方式解决问题。|图片来源:微信截图

Manus 产品的理念,在其团队的产品实践过程中逐渐明确:即 Less Structure、More Intelligence(更少的结构,更多的智能)。

这也是让 Manus 团队产生一个个「A-Ha,Wait!」(惊呆了)的时刻。举个例子,这是今年 1 月在团队发生的一幕:

当让 Manus 试着做 GAIA 测试集上的一个题目:「在一个类似国家地理风格的 Youtube 视频链接里,各种企鹅们来来回回走出又进来画面,让 Manus 数一帧画面里面同时出现最多种企鹅时,是有几种?」

然后,神奇的事情发生了。

Manus 先是打开这个视频链接,接着做的第一个动作是「Press K」,接着挨个截图记录哪一帧出现了哪种企鹅后,最后得出最多的一帧画面有 3 种企鹅。Manus 接下来要回去检查,它的下一个动作是「Press 3」……。最后检查后给出答案就是 3。

作为建造 Manus 背后的人,理应很了解它的能力边界,但对团队来说,真实情况是「总有惊喜发生」。意外的不仅是 Manus 做对了题目,而且,用了多年电脑和 Youtube 的人类朋友可能都不一定清楚,键盘上「K」「3」这些按键是什么?

看着有些恍惚的眼前一幕,团队跟着 Manus 做了一遍,键盘上的「K」是暂停键,可以让 Manus 暂停后挨个截图记录哪一帧出现了哪种企鹅后;「3」也是一个快捷键,从 0 到 9 分别代表进度条的 0% 到 90%,3 是进度条的 30%,可以精确定位到那个视频的那一秒钟,然后告诉人类这个画面有几种企鹅。

「这个过程跟传统意义上的 Chatbot 不一样。第一,它能看 YouTube 的画面,而不是看字幕。第二,我们甚至发现它在用 YouTube 快捷键,非常震惊,它回答出来了这个问题。」肖弘在此前腾讯科技的采访中也提到了这一幕。

突然就发现,Manus 不仅在编程上比人擅长,就连在人们天天使用的 Web、App 上,Manus 的知识量也远超想象,作为一个全知全能的 AI,它可以在任何工具里了解所有途径和手段,然后选择最优的方法。

这让团队再一次感受到了「Less Structure,More intelligence」——尽量减少人工对 AI 的限制,让 AI 通过自己的进化来发挥作用,而不是教它怎么做。

在 Manus 官网的最底部,悄悄呈现了 Manus 背后最重要的发现:「Less Structure,More intelligence」。|截图来源:Manus

这是「蝴蝶效应」联合创始人、首席科学家 Peak 在 Manus 产品上线当天,对 Manus 产品背后最重要的第一性原理——「Less Structure,More intelligence」作出的阐述和延展思考:

当你的数据足够优质、模型足够智能、架构足够灵活、工程足够扎实,那么 Computer Use、Deep Research、Coding Agent 等概念就从产品特性变为了自然涌现的能力。

回归第一性原理也让我们对产品形态有了全新的思考:·  AI 浏览器不是在浏览器里加 AI,而是做给 AI 用的浏览器;
·  AI 搜索不是从索引召回再总结,而是让 AI 以用户的权限去获取信息;
·  操作 GUI 不是抢夺用户设备的控制权,而是让 AI 有自己的虚拟机;
·  编写代码不是最终目的,而是解决各种问题的通用媒介;
·  生成网站的难点不是搭建框架,而是让内容言之有物;
·  Attention 不是 all you need,解放用户的 attention 才能重新定义 DAU;
·  ···

一次次「Less Structure,More intelligence」的发现与实践,Manus 产生了超出期待的效果,包括在 GAIA benchmark 中的 pass@1 分数超过了 OpenAI Deep Research 在 cons@64 下的成绩;同时,在内部测试中,Manus 也能够直接覆盖 Y Combinator W25 中 76% 的专用 agent 产品的场景。

 

03「Agent 可能是『对齐』的问题,而不是基础模型能力的问题」

现在,这些洞察的含金量正在更大的范围内引起讨论:

Hugging Face 创始人、CEO Clement Delangue 在 X 平台提出 Peak 的发现值得思考:智能体的能力不是卡在基座模型上,而是像 GPT-3 与 InstructGPT(ChatGPT)的差别一样,是对齐的问题。一些开源基础模型被简单训练成「无论问题的复杂程度如何,都能在一个轮次中回答完所有问题」,但这是聊天机器人场景中的要求,只需要对智能体的路径做一些后训练,就能立即带来巨大的不同。|截图来源:X

Manus 并未引入 MCP(《模型上下文协议》),而是让 AI 能够自己写代码去调用 API,来胜任各种各样长尾任务。|截图来源:X

在过去几天对 Manus 的讨论中,听到最多的一个问题是:「通用的AI Agent」行不行得通,边界在哪里?

在 Peak 看来,因为人与世界的交互其实非常标准,有眼睛、手、耳朵,如果把 action space(行动空间)定义好,就应该能把一个 agent 嵌入到一个本来由人来进行的一个环节中。

既然人能够使用各种工具来完成垂直领域很深的操作,那么如果一个 agent 本身具有足够好的知识,经过了适当的培训,又有很好的一个与世界交互的界面,它应该能像人一样工作,甚至可以让这个 agent 用某个 SaaS 产品。比如在 Manus.im 官网呈现的一个找房子的案例,其实就是让 AI 用一个房地产领域专用的 SaaS 产品工作。

他认为,应该定义清楚的是 agent 使用工具的边界,而不是它为哪群人服务。Manus 不是在模拟一个干具体事的一个人,不是比如按照研发、产品经理等划分的角色智能体;而是在模拟一个能干事的人、是模拟一个实习生是怎么工作的。

Manus 的多智能体系统(Multi-agent system),指的是规划(Planning)和执行(Execution)的分离。

在执行器(Executor)上,Manus 采用了在编程、以及长程规划和逐步解决问题的能力暂时领先的 Claude,也在用 Qwen 的一系列模型做后训练。

昨天,Manus 也与阿里通义千问达成战略合作,致力于在国产模型和算力平台上实现 Manus 的全部功能。|图片来源:Manus

在规划器(Planner)的部分,Manus 则做了很多工作。

由于目前市面上的货架 API 或者说模型,本质上是为聊天机器人的场景做对齐的,在训练的时候,无论用户提了一个多么复杂的问题,其训练的优化目标都是在一个回复里把用户的问题回答清楚,但这其实跟 agent 所需要的 planning 完全相反。

所以如果把市面上现有的模型直接用在 agent 场景,并没有「对齐」,这个模型永远会急功近利地在一轮对话内给出一个「稀里糊涂」的结果,就像很多 bullet point 总结。

「对齐方式会应该不一样,我们团队认为,需要不同数据去专门做对齐」,肖弘说。

去年 10 月,Peak 在知乎也记录过一个尝试复现 OpenAI o1 兴趣项目——Steiner 开源模型的进展与失败,实际上这个项目恰是在做 Manus 规划器部分 step by step planning(一步步规划)的预研。

总体上,Manus 是在模拟一个做事的人,这是团队对 Manus 作为通用型 AI 助手的产品定义。至于对其边界的思考,团队大概率也仍在探索中,需要更多的用户使用案例。

在 Manus 发布前放出的腾讯科技采访中,肖弘其实已经提到了对 Manus 通用性所在的初步思考,「一个很核心问题,或者说产品经理很重要的一个职责,是控制好用户预期。假定它能干世界上所有事,比如:我要怎么赚 100 万美金?这本来就不是应该由一个 Agent 去执行的事情。但如果我们能够给出更多更具体的例子,让大家的预期更合理,大家会用起来更顺畅。」

 

04「壳有壳的用」,最懂壳的团队

2 月 27 号凌晨,Manus 产品合伙人张涛和首席科学家季逸超(Peak)看到 Manus.im 打榜成绩出来的一瞬间,两位都落泪了。Manus 在 GAIA Benchmark 上的成绩超过 OpenAI 的 Deep Research,而且以 OpenAI 打榜时 1/10 左右的成本(2 美元/任务)做到了这个意外的成绩。

图片来源:Manus.im

几十人的团队,在 agent 达成全行业共识的竞争态势之时,成为第一波做出通用 agent 产品的团队之一,在产品工程、前端交互体验上,也有独特性。

做成事情的正反馈,胜过所有。对创业团队来说,没有比这更好的激励了。但在这之前,Manus 是怎么发生的?为什么是这个团队做出来的?

「今天的模型能力是能够完成一些复杂、多步才能搞定的任务。只是没有这样的产品,所以大家感受不到。」肖弘在此前腾讯科技的采访中提到的洞察可以用来理解这一问题。

同时,「能有机会尝试做 Agent 的产品的团队,并不多。因为,需要很多复合能力。他要搞过 Chatbot,搞过一点 AI 编程相关,搞过浏览器相关,因为要调用浏览器,而且对 LLM 的边界有不错感知——今天发展到什么水平,接下来会发展到什么样的水平。这些能力首先同时拥有的公司没那么多,而且有这些能力的公司,可能手头正在干一个很具体业务。我们恰好有些同学刚好有时间一起把这些事做出来。」

「恰好」。

  • 在恰好的时间发现模型能力达到了可以做 agent 的程度,而不一定非要等一个像 Operator 一样的端到端大模型出来;

  • 也恰好发现了问题出在对齐上;

  • 也恰好做过聊天机器人延展出来的所有功能和 AI 浏览器;

  • 同时因为一直在所谓「套壳」做大模型应用产品所以对 LLM 有敏锐的感知;

「蝴蝶效应」团队达成了在当下做出这样一款通用 agent 的全部要素,所以现在有了完成度相对行业比较高的通用 agent。

在被问及要做 Manus 的决定性瞬间是什么时,Peak 还原了更多的细节,他表示,「创业其实没有『干净的』pivot」,这一切是连贯的、没有明确界限的。

「在做一款产品的时候,也会频繁关注外界的情况。」当时有几件事,一是做浏览器的时候,做过端侧模型,后来发现浏览器需要的场景非常非常宽,有不同的 feature,做的过程发现了基座模型变强的速度在加快,强到它跟 agent 之间的差距可能是一个 alignment 问题。尽管可能外界觉得好像大语言模型已经要逐渐收敛、撞墙。

同期,外界也在发生变化。去年年初 Cursor 开始火,然后是 Windsurf 和 Devin。这背后对应同一个脉络,agent 在编程领域火了,火的途径逐级递进。Cursor 是程序员的一个 copilot,提升编程效率,从 Windsurf 开始逐渐有些自动化的流程进来,让你在本机有更强的自动化能力,Devin 又达到了自动化新高度。

VC 的动向也是一致的,比如在去年和前年,YC 投了两类公司,一是云端的 Browser,比如 Browser base;第二类是类似于 e2b 这种轻量级的 AI Sandbox 虚拟机这些东西。

这说明「模型的基建在迅速成熟,Infra 的基建也在迅速成熟,再加上看见外界产品逐渐有更多的接受度,我们就觉得这是一个值得 all in 的方向。这是一个非常渐进的、平滑的过程,再加上做浏览器时的积累比如 chromium 那些基建可以无缝迁移过来,这也是为什么我们敢在云端搞浏览器」。

总结来说,在所谓「套壳」中对需求和模型的敏锐感知和经验积累,共同造就了 Manus。Monica 的很多场景需要做模型后训练,同时在AI浏览器的实践中强化了最重要的一课「less structure、more intelligence」,发现模型能力达到了做 agent,问题在于对齐。接着就是 Manus 飞速进化的 3 个月。

此前,「蝴蝶效应」团队一度被质疑「套壳」的价值何在,其在不自研大模型的情况下,通过整合现有大模型做出了 Monica,把聊天、搜索、阅读、写作、翻译等功能整合在一起,也通过一个个接 API 的方式集成了很多任务执行的场景,去年底用户量达千万。

现在,当豆包、夸克、元宝都大力推广各自的 Monica 类产品,当一个小团队又把现有技术利用起来做出第一个通用消费级 agent 时,是时候该重新理解「壳」了。

「套壳」以及「壳」究竟是什么?

在肖弘看来,所有突破都是模型带来的,基本上是模型先驱动、模型先行。壳是要把模型技术上的创新点,以一个用户可感知的方式展示出来,把模型创新能力封装成用户最能感知的样子。

从这个定义出发,DeepSeek App(包括思维链的展示)是 DeepSeek-R1 的壳,Cursor 是 Anthropic Sonnet 3.5 的壳,Perplexity 是 GPT-4 的壳,ChatGPT 是 InstructGPT 的壳。

随着模型能力在快速进化,「那个壳」也需要进化。每一代模型能力进化之后,甚至不一定是原厂,是一个第三方厂商把它的用户可感知价值给呈现出来。就像 Cursor 把 Claude 3.5 Sonnet 的用户可感知的价值。

3 月 5 日,在 Monica.im 发布两周年的时间点,为什么是这几十个人做出了超过各类 Deep Research 和 OpenAI Operator 的产品体验,答案就在对壳的理解和实践里。

如何做出新的、可以做 agent 的模型下最好的壳?

作为 Manus 的建造者,张涛认为,「从后台去看它整个的架构,我们看到每个地方都有大量的未完成的工作要去做,而那些地方每一个地方都是决胜的关键,都是让产品面都不一样的地方。」

在团队看来,最重要的优势是创新速度(pace of Innovation),无论是应用还是模型,现在都到了一个相对饱和的状态,真正到最后的核心能力唯有一个,就是跑得快,尽管「数据飞轮」「网络效应」这些东西还未被验证有没有。

「在一个全新的领域里,一切未定,一切未知,最重要的就是创新速度,拼的是在各种各样的方向上探索、试错,快速找到正确的路径。」而 Manus 团队从管理理念、组织架构、产业流程上,足够灵活。当新机会出现时,能在有限的资源里能够贯通整个公司从上下所有的资源,并且极高的决策速度,并适应犯错的反馈。

从左至右依次是「蝴蝶效应」首席科学家 Peak、CEO 肖弘、产品合伙人张涛|图片来源:网络

对于 Manus 的预期,肖弘认为「哪怕有窗口期你也值得试一试。」过去一年,他的思考也在发生剧烈变化,比如现在的他认为「当意识到自己提前的时候,更激进,超级激进。今天复盘,觉得 23 年 Monica 不够激进。」「如果你知道你在创新,你在领先,你就应该激进。」

不知道 Manus 能不能给肖弘和他的团队带来从 1 到 N 的体验与跨越,但这个最懂「壳」的团队相信心手合一地创造、也相信创造带来的蝴蝶效应——Manus 来源于 MIT 的一个 motto:Mens at manus,强调心手合一。不能光学,还得做,对现实世界产生 impact,才是真正的知识。

未来,随着 Manus 背后更多的沉淀开源出来,更广范围的蝴蝶效应也会进一步释放。

 

浏览量: 29

Manus与阿里千问合作,实现全部功能;美总统:抵制特斯拉违法!;OpenAI 发新工具,目标直指 Manus

 
 

Manus 与阿里通义千问团队达成战略合作

3 月 11 日,Manus 官方微博宣布,与阿里通义千问团队正式达成战略合作。双方将基于通义千问系列开源模型,在国产模型和算力平台上实现 Manus 的全部功能。
Manus 是由创业公司 Monica 发布的首款 AI Agent 产品,最近在社交媒体火爆出圈。

早些时候,Manus 创始人季逸超在社交平台透露,Manus 产品使用了不同的基于阿里千问大模型(Qwen)的微调模型。(来源:快科技)

 
 

DeepSeek 官方辟谣:R2 发布为假消息

针对 DeepSeek 将在 3 月 17 日发布下一代 R2 模型的传闻,DeepSeek 官方企业咨询账号在用户群中回应称,「辟谣:R2 发布为假消息」。

DeepSeek 的 R1 模型在今年 1 月发布后可谓爆火,持续刷屏各大主流媒体和社交网站。

今年 2 月,DeepSeek 宣布其仅有三个官方账号,分别是微信公众号”DeepSeek”、小红书 @DeepSeek(deepseek_ai)以及 X (Twitter) : DeepSeek (@deepseek_ai)。

官方强调,与 DeepSeek 相关的一切信息均以官方账号发布为准,任何非官方账号、个人账号发布的信息都不代表 DeepSeek 的观点,提醒大家注意甄别。(来源:财联社)

 

 

谷歌欲杀回智能眼镜市场,1.15 亿美元收购眼球追踪公司 AdHawk

据报道,谷歌正在就收购加拿大眼球追踪技术开发商 AdHawk 微系统进行最后的谈判,该搜索巨头欲重新进军头戴设备和智能眼镜市场。知情人士称,谷歌打算以 1.15 亿美元 (约合 8.35 亿元人民币) 收购 AdHawk,其中包含 1500 万美元的未来付款,这些款项将取决于 AdHawk 是否达成业绩目标。该协议预计将在本周内完成,但由于交易尚未签署,谈判在后期仍存在破裂的可能。

AdHawk 成立于 2017 年,已研发出了实现先进眼球追踪功能所需的芯片、硬件和软件。该公司推出了名为 MindLink 的眼镜,并把这项技术提供给了制造商,允许设备确定用户正在注视的位置。AdHawk 的主要卖点在于其低功耗组件,分析用户角膜和瞳孔的速度比竞争对手的传感器更快。

谷歌是智能眼镜技术的开拓者,早在十多年前就推出了谷歌眼镜。然而,该产品销量一直不佳,并于两年前停产。但是在那之后,谷歌已讨论重返智能眼镜市场,理由是人工智能前景广阔。除了与三星的合作外,谷歌多年来一直在测试新的眼镜原型品。眼球追踪技术,尤其是采用低功耗组件的这种技术,有望帮助谷歌将这些设计推向市场。(来源:凤凰网)

雷诺CEO:在汽车行业欧洲应向中国学习

法国汽车制造商雷诺集团首席执行官梅奥日前公开呼吁,面对中国强劲发展势头,在汽车行业,欧洲应当转变思维方式,向中国学习,以避免彻底落后。梅奥表示,汽车向电气化发展是有利趋势,「我们不会再回到过去了」。欧洲应采取虚心态度,建立新的联系,与中国制造商合作,从他们的方法中汲取灵感,并尝试预测新的技术革命方向。(来源:新华社)
 

特朗普称抵制特斯拉是非法的 要买特斯拉支持马斯克

美国总统特朗普周二公开表示,他要买特斯拉以支持埃隆-马斯克。在特朗普发表上述言论之时,这家电动汽车制造商的销售和股价正面临由于公司 CEO 涉足全球政治带来的压力——最引人注目的是马斯克担任了特朗普削减成本的政府效率部门负责人。
特朗普在周二凌晨在 Truth Social 上发表的一篇文章中写道:「明天早上我将购买一辆全新的特斯拉,以表示对埃隆·马斯克(Elon Musk)的信心和支持,他是一位真正伟大的美国人。」
马斯克在去年总统大选前对特朗普的支持、以及随后在他的政府效率倡议中发挥的领导作用,均引发了强烈反对。
分析师称,马斯克身份与声誉的转变,已经给该汽车制造商的股票带来了许多麻烦,该股周一(3 月 10 日)暴跌 15.4%,创下了自 2020 年以来的最大单日跌幅,并使其年度至今的股价下跌了 45%。(来源:环球市场播报)
 

禾赛科技盘中股价暴涨超 41%,消息称其激光雷达拿下奔驰大单

禾赛科技业绩交流会上称,预计 2025 年营收将达到 30 亿至 35 亿元,其中 ADAS 占总收入约 60% 至 65%。激光雷达总出货量为 120 万至 150 万。禾赛的主机厂客户主要是理想和小米。盖世汽车相关数据显示,2024 年,禾赛通过理想 L6/7/8/9 以及理想 MEGA 五款车型,合计配套了 23.8 万颗激光雷达,为小米 SU7 供应了 10.07 万颗激光雷达。
3 月 11 日,禾赛科技盘中股价暴涨超 41%,消息称其激光雷达拿下奔驰大单。(来源:财联社)

OpenAI 发布新工具,推动 AI 智能体从「回答问题」跨越到「执行任务」

OpenAI 正试图帮助开发人员创建自己的代理。该公司正在发布一个新的 Responses API,为开发者提供构建模块,以创建能够搜索网络、挖掘文件和代表他们在 计算机上执行任务的代理。
OpenAI 平台产品负责人奥利维耶-戈德门特(Olivier Godement)介绍说:”有些代理我们自己就能创建,比如深度研究(Deep Research)和操作员(Operator)。但这个世界是如此复杂,有如此多的行业和用例…… 因此,我们非常高兴能为开发者提供这些基础、这些构建模块,以便为他们的用例、他们的需求构建最好的代理。”
Responses API 附带一个基于 ChatGPT 用于搜索的相同模型构建的网络搜索工具,允许开发人员在使用 GPT-4o 和 GPT-4o mini 时从网络上获取实时信息和引用。它还有一个计算机使用功能,同样使用公司的 Operator 模型来代表用户执行任务。Responses API 还有一个搜索大量文件的工具,OpenAI 称它可以帮助客户支持人员筛选常见问题,或帮助法律助理查找以前的案件。
除了 Responses API,OpenAI 还发布了 Agents SDK,并将其描述为开发人员”协调”人工智能代理工作流程的一种方式。”OpenAI API 团队的产品经理 Nikunj Handa 介绍说:”Responses API 就像是使用模型和工具来完成特定工作的原子单元。Agent SDK 是让多个原子单元协同工作,以解决更复杂的任务。这将使开发人员更容易管理他们的所有代理,并确保他们朝着一个目标工作。”(来源:网易)
 

雷克萨斯 RZ550e 电动紧凑豪华 SUV 登场:402 马力、首配 F Sport 标识、引入线控转向技术

3 月 12 日消息,汽车媒体 caranddriver 今天(3 月 12 日)发布博文,报道称雷克萨斯(Lexus)在欧洲市场升级 RZ 电动紧凑型豪华 SUV,推出了全新的 RZ550e 车型,最大功率达到 402 马力。
新款 RZ550e 车型首次搭载 F Sport 标识,采用双电机全轮驱动系统,最大功率达到 402 马力,较现有的 308 马力 RZ450e 和 201 马力单电机 RZ300e 有显著提升。
此外,非 F Sport 版本的双电机系统也升级至 376 马力,命名为 RZ500e,单电机基础版本则小幅提升至 221 马力。

雷克萨斯终于在新款 RZ 中引入了线控转向技术。两年前,雷克萨斯在 RZ 发布时曾展示过这一技术,但当时因转向响应过于灵敏而未正式推出,经过工程师的优化,转向范围扩大至 200 度,解决了此前的问题。

新款 RZ 还引入了「互动手动驾驶」功能,模拟八速手动变速箱。虽然细节有限,但这一基于软件的程序通过声音和视觉提示增强驾驶体验。有趣的是,声音并非模仿燃油发动机,而是放大了电动汽车的自然声音。
电池组的可用容量从 64.3 kWh 提升至 69.3 kWh。尽管容量增加有限,但雷克萨斯声称 WLTP 续航里程增加了 100 公里,EPA 标准下约为 53 英里。
目前 RZ 的 EPA 续航里程为 196 至 266 英里(约 315.43~428.09 公里)。此外,新款 RZ 还配备了 22 kW 的车载充电器,取代了现有的 6.6 kW 充电器,提升了充电效率。(来源:汽车之家)

新研究发现人工智能搜索工具的平均准确率仅为 60%

Tow 数字新闻中心最近研究了八个 AI 搜索引擎,包括 ChatGPT Search、Perplexity、Perplexity Pro、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search 和 Copilot。他们测试了每种工具的准确性,并记录了工具拒绝回答的频率。
研究人员从 20 家新闻出版社(每家 10 篇)随机选择了 200 篇新闻报道。他们确保每篇报道在使用文章摘录时都能在 Google 搜索中返回前三个结果。然后,他们在每个人工智能搜索工具中执行相同的查询,并根据搜索是否正确引用了 A)文章、B)新闻机构和 C)URL 来评定准确性。
然后,研究人员根据从”完全正确”到”完全不正确”的准确度给每条搜索贴上标签。从下图中可以看出,除了两个版本的 Perplexity 外,其他人工智能的表现都不理想。总体而言,人工智能搜索引擎有 60% 的时间是不准确的。(来源:cnbeta)
 
浏览量: 8

图灵奖的获奖者们,担心成为 AI 届的「奥本海默」

1947 年,艾伦·图灵在一次演讲中提到「我们想要的是一台能够从经验中学习的机器」。
78 年后,以图灵命名,有着「计算机界诺贝尔奖」之名的图灵奖,颁给了两位毕生致力于解决图灵这一问题的科学家。
安德鲁·巴托(Andrew Barto)与理查德·萨顿(Richard Sutton)共获 2024 年度图灵奖,二人是相差九岁的师徒,是 AlphaGo 和 ChatGPT 技术上的奠基人,亦是机器学习领域的技术先驱。

图灵奖获奖者安德鲁·巴托(Andrew Barto)与理查德·萨顿(Richard Sutton)|图片来源:图灵奖官网

 
谷歌首席科学家 Jeff Dean 在颁奖词里写道「由巴托和萨顿开创的强化学习技术,直接回答了图灵的问题。他们的工作是过去几十年 AI 进步的关键。他们开发的工具仍是 AI 繁荣的核心支柱……谷歌很荣幸赞助 ACM A.M.图灵奖。」
图灵奖 100 万美元奖金的唯一赞助方即是谷歌。
而在获奖后,站在聚光灯下的两位科学家却剑指 AI 大公司,他们对媒体发出「获奖感言」:现在的 AI 公司在「受到商业激励」而非专注于技术研究,在社会上「架起一座未经测试的桥梁,让人们过桥来测试。」
无独有偶,图灵奖上一次颁发给人工智能领域的科学家,是在 2018 届,约书亚·本希奥、杰弗里·辛顿、杨立昆三位因在深度学习领域的贡献而获奖。

2018 年图灵奖获得者们|图片来源:eurekalert

 
其中,约书亚·本希奥和杰弗里·辛顿(亦是 2024 年诺贝尔物理学奖获奖者)两位「人工智能教父」在最近两年的 AI 浪潮里,也频繁呼吁全球社会和科学界警惕大公司对人工智能的滥用。
杰弗里·辛顿更是直接从谷歌辞了职,以便「畅所欲言」,这次获奖的桑顿,在 2017 – 2023 年也曾任 DeepMind 的研究科学家。
当计算机界的最高荣誉一次次被授予给 AI 核心技术的奠基者们时,一个耐人寻味的现象逐渐浮现:
为何这些站上巅峰的科学家,总会在聚光灯下转身敲响 AI 的警钟?
 

人工智能的「造桥者」

如果说艾伦·图灵是人工智能的引路人,那安德鲁·巴托和理查德·萨顿就是这条道路上的「造桥者」。
在人工智能飞驰之时,在被授予礼赞之后,他们在重新审视自己搭建的桥梁,能否承载人类安全通行?
或许答案正藏在他们跨越半个世纪的学术生涯中——唯有回溯他们如何构建了「机器的学习」,才能理解他们为何警惕「技术的失控」。

图片来源:卡耐基梅隆大学

 
1950 年,艾伦·图灵在其著名论文《计算机器与智能》中,开篇就提出一个哲学和技术问题:
「机器能思考吗?」
由此,图灵设计出了「模仿游戏」即后世广为人知的「图灵测试」。
同时图灵提出,机器智能可以通过学习获得,而不是仅依赖事先编程。他设想了「儿童机器(Child Machine)」的概念,即通过训练和经验,让机器像孩子一样逐步学习。
人工智能的核心目标是构建出能感知、并采取更好行动的智能体,而衡量智能的标准,即智能体有判断「某些行动比其他行动更好」的能力。
机器学习的目的就在于此,给予机器行动后相应的反馈,并且能让机器自主地在反馈经验中学习。换言之,图灵构思出基于奖励和惩罚的机器学习方法与巴普洛夫训狗无异。

我在游戏里越玩越败越强,也是一种「强化学习」|图片来源:zequance.ai

 
由图灵引出的机器学习之路,在三十年后,才由一对师徒建出了桥——强化学习(Reinforcement Learning,RL)。
1977 年,安德鲁·巴托受到心理学和神经科学的启发,开始探索一种人类智能的新理论:神经元就像「享乐主义者」,人类大脑内数十亿个神经元细胞,每个都试图最大化快乐(奖励)并最小化痛苦(惩罚)。而且神经元并不是机械地接收信号和传递信号,如果某个神经元的活动模式导致了正反馈,它就会倾向于重复这个模式,由此共同驱动了人类的学习过程。
到了 1980 年代,巴托带上了他的博士生理查德·萨顿,想把这套「不断尝试、根据反馈调整连接,找到最优的行为模式」的神经元理论应用在人工智能上,强化学习就此诞生。

《强化学习:导论》成为经典教材,已被引用近 80000 次,|图片来源:IEEE

 
师徒二人利用马尔可夫决策过程的数学基础,开发并编写出了许多强化学习的核心算法,系统地构建出了强化学习的理论框架,还编写了《强化学习:导论》教科书,让数万名研究人员得以进入强化学习领域,二者堪称强化学习之父。
而他们研究强化学习的目的,是为了探寻出高效准确、回报最大化、行动最佳的机器学习方法。
 

强化学习的「神之一手」

如果说机器学习是「填鸭式」学习,那强化学习就是「放养式」学习。
传统的机器学习,就是给模型被喂大量标注好的数据,建立输入和输出之间固定的映射关系。最经典的场景就是给电脑看一堆猫和狗的照片,告诉它哪张是猫、哪张是狗,只要投喂足够多的图,电脑就会辨认出猫狗。
而强化学习,是在没有明确指导的情况下,机器通过不断试错和奖惩机制,逐渐调整行为来优化结果。就像一个机器人学走路,不需要人类一直告诉它「这步对,那步错」,它只要尝试、摔倒、调整,最终自己就会走路了,甚至走出自己独特的步态。
显而易见,强化学习的原理更接近人类的智能,就像每个幼童在跌倒里学会走路,在摸索中学会抓取,在咿呀里捕捉音节,学会语言。

爆火的「回旋踢机器人」背后也是强化学习的训练|图片来源:宇树科技

 
强化学习的「高光时刻」,正是 2016 年 AlphaGo 的「神之一手」。当时 AlphaGo 在与李世石的比赛中,第 37 手落下了一步令所有人类惊讶的白棋,一步棋逆转败势,一举赢下李世石。
围棋界的顶级高手和解说员们,都没有预料到 AlphaGo 会在该位落子,因为在人类棋手的经验里,这步棋下的「莫名其妙」,赛后李世石也承认,自己完全没有考虑过这个走法。
AlphaGo 不是靠背棋谱背出来的「神之一手」,而是在无数次自我对弈中,试错、长远规划、优化策略后自主探索出来,这既是强化学习的本质。

被 AlphaGo 「神之一手」打乱节奏的李世石|图片来源:AP

 
强化学习甚至反客为主影响人类智能,就像 AlphaGo 露出「神之一手」后,棋手开始学习和研究 AI 下围棋的走法。科学家们也在利用强化学习的算法和原理,试图理解人类大脑的学习机制,巴托和桑托的研究成果之一,即建立了一种计算模型,来解释多巴胺在人类决策和学习中的作用。
而且强化学习特别擅长处理规则复杂、状态多变的环境,并在其中找到最优解,比如围棋、自动驾驶、机器人控制、与语焉不详的人类谈笑风生。
这些正是当下最前沿,最热门的 AI 应用领域,尤其是在大语言模型上,几乎所有领先的大语言模型都使用了 RLHF(从人类反馈中强化学习)的训练方法,即让人类对模型的回答进行评分,模型根据反馈改进。
但这正是巴托的担忧所在:大公司建好桥后,用让人们在桥上来回走的方法,来测试桥的安全性。
「在没有任何保障措施的情况下,把软件直接推给数百万用户,并不是负责任的做法,」巴托在获奖后的采访里说道。
「技术的发展本该伴随着对潜在负面影响的控制和规避,但我并没有看到这些 AI 公司真正做到这一点。」他补充道。
 

AI 顶流到底在担心什么?

AI 威胁论没完没了,因为科学家最害怕亲手缔造的未来失控。
巴托和桑顿的「获奖感言」里,并无对当前 AI 技术的苛责,而是充斥着对 AI 公司的不满。
他们在采访里都警告表示,目前人工智能的发展,是靠大公司争相推出功能强大但容易犯错的模型,他们借此筹集了大量资金,再继续投入数十亿美元,展开芯片和数据的军备竞赛。

各大投行都在重新估值 AI 行业|图片来源:高盛

 
的确如此,根据德意志银行的研究,当前科技巨头在 AI 领域的总投资约为 3400 亿美元,这一规模已经超过希腊的年度 GDP。行业领头羊 OpenAI,公司估值达到 2600 亿美元,正准备展开新一轮 400 亿美元的新融资。
实际上,许多 AI 专家都和巴托和桑顿的观点不谋而合。
此前,微软前高管史蒂芬·辛诺夫斯基就曾表示,AI 行业陷入了规模化的困境,靠烧钱换技术进步,这不符合技术发展史中,成本会逐渐下降而不是上升的趋势。
就在3 月 7 日,前谷歌 CEO 埃里克·施密特、Scale AI 创始人 Alex Wang、AI 安全中心主任丹·亨德里克斯三人联名发表了一篇警示性论文。
三位科技圈顶流认为,如今人工智能前沿领域的发展形势,与催生曼哈顿计划的核武器竞赛相似,AI 公司都在悄悄进行自己的「曼哈顿计划」,过去近十年里,他们对 AI 的投资每年都在翻倍,如不再介入监管,AI 可能成为自核弹以来最不稳定的技术。

《超级智能战略》及合著者|图片来源:nationalsecurity.ai

 
因深度学习在 2019 年获得图灵奖的约书亚·本希奥,也在博客中发长文警告,如今 AI 产业有数万亿美元的价值供资本追逐和抢夺,还有着足以严重破坏当前世界秩序的影响力。
诸多技术出身的科技人士,认为如今的 AI 行业,已经偏离了对技术的钻研,对智能的审视,对科技滥用的警惕,而走向了一种砸钱堆芯片的大资本逐利模式。
「建起庞大的数据中心,收用户的钱还让他们用不一定安全的软件,这不是我认同的动机。」巴托在获奖后的采访里说道。
而由 30 个国家,75 位 AI 专家共撰的第一版《先进人工智能安全国际科学报告》中写道「管理通用人工智能风险的方法往往基于这样一种假设:人工智能开发者和政策制定者,可以正确评估 AGI 模型和系统的能力和潜在影响。但是,对 AGI 的内部运作、能力和社会影响,科学理解其实非常有限。」

约书亚·本希奥的警示长文|图片来源:Yoshua Bengio

 
不难看出,如今的「AI 威胁论」,已经把矛头从技术转向了大公司。
专家们在警告大公司:你们烧钱,堆料,卷参数,但你们真正了解你们开发的产品吗?这亦是巴托和桑顿借用「造桥」比喻的由来,因为科技属于全人类,但资本只属于大公司。
何况巴托和桑顿一直以来的研究领域:强化学习。它的原理更贴合人类智能,且具有「黑箱」特色,尤其是在深度强化学习中,AI 行为模式会变得复杂且难以解释。
这也是人类科学家的担忧所在:助力和见证了人工智能的成长,却难以解读它的意图。
而开创了深度学习和强化学习技术的图灵奖获奖者们,也并不是在担心 AGI(通用人工智能)的发展,而是担心大公司之间的军备竞赛,在 AGI 领域造成了「智能爆炸」,一不小心制造出了 ASI(超级人工智能),两者的分野不仅是技术问题,更关乎人类文明的未来命运。
超越人类智能的 ASI,掌握的信息量、决策速度、自我进化的水平,将远超人类的理解范围,如果不对 ASI 进行极为谨慎的设计和治理,它可能成为人类历史上最后一个,也是最无法抗衡的技术奇点。
在 AI 狂热的当下,这些科学家或许是最有资格「泼冷水」的人。毕竟五十年前,在电脑还是个庞然大物时,他们就已经开启了人工智能领域的研究,他们从过去塑造了当下,也有立场去怀疑未来。

AI 领导者会迎来奥本海默式的结局吗?|图片来源:经济学人

 
在2月《经济学人》的采访里,DeepMind 和 Anthropic 的 CEO 表示:
 
会因担心自己成为下一个奥本海默,而彻夜难眠。
浏览量: 33

海外 AI 圈,开始讨论起 Manus

 

Manus的风,终于吹到了海外。

 

上周三,这款由国内初创公司 Monica 推出的通用AI agent,凭借其强大的自主任务执行能力,迅速成为科技界的焦点。

 

在国内,Manus被誉为「全球首款通用型AI Agent」,一经发布即引发了热烈讨论。研发团队展示了Manus在简历筛选、房产研究、股票分析等任务中的应用,显示了在复杂任务处理中的潜力。

 

然而,尽管在国内爆火,Manus也备受争议,原因之一在于其讨论热度主要集中在国内,海外市场则少有关注。

 

从周末开始,情况在转变,海外一些主流媒体陆续发出了对Manus的讨论,也有不少kol对Manus不吝好评。

 

1 海外怎么看 Manus?

 

Manus 是一个通用的 AI agent,可以处理跨各个领域的复杂、真实的任务。开发 Manus 的初创公司 Monica 将这种新的 AI agent称为「连接思想和行动的桥梁:它不仅会思考,还会提供结果」的平台。

 

其开发人员称,这种新的 AI agent可以自主思考、计划和执行各种现实世界的任务。从创建网站到规划旅行和分析股票,Manus 可以做任何事情,只需对它作出提示。

 

周三晚间发布后,关于Manus 的讨论主要集中在国内互联网,而从周末开始,海外对Manus 的关注度也开始上升。

 

Hugging Face 的产品负责人在使用后称, 「Manus 是我尝试过的最令人印象深刻的 AI 工具。

  • 它的代理能力令人惊叹,重新定义了什么是可能性。
  • 用户体验是许多其他工具曾经承诺过的……但这次它真的做到了。」

 

Twitter的创始人杰克·多尔西也转发了Manus AI官方X上的视频并简短地表达了夸赞:

图片来源:X

 

AI 政策研究员 Dean Ball 将 Manus 描述为「使用 AI 的最复杂的计算机」,甚至给到比deepseek更高的评价,「Deepseek 是关于复制美国公司已经公开实现的能力,Manus 是在推进前沿研究」。

 

一名海外的软件开发者Mckay Wrigley 在X上展示了他使用 Manus 的14 分钟演示,并称「好得令人震惊」:

图片来源:X

 

「现在想象一下 2-3 年后的情况:

– 它的智商 >180

– 永不停止工作

– 速度快 10 倍

AGI 即将到来 – 期待快速发展。」

 

Ivan Fioravanti ,CoreViewHQ GenAI 联合创始人兼首席技术官也在使用后在X上发出感慨,「Manus AI 真的很强大」:

图片来源:X

 

MenloVentures的 VC Deedy用Manus对特斯拉股票做了一份专业分析,后者仅用大约1小时就完成了大约2周专业水平的工作:

图片来源:X

 

AI 初创公司 Pleias 的联合创始人亚历山大·多利亚 (Alexander Doria) 在 X 上对Manus的态度经历了几次转变,先是写到在测试 Manus 时遇到了错误消息和无限循环:

图片来源:X

 

随后在完成了一份75页的科学报告后称,「这确实是AI agents的另一个DeepSeek时刻」:

图片来源:X

 

以及,「Deep Research背后的OpenAI o3模型要更智能得多,但正如Simon指出的那样,Manus AI不知怎么另辟蹊径,生成的输出结果几乎同样出色。这有点类似于DeepSeek R1对o1所做的事。」

图片来源:X

 

最近的一条关于Manus的更新里,他还修改了对AGI的预测,将年底前出现的概率从 90% 提高到 95%。「最迟到明年到来的可能性为 99.9%。」

 

海外媒体也开始报道。the economic times发了两篇,一篇标题用了震惊体——《另一家中国公司震惊硅谷,Manus AI 在复杂任务处理方面以 DeepSeek 级别的性能震惊科技界;AGI 是否比我们想象的更接近?》

 

另一篇《Manus AI:中国的第二个 DeepSeek 时刻》里,称Manus 是迈向自主性 AI 的飞跃,并谈到中国在自动驾驶系统方面的积极进步可能会使其在关键领域获得先发优势,而Manus AI 的出现已经进一步证明,这种进步是可以复制的。

 

在福布斯的报道里,有一段直接写到「它是世界上第一个完全自主的 AI agent,不仅可以帮助人类,还可以取代人类……从本质上讲,它是一个经过训练的博学家,可以管理跨行业的任务,而不会因人类的迟疑而产生效率低下。」

 

这篇报道指出了 Manus 与海外类似产品的不同之处,「与ChatGPT-4和谷歌的Gemini依赖人类提示来引导它们不同,Manus不会等待指令。相反,它旨在自行启动任务、评估新信息并动态调整其方法。在许多方面,它是第一个真正的通用AI agent。」

 

当然跟国内有一些人不太看好 Manus 一样, X 上也有用户指出,Manus在回答事实性问题时会出错,并且并不总是引用其信息来源,而且经常会遗漏一些很容易在网上找到的信息。

 

TechCrunch 的记者也写到了自己在测试中只是让 Manus 执行一些看似简单的日常任务,却也屡屡受挫,比如当被要求从外卖范围内的快餐店订购炸鸡三明治时,Manus在第一次尝试后崩溃,第二次虽然找到了合适的菜单项,但无法完成订购流程,甚至无法提供结账链接。同样,在预订从纽约到日本的商务舱机票时,Manus仅能提供一些航空公司和机票搜索引擎的链接,其中部分链接已失效,无法满足用户的具体需求。

 

但这些bug听起来情有可原?毕竟Manus目前还处于内测阶段,系统容量有限,优化和改进也都还在进行之中。

 

2 改变游戏规则

 

从国内到海外,关于 Manus 的讨论还在继续。无论如何,Manus已经改变了游戏规则。

 

过去三年,人工智能都在围绕 AGI 展开,从 GPT-4 到 DeepSeek,智能似乎是评判一个 AI 产品的唯一标尺。而去年底开始火爆的 AI 硬件,以及 Manus 的出现代表着另一种趋势:AI 应用落地已经到了加速的节点。

 

Manus实现了从传统AI的“全知全能”模式向“知行合一”的行动主体的转变,让AI从辅助工具向独立行动主体转变。它不再仅仅是回答问题或提供建议,而是能够自主地分析、规划并执行复杂任务,将AI的“思考”与“行动”无缝衔接。

 

一方面,这不仅是技术的进化,更是一种范式的转变——AI 不再只是被动地响应指令,而是能够自主决策、执行任务,并在没有人类介入的情况下持续优化自身。

 

对于AI领域的开发者而言,这是他们长期追寻的目标——一个不仅能生成信息,还能理解、应用,并在错误中学习的系统。而对于依赖 Manus 执行任务的人来说,这种变革可能意味着深刻的冲击。

 

另一方面,Manus似乎也改变了AI行业竞争的锚点。过往人工智能的主导权似乎掌握在美国科技巨头手中,行业的竞争焦点围绕着谁能训练出最强大的大模型。Manus 的出现似乎打破了这一设定。

Manus AI在X上宣布将在太平洋时间凌晨 2:00 进行定期维护|图片来源:X

 

这款产品或许还不够成熟,但更重要的是,Manus这种“知行合一”的行动主体所代表着的智能工业化——一个如此高效的系统出现,会让企业们很快意识到,用人工智能取代人力劳动的必要性,人机关系再次到了一个节点。

 

 

浏览量: 24

文章分页

上一页 1 … 35 36 37 … 86 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间