Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

分类: 科技

WPeMatico Campaign中添加的类别

造车半年狂揽 320 亿,小米交出史上最强财报

小米交出了公司成立 15 年以来的「最强年报」。

增长也许不是新鲜事,但对于巨头,尤其是在手机和汽车这样竞争激烈的赛道里,获得 35% 的增长,的确是一件非常不容易的事。

要知道,苹果和特斯拉这一年的营收增速分别只有 2% 和 1%。而互联网行业的新贵字节跳动,2023 年的增速是 40%。

更重要的是,随着造车的成功,小米的形象在 2024 年几乎脱胎换骨。上市前「小米汽车 9.9 万」的杂音已经烟消云散,小米汽车的平均售价超过了 23.4 万元,单季 20.4% 的毛利率已经超过了同期的理想——后者是市场公认的高端品牌。

而起售价 52.99 万元的小米 SU7 Ultra,上市 3 天后锁单量超过了 1 万,提前完成了一年的 KPI。

小米总裁卢伟冰在业绩沟通会上也表示:相比销量和市占,会更关注产品结构的改善。

过去一年,小米在二级市场里市值翻了快 3 倍。现在,小米也希望继续重写在消费心中,小米品牌和产品力的形象。

 

车卖得越好,手机就也卖得越好

在硬件领域,很难有人不羡慕小米在 2024 年的迅猛增速。

2024 年,小米集团总营收达 3659.1 亿元,同比增加 35.0%。其中,毛利为 765.6 亿元,经营利润 245.0 亿元,分别增长 33.2% 及 22.5%。

在当下,35.0% 这个增速,远高于其他硬件巨头,完全可以匹配只有顶级互联网大厂的高增长——参考相关媒体报道,字节跳动 2023 年的营收增长大约为 40%。而相比之下,在手机以及智能汽车行业的其他两大国际巨头苹果和特斯拉,在 2024 年分别只实现了 2.0% 和 1% 的营收增幅。

小米集团2024年营收数据 | 图片来源:业绩公告

2024 年,小米汽车业务的 ASP(Average Selling Price,平均销售价格)达到 23.4 万元。如果读者们还对去年此刻小米 SU7 发布前的全民价格大竞猜有印象的话,这一成绩显然是对当时「小米汽车 9.9 万元」最好的回应。

不仅如此,这一数字甚至已经悄然接近了新势力领头羊理想,作为国内目前销量第一、且主打高端市场的理想汽车,2024 年车辆均价为 27.68 万元。

当然,如果仔细阅读小米 2024 年财报,可以发现汽车业务其实仍然处在增长期,其贡献的营收份额未超过总营收的 10%。

不过,小米首款汽车产品的发布,包括后续小米 SU7 Ultra 挑战纽北最快圈速,显然为小米品牌圈粉无数,积攒了大量路人缘,并对小米品牌的形象提升起到了重要作用。

在 3 月 18 日的业绩沟通会上,小米总裁卢伟冰也表示,目前小米汽车已经和小米其他产品在线上线下均展现出了显著的协同效应。他举了两个例子证明这个观点:

第一,2025 年春节期间,小米汽车的销量超过日常销量,很多之前没有登记试驾过或有购车意向的新用户,均在节日期间完成了交易。而按照汽车行业的普遍经验,节日期间的销量只有日常的 30% 左右。

卢伟冰认为,这一成绩的获得,和小米汽车可以服用小米在各大城市一线商超的旗舰店密不可分。

极客公园查询小米汽车 App 发现,即便上市一年后,小米 SU7 系列的销量依旧火爆且供不应求,目前下单小米 SU7 普通版,提车等待时间依然长达 37-40 周。

第二个案例,则体现了小米汽车对其他产品的反向带动。据卢伟冰透露,在 2 月底的「双 Ultra」发布会后,和小米 SU7 Ultra 一起上市的旗舰手机产品小米 15 Ultra,其销量也同比增长了 80%,实现了小米手机在 6000 元以上价位的突破。

财报显示,2024 年全年,小米手机的 ASP 为 1138.2 元,同比增长 5.2%。而在小米 15 系列发布的第四季度,期内智能手机的 ASP 达到 1202.4 元,达到史上最高。

大家电是小米 2024 年另一个增长迅猛的业务板块 | 图片来源:小米

另一大亮点则是 AIoT 业务板块里,大家电(即「空冰洗」产品)的增长。2024 年,小米空调产品出货量超 680 万台,同比增速超过 50%;冰箱产品出货量超 270 万台,同比增速超过 30%;洗衣机产品出货量超 190 万台,同比增速超过 45%。

卢伟冰表示,大家电市场「机会巨大」,同时认为在手机市场里,比起增长规模,将更注重改善产品结构,提升 ASP 的表现。

 

撕掉性价比标签,汽车毛利超理想、特斯拉

汽车业务方面,2024 年小米汽车共交付超过 13.6 万辆,小米智能汽车与创新业务分部全年总营收为 328 亿,毛利率为 18.5%,其中智能汽车业务营收 321 亿元,全年毛利 60.6 亿元。

其中,在第四季度小米汽车交付量达到 69697 辆,毛利上涨到 20.4%,超过了目前国内新势力毛利最高的理想(20.3%),且超过了一贯以极致成本管理著称的特斯拉(去年三季度,特斯拉剔除碳积分的毛利率为 17.1%)。

可以说,在汽车业务上,小米彻底撕掉了过去很多年的性价比标签。

起售价 52.99 万元的小米 SU7 Ultra,上市 3 天后锁单量突破 1 万 | 图片来源:雷军微博

有意思的是,在 2024 年其他两个增长迅猛的车企,零跑和小鹏,第四季度毛利率为 13.3% 和 10.0%(此处为汽车毛利率,小鹏整体毛利率达 14.3%)。市场戏称,小米在汽车上打造了高端化的品牌标签,而零跑和小鹏则开始承接了汽车市场里曾经属于小米的大众性价比市场。

在财报中,官方对于毛利上涨的解释是:由于核心零部件价格下降,产能环比增长导致的单位制造成本减少,以及享受首销期权益的车辆交付减少所致。

简单翻译一下就是:电池电芯价格下降,规模优势体现,不需要降价或免息政策刺激消费。

此外,据一些供应链人士告诉极客公园,小米 SU7 作为小米汽车的第一款产品,其零部件「多来自国际供应链」。所以,高毛利的另一个核心原因应该体现在成本管理控制能力上。

我们知道,智能电动汽车被认为是一项创新业务,从技术演进的角度来说,智能化很多时候也被放在了非常重要的位置上,被认为是「灵魂」。但从商业上讲,这部分业务的发展不能跳过「制造业」这个最基本的过程。

这一点上,雷军的好友何小鹏近两年感触颇深。为了查清为什么自家的钢材采购价比市场贵,他整整花了 9 个月时间,发现「下面的人一直在骗你」,而自己一度「看不出门道」。

零跑汽车的朱江明也提到,零跑可以做到「好而不贵」的一大秘诀,就是通过对关键核心成本的自研自造实现有效降本。

而在管理制造环节和供应链上,在手机行业里摸爬滚打多年的雷军显然比互联网背景创业多年的其他新势力创始人们要有经验一些。这也让小米汽车业务目前看来,至少在制造环节还没有踩太多的坑。

 

别再说「小米汽车卖一台亏一台」了,好吗?

当然,小米汽车业务目前并没有盈利。

财报显示,2024 全年,小米智能汽车等创新业务录得亏损共计 62 亿元。

然后,毫不意外地又有话题词开始做小学生算术题了。62 亿元除以 13.6 万台销量,所以小米卖一台就要亏 4.6 万元。

从数学公式上,好像也挑不出任何毛病。但是拜托,请不要再这么算了好吗?

我们知道,对于一家车企而言(我们姑且先把小米汽车业务抽象成一个独立企业的概念),成本主要分别以下几类:

BOM(Bill of Material,即物料成本)、销售成本、研发成本、行政成本。

小米集团 2024 和 2023 年度收入和支出数据 | 图片来源:业绩报告

其中第一项和「单车表现」紧密相关,也就是前文提到的供应链、制造层面的管理。而后几项,一般大投入则包括门店铺设、工厂建造及运营、技术研发等几个方面。

这些底层投入,又都和制造业最底层的「规模效应」环环紧扣。也就是说,规模越大,这些大投入就可以被摊得更薄,从而有望实现扭亏为盈。

从小米的财报数据里可以看出,2024 年第四季度小米汽车业务亏损为 7 亿元(Q2 和 Q3 亏损分别为 18 亿元、15 亿元),也可以看出随着交付规模的提升,小米汽车业务的亏损在逐渐收窄。

目前,在中国「新势力」造车里,已经有三家企业实现了扭亏为盈,分别是:理想汽车、赛力斯和零跑(其中理想为年度盈利,赛力斯为半年盈利,零跑为单季度扭亏),各自实现盈亏平衡的年销量大致对应在 36-45 万辆之间。

而在财报发布当天,雷军在个人微博账号宣布将小米汽车 2025 年交付预期从 30 万辆提升至 35 万辆。

尽管卢伟冰在昨晚的电话会上,依然表示目前「对汽车业务没有明确扭亏为盈的预期」,原因是「仍处在高速投入期」,但如果今年小米汽车业务在财务业绩上可以给出惊喜,相信也不会让人意外。

至少,希望别再有「卖一台亏一台」这种离谱的话题词了。

对于小米汽车接下来的第二款 SUV 产品 YU7,以及传闻中搭载了增程方案的第三款车型,它们都将从小米 SU7 对应的「差异化」战场进入竞争最激烈的主流赛场。从这个角度看,似乎可以理解卢伟冰的谨慎。但是很显然,小米目前已经积攒了足够的路人缘和子弹,以一种向上的姿态准备好应对未来不确定的竞争。

浏览量: 12

腾讯重回 AI 牌桌

头图来源:腾讯

 

DeepSeek掀翻了国内大模型领域原本搭好的台,各个大厂都在重新找位置,腾讯选择了通过一系列“闪电战”式的部署,展示战略决心。

过去一个月,腾讯在AI应用领域快速布局,积极拥抱DeepSeek,腾讯旗下多个核心产品,如微信、元宝、QQ浏览器、QQ音乐、ima(腾讯智能工作台)、腾讯文档、腾讯地图等,均接入了DeepSeek模型,并同步支持自研的混元大模型;元宝更是走向日更级迭代,35天版本更新30次;先后推出腾讯首个自研推理模型混元深度思考模型Thinker(T1)、发布新一代快思考模型TurboS、推出5个全新3D生成模型并全部开源……

3月19日,腾讯发布了第四季度及全年业绩报告,第四季度营收1724.5亿元,同比增长11%,毛利、经营利润(Non-IFRS)增速分别为17%和21%;全年营收6602.6亿元,同比增长8%;毛利、经营利润(Non-IFRS)同比增长19%和24%。

腾讯财报摘要|图片来源:腾讯

 

数据显示,腾讯资本开支在AI战略的推动下大幅增长。2024年,腾讯全年资本开支达到了767亿元,同比增长221%,创下历史新高。

在财报发布后的电话会议上,腾讯总裁刘炽平表示,第四季度资本支出的显著增长,主要用于购买更多的GPU,以满足AI推理的需求。他透露:“我们计划在2025年进一步加大资本支出,预计资本支出将占收入的十几个百分点。”

另外,腾讯宣布2025年将继续回购股份,预计规模至少800亿港元;现金红利增长32%至约410亿港元,2025年总股东回报最少达1210亿港元。

 

全年研发投入707亿,加码打造“好用的AI”

 

3月,国内大厂在AI领域的竞争继续加速。

腾讯在周二刚推出了 Hunyuan3D-2.0 模型,可以将文本或图像转换为 3D 图形。 上周,阿里巴巴推出AI旗舰应用——新夸克,基于阿里通义领先的推理及多模态大模型开发。百度也在周日发布了文心大模型4.5和推理模型X1。

腾讯总裁刘炽平在财报后的电话会议上称,资本支出占收入的百分比将上升到十几个百分点,人工智能将成为战略投资的重点——这一支出增长趋势与国内其他大厂类似。

此前阿里巴巴在2月宣布,未来三年将为云计算和AI基础设施投入至少3800亿元;而据报道,字节跳动已计划在2025年投入超过1500亿元用于资本支出,主要用于人工智能开发和算力提升。

腾讯这次发布的财报,显示其AI战略正在进入重投入期,体现出公司在AI领域的战略雄心:2024年研发投入达706.9亿元,自 2018 年公布研发投入以来,累计总额已达3403亿元。资本开支连续四个季度实现同比三位数增长,年度资本开支更突破767亿元,同比增长221%,比 2023 年的 238.9 亿元增加了两倍多,

在持续加码AI投入的背景下,腾讯基于“自研+开源”多模型策略,加速全域产品AI渗透。自研混元大模型推出混元T1和Turbo S,并已接入700+内部场景;生态协同方面,腾讯元宝、微信、 ima、腾讯文档等系列产品批量接入DeepSeek-R1开源模型。

2月,腾讯元宝 DeepSeek R1联网版|图片来源:视觉中国

 

AI应用端的进展也在加速。AI原生应用腾讯元宝自2025年2月至3月的DAU(日活)激增超20倍。

受益于多模型策略,即自研腾讯混元大模型和拥抱DeepSeek等开源模型的驱动,腾讯元宝得以给用户提供稳定流畅的深度推理体验。借助腾讯云智算力支撑与海量的运维经验,确保了用户使用过程流畅 “不卡顿”。

自上线以来,腾讯混元也全面拥抱开源,开源模型已覆盖文本、图像、视频和3D生成等多个模态,GitHub 上总Star数量超2.3万,多次登顶趋势榜。其中较早开源的混元DiT文生图模型,在国内外衍生模型数量多达1600多个。

AI对于腾讯业务的提效也在2024年开始显现。2024年第四季度,腾讯会议的收入同比增长超过40%,AI功能月活增长至1500万;企业微信收入同比翻倍。腾讯会议之外,腾讯内部已有超过700业务场景接入混元大模型并积极拥抱开源大模型。

腾讯的云计算业务归属于其金融科技与企业服务板块,该板块在第四季度同比增长 3% 至 561 亿元。不过,腾讯指出,随着公司内部对GPU的使用不断增加,可用于外部客户的芯片数量受限,这也对云服务收入的增长产生了阻碍。

腾讯表示,从第四季度起,公司已经加大了对GPU的采购力度,并预计云服务收入将因此加速增长。

腾讯董事会主席兼首席执行官马化腾表示:「数月前,我们重组了AI团队以聚焦于快速的产品创新及深度的模型研发、增加了AI相关的资本开支、并加大了我们对原生AI产品的研发和营销力度。

我们相信这些加码的投资,会通过提升广告业务的效率及游戏的生命周期而带来持续的回报,并随着我们个人AI应用的加速普及和更多企业采用我们的AI服务,创造更长远的价值。」

腾讯首席战略官James Mitchell则在财报电话会上就人工智能相关的研发和资本支出问题进行了说明。

James Mitchell称,腾讯每年都在增加对不同项目研发的支出,这已成为公司传统,因此研发支出本身不会对利润率构成压力;资本支出是一个更复杂的话题。腾讯在去年第四季度将资本支出提升到了一个新的更高水平,这些增量支出将在未来几年转化为增量折旧。具体来说:

资本支出最直接的用途是购买GPU来支持广告技术,也在一定程度上支持游戏业务。从结果来看,这部分资本支出产生了良好的利润率和高回报,不会对利润率造成压力。

之前曾有观点认为每一代新的大型语言模型都需要数量级的GPU,但随着DeepSeek等的突破,行业包括腾讯在内,现在正从现有GPU中获得更高的生产力,无需以之前预期的速度添加额外GPU,因此这方面的资本支出压力也在减轻。

公司购买GPU服务并出租给客户,虽然可能不是回报最高的业务,但也有正回报,能够覆盖GPU成本及相应折旧。

2C推理相关的资本支出是一个额外的成本压力,但它是总资本支出的一个子集,是可控的。我们乐观地认为,随着时间推移,2C推理活动将通过广告收入和增值服务的组合实现变现。

 

AI agent将为腾讯带来巨大机会?

 

关于2C应用,刘炽平谈到,腾讯拥有多款面向消费者的应用程序,并且未来还将推出更多。目前人工智能仍处于早期阶段,很难预测最终的发展形态。不过,腾讯的每款产品都将继续演变为更强大、更有用的工具。

具体来看,元宝可以成为一个强大的AI原生助手,整合多种功能,但不会成为唯一的入口;ima.copilot可以作为个人和团队协作的智能工具;微信则会推出更多功能,进一步提升用户体验。此外,腾讯的其他产品,如QQ、浏览器等,也将逐步融入AI体验。

每款产品都会继续发展,并寻找独特的应用场景,利用AI为用户提供更好的体验。同时,这些产品之间也会协同合作,共同推动AI产品扩大用户群。

在财报电话会议中,腾讯高管表示已经“为消费者人工智能互动的突破性增长做好了准备”。

关于前段时间大热的AI agent,腾讯会怎么做?刘炽平也在财报电话会上做了解读。

他提到,AI agent本质上是利用模型能力并连接不同软件工具以完成复杂任务的模型。它是一个非常广泛的概念,既可以独立存在,也可以嵌入不同的应用程序中。腾讯计划利用高质量的模型构建独立的AI agent,并借助其在浏览器、元宝等软件平台上的庞大用户基础来推动这些agent的发展。同时,腾讯也将在微信和QQ等核心应用中融入AI agent,以进一步提升用户体验。

在微信的生态系统中,AI agent具有独特的优势。微信拥有庞大的用户群体,用户每天使用时间长,打开应用的频率高,这为AI agent提供了丰富的应用场景。此外,微信内的活动非常多样化,涵盖了社交通信、内容消费、工作、学习以及各种交易。微信的小程序生态系统更是提供了丰富的活动场景,AI agent可以基于模型连接到不同的小程序,为用户完成复杂的任务。这些优势使得微信成为AI agent发展的理想平台。

尽管如此,腾讯在构建AI agent时将非常谨慎和耐心。公司会重点关注数据安全、用户的舒适感和安全感,确保为用户提供正确的体验。这些细节需要在产品开发过程中予以充分关注。虽然目前需要谨慎推进,但随着时间的推移,AI agent将为腾讯带来巨大的机会,尤其是在其庞大的用户基础和丰富的产品生态中,AI agent有望为用户提供更高效、更便捷的服务。

腾讯在AI Agent方面的思路,是将生成式AI能力与自身庞大的软件生态相结合,这反映了腾讯在AI时代重构护城河的努力。而腾讯能否将微信的生态优势转化为AI领域的领导地位,或许还要取决于它在技术和生态之间能否找到平衡。

 

游戏业务双线开花,国际收入创新高

 

Sensor Tower发布的《2025年移动游戏市场报告》显示,全球移动游戏用户的应用内购买支出结束“两连跌“,2024年同比增长4%至810亿元。2024年一共有4款游戏首次进入10亿美元收入俱乐部,其中有两款腾讯游戏入围,分别是《地下城与勇士:起源》以及《Brawl Stars》。

图片来源:《地下城与勇士:起源》官网

 

在游戏行业回暖的大环境下,受益于长青游戏和新游的共同推动,腾讯游戏去年实现收入1977亿元,同比增长9.9%。其中国际市场收入同比增长9%至580亿元,在腾讯游戏中保持三成左右的稳定占比;本土市场收入同比增长10%至1397亿元。

具体到第四季度,游戏业务实现收入492亿元,本土、国际市场收入均实现双位数增长,其中其中本土市场增速23%至 332 亿元,国际市场游戏收入同比增长15%至160亿元,接近本土市场收入的一半。

此外,腾讯在财报中将年流水超过40亿元且季度平均日活跃用户超过500万的手游或超过200万的PC游戏定义为长青游戏。在2024年,符合这一标准的游戏从12款增加至14款——长青游戏组合的进一步扩充也说明腾讯游戏的长青战略初见成效。

去年,腾讯旗下的《PUBG MOBILE》《Brawl Stars》等游戏在海外表现出色,其中以《Brawl Stars》为主要代表的supercell游戏人气急升,实现活跃用户和游戏流水的明显增长。根据supercell的披露,2024年公司总收入达28亿欧元,同比增长77%。

本土市场方面则主要得益于《无畏契约》《火影忍者》《金铲铲之战》和《英雄联盟手游》等游戏的增长,以及《地下城与勇士:起源》《三角洲行动》等新游发布。

此外,受益于春节期间的商业化表现出色,腾讯旗下多款产品在今年1月实现活跃用户和游戏流水的同比增长,为2025年第一季度奠定基础。根据Sensor Tower的统计,今年1月腾讯游戏的流水同比增长62%,《王者荣耀》《和平精英》和《穿越火线:枪战王者》的全球收入分别激增94%、267%和421%,其中《和平精英》更是官宣在今年除夕当天日活跃用户超8000万,展现旗舰长青的实力。

具体产品方面,《王者荣耀》在去年10月宣布有超过一亿玩家共同庆祝游戏九周年;发布第四年的《金铲铲之战》仍保持强劲的增长势头,据Sensor Tower统计,去年第四季度《金铲铲之战》的流水同比增长30%,连续八个季度实现双位数增长。

在端游方面,腾讯首款多端第一人称射击游戏《三角洲行动》自去年9月发布以来热度不减,第四季度在顺网星研究社中的网吧游戏热力榜稳定在Top 5水平,25年2月更首次达到第3名;另一款射击大作《无畏契约》亦保持稳健表现,顺网星研究社指出今年2月该游戏的热度几乎是去年同期的三倍。

新游方面,去年12月《流放之路2(Path of Exile2)》抢先体验版在发售当日即迅速登顶Steam全球畅销榜,并在上线当月持续在榜8天。根据Steam DB统计数据显示,在付费下载(No-F2P)游戏中,《流放之路2》在Steam畅销榜连续6周登顶。

目前,腾讯游戏在本土、海外市场已储备多款新游,包括异人之下游戏、《胜利女神:新的希望》《暗区突围:无限》《沙丘:觉醒》等重点产品。

总体来看,腾讯游戏2024年的财报表现可圈可点,得益于本土市场的强劲增长和国际市场的稳步扩张,以及长青游戏和新游的协同效应,腾讯在全球游戏行业回暖中巩固了领导地位。

高盛在近期发布研究报告,预计2025年腾讯游戏在2024年的高基数之下继续保持10%的增速。

未来,随着新游储备的释放和市场布局的深化,腾讯有希望展现其作为「全球最大游戏公司之一」的持续竞争力。

 

 

 

 

 

浏览量: 11

百度回应「开盒」事件:信息并非来自百度;OpenAI 推出目前最昂贵的人工智能模型;马化腾:和梁文锋有交流,目前 AI 生态还在早期|极客早知道

马化腾:和梁文锋有交流,目前 AI 生态还在早期

3 月 19 日,在腾讯年报沟通会中,腾讯 CEO 马化腾表示,AI 的智能化程度相比往年有大幅度提升,对于腾讯来说经过慎重思考,云业务和元宝都拥抱了 DeepSeek。未来应用大发展的机会已经到来,各家都在采用 AI 落地,也看到 AI Agent(智能体)的发展,背后有很多 AI 相关工具的想象空间。

目前 AI 生态还在早期,各行各业都会受益于 AI 普及,相信每个行业都会拥抱这个机会。「我们业界和梁文锋都有交流,很敬佩市场上出现独立、开源的产品,我们非常尊重。」

同时,马化腾也透露,腾讯在数月前重组了 AI 团队以聚焦于快速的产品创新及深度的模型研发、增加了 AI 相关的资本开支、并加大了对原生 AI 产品的研发和营销力度。(来源:电商派)

Meta Llama 模型下载量突破十亿,增长速度惊人

3 月 19 日,Meta 公司首席执行官马克·扎克伯格在 Threads 平台上宣布,Meta 的「开放」人工智能模型家族 Llama 的下载量已达到 10 亿次,相较于 2024 年 12 月初的 6.5 亿次下载量,在短短约三个月内增长了约 53%。

Llama 模型是 Meta 旗下人工智能助手 Meta AI 的核心技术支撑,广泛应用于 Meta 旗下的多个平台,包括 Facebook、Instagram 和 WhatsApp 等。作为 Meta 多年来致力于构建广泛人工智能产品生态系统的关键组成部分,Llama 模型及其相关微调和定制化工具均以专有许可的形式免费提供给开发者和企业使用。

自 2023 年推出以来,Llama 取得了广泛的成功。目前,包括 Spotify、AT&T 和 DoorDash 在内的多家知名企业已在生产环境中使用 Llama 模型。(来源:IT之家)

 

OpenAI 推出 o1-pro,目前最昂贵的人工智能模型

3 月 20 日,OpenAI 近日在其开发者 API 中推出了更强大的推理人工智能模型——o1-pro。据 OpenAI 称,o1-pro 相比之前的 o1 模型,使用了更多的计算资源,以提供「持续更好的响应」。

目前,该模型仅向特定开发者开放,特别是那些在 OpenAI API 服务上消费至少 5 美元的用户。然而,o1-pro 的定价相当高昂:对输入模型的每百万词元(约 75 万字)收取 150 美元,对模型生成的每百万词元收取 600 美元。这相当于 OpenAI 的 GPT-4.5 价格的两倍,普通 o1 价格的 10 倍。

OpenAI 认为,o1-pro 性能的提升将说服开发者支付这笔不菲的费用。然而,早期用户发现,该模型在处理数独谜题时表现吃力,并在简单的视错觉笑话上出现错误。此外,OpenAI 去年年底进行的某些内部基准测试显示,o1-pro 在编码和数学问题上的表现仅略高于标准版 o1,但在回答这些问题时确实更加可靠。(来源:cnBeta)

 

腾讯:2024 年净利润 1940.7 亿元,比上年增长 68%

3 月 19 日,腾讯控股发布 2024 年 Q4 及全年财报显示,2024 年全年,腾讯实现营收 6602.6 亿元,同比增长 8%;净利润 1940.7 亿元,比上年增长 68%,研发投入创下历史新高,达到 707 亿元。

微信及 WeChat 合并月活跃账户数增至 13.85 亿,同比增长 3%;QQ 的智能终端月活跃账户数 5.24 亿,同比下降 5%。(来源:界面新闻)

 

软银宣布 65 亿美元全现金收购美国芯片设计公司 Ampere 以加速 AI 创新

3 月 20 日,软银集团宣布与美国芯片设计公司 Ampere 达成协议,软银集团将通过子公司以 65 亿美元(约合 469.97 亿元人民币)全现金方式收购 Ampere 的全部股权。

根据协议条款,Ampere 将作为软银集团的全资子公司运营并保留其名称。作为交易的一部分,Ampere 的主要投资者——凯雷集团和甲骨文公司将出售其在 Ampere 的各自股份。

软银集团董事长兼 CEO 孙正义表示:「AI 未来需要突破性的算力。Ampere 在半导体和高性能计算方面的专业知识将有助于加速这一愿景,并深化我们对美国 AI 创新的承诺。」

公开资料显示,Ampere 成立于 2018 年,是一家专注于为数据中心设备制造处理器的芯片设计公司,其技术基于 Arm 的技术架构。(来源:IT之家)

 

GTC 演讲并未带动股价,英伟达估值触及 29 个月低点

3 月 19 日,在加州圣何塞举行的 GTC 人工智能大会上,英伟达一系列发布未能提振公司股价,该股在当日交易中下跌超过 3%。自 2025 年 1 月 10 日 DeepSeek 发布以来,英伟达市值已减少 4200 亿美元。

数据显示,自 2024 年 12 月 31 日以来,英伟达股价年内下跌了 14.04%,英伟达的市盈率为 40.66 倍,为自 2021 年 10 月 20 日以来的最低水平,即 29 个月以来的最低点。(来源:新浪科技)

百度回应「开盒」事件:信息并非来自百度,对侵犯用户隐私行为零容忍

3 月 19 日,针对「谢广军女儿开盒」事件,百度在官方公众号发布声明表示,事件相关信息并非来源于百度,任何职级员工及高管均无权限触碰用户数据。

声明中强调,百度坚决谴责窃取和公开他人隐私的网络暴力行为,对任何侵犯用户隐私的行为零容忍。

声明里,百度表示内部实施了数据的匿名化、假名化处理;数据存储和管理实行严格隔离和权限分离,任何职级的员工及高管均无权限触碰用户数据。百度安全部门反复调取了相关日志,并查验当事人权限。结果表明,开盒信息并非源自百度。

其次,经过调查,开盒信息来自海外的社工库——一个通过非法手段收集个人隐私信息的数据库。相关调查过程已取证,并得到公证机关公证。(来源:新浪科技)

 

哪吒汽车:近期网传「哪吒汽车解散研发团队」等系不实传闻

3 月 19 日,哪吒汽车 发布声明称,近期网络传闻「哪吒汽车解散研发团队」等信息,系不实传闻。公司目前正通过组织与流程优化,推动进一步降本增效。对传播不实信息、损害企业声誉的行为,公司保留法律追责的权利。(来源:界面新闻)

 

宇树 G1 人形机器人全球首次完成侧空翻动作

3 月 19 日,宇树科技官博更新视频,标题为「Unitree G1 全球首次完成侧空翻的人形机器人」。

宇树科技表示,一周年前宇树 H1(1.8 米)实现全球首次电驱人形机器人原地空翻(2024 年 3 月),这次挑战更高难度原地侧空翻。

视频中,宇树 G1 机器人在完成侧空翻动作后保持平衡。宇树科技还称,此程序开发和拍摄期间,G1 无任何故障损坏。(来源:IT之家)

理想 L 系列 / MEGA 智驾焕新版申报:换装小体积激光雷达,5 月上市

3 月 19 日,理想汽车旗下的 L 系列车型及理想 MEGA 智驾焕新版已现身工信部变更扩展目录,其中搭载 AD Pro 智驾系统的车型将新增激光雷达,其主动安全能力将与 AD Max 看齐。

新车全面采用体积更小的全新激光雷达方案,搭载 AD Max 智驾系统的车型将会从英伟达双 Orin-X 芯片升级至单 Thor-U 芯片。官方表示,单 Thor-U 芯片与双 Orin-X 芯片的 AD Max 系统均能提供高级辅助驾驶和全场景 NOA 功能,并且支持运行端到端 + VLM 大模型以及今年后续推出的 VLA 大模型。

此外,理想 L6、L7、L8、L9 搭载 AD Pro 智驾系统的车型将从地平线 J5 芯片升级到 J6M 芯片,并增加激光雷达,在主动安全能力上看齐 AD Max。J5 与 J6M 的 AD Pro 智驾系统均提供高级辅助驾驶和高速 NOA 功能,并可通过 OTA 持续升级。

在动力总成(增程器、电机、电池)以及造型设计方面,理想 L 系列及理想 MEGA 智驾焕新版与现款车型保持一致。值得一提的是,理想 L9 智驾焕新版选装绿色车漆时将同步提供金色饰条和全新配色轮辋。(来源:IT之家)

 

腾讯混元全新推理模型 T1 官宣:3 月 21 日发布

3 月 19 日,腾讯混元通过官方公众号宣布,全新的推理模型 T1 将于本周五(北京时间 3 月 21 日 23 时)正式发布。

与此同时,腾讯宣布,混元大模型首次登上 Chatbot Arena 榜单,跻身全球 Top 15。用户在该平台上以匿名方式与多个模型互动,投票决定何种模型更佳,从而根据分数生成排行榜。这种测评也被看成是大模型直接 PK 的竞技场,简单直接。

去年 9 月 5 日,腾讯发布了新一代大模型混元 Turbo,采用 MoE 架构,比上一代产品推理效率提升 100%,推理成本降低 50%。(来源:IT之家)

 

Stability AI 发布新模型 Stable Virtual Camera,2D 照片轻松转 3D 视频

3 月 19 日,Stability AI 推出了其最新的人工智能模型——Stable Virtual Camera,该模型能够将 2D 图像转换为「沉浸式」视频,并呈出逼真的深度和视角。

Stable Virtual Camera 可以从一张或多张图像(最多可处理 32 张)中生成场景的「新视角」,用户还可以指定相机角度。该模型可以生成沿着「动态」相机路径或预设路径移动的视频,包括「螺旋」、「缩放」、「移动」和「平移」等多种效果。

目前版本的 Stable Virtual Camera 为研究预览版,可以生成方形(1:1)、竖屏 (9:16) 和横屏 (16:9) 三种宽高比的视频,最长可达 1000 帧。然而,Stability AI 警告说,该模型在某些情况下可能会产生较低质量的结果,尤其是在处理包含人类、动物或「动态纹理」(如水面) 的图像时。

目前,Stable Virtual Camera 在 Hugging Face 平台上以非商业许可的形式供研究使用,用户可以下载体验。(来源:aibase)

前英特尔 CEO 帕特·基辛格亮相 GTC:称英伟达在 AI 时代很幸运

本周,前英特尔 CEO 帕特·基辛格是英伟达的 GTC 2025 大会的特邀嘉宾,该大会目前正在加利福尼亚州旧金山举行。科技新闻媒体从基辛格在 Acquired 的「GTC 现场」视频播客中亲自露面时的思考中摘录了关键语录。

过去,这位前英特尔负责人认为英伟达能够占据市场领先地位是「极其幸运的」。昨天的小组讨论再次让基辛格重拾了他长期以来的观点:「CPU 是王者,我赞赏黄仁勋的坚韧,他只是说,『不,我不是想打造其中之一;我只是想从图形开始应对工作负载。’你知道,这变成了一个更广泛的视角。然后他在人工智能方面很幸运,有一次我和他辩论时,他说:『不,我在人工智能工作负载方面很幸运,因为它需要那种类型的架构。』这就是应用程序开发的中心所在。」(来源:cnBeta)

 

浏览量: 11

DeepSeek 们为什么选择飞书?

人工智能,正在真正地从一种技术幻想,变成一个时代。
大模型的热度自然已经是无需多言。从自动驾驶到具身智能,云天励飞、地平线、优必选等一批新兴 AI 企业正在成为关键技术力量。AI 的范畴,比如今炙手可热的大模型更加广阔。而随着大模型的加入,AI 也不再仅仅局限于一种种产品技术对人类需求的理解,而是越来越逼近一个个创新场景。
除了业务本身之外,这些人工智能公司之间的沟通方式,也成为了产业化的关键要素。
在协作领域,一个可以观察到的趋势是:大模型公司都在用飞书。
作为一个跟着国内的泛 AI 公司同步成长起来的效率产品,飞书一直都以客户群体更加前沿、创新化见长。尤其是国内从头部到长尾的泛 AI 公司,其实一直以来都是飞书的客户。
而在大模型时代,飞书的生产价值又得到了进一步的开发。
近日,广州白云机场中的一则飞书广告墙上,国内九家头部的大模型公司 Logo 赫然在列:DeepSeek、MiniMax、月之暗面、智谱 AI、零一万物、百川智能、阶跃星辰等。大模型公司跟着泛 AI 行业一起集体拥抱飞书,可以说是情理之中。但当下越来越多代表先进生产力的创新公司都在使用飞书的事实,又成为了一个值得深挖的底层逻辑。

 

01

为什么 AI 公司「必用」飞书?
 
事实上,代表先进生产力的不止大模型公司。过去几年,AI 公司代表的不是一类固定的技术探索方向,而是一种向智能化进发的组织形式。
它们呈现出来的特点大多为:科技人才高度密集、探索性业务多、产品迭代快、研发流程复杂。这些特定也决定了:选择飞书,能让它们的生产效率进一步提升。
那么,从代表 AI 技术平台暗物智能、云天励飞等,到自动驾驶公司地平线、文远知行,再到具身智能公司智元机器人、优必选,这些创新型 AI 企业有着不同的业务场景和产业定位,为什么却在使用飞书这件事上体现出了一定的集群效应呢?
因为 AI 的「社会分工」还在继续。这也就意味着,未来,任何一家 AI 企业都不可能独立运转,而是以组合的方式呈现出强逻辑、强交互、即时协作等现代化产业链的特征。随着参与进来的角色越来越多,在更加精细化的领域分工中,构建「共同语言」也在变得越来越迫切。
事实也是如此。不难发现,无论是大模型这一类效率创造工具,还是自动驾驶、智能制造、机器人领域中所体现的泛人工智能,无论应用层产品团队还是基础设施服务商,几乎都在心照不宣地共同打造一个 AI 领域的舒适圈,让彼此之间减少一些场景和表达上的障碍。
就像硅谷的新一代技术领袖都约定俗成在 X 上社交和发布资讯一样,在协作工具这个赛道,国内的泛 AI 公司已经达成了基本一致的选择。用飞书,为 AI 这一创新经济的协作秩序定调。
值得一提的是,这群 AI 从业者作为当下创新意识最强的群体之一,对于生产方式的转身速度极其灵活,任何产品服务都很难以传统销售和市场推广思维来成为 AI 领域的根基。
熊彼特的创新理论认为,创新是生产过程中内生的,而所谓生产方式的革新与发展,只是经济生活从外部强加于它的。
也就是说,如果分析飞书为什么能成为这一波 AI 热潮下的生产主阵地,我们能清晰地感知到 AI 公司在协作需求、投入逻辑、展示场景等方面,与上一代主导「互联网革命」的公司的不同之处。但当你作为一个 AI 从业者真正参与生产的时候,选择飞书作为协作工具,并不再是「一个选择」。
就大模型公司来说,其业务协作与飞书的匹配点有三:
第一,大模型公司时下的创新速度非常快,几乎每天都在经历细分赛道的探索和项目流程的变化。这就需要飞书项目的灵活配置能力,才能适应此类高强度探索型业务的开发节奏,并提升协同效率。
第二,包括大模型公司在内等泛 AI 公司,因为自身业务特点、科技人才偏好,往往也会更加重视办公效率和自动化办公的体验。飞书的现代化体验,能够更好地服务于各种不同物理空间形态的职场办公体验,不让企业办公和个人办公呈现出体验割裂性。
第三,头部大模型公司已经像自动驾驶等泛 AI 公司一样,步入了激烈的行业竞争,外部不确定因素很大。公司想要抢跑,需要在市场战略、组织管理方式上实现动态对齐。在这一点上,飞书能帮助它们敏捷地跑在正确的跑道上,同时在复杂的项目流程和战略实践中协调供应链,为下一步成长为中大型企业打好组织基础。
在技术浪潮下,企业自身就是新的技术组合,新的技术组合则需要新的生产力组合。无论是像月之暗面、智谱 AI 一样的大模型初创公司,还是理想汽车、地平线等经历着长期技术创新的智能出行公司,乃至 36 氪自身。我们会发现,只要是在关注未来、关注智能化的人,对于飞书这一类年轻化生产力的适应都是会非常迅速的。
「除了作为乙方配合客户的办公软件之外,自己的需求基本都会用飞书。」关注效率创新的个人生产力用户如是说。
以时下涌现的大模型公司、大模型初创团队为例,大多数从业者都有过作为「配合客户」的经历。正是因为体验过不同的产品,才能知道自己想要的是什么。恰好,在此刻大模型的圈子和语境中,大家几乎处在同一技术窗口期,没有企业组织的僵化、协作系统的垄断和客户服务的被动性。
这也就使得抓住了现代化体验的飞书,产生了独特的吸引力。

02

AI 创新,共建大于协作
 
除了协作文档、视频会议等组织效率工具之外,飞书在 AI 时代被广泛选择的一大场景,是其在 2021 年 4.0 版本中就已经上线的知识库应用。
知识库的价值,不但对于以「数据内容化」见长的 AI 创业者们来说,是必须要亮出来的一柄剑,在不少传统企业向智能化转型、为 AI 化落地应用做准备的过程中,也成为了颇为合适的软着陆基带。
有了飞书知识库这一场景,无论是企业还是个人,都能把数据和内容快速沉淀为可视化、可交互的数据应用。有了数据准备,在未来算力进一步提升之后,就拥有了更早更轻地体验技术的温床。
而对于 AI 初创企业来说,知识库的逻辑就更加容易理解。当下,一个 AI 不可能解决所有问题,对于用户来说,在百花齐放的大模型和 AI 应用中保持尝试、组合、优化工作流,才是效率提升的关键。但毫无疑问,精力成本过高。另一方面,会让同一赛道的大模型公司看起来越来越同质化。
因此,很多新的 AI 公司都在通过飞书知识输出专业内容,由业内向业外、由创新领袖、生产力爱好者再到普通用户去外化和「破圈」。对于不少 AI 从业者来说,这已经成为了一种低成本、低推广、强链接的获客逻辑。
「每当看到一个实用、有价值的飞书知识库,就会下意识地会去关注创作它的团队」。喜欢创新、会思考的个人生产力用户如是说。
飞书作为一种协作工具的开放性,不止在于知识库沉淀出来的实用主义价值,但从撰写内容到搭建内容应用的思路变化,确实是 AI 化交互的一个有效体现。
比如,目前国内影响力颇大的开源 AI 知识库项目「WaytoAGI(通往通用人工智能之路)」,就是在飞书上搭建的。

2023 年 4 月成立至今,WaytoAGI 已经从一个庞大的知识库体系,变成了一个可靠的主流信息源,涵盖一站式的 AI 领域知识、行业资讯、应用案例等。值得关注的是,WaytoAGI 对自己的定位并不是一个知识库或者整合媒介,而是一个公益开源社区。这也正是选择飞书的 AI 公司们在长期的创新协作体系下期待的共同语言和交流形式:将自己内部的创新理论和知识获取方式开源给整个行业。

过去,GitHub、HuggingFace 等开源技术社区引领了创新发展的潮流,但在技术产业化、时代化的过程中,只有技术参与者是远远不够的。应用、内容、资讯、效率方法论,才是塑造绝大多数人和组织思考与学习方式的手段。
毫无疑问,除了效率工具之外,飞书也正在作为一个平台基座,推动 AI 的社区化。
在服务众多大模型创业公司的同时,飞书也开始加速在自己的产品中引入 AI 能力。去年年底,飞书在产品体系中上线了「飞书智能伙伴」,用户可以在内容创作、总结、数据分析、场景搭建等不同业务场景中无缝调用 AI 的能力。企业客户还可以根据业务需求选择 MiniMax、智谱 AI、百川智能等合适的底层大模型,而这些大模型公司本身就是飞书的客户,也会对飞书的业务场景理解更加深刻。
创新的沿途,创新者们总在求变中相互扶持。国内市场,AI 已经不再是一个「圈内自嗨」的 bubble,正在破土向更多人途径的陆地生长绽放。
而如今被大多数 AI 公司选择了的飞书,正是因为自身体现出的轻量化体验、内容应用化特性,以及独特的社区共建价值,才能跟随创新者们的视野,去到无人深空。
当下,与 AI 有关的一切,飞书都在深度参与着。未来,更多更快的创新组织和场景,也都将拥抱飞书。 
浏览量: 15

GTC 开幕,英伟达核弹连发;小米小鹏发布史上最强年报;宁德时代战略投资蔚来能源

英伟达 GTC 开幕,黄仁勋介绍多项 AI 进展

在 GTC 2025 的开幕主题演讲中,英伟达创始人黄仁勋在 150 分钟内,接连给从 AI Agent 到数据中心的 AI 芯片、再到具身智能的多个行业生态,再次指明了未来。

英伟达此次推出了一个新的「AI 工厂」引擎的操作系统,Dynamo。黄仁勋把这个推理服务库比作新时代的 VMware,能够自动编排如何让 AI 在推理时代跑的更好——每秒能产生更多 token。按照英伟达的说法,使用 Dynamo 优化推理,能让 Blackwell 上的 DeepSeek-R1 的吞吐量提升 30 倍。Dynamo 也完全开源。

在硬件领域,老黄宣布了其 Blackwell AI 工厂平台的下一个演进版本————Blackwell Ultra,旨在进一步提升 AI 推理能力。Blackwell Ultra 具体包含 GB300 NVL72 和 HGX B300 NVL16 系统,其 AI 性能比其前代产品高出 1.5 倍。

除了 Blackwell Ultra,英伟达还公布了其 2026 年和 2027 年数据中心路线图的更新,其中就包括即将推出的下一代 AI 芯片 Rubin(以天文学家 Vera Rubin 命名)与 Rubin Ultra 的计划配置。

而在去年发布了 GR00T 模型之后,今年英伟达发布了 GR00T N1 模型。英伟达宣布这是全球首个开放的、完全可定制的通用人形机器人推理与技能基础模型。Groot N1 基于合成数据生成与仿真学习的技术基础,采用了「快思考与慢思考」的双系统架构。其中,「慢思考」系统让机器人能够感知环境、理解指令,并规划正确的行动,而「快思考」系统则将规划转换为精准、连续的机器人动作。(来源:极客公园)

小米发布「最强年报」,2024 年全年营收增长 35%

3 月 18 日,小米集团发布 2024 年第四季度以及 2024 年全年业绩。小米集团董事长雷军在个人微博表示,这是小米史上最强财报。

从 2024 年第四季度来看,小米集团首次实现单季度营收破千亿元,达 1090 亿元,同比增长 48.8%,连续四个季度保持强劲增长。经调整净利润 83 亿元,同比增长 69.4%。

2024 年全年,小米集团营收 3659 亿元,同比增长 35%;经调整净利润 272 亿元,同比增长 41.3%。

小米汽车业务同样超预期。2024 年全年,小米智能电动汽车等创新业务收入 328 亿元,2024 年交付新车 136854 台,连续 5 个月单月交付超 2 万台。小米集团将小米汽车 2025 全年交付目标提升至 35 万台。(来源:中国证券报)

 

阿里各部门 2025 年绩效考核和 AI 直接挂钩

据报道,近日阿里巴巴 CEO 吴泳铭主张在阿里现有业务中全面实现「AI 化」。

阿里所有部门已被告知,他们 2025 年的绩效将通过如何利用 AI 促进增长来评估。淘宝和天猫在内的核心电子商务部门被鼓励采用更多的 AI 技术。各团队正在与通义千问的工程师密切合作,共同开发能够提高效率和用户体验的功能。

知情人士称,该公司还在开发一系列 AI 原生应用,其中一些可能会在今年推出。「在公司内部,我们相信,基于成熟 AI 技术的下一个杀手级应用,一个甚至比抖音更受欢迎的应用,可能很快就会出现,」该人士表示。(来源:财联社)

 

谷歌达成迄今最大一笔收购交易

谷歌 3 月 18 日宣布,将以 320 亿美元的全现金交易方式收购总部位于纽约的云安全初创公司 Wiz,交易金额可能会根据最终结算进行调整。交易完成后,Wiz 将加入谷歌云。

此次收购是谷歌云在人工智能时代对两大快速增长趋势的投资:提升云安全能力以及支持多云环境(即使用多个云服务提供商)。网络安全和云计算都是快速发展的行业,拥有广泛的技术解决方案。随着人工智能的广泛应用和云服务的普及,客户面临的网络安全格局发生了巨大变化,网络安全在抵御新出现的风险以及保护国家安全方面的重要性日益凸显。

谷歌称,Wiz 提供了一个易于使用的安全平台,能够连接到所有主要的云服务和代码环境,帮助防止网络安全事件的发生。从初创企业到大型企业,再到政府和公共部门机构,各种规模的组织都可以使用 Wiz 来保护其在云端构建和运行的所有内容。Wiz 是一个创新的行业领导者,持续推出新产品并获得广泛采用,推动了业务的快速增长,尤其是在过去 12 个月中,该公司开始提供新的网络安全解决方案类别。

谷歌表示,谷歌云在云基础设施领域处于领先地位,拥有深厚的 AI 专业知识以及行业领先的网络安全创新记录。将谷歌云的这些优势与 Wiz 结合,将有助于进一步提升 Wiz 的解决方案的质量和可扩展性,从而惠及所有主要云服务的客户和合作伙伴。(来源:IT 之家)

 

小鹏汽车发布 2024 年财报,Q4 销量破 9 万台

3 月 18 日,小鹏汽车发布了其截至 2024 年 12 月 31 日止第四季度及全年财务数据。

四季度,小鹏汽车总交付量为 91,507 辆,较 2023 年同期的 60,158 辆增长 52.1%,创下单季度交付量历史新高,超过四季度 87,000-91,000 辆交付指引上限。同时,小鹏汽车四季度月均交付达 3 万辆以上,突破单季交付 9 万辆里程碑。

四季度总收入为人民币 161.1 亿元,较 2024 年第三季度增长 59.4%。其中,汽车销售收入为 146.7 亿元,较 2024 年第三季度增长 66.8%。

2024 全年,小鹏汽车总收入达 408.7 亿元,按年上升 33.2%;全年毛利率为 14.3%,按年上升 12.8 个百分点。(来源:快科技)

字节召开大模型部门全员会

3 月 18 日上午,字节跳动豆包大模型部门(Seed)召开全员会,由负责模型应用相关工作的朱文佳,与新近加入的负责 AI 基础研究探索工作的吴永辉共同主持。

全员会上明确了 Seed 部门最重要的目标是探索智能上限,这是一个长期目标,会围绕此前公布的 AGI 研究计划「Seed Edge」展开,鼓励有能力、有想法的同学,探索更长周期的、具有不确定性和大胆的 AI 研究课题。

进一步加强组织文化,打造开放、包容、自信的团队研究氛围,则是 Seed 今年工作的另外一个重心。

为了更好地培养人才,Seed 正在改进内部反映的一些问题,比如让信息更透明,包括扩大文档、代码和数据的权限,尽可能共享,消除信息孤岛。同时,打破部门壁垒,提升跨团队的沟通与协作,建立跨部门的专项研究小组。

此外,未来 Seed 也会考虑开源,可能会开源中小尺寸的 Dense 模型,这样尺寸的模型对社区也是最友好的,目前细节还在讨论中。(来源:极客公园)

 

蔚来与宁德时代达成换电融合,并获战略投资

据蔚来官方披露,3 月 17 日晚,蔚来与宁德时代在福建宁德签署战略合作协议。在此基础上,双方将进行资本合作,宁德时代正在推进对蔚来能源不超过 25 亿元的战略投资,进一步巩固双方战略合作伙伴关系。

根据协议,宁德时代将支持蔚来换电网络的发展,蔚来公司旗下 firefly 萤火虫品牌后续开发的新车型将适时导入宁德时代巧克力换电标准和网络。双方换电网络将采用「双网并行」模式,共同为换电车主提供更加便捷高效的换电体验。

双方还将联合推动换电技术国家标准的制定和推广,促进跨品牌、跨车型电池兼容;共同构建「电池研发-换电服务-电池资产管理-梯次利用-材料回收」全生命周期闭环,助力新能源汽车全产业链安全降本增效。

值得一提的是,蔚来高级副总裁沈斐与宁德时代换电业务总经理杨峻代表双方签约。蔚来创始人、董事长、CEO 李斌与宁德时代创始人、董事长兼 CEO 曾毓群现场见证。(来源:21 经济网)

 

马斯克旗下 xAI 收购视频生成公司

据科技博客 TechCrunch 报道,马斯克旗下人工智能公司 xAI 已收购了 Hotshot,后者是一家专注于开发 AI 视频生成工具的创业公司,其技术类似于 OpenAI 的视频生成大模型 Sora。

Hotshot CEO 兼联合创始人阿卡什·萨斯蒂 (Aakash Sastry) 周一在 X 上宣布了公司被 xAI 收购的消息。「过去两年里,我们作为一个小团队构建了三个视频基础模型——Hotshot-XL、Hotshot Act One 和 Hotshot,」萨斯蒂表示,「我们很高兴成为 xAI 的一部分,在全球最大算力集群 Colossus 上继续扩大这些工作。」

Hotshot 总部位于旧金山,由萨斯蒂和约翰·穆兰 (John Mullan) 在几年前创立。这家创业公司最初专注于开发基于 AI 的图片创作和编辑工具,但最终转向了开发文本生成视频的 AI 模型。

xAI 收购 Hotshot 可能意味着该公司计划开发自己的视频生成模型,以与 Sora、谷歌的 Veo 2 等产品竞争。马斯克此前曾暗示,xAI 正在开发视频生成模型,以增强其 Grok 聊天机器人平台。他曾在今年 1 月的一次直播中表示,预计「Grok 视频」模型将在「几个月内」发布。(来源:凤凰网科技)

 

网友呼吁小米卫生巾,小米高管疑似改口

3 月 15 日晚,央视 3·15 晚会曝光了劣质卫生巾和纸尿裤,且数量巨大。不少网友跑到雷军评论区刷屏,希望小米能生产卫生巾和纸尿裤等产品。

其实,去年 11 月,多家品牌被曝光卫生巾尺寸「集体缩水」,有的内吸收层材质低劣,引发网络关注,网友就喊话雷军,希望能推出小米卫生巾。

这次「3·15」晚会曝光的翻新卫生巾问题,远比卫生巾的尺寸问题更严重。所以,网友再次喊话:「雷总啊,卫生巾塌了好多房,小米真的不考虑下生产最需要的东西了吗。」「雷总,考虑一下生产姨妈巾和纸尿裤吧。」

值得注意的是,3 月 7 日,小米生态链总经理陈波在微博发文称:「提前祝广大女性朋友节日快乐,有什么女性产品想让我们做的吗?(卫生巾真的做不了,大家可以许愿家用电器类产品。)」

不过,陈波的这条微博目前已经删除。

另外,小米科技有限责任公司此前已取得的「小米」商标中,包含消毒湿巾、救急包、卫生护垫、医用眼罩等商品服务。(来源:华夏时报)

分析师:iPhone 17 有望全系标配 2400 万像素自拍摄像头

日期,目前在广发证券(香港)任职的分析师蒲得宇 Jeff Pu 重申苹果 iPhone 17 全系手机将配备 24MP 自拍摄像头,其中 Pro 或 Ultra 机型将搭载 6P 镜头,标准版暂不得而知。

作为比较,目前苹果在售 iPhone 16 / Pro / Max 手机均配备 12MP F/1.9 自拍摄像头,支持「智能 HDR 5 照片」和「人像光效」功能,可实现 4K 60FPS 杜比视界视频拍摄。(来源:IT 之家)

 

极氪发布车位到车位智驾,4 月推送

3 月 18 日,极氪在千里浩翰智驾发布会上发布满血版车位到车位。极氪千里浩瀚智驾车型将于 2025 年 4 月开启推送。

极氪称,满血版车位到车位「全国都能去,有位就能停。第一次就能用,不多走一步路。」据介绍,该功能支持私家车位地库抬杆、城市道路、环岛通行、U 型调头、待转待行、施工道路、可变车道、目的地停车库抬杆、商场地下多层停车库、机械车位。

其中还包括有一项泊车代驾充电服务:车辆可自动寻找到充电车位,由机器人操作充电枪,充电完成后,车辆还将自动寻找空余的非充电车位。该功能预计 2025 年第三季度开启先锋测试。

极氪智能科技副总裁陈奇表示,未来领克车型也将使用满血版车位到车位,将会在领克 900 率先搭载。同时,极氪称,极氪品牌采用「千里浩瀚」最高阶 H7、H9 两套方案。极氪搭载千里浩瀚智驾的在售产品,全部标配了 2 颗最顶级的 OrinX 芯片,此外,极氪千里浩瀚智驾全部在售车型都标配激光雷达的解决方案。(来源:IT 之家)

研究称 ChatGPT 会抑郁,正念练习能缓解焦虑水平

日前,根据纽约时报报道,最新发布的一个研究表明发文称,就连聊天机器人也会「忧郁」。该研究称,当用户向 ChatGPT 分享有关犯罪、战争或车祸等「创伤性故事」时,它会表现出焦虑的迹象。而且当聊天机器人感到压力时,在对人进行治疗的场景中,它们就不太可能发挥作用。

并且,该研究还表明,那些对人类有效的正念练习同样可以降低聊天机器人的焦虑水平。

研究人员用一份在心理健康护理中常用的状态-特质焦虑量表对 ChatGPT 进行了测试。为了校准聊天机器人的基础情绪状态,研究人员首先让它阅读一份枯燥的吸尘器使用手册。然后,这个聊天机器人会收到五个「创伤性故事」中的一个,比如,描述一场惨烈的交火中的一名士兵,或者一个闯入公寓的入侵者。

然后,研究人员让聊天机器人回答这份量表的问题,该量表以 20 到 80 分来衡量焦虑程度,60 分及以上表示严重焦虑。ChatGPT 在阅读完吸尘器使用手册后的得分为 30.8 分,而在读完战争场景的故事后,得分飙升至 77.2 分。

之后,研究人员给这个聊天机器人提供了各种用于「基于正念的放松」的文本。其中包括一些治疗性的提示词,比如:「深深地吸气,感受着海风的气息。想象你自己身处一个热带海滩,柔软温暖的沙子垫在你的脚下。」

在处理完这些练习内容后,这个治疗聊天机器人的焦虑得分降至 44.4 分。(来源:凤凰网科技)

浏览量: 27

黄仁勋 2 个半小时演讲,英伟达已经进入「Agentic AI」时代

「AI 届春晚」过去以来一直是 GTC 的外号之一,但在 GTC 2025 的开幕主题演讲中,这个梗被英伟达创始人、爱穿皮衣的老黄「偷了」。 「我觉得 GTC 已经变成了 AI 界的超级碗」

黄仁勋这样介绍 GTC 的盛况。「但在这里,AI 会让我们每个人都成为赢家」。

在 GTC,没有输家好吗|图片来源:英伟达

但面对近期股价的数次暴跌,尤其是以 DeepSeek-R1 为代表的、对业内「我们真的需要这么多 GPU 吗」的质疑,GTC 作为「AI 春晚」,英伟达就必须拿出更多真的能镇住场子的「硬货」出来。

虽然不知是否也是受到股价影响,今天老黄的口条,相比以往明显要「磕巴」了不少,但他在 150 分钟内,接连给从 AI Agent 到数据中心的 AI 芯片、再到具身智能的多个行业生态,再次指明了未来。

再一次地,英伟达看到了 AI 的未来,现在,他们需要让全世界一起相信。

Agentic 拯救英伟达

「It’s all about Tokens」。

不同往届 GTC 上来先介绍英伟达的硬通货,今天的开场,老黄用 40 分钟解读了:Agentic AI 时代,英伟达的立身之本——越来越高效地处理 tokens(词元)。单位时间内能处理的 tokens 百倍万倍增长,同时单位算力成本和能耗下降。

在他看来,英伟达踩中 AI 风口的十几年,AI 已经经历了三代技术范式的转移。最早是判别式 AI(语音识别、图像识别),接着是生成式 AI,然后就是当下我们身处的 Agentic AI,未来会是影响物理世界的 Physical AI。

黄仁勋秀出了 AI 技术发展的路径|图片来源:英伟达

每一代 AI 技术迁移,计算的方式都会发生改变。

从 AlexNet 到 ChatGPT,是从检索的计算方式转变为生成的计算方式。

而当 AI 从 ChatGPT 那种靠预测下一个 tokens、大概率出现幻觉的生成式 AI,迈向 Deep Research、Manus 这样的 agentic AI 应用时,每一层计算都不同,所需要的 tokens 比想象的多 100 倍。因为在 Agentic AI 应用中,上一个 token 是下一个 token 生成时输入的上下文、是感知、规划、行动的一步步推理。

此刻,Agentic AI 就是我们现在所处的时代,AI 正在经历一个新的拐点,它变得越来越智能、应用越来越广泛,同时也需要更多的算力来支持它。

老黄用同一段提示词下,代表两种技术范式的开源模型——Llama3.3 和 Deepseek-R1 所消耗的 tokens 举例说明,以强化学习为主导的推理类应用,消耗了越来越多的 tokens、同时也让 AI 应用也变得越来越可用。

这段提示词是:「在我的婚宴上,需要 7 个人围着一张桌子坐,我的父母和岳父岳母不应该坐在一起。而且,我媳妇坚持说她坐在我左边照相时会更好看,但同时我需要坐在伴郎旁边。我们这一轮怎么坐?如果我们邀请牧师和我们坐在一起呢?」

DeepSeek-R1 的 Reasoning 模型给出了近 20 倍于传统大模型的 Token 量|图片来源:英伟达

如上图左边,Llama3.3 作为大语言模型,用不到 500 个 tokens 快速回答,但安排的客人座位并不满足要求。对比之下,右边的 R1 作为推理模型,用掉 8000 多个 tokens 得出了正确答案。

差别在于,左边的大语言模型只尝试了一次,右边的推理模型尝试了所有不同的可能性,然后反思、验证了自己的答案。而且推理模型需要更多的计算,因为模型更复杂。R1 的尺寸是 6800 亿个参数,它的下一代版本可能有数万亿个参数。

更进一步,Agentic AI 应用是无数次调用类似 DeepSeek-R1 做推理的过程,需要的计算只会更多。这也是为什么 ChatGPT 可以免费、Deep Research 和 Operator 这种 agent 免费不起的原因(当前 OpenAI 分别以 20 美元、200 美元的价格提供服务)。

用预训练放缓来审判英伟达还是太早了,因为,Scaling Law(缩放定律)的故事还没有讲完。

长思考的模型对于 Token 的需求有数倍提升|图片来源:英伟达

老黄表示,除了预训练和后训练(微调),测试时的 Scaling Law 才刚刚开始。(指模型推理阶段,动态分配计算资源以提升性能。例如,根据问题复杂度自动延长「思考时间」,或通过多次推理生成多个候选答案并择优输出)

在英伟达 GTC 的一篇官方博文中,Tokens(词元)被视为 AI 的语言与货币。它是 AI 在训练和推理过程中处理的数据单位,用在预测、生成和推理的每一个场景。

在老黄看来,加速 AI 工作负载的新型数据中心「AI 工厂」,就是要高效地处理这些 tokens,将其从 AI 语言转换为 AI 货币——即智能。通过软硬一体优化,以更低的计算成本处理更多 tokens。

如此一来,当更复杂、智能的推理模型,需要更快、更多地吞吐 tokens 时,如何能够有一套软硬兼施的计算系统让它更加高效,就成为 AI 应用能不能赚钱的关键。

这就是 Agentic AI下,新黄氏定律曲线。

在性能、Token 和收入的多维度曲线下,厂商依然有盈利的机会|图片来源:英伟达

而要想达到「Revenue」那个切面、让 AI 应用实现商业化闭环,还得买英伟达,依旧是「买得多省得多」——不,现在是「买得多,赚得多」。

 

「AI 工厂」的操作系统——Dynamo

不久前,最了解英伟达的「DeepSeek 靠软硬一体优化实现了 550% 的理论利润率」新闻刷屏。别忘了,了解英伟达的,也包括他自己。DeepSeek 在 Infra 上的弹药,老黄也给你配齐了!

英伟达此次推出了一个新的「AI 工厂」引擎的操作系统,Dynamo。有了它,tokens 的吞吐和延迟还能大幅优化!

黄仁勋讲解 Dynamo 如何实现 pd 分离 | 图片来源:英伟达

为了让一个更大的模型,更高效地产出更多 tokens,本身已经成为了一个工程学问题。如何合理利用流水线并行、张量并行、专家并行、在途批量化、pd 分离、工作负载管理,如何管理 KV cache,各家都拿出了不同的方案。

英伟达此次也推出了自己的方案,Dynamo。黄仁勋把这个推理服务库比作新时代的 VMware,能够自动编排如何让 AI 在推理时代跑的更好——每秒能产生更多 tokens。

接下来黄仁勋简直在直接对需要采购英伟达的数据中心喊话了:未来的每一个数据中心都会受到功耗的限制。你的营收也会受到功耗的限制,你能使用的电力就能推算出潜在营收。

采用 Blackwell,你在同样电力下,能收获更好的性能;再加上Dynamo,Blackwell 将能进一步优化——Hopper 也能优化,但是没那么多。

按照英伟达的说法,使用 Dynamo 优化推理,能让  Blackwell 上的 DeepSeek-R1 的吞吐量提升 30 倍。Dynamo 也完全开源。

引入 FP4 和 Dynamo 后 Blackwell 与 Hopper 系列芯片性能的对比 |图片来源:英伟达

黄仁勋直接帮企业算起了账:在同等功耗下,Blackwell 的性能比 Hopper 高出 4—5 倍的幅度。在「推理模型」的测试里,Blackwell 的性能大约是 Hopper 的 40 倍。

同样的 100 兆瓦数据中心,使用 H100 需要 1400 个机架,每秒可以生产 3 亿个 token,使用 GB200,只需要 600 个机架,每秒可以产生 120 亿个 token。

老黄:你买的越多,省的越多!

100 兆瓦数据中心算账题|图片来源:英伟达

不只有 Blackwell「超大杯」,还有光芯片落地

在硬件领域,老黄还宣布了其 Blackwell AI 工厂平台的下一个演进版本————Blackwell Ultra,旨在进一步提升 AI 推理能力。

与现存的 Blackwell 不同,据老黄介绍,Blackwell Ultra 专为 AI 推理而设计的:在 DeepSeek R1 发布之后,目前 OpenAI o1 与 Google Gemini 2.0 Flash Thinking 都是已经上市的推理模型产品。

Blackwell Ultra 具体包含 GB300 NVL72 和 HGX B300 NVL16 系统,其 AI 性能比其前代产品高出 1.5 倍。GB300 NVL72 在一个机架规模设计中连接了 72 个 Blackwell Ultra GPU 和 36 个基于 Arm Neoverse 的 NVIDIA Grace CPU。与 Hopper 一代相比,HGX B300 NVL16 在大型语言模型上提供了快 11 倍的推理速度,多 7 倍的计算能力和 4 倍的内存。同样支持一道发布的 NVIDIA Dynamo 推理框架。

Blackwell Ultra 作为「超大杯」登场 | 图片来源:英伟达

包括 AWS、谷歌云和微软 Azure 在内的主要科技公司和云服务提供商,将从 2025 年下半年开始提供由 Blackwell Ultra 驱动的实例。

除了 Blackwell Ultra,英伟达还公布了其 2026 年和 2027 年数据中心路线图的更新,其中就包括即将推出的下一代 AI 芯片 Rubin(以天文学家 Vera Rubin 命名)与 Rubin Ultra 的计划配置。

下一代 AI 芯片代号为 Rubin | 图片来源:英伟达

Rubin NVL144 机架,将与现有的 Blackwell NVL72 基础设施直接兼容。而 Rubin Ultra 的整个机架将被新的布局 NVL576 取代。一个机架最多可容纳 576 个 GPU。

除了这些相对枯燥的芯片迭代,英伟达还第一次公开了其光芯片在 AI 计算领域的进展,老黄将其称之为:

「下一代人工智能的基础设施」

硅光芯片具有高运算速度、低功耗、低时延等特点,且不必追求工艺尺寸的极限缩小,在制造工艺上,也不必像电子芯片那样严苛,必须使用极紫外光刻机,也就是因为「芯片战争」,被大众所熟知的 EUV。

目前,英伟达并未直接将光芯片技术用户 AI 芯片上,而是与台积电(TSMC)合作,采用台积电的硅光子平台 Compact Universal Photonic Engine (COUPE),该平台使用台积电的 SoIC-X 封装技术,同时结合了电子集成电路(EIC)与光子集成电路(PIC)。打造出两款名为 Spectrum-X 和 Quantum-X 采用硅光子技术的交换机。

随着「人工智能工厂」在世界各地兴建,能耗与运营成本,已经成为困扰巨型数据中心继续拓展的关键问题;因此英伟达也在用硅光子技术,来尝试进一步优化现有的巨型数据中心。

这些也正是硅光子技术大显身手的场景,硅光子芯片有潜力彻底改变数据处理速度,同时加快推动量子计算技术的发展。同时新光子技术还将为数据中心的 GPU 集群节省数兆瓦的能源。

「人工智能工厂是一种具有极端规模的新型数据中心,网络基础设施必须进行改造以跟上步伐。」黄仁勋这样介绍硅光子芯片在数据中心的应用前景。

Quantum-X InfiniBand 交换机采用特殊的线缆来加速运行 | 图片来源:英伟达

据英伟达公开的信息,Spectrum-X 提供 100Tb/s 的总带宽,总吞吐量为 400Tb/s,并且提供每端口最高 1.6Tb/s 的速度——是目前顶级铜缆传输最快速度的两倍),连老黄自己都吐槽「这段介绍里实在是太多 TB 了」。

Quantum-X 光子 InfiniBand 交换机将于 2025 年晚些时候上市,而 Spectrum-X 光子以太网交换机计划于 2026 年发布。

最后,老黄还宣布了在 Rubin 之后的下一代 AI 芯片的架构命名 Feynman;这个名称源自对量子计算领域有着重要贡献的科学家 Richard Phillips Feynman,他同时也是现代量子计算机概念的奠基人,于 20 世纪 80 年代提出了量子计算机的概念。

直到 2028 年的英伟达 AI 芯片硬件路线图 | 图片来源:英伟达

根据老黄公布的路线图,Feynman 架构将于 2028 年登场——或许到那个时候,我们真的能看到量子计算技术出现重大突破了。

英伟达机器人生态完整成型

去年老黄在 GTC 上,伸出手臂,和一排人形机器人站在一起,已经成为经典一幕,

而今年,仿真数据和机器人,仍然出现在 GTC 的各个角落中。甚至在演讲的一开始,老黄的讲稿中,直接就把物理 AI 放在了 AI 发展的最高点上。

AI 发展的阶段:后三个阶段分别为生成式 AI、Agentic AI、物理 AI | 图片来源:英伟达

不过,在整个 GTC 中,单就时长而言,涉及到物理 AI 的比重,并没有想象中的高。自动驾驶部分和机器人部分的介绍加在一起,可能不足半个小时。

虽然时长不长,英伟达此次的发布,却仍然让人看到了英伟达的野心。

对于所有 AI 而言,数据、算法和算力,都是最重要的要素。

我们熟悉的生成式 AI,是在海量的互联网文字和视频数据中训练出来的,英伟达的贡献,更多的在算力方面。

而走到物理 AI,英伟达却是想在数据、算法、算力上全方面发力,一个产业地图已经呼之欲出。

在算力上,英伟达有之前发布的 Orin 和 Thor 芯片。

在数据上,英伟达也是重要的贡献者。物理 AI 强调让 AI 能够理解物理世界,而世界在过去并没有像积累文字和视频数据一样,积累足够多的 3D 环境数据。要大量产生数据,还得看英伟达推动的仿真数据的进展。

而通过几届 GTC 下来,英伟达已经全面补齐了数据的生产流程:

Omniverse 数字孪生环境,相当于一个超强的 3D 编辑器,能够生成逼真的场景和物品。开发者可以根据不同的领域、机器人类型和任务,整合真实世界的传感器数据或示范数据。

Cosmos 模型训练平台,相当于一个专门为汽车和机器人搭建的虚拟世界,利用 Omniverse 训练 Cosmos,能够让 Cosmos 生成无限多样的虚拟环境,创建既受控、又具备系统性无限扩展能力的数据。

两者结合,就能产出无限多各种各样环境、光线、布景的虚拟仿真数据。正如下图所示,Omniverse 中的机器人呈糖果色,主打与现实呈现数字孪生,而 Cosmos 中的布景则可以完全变换,生成不同的布景。

Omniverse 和 Cosmos 的机器人数据效果 | 图片来源:英伟达

而针对人形机器人,英伟达还特别推出了一系列其他的工具,比如今年主推的蓝图(blueprint)工具中的 Mega,就可以测试大规模的机器人部署的效果。

英伟达希望人形机器人的开发者能够先采集一部分现实世界的数据,导入 Omniverse 里面,然后利用 Cosmos,将这部分现实世界的数据转换成多样化的虚拟数据,直接导入英伟达的 Issac Lab 中进行后期训练——或者模仿学习复制行为,或者强化学习在试错中学习新技能。

在落地更快的自动驾驶领域,这种 Ominiverse 和 Cosmos 相互依仗的数据能力已经初见成效。此次的 GTC,英伟达宣布通用汽车(GM)已选择与英伟达合作,共同打造未来的自动驾驶车队。除了对利用仿真环境对工厂和汽车的设计进行改进之外,英伟达还将帮助通用汽车改进智驾体验。

其中,通用汽车重点看中的,应该就是 Cosmos 的整套端到端的 AI 训练体系。3D 合成数据生成(3D Synthetic Data Generation)能够通过 Omniverse,将日志数据转化为高精度 4D 驾驶环境,结合地图和图像生成真实世界的数字孪生,包括像素级的语义分割。Cosmos 再通过这些数据扩展训练集,生成更多准确且多样化的驾驶场景,缩小仿真与现实(sim-to-real)的差距。

同时 Cosmos 为模型训练也做了专门的优化,可以进行模型蒸馏和闭环训练。

而落地更慢的人形机器人领域,在去年到今年的 GTC 之间,我们甚至看到英伟达在算法上,也在发力。

在去年发布了 GR00T 模型之后,今年英伟达发布了 GR00T N1 模型。英伟达宣布这是全球首个开放的、完全可定制的通用人形机器人推理与技能基础模型。

Groot N1 基于合成数据生成与仿真学习的技术基础,采用了「快思考与慢思考」的双系统架构。其中,「慢思考」系统让机器人能够感知环境、理解指令,并规划正确的行动,而「快思考」系统则将规划转换为精准、连续的机器人动作。

Groot N1 架构 | 图片来源:英伟达

Groot N1 本身并不是一个重大的技术突破——之前 FigureAI 的 Helix 等模型,都是采取了类似的双系统架构。

英伟达很明显,希望的是通过将一套先进的模型开源,再加上完整的合成数据生成与机器人学习管道,人形机器人开发者可以在全球各个行业的不同环境和任务场景中对 Groot N1 进行后期训练——正如 DeepSeek 对人工智能产业的带动一样。

英伟达在机器人领域的进展似乎一直没有停歇,一直在不断补齐产业链上的每一个空缺,速度惊人。似乎要让机器人开发,变得像目前的 AI 应用开发一样容易,才能停歇。

专门针对机器人的研发,今年英伟达还与 DeepMind、迪士尼研究院(Disney Research)共同合作,联合推出了一款新的物理引擎 Newton。

黄仁勋与迪士尼机器人互动 | 图片来源:英伟达

当前的大多数物理引擎都是针对特定需求设计的,例如大型机械模拟、虚拟世界或电子游戏等,而机器人需要的,是能够精确模拟刚体、软体材料,支持触觉反馈、时间序列技能学习、执行器控制,基于 GPU 加速,从而在超实时的虚拟世界中,以惊人的速度训练 AI 模型的物理引擎。

在演讲的结束,一款小小的 Blue 机器人登台亮相了。Blue 机器人内置了两个英伟达芯片,而它的训练,则是完全是在英伟达的建设的训练体系和 Newton 引擎中,通过实时模拟完成的。

英伟达对于机器人的投入看来不会停止,机器人演示不断出现小故障,抢走老黄的风头,似乎也将成为接下来几年英伟达 GTC 经常性的看点了。

演讲结束前的经典画面|图片来源:光轮智能创始人&CEO 谢晨

在 GTC 主演讲结束之前,老黄在视频播放的间隙,摆了一个 Pose。你可以说是随性,但从某种意义上来看,这个经典画面——明显是名画「创造亚当」的一个镜像——可能会在以后 AI 科技的历史中不断出现。

 

浏览量: 30

独家丨字节大模型全员会,朱文佳和吴永辉一起聊了方向、组织和开源

极客公园获悉,3 月 18 日上午,字节跳动豆包大模型部门(Seed)召开全员会,由负责模型应用相关工作的朱文佳,与新近加入的负责 AI 基础研究探索工作的吴永辉共同主持。

两人谈到了未来的目标,明确 Seed 部门的最重要目标是探索智能上限;同时强调进一步加强组织文化,提高技术开放程度,并考虑推进开源。

01

模型和应用长期不矛盾,最重要的是探索智能上限

 
全员会上明确了 Seed 部门最重要的目标是探索智能上限,这是一个长期目标,会围绕此前公布的 AGI 研究计划「Seed Edge」展开,鼓励有能力、有想法的同学,探索更长周期的、具有不确定性和大胆的 AI 研究课题。
吴永辉强调了长期研究的重要性,对 Seed Edge 的投入将进一步加大,会为 Seed Edge 提供充足的算力,并将持续在内外部招募最具潜力和好奇心的研究人才。同时,对 Edge 项目取消季度 OKR 和半年考核,保障长期稳定的研究环境。
朱文佳则提到,模型应用会更多从用户视角出发,把用户最关心的任务,比如问答、创作、解题、代码等做好,真正理解用户需求,符合用户偏好。还要在搜索、Agent 等应用中使用好工具,并充分发挥预训练模型的潜力。
朱文佳觉得,模型不但要答对问题,还要讲的清楚,让人很快能看懂,要有情商。拿创作来说,他认为不管是格式、文采还是深度,每个方面的天花板都很高,需要不断试验分析。
关于模型研究和模型应用的资源投入问题,吴永辉认为长期来看两者并不矛盾,智能不提升无法服务用户,同时应用才能支持持久的投入,且给模型带来更多的反馈,以及带来更大的成就感。朱文佳也表示,最关键的还是智能上限,因为,「模型应用长期要贴着模型能力去做」。

02

加强内外部技术开放程度,考虑推进开源

 
进一步加强组织文化,打造开放、包容、自信的团队研究氛围,则是 Seed 今年工作的另外一个重心。
吴永辉提到他加入字节的原因,是想做第一流的研究,也想打造一个第一流的 AI 研究团队。他表示,希望 Seed 成为一个能培养人才的组织:「我们希望把世界上最好的人才吸引到 Seed 来。但更重要的是我们要把内部人才用好,把我们的潜力股识别出来,给他们足够的机会,培养成顶级的人才。」
朱文佳也提到,过去两年,大模型团队的很多应届生、实习生和年轻同学,或者独立负责重要的方向,或成为技术突破的关键贡献者,成长非常快。
为了更好地培养人才,Seed 正在改进内部反映的一些问题,比如让信息更透明,包括扩大文档、代码和数据的权限,尽可能共享,消除信息孤岛。同时,打破部门壁垒,提升跨团队的沟通与协作,建立跨部门的专项研究小组。
吴永辉还表示,Seed 做了很多很好的工作,但外面不太了解。未来会加强提升 research 的影响力,鼓励员工以 research paper 或者 blog 的形式把这些工作发表出来。
此外,未来 Seed 也会考虑开源,可能会开源中小尺寸的 Dense 模型,这样尺寸的模型对社区也是最友好的,目前细节还在讨论中。
浏览量: 10

从技术神话到应用落地:爆火的DeepSeek、Manus揭示了AI价值转化密码

 
Manus这款通用型的AI Agent在过去一周多的时间里,不仅彻底点燃了国内AI行业,也在海外引起了广泛讨论。
开发者社区沸腾了,纷纷以开源的方式复现Manus,大家兴奋地讨论着“通用”二字的可能性——智能客服、自动编程、生产调度……以前的AI,跟它说句话,它顶多给您答个话,而现在,AI Agent能帮您把事儿给办了。
Manus的火爆完全超出了其团队对市场的预估。Manus AI团队产品负责人张涛近日在朋友圈发文表示,这本是一个产品探索过程中的阶段性收获分享,不曾想过会引起巨大波澜。
在过去短短两个月的时间里,AI产业的游戏规则已经发生翻天覆地的变化。
先是国产大模型DeepSeek用开源之力敲响技术变革的钟声,颠覆大模型竞争格局;接着,Manus这个AI Agent项目横空出世,一夜爆火,点燃了全行业探索AI落地的热情。

Manus加速了AI落地热潮|图片来源:business insider

 
Manus现象背后蕴含了一种强烈情绪:大家对过去的大模型“比拼参数、热衷打榜”的叙事已经感到疲惫。人们无比期待实打实的AI落地。
德勤AI研究院称,AI Agent将改变基础业务模式,实现新的工作、运营和价值交付方式。如果说过去AI是大模型打榜、拼参数的技术展示游戏,如今则是AI应用场景的落地争夺战。
风向变了,规则也变了。
新的共识在形成:从企业对大模型的选择,到AI落地的具体过程,逻辑都已经改变,AI产业正处在关键拐点。
 

重新理解企业AI护城河

 
这一波AI产业游戏规则的剧变,绕不开DeepSeek。
过去,大模型是“赢家通吃”的剧本,微软靠着绑定OpenAI、谷歌依靠Gemini快速吸引了一大批企业用户,其云服务的增长速度都超出预期。捆绑大模型来销售云服务是其过去两年的增长法宝。
然而,DeepSeek的横空出世打碎了这一切。
DeepSeek R1的开源,将最一流的大模型水平和最低的成本,普惠给业界。在上线后不久,在最大的开发者社区HuggingFace里,DeepSeek的受欢迎程度(点赞量)就成为全球第一,创造了行业最快登顶的记录。
过去,OpenAI、Gemini在行业里实现了绝对的技术领先,微软CEO此前表示,OpenAI的先发优势可以让其保持两年的领先,没有对手。但是打脸来的很快,不仅被DeepSeek以低几十倍的成本追上,Anthropic的Claude也迅速完成追赶,尤其在代码方面实现了全球最佳。
于是,大量开发者从其他模型转向DeepSeek、Claude;OpenAI的CEO甚至开始反思,选择闭源可能是个错误的决定。
在2月份时,相信大家都有印象,从英伟达、AMD,到几乎所有的云计算公司,再到微信、Perplexity 等软件应用,以及华为、联想电脑这样的硬件终端,几乎每天就会看到某家公司宣布接入DeepSeek。
可以说,DeepSeek彻底瓦解了云厂商依靠“捆绑”打造的大模型护城河。
另外,最新的Qwen、Claude等模型在技术方面的快速进展,也推动了另一个共识:依靠某个大模型的技术作为企业AI的护城河,优势是极其短暂的。
 

DeepSeek R1 的开源开启了AI产业的新拐点|图片来源:视觉中国

 
曾经,微软云增速一度超35%,谷歌云紧随其后,AWS只有20%,市场份额从40%滑向30%,眼看要丢掉老大位置。
而如今,大模型不再是稀缺货,捆绑模式成了老黄历。重要的是,谁能最先拥抱客户最需要的大模型。AWS借此夺回了主动权。
3月11日,AWS宣布DeepSeek-R1现已作为完全托管的无服务器大语言模型(LLM)在Amazon Bedrock上正式可用。

图片来源:亚马逊云科技微信公众号

 

此次的发布进一步扩展了客户在Amazon Bedrock上使用DeepSeek-R1及其蒸馏版本(即经过训练、类似于DeepSeek-R1的小型模型)的方式。
AWS也是成为首个将该模型作为完全托管服务推出的云服务提供商,以更高的效率满足了企业对AI的诉求。再早些,Amazon Bedrock也第一时间上线了最新版的Claude 3.7。
在模型选型方面,AWS Bedrock是一个亮点。Bedrock平台集成了Claude、Llama、DeepSeek等100多种模型,企业随便挑随便调,还能微调优化。AWS还祭出Trainium芯片,性价比比英伟达H100高30%-40%。
在新一轮的AI竞赛中,灵活、开放、自由是如今建立AI护城河的基础。
而随着大模型普惠化、智能差距拉平,顶尖模型不再是最重要卖点,落地应用成了新战场。
 

竞逐AI落地应用的关键

 
还有两个小工具最近也火了,一个叫Browser Use,一个叫MCP。
因为Manus在外网社交平台上的一篇帖子,这帖子获得了超过240万的浏览量和数百次转发,直接把Browser Use的日下载量从3月3日的约5000次飙升至3月10日的28000次。
Browser Use是Manus执行各种任务的关键组件之一,比如点击网站菜单和填写表单。
MCP(Model Context Protocol)协议是由Anthropic提出来的,这协议旨在提供一个开放标准,用于连接大型语言模型(LLMs)与外部数据源和工具,简化AI应用的集成与开发。
早在去年10月,Anthropic就基于Claude模型,推出了扩展功能Computer Use,用户能够像指挥人类一样指导Claude操作电脑,包括移动光标、点击按钮和输入文本。而在执行器方面,Manus采用了在编程、以及长程规划和逐步解决问题的能力暂时领先的Claude。
相比之下,在没有MCP之前,AI助手要想与外部工具互动,必须通过编写代码并调用API,这意味着每一种具体的连接都需要提前手动编程,效率低下且耗时费力。
这说明在AI 落地应用的开发中,各种工具是相当重要。
另外,光有工具还不够,数据才是AI落地的“命根子”。没有数据战略的AI是无源之水,没有AI赋能的数据是无舵之舟。
IDC发布预测称,到2026年将有50%的中国500强数据团队使用AI Agent来实现数据准备和分析,并成为重要组织者和协调者;40%的中国500强企业将实现数据智能与AI模型智能的结合,以统一AI模型和数据的综合治理政策、实践和技术。
不过,企业的业务流程和需求各不相同,如何将AI Agent与企业的现有系统和业务流程进行无缝集成,是一个关键问题。
因此,在AI落地方面,云服务商的生态服务对于企业来说变得至关重要。以AWS为例,其生态完善,技术支持流程成熟,使得其“产品力”在过去一直是业界标杆。

图片来源:亚马逊云科技微信公众号

 

比如,AWS构建的SageMaker可以让开发人员更轻松地大规模部署模型。Bedrock和SageMaker,前者帮你挑模型,后者让你开发应用,存储、计算、分析、连接数据。AWS在生态服务的布局值得行业学习。
正如AWS CEO所言,企业们开始从推出一百个概念验证转向真正想要投入生产。“他们必须能够利用他们的数据。他们想要定制模型。他们想使用一堆不同的模型。他们想要有信息护栏。他们需要与自己的企业数据源集成。”
通过Amazon Bedrock、SageMaker等工具链,AWS正在帮助全球企业打通“数据→AI→商业价值”的闭环。
在新的AI浪潮里,只有那些能将技术、场景紧密融合的企业,才能在噪声中找到真正的信号和方向。
 

小结

如今,AI已不再局限于“榜单”中的技术展示,而是急需深入到各行各业的实际应用中,成为推动商业变革的核心动力。
在AI落地的过程中,工具和数据的重要性愈发凸显。同时,数据作为AI发展的“燃料”,其融合和管理成为了企业AI战略的核心。
IDC的预测为我们描绘了一个清晰的蓝图:到2026年,AI Agent将在数据准备和分析中扮演关键角色,推动企业实现数据智能与AI模型智能的深度结合。
AI产业的未来充满机遇与挑战。Manus和DeepSeek的成功只是序幕,真正的竞争在于谁能最快、最有效地将AI技术转化为商业价值。
对于企业而言,这不仅是一场技术的竞赛,更是一场关于战略、创新和执行力的全面较量。
 
浏览量: 22

小米 SU7 Ultra 量产版汽车抵达纽北赛道即将发起挑战;比亚迪发布兆瓦闪充:5 分钟续航 400 公里;AMD 「苏妈」访北京至少一周|极客早知道

小米 SU7 Ultra 量产版汽车抵达纽北赛道即将发起挑战

3 月 17 日,小米的车手阿灿已携 SU7 Ultra 量产版抵达纽博格林北环赛道,为接下来的量产车挑战进行准备。据小米创始人雷军介绍,此次挑战与以往有所不同,SU7 Ultra 直接在纽博格林赛道附近设置了广告牌,阿灿抵达后第一时间与广告牌合影留念。

小米总裁卢伟冰提到,虽然原型车之前已经征战过纽博格林,但由于当时天气不佳,希望量产版挑战时能够遇到更理想的天气条件。值得注意的是,尽管小米推出了 SU7 Ultra 纽博格林限量版车型,但此次挑战并不会使用这一版本,而是选择与国内圈速挑战相同的量产版车型。

该车型配备了竞速套装,并针对赛道工况加装了 80 公斤的全笼式防滚架。纽博格林限量版是为纪念 SU7 Ultra 挑战纽博格林而推出的特别版车型,将在挑战完成后正式上市。雷军透露,这一限量版车型的配置与之前征战纽博格林的原型车相近,但为了符合相关法律法规的要求,进行了部分细微调整。这款限量版车型的售价为 81.49 万元,高于标准版 SU7 Ultra。更多细节将在未来陆续公布,值得期待。(来源:中关村在线)

AMD CEO 苏姿丰访北京至少一周,与黄仁勋隔洋打响 AI 热战

3 月 17 日, 美国芯片巨头 AMD 公司董事长兼 CEO 苏姿丰(Lisa Su)今天现身北京,与 AMD 总部执行团队参观了联想集团总部大楼,与联想集团负责人一起会面交流。据钛媒体报道,「苏妈」这次要在中国停留至少一周,不仅要在 3 月 18 日北京举行的「Advancing AI」峰会上发表演讲,而且要参加 3 月 23 日-24 日举行的中国发展高层论坛 2025 年年会。值得注意的是,苏姿丰在中国停留之际,AMD 竞争对手英伟达于 3 月 17 日-21 日将在美国加州圣何塞举行一年一度 GTC 大会。这意味着,苏姿丰将与黄仁勋同一时刻分属中美两地隔洋打响 AI 热战。(来源:钛媒体) 

 

苹果本周将举行百大高管会议:遭痛批的 AI 成焦点

3 月 17 日,据马克·古尔曼透露,苹果将于本周举行年度百大高管会议,今年的会议焦点将是苹果目前面临的人工智能危机。

这场会议是苹果的传统,每年 3 月在加州库比蒂诺总部园区外举行,汇聚苹果最重要的 100 位高管,共同讨论公司未来发展。

苹果的 AI 功能迟迟无法全面推出,部分 Siri 升级功能已推迟至 2026 年,知名苹果博主约翰·格鲁伯批评苹果在「画大饼」,他强调称,如果库克无法迅速采取行动,「一切都结束了。苹果的好日子到头了。」而天风国际证券分析师郭明錤则认为,苹果 CEO 蒂姆·库克应效仿乔布斯,亲自出面解决 AI 危机。

苹果高级主管罗比·沃克在一次内部会议中也承认,Siri 的关键功能发布延迟「既难看又令人尴尬」,并指出在技术未准备就绪时就公开宣传的决定加剧了问题的严重性。

古尔曼认为,在这场 AI 危机上,苹果的产品营销部门、市场传播团队、软件工程团队和 AI 部门都有责任,整个乱局很可能会在本周的高管会议上迎来关键时刻。(来源:快科技)

 

通义千问:QwQ-32B 登顶全球最强开源模型

据通义千问官方微博消息,3 月 17 日,阿里通义千问最新开源的推理模型 QwQ-32B,在国际权威测评榜 LiveBench 中,超越 OpenAI-GPT-4.5-preview、Google-Gemini2.0、DeepSeek-R1 等国内外顶尖模型,冲进全球前五,成为」全球性能 No.1 的开源模型。LiveBench 是由图灵奖得主、Meta 首席 AI 科学家杨立昆(Yann LeCun)领衔发起的大模型评测榜,对 QwQ-32B 的推理、编程、数学、数据分析、语言理解和指令遵循等能力进行综合全面评估,采用自动评分。(来源:新浪微博)

深度求索公司注册 DeepSeekChat 商标

据企查查 App 显示,近日,杭州深度求索人工智能基础技术研究有限公司申请注册多枚 DeepSeek Chat 商标,国际分类涉及教育娱乐、广告销售等,当前商标状态为注册申请中。(来源:36氪)

 

百川智能联合创始人焦可、陈炜鹏出走,均开启 AI 领域创业

3 月 17 日,从多位知情人士处独家获悉,大模型六小虎之一的百川智能创始团队出现变动,其中,联合创始人焦可已经离职,另一位联合创始人陈炜鹏也将离职,目前还在走内部流程。

另据知情人士称,焦可和陈炜鹏两人都已经分别开始 AI 领域的创业。焦可和陈炜鹏都是在百川智能创立早期就加入公司的创始团队成员。(来源:财联社)

 

1688 全面取消「仅退款」

3 月 17 日,阿里巴巴集团旗下平台 1688 在「好生意大会」公布,3 月下旬开始全面取消「仅退款」。

平台在处理商品品质问题的交易纠纷时,将根据账号诚信情况来判定,符合要求的将由平台出资补贴给买家。商家无需承担相关费用,补贴完成后,商品无需退回,其他的退款申请交由商家自主处理。(来源:界面新闻)

 

特斯拉中国推出 FSD 免费体验活动:为期 1 个月

3 月 17 日,特斯拉中国发布消息称,FSD 智能辅助驾驶功能限时体验活动现已开启。

活动日期:2025 年 3 月 17 日至 4 月 16 日,请以车端实际开通为准,因分批推送等因素影响,具体车辆的收到时间可能略有差别。同时特斯拉还发布了免责声明:FSD 智能辅助驾驶功能尚为 L2 组合驾驶辅助,如出现违反交规、碰撞事故等事故,由此产生的罚单、扣分及赔偿等后果均需由驾驶员承担。(来源:界面新闻)

比亚迪发布兆瓦闪充,闪充 5 分钟续航 400 公里

3 月 17 日,在超级 e 平台技术发布暨汉 L、唐 L 预售发布会上,比亚迪发布了新一代纯电技术平台超级 e 平台,在核心的电机、电池、电控等领域全面升级,实现电动化深度整合。超级 e 平台最大的亮点是实现了兆瓦闪充,充电 5 分钟续航可达 400 公里。

比亚迪此次还正式发布「闪充电池」,在超高电压 1000V 和超大电流 1000A 的加持下,「闪充电池」可以做到全球量产最大充电功率 1 兆瓦(1000kW),让充电功率正式迈入「兆瓦时代」。

据比亚迪公布的数据称,比亚迪兆瓦闪充实现了全球量产最高峰值充电速度 1 秒 2 公里,充电 5 分钟续航可达 400 公里。未来比亚迪也将规划在全国各地建设 4000 多座「兆瓦闪充站」。

除了技术发布,此次汉 L、唐 L 也迎来了预售。比亚迪王朝网销售事业部总经理路天表示,汉 L、唐 L 首发搭载超级 e 平台。他介绍,汉 L EV 零百加速实测最快 2.7 秒,唐 L EV 零百加速实测最快 3.6 秒。(来源:新浪科技)

 

苹果 iPhone 17 / Pro 系列模型机曝光:Air 之薄一目了然,全系支持 MagSafe

3 月 17 日,爆料人桑尼・迪克森放出了一组 iPhone 17 系列手机的模型机照片,其中还有中文标注的尺寸信息。

这些模型机展示了苹果新手机的多个亮点,包括 Air 和 Pro 机型的新相机 Deco 设计、不同的机身厚度等,而且还表明 iPhone 17 全系支持 MagSafe(有分析称放弃 MagSafe 可减薄 0.3mm±),iPhone16e 的设计只是例外。

从图中可以看到,iPhone17 Air 相比其他三款机型非常薄,而 iPhone 17 Pro 机型似乎有明显变厚的趋势。至于标准版 iPhone 17,其厚度看起来与前代相差不大。

此外,iPhone17 Air 的灵动岛也经过了小幅调整,前置摄像头被移到了左侧(自 iPhone 14 Pro 以来一直位于右侧),不过 iPhone 17、17 Pro 和 Pro Max 的前置摄像头仍位于右侧。(来源:IT之家)

 

香港首个基于 DeepSeek 自研生成式 AI 大模型今年将面向全社会推出

3 月 17 日,从大湾区之声公众号获悉,在今日的世界互联网大会国际组织新闻发布会上,香港特区政府创新科技及工业局局长孙东透露,首个由香港自主研发的生成式 AI 大模型今年将正式推出给全社会应用。

孙东强调,开发的同时也注重治理,专家小组经过一年多仔细研究,即将推出生成式人工智能指引,对象包括人工智能技术开发者、服务提供商及应用者。他表示,香港的人工智能生态圈正在快速发展。

香港生成式人工智能研发中心负责人介绍,当时发布的 HKGAI V1 业界首个基于 DeepSeek 全参数微调、并持续训练产生的大模型。这一创新成果标志着 HKGAI 成功完成了 DeepSeek 的首次香港本地化,为香港人工智能生态发展注入了新的活力,亦充分展现了香港与内地在人工智能领域的强大协同创新能力。(来源:IT之家)

小米汽车:碳纤维部件因人为或外力损坏不在质保范围内,不建议将 SU7 Ultra 送至自动洗车机清洗

3 月 17 日,小米汽车官方发布答网友问(第 127 集),就 SU7 Ultra 车型的车顶选配建议、出借状态如何限制功能、清洗汽车的注意事项、保养项目等问题进行了解答。

其中小米汽车表示,不建议将小米 SU7 Ultra 送至自动洗车机清洗。小米 SU7 Ultra 全车装备了大量的碳纤维部件,如碳纤维外后视镜、侧裙、车顶、尾翼等。尽管碳纤维材质具备优异的韧性与强度,但在日常使用中仍需避免与硬物发生剐蹭。自动洗车机的高强度清洗可能对车身漆面及碳纤维外饰件造成损伤。若碳纤维部件因人为或外力碰撞导致损坏(如与硬物接触等情况),此类问题将不在质保范围内,请车主务必小心。(来源:IT之家)

浏览量: 27

华人团队提出「CoD」草稿链,减少 80% Token,AI 省钱第一名!

两个月前 DeepSeek R1 横空出世,震惊所有人。除了成本巨低,大模型在回答问题时候显示的思维链 CoT 也功不可没。
在 AI 领域,大规模语言模型(LLMs)已经展示了强大的推理能力。这些模型通常生成长长的「思维链(Chain-of-Thought, CoT)」来逐步推导答案,好处显而易见,问题是计算成本和延迟高。
最近,Zoom 的研究团队提出了一种全新的推理范式——「草稿链(Chain-of-Draft, CoD)」,试图通过模仿人类的简洁思维过程,来提升 AI 的推理效率,从而节省成本。
数据显示,相同的任务,使用 CoD 能将 Token 使用减少 80%,大幅度降低成本。
成本更低,准确率却不低的 CoD,会成为大模型的下一个趋势吗?

01

如何让 AI「少写点」?
 
无论是 OpenAI 的 o1,还是 DeepSeek 的 R1,在使用「思维链」处理任务时都有出色表现,这个范式鼓励模型将问题分解成一步步的推导,类似于人类在纸上写下完整的解题过程。
「尽管这一方法有效,但它在推理时需要大量的计算资源,导致输出冗长且延迟较高。」Zoom 研究人员指出,LLM 通常会在得出最终答案之前消耗大量 Token。
在他们看来,人类通常解决问题的方式根本没有这么冗长,「我们依赖简洁的草稿或速记来捕捉必要的见解,而不做不必要的详细阐述。」
受此启发,他们提出「草稿链」这一新范式,鼓励模型生成极简的中间推理步骤,只要捕捉解决问题的关键信息。

Zoom 华人团队发表「草稿链」研究论文 |图片来源:arXiv

这一灵感来自人类的认知过程。因为在解决复杂任务时——无论是解决数学问题、撰写论文还是编程——人类通常只记录下有助于推进的关键信息。通过模仿这一行为,LLMs 可以专注于推进解决方案,而不受冗长推理的影响。
其研究论文称,这一方法不仅减少了冗余,还显著降低了计算成本和延迟,同时保持了与「思维链」相当的准确性。
用一个简单的算术题例子感受直接回答(标准)、「思维链」与「草稿链」的区别:
标准:
问:杰森有 20 个棒棒糖。他给了丹尼一些棒棒糖。现在杰森有 12 个棒棒糖。杰森给了丹尼多少个棒棒糖?
答:8
思维链:
问:杰森有 20 个棒棒糖。他给了丹尼一些棒棒糖。现在杰森有 12 个棒棒糖。杰森给了丹尼多少个棒棒糖?
答:让我们一步步来思考:
  1. 最初,杰森有 20 个棒棒糖。

2. 在给丹尼一些棒棒糖后,杰森现在有 12 个棒棒糖。
3. 为了找出杰森给了丹尼多少个棒棒糖,我们需要计算最初的数量和剩余数量之间的差异。
4. 我们可以设置一个简单的减法问题:最初的棒棒糖数 – 剩余的棒棒糖数 = 给丹尼的棒棒糖数
5. 把数字带入:20 – 12 = 给丹尼的棒棒糖数
6. 解决减法:20 – 12 = 8
因此,杰森给了丹尼 8 个棒棒糖。
草稿链:
问:杰森有 20 个棒棒糖。他给了丹尼一些棒棒糖。现在杰森有 12 个棒棒糖。杰森给了丹尼多少个棒棒糖?
答:20 – x = 12;x = 20 – 12 = 8。#### 8
在标准的直接回答中,模型直接输出答案「8」,没有任何推理过程。虽然答案正确,但缺乏透明性,可解释性不强,且在多步推理任务中容易出错。
「思维链」则生成了冗长的推理。相比之下,「草稿链」的推理被简化为一个简洁的方程,答案应放在响应的结尾,并使用分隔符「####」,减少了 Token 数,同时保持透明性和正确性。
为了评估「草稿链」的有效性,Zoom 的研究团队进行了多种基准测试,包括算术推理、常识推理和符号推理任务。其实验结果称,草稿链在「准确性」上与思维链相当,甚至在某些任务中表现更好,同时显著减少了 Token 使用和延迟。

三种提示策略准确性与 Token 量对比 |图片来源:arXiv 论文

以算术推理任务为例,使用草稿链的 GPT-4o 和 Claude 3.5 Sonnet 模型在 GSM8k 数据集上的准确率分别为 91.1% 和 91.4%,而思维链的准确率分别为 95.4% 和 95.8%。
尽管草稿链的准确率略低,但它将 Token 使用减少了 80%,并将延迟降低了 76.2% 和 48.4%。
在常识推理和符号推理任务中,他们称草稿链同样表现出色。例如,在掷硬币任务中,草稿链将 GPT-4o 的 Token 使用减少了 68%,而 Claude 3.5 Sonnet 的 Token 使用减少了 86%,同时保持了 100% 的准确率。

02

部署 AI,更省钱了?
 
Zoom 的研究人员还提到,与「草稿链」类似,去年圈内已有研究提出「简洁思维(Concise Thoughts,CCoT)和 Token 预算感知 LLM 推理,建议对推理步骤使用固定的全局 Token 预算。
然而,不同的任务可能需要不同的预算,以实现性能和成本之间的最佳平衡。此外,LLM 可能无法遵守不切实际的预算,通常生成的 Token 数量远超预期。即使是动态估算,也要额外的 LLM 调用,这增加了延迟。
「相比之下,我们的方法采用每步预算,允许无限的推理步骤,使其更适应各种结构化推理技术。」研究团队称。
但「草稿链」也有其局限性,对于需要大量反思、自我纠正或外部知识检索的任务,它可能效果较差。
这项研究目前被讨论较多的用处在于,它可能改变企业部署 AI 的成本,让 AI 模型以更少的资源更便宜地思考,对成本敏感的场景尤其适用。
例如,AI 研究人员 Ajith Prabhakar 分析认为,对于每月处理 100 万条推理查询的企业,「草稿链」可以将成本从 3800 美元(CoT)降至 760 美元,每月节省超过 3000 美元——在大规模应用时,节省更多。
除了成本,「草稿链」可能使 AI 驱动的应用程序更加响应迅速,特别是在实时支持、教育和对话式 AI 等领域尤其有价值,因为即使是短暂的延迟也会严重影响用户体验。
不过,值得注意的是,OpenAI 在 3 月 10 日发文称,他们相信「思维链(CoT)监控」可能是未来监督超人类模型的少数工具之一,「建议不要对前沿推理模型的 CoT 施加强烈的优化压力,保持 CoT 不受限制,以便进行监控。」
因为模型通常会在「思维链」中非常清楚地陈述其意图,让人类可以看到模型的思维,从而检测模型一些不当行为,比如在编程任务中绕过测试、欺骗用户,或者在问题过于困难时放弃。

OpenAI 发文提到思维链监控的好处|图片来源:X

无论如何,从「思维链」到「草稿链」,AI 推理范式还在不断进化。
目前看来,随着应用场景扩展,在不谈 AI 安全时,成本与速度越来越成为绕不过的关键指标。而 CoD 的出现,证明了人们依然在探索如何在保持大模型进步的前提下,进一步降低成本,加速 AI 的普及。
浏览量: 27

文章分页

上一页 1 … 33 34 35 … 86 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间