Skip to content
  • 51蛙吖蛙元宇宙社交空间官网
51蛙吖蛙 – 元宇宙社交

51蛙吖蛙 – 元宇宙社交

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

标签: 科技

对标英伟达,摩尔线程上市后首次亮家底

2025 年,国产 GPU 行业迎来了一个不仅关乎生存,更关乎胜负的「大年」。

在国际博弈与 AI 大模型爆发的双重夹击下,国内企业达成了前所未有的共识,若不拥有自主 GPU 算力,就无法在通往未来的牌桌上保住席位。过去两年,国内模型玩家们一边在全球范围内「屯粮」,一边悄悄投遍了国内所有的 GPU 厂商,每个人都在等待那个能真正承载中国 AI 野心的玩家出现,希望国产芯片能在性能上与国际巨头正面一搏。

不过,今天这一切或许有了新的变化。12月20日,摩尔线程在北京中关村国际创新中心举办了首届 MUSA 开发者大会(MDC 2025)。会上,摩尔线程创始人、董事长兼 CEO 张建中在主题演讲中介绍了其最新 GPU 架构「花港」,算力密度提升 50%,效能提升 10 倍。落在具体芯片上,摩尔线程基于该架构推出高性能 AI 训推一体「华山」芯片与专攻高性能图形渲染的「庐山」芯片。

据介绍,在性能上,华山的访存容量甚至超越了英伟达 Blackwell,访存带宽与之并肩齐驱。尽管在绝对浮点算力和互联带宽上仍处于追赶 Blackwell 的状态,但它已多方位超越了长期作为行业标杆产品。这种「紧咬旗舰」的态势,标志着国产 GPU 已经完成了从「能用」到「顶级好用」的跨代跃迁。

华山性能示意图 | 图片来源:极客公园

而专注于高性能图形渲染的庐山,相较于上一代的 S80,能够为 3A 游戏性能带来 15 倍的提升,具体而言,在 AI 性能上有 64 倍的提升,在光线追踪性能上有 50 倍提升。

作为目前少数敢于和英伟达公开掰手腕的国产 GPU 厂商之一,摩尔线程在此次发布会中所推出的产品,更具象体现其「全功能 GPU」的定位,从具身智能到生命科学,再到量子计算,摩尔线程和生态伙伴们的合作正逐步展开。

熬过了漫长的静默期,摩尔线程终于以「国产 GPU 第一股」的姿态站到聚光灯下。此刻,它必须面对市场的集中叩问如何立足市场?未来征途又将去往何处?尤为关键的是,在数款硬件落地之后,其业务体系究竟如何布局?在芯片荒与算力焦虑交织的当下,摩尔线程这种全方面布局方式究竟能否在激烈竞争中挖到真正的「算力黄金」?通过这场大会释放出的多方信号,我们得以窥见这家公司重塑计算效率边界的野心与路径。

一、1个架构,2款硬件,3款芯片

「算力就是国力。我们希望能够从芯片到集群以『加速计算』的能力,利用全功能 GPU 打造国之重器。」在摩尔线程创始人张建中讲述自己讲如何打造一条从微观芯片架构到宏观智算集群的自主突围之路。

与英伟达构筑的 CUDA 护城河逻辑相似,摩尔线程深知单一硬件无法定义未来,因此打造了一个纵深极广的生态系统MUSA,底层集成了 AI 计算、3D 图形渲染、高性能计算与智能视频编解码的全功能 GPU ,以全数据单元的兼容性将算力触角延伸至科学计算、数字孪生、具身智能、量子计算乃至 6G 通信与生物医药等前沿领域。

在全功能GPU之上,是硬件系统,摩尔线程的智算集群叫作夸娥。夸娥智算集群实现了从微型系统到十万卡规模的弹性扩展;MUSA 软件栈则通过完备的加速库、调试工具及应用实例,为开发者提供了从底层基础软件到 AI 训推系统框架的闭环支持,甚至通过复杂的管理套件,攻克了超大规模系统运维的难题。

架构迭代升级的确定性,是国产芯片对抗外部不确定性的定海神针。在历经苏堤、春晓、曲院、平湖四代量产演进的积淀后,摩尔线程计划于明年正式量产第五代架构「花港」。

摩尔线程通过底层指令集升级来换取性能空间优化,花港在同等工艺条件下实现了 50% 的算力密度增长与 10 倍的能效提升。摩尔线程还专门针对大模型趋势优化了 FP4、FP6、FP8 等低精度计算单元,并支持十万卡以上集群的扩展。

花港架构 | 图片来源:摩尔线程

基于此架构的 AI 芯片「华山」,更是引入了新一代异步编程模型,通过 TCE-PAIR 技术实现 Tensor 核心间的数据共享,让本需两次调用的数据一次完成,解决了计算单元因任务分配不均而「空转」的顽疾,在硬件底层优化了算子的实际吞吐效率。

此外,摩尔线程技术溢出不仅影响到数据中心,同样在图形与边缘侧市场引发了质变。承袭花港架构底层优势的专业图形显卡「庐山」,相比前代 S80,其游戏性能提升 15 倍,AI 原生算力激增 64 倍,几何处理能力提升 16 倍,并支持 50 倍性能的光线追踪硬件加速。通过统一任务引擎管理框架,「庐山」确保了多核并行效率的最大化,使其足以胜任 CAD 与 CAE 等高精度的工业辅助设计任务。

庐山 芯片 | 图片来源:摩尔线程

在连接云端与端侧的战略上,新一代 AI SoC 长江内部融合了 CPU、GPU、NPU、VPU、DPU、DSP 及 ISP 等多元异构引擎,让端侧设备极高的灵活性。目前,长江能够在一个高效率、低功耗的单芯片系统内,同时处理复杂的逻辑指令与超高清视频编解码,覆盖了从机器人到智能终端几乎所有的技术诉求。

长江智能 SoC 芯片 | 图片来源:摩尔线程

为了加速生态下沉,摩尔线程还推出了售价 9999 元起的算力本 MTT AIBOOK 与个人工作站 AICube,试图将「云端算力」升级为「开箱即用」的个人生产力。

据介绍,MTT AIBOOK 是首部真正意义上的「算力本」,它搭载了长江SoC,将大模型训推能力直接封装进便携设备。摩尔线程认为,通过内置的 MT AIOS,开发者可以在 Linux 原生环境下自由切换 Windows 虚拟机与安卓系统,实现从模型训练、推理调试到多端应用部署的周期闭环。

MTT AIBOOK | 图片来源:摩尔线程

针对个人开发者面临的环境配置痛点,AIBOOK 还提供了预装方案,不仅支持 Docker 与深度神经网络库,还集成了 VS Code、Python 及 PyTorch、vLLM 等主流框架,配合 1TB SSD 与最高 64G 高速存储,让「一人一 Agent」的设想成为可能。用户可以利用其开放系统开发专属智能体,甚至让 Agent 接管系统操作,真正实现 AI 原生的工作流。

如果说 AIBOOK 算是流动的节点,那么 AICube 则是一个静默而强大的算力中枢。作为一个目前处于原型机阶段的小型工作站,AICube 利用强大的算力化身为家庭或办公室的「数据中枢」,通过人工智能交互对碎片化信息进行智能化管理。无论是咨询旅行照片、检索家庭短片还是规划行程,其内置数字人都能充当「家庭大脑」提供即时服务。

算力竞赛的终局,最终都会回归生态渗透率的较量。为了打破 CUDA 生态的惯性迁移壁垒,摩尔线程正在开发的 MUSACode 大模型已实现 93% 的自动化编译率,并正在自研通过自然语言直接生成代码的 Text to MUSA 技术,试图大幅降低迁移门槛。此外,GPU 虚拟化技术的迭代实现了热迁移与热插拔功能,这种高可靠性特性极大增强了国产算力在云端部署中的商业竞争力。

从华山到庐山再到长江,从数据中心到个人桌面,这种多方位布局体现了摩尔线程试图通过架构创新与软件深度重构,在现有制程框架下大幅提高计算效率。

 

二、打造万卡 AI 超级工厂

前几年,万卡集群曾被视为难以逾越的巅峰,但随着千亿级乃至万亿级参数大模型的涌现,如何构建一个真正属于国产化的超算底座,成了行业共同的追索。在这个过程中,摩尔线程并不满足于只做芯片的供应商,而是希望打造一座智能的「AI 工厂」。

在大规模集群中,如何让数以万计的 GPU 像一个大脑一样协同工作,其中最大的难题之一在于 Scale-up(垂直扩展)的效率。

为了打破互联的围墙,摩尔线程的「华山」芯片不仅拥有高速的 MTLink 4.0 技术,还主动拥抱多元化的以太网协议,将国内合作伙伴的各种协议内置在芯片里,这也让华山芯片的兼容性能无缝适配广阔硬件生态,让国产算力能够通过跨厂商的交换机实现自由扩展。目前,华山的超节点 Scale-up 能力已提升至 1024 卡,这意味着超千颗 GPU 能在一个节点内实现极致的带宽互通,为十万卡级别的超大规模集群打开了物理想象力。

然而,当算力规模走向十万卡级别,稳定性就成了集群运转的生死线。摩尔线程通过RAS 2.0 技术,采用 ECC 与 SRAM 校验机制,芯片能在问题发生的一瞬间自动检测、上报并精准隔离故障单元。这种设计确保了在成千上万芯片构成的星阵中,局部的微小问题不会引发系统性的崩溃,让开发者和管理者能够实时掌控集群的健康状态,确保了整个智算中心的安全性与业务连续性。

从 2024 年的千卡试水,到 2025 年万卡集群的落地,再到未来十万卡级的蓝图,摩尔线程的夸娥智算集群正在重塑国产算力的上限。这座坐落于北京的万卡工厂,不仅拥有惊人的 10 EFLOPS 浮点算力,更在模型算力利用率和有效训练时长上给出不错的成果。目前,它通过深度软硬件协同,让 MFU 稳定在 60% 以上,真正解决了大模型训练中「出工不出力」的难题。

很显然,在摩尔线程的愿景里,国产超算不应只是硬件堆砌。为此,他们推出了MTT C256 超节点解决方案,让 256 颗 GPU 在亿级拓扑互联下实现互通。同时,为了降低开发门槛,他们打造了从自研 MT Transformer 推理引擎到全面兼容 vLLM、Llama.cpp 等开源生态的软件矩阵。

MTT C256 超节点解决方案| 图片来源:摩尔线程

从华山芯片到夸娥集群,再到那些让代码迁移变得轻而易举的 MUSACode 工具,摩尔线程正在做的是试图在这个由制程瓶颈与技术壁垒构成的迷宫中,开辟出一条通往「算力自由」的中国路径,让国产智算中心真正成为能支撑起万物智能的基座。

 

三、成为下一个「英伟达」?

当摩尔线程将其完整的产品图谱悉数铺开时,你会惊觉这家公司在静默的时光里已然走过了极为深远的征途。从苏堤、春晓、曲院、平湖,再到计划量产的「花港」架构,这种一年一代的迭代速率,勾勒出一条国产算力向上攀升的曲线。从底层的芯片逻辑看,摩尔线程始终紧扣「全功能、全精度、全产品业务」三大支柱。

在展会现场,这种「全」的意图被展现得淋漓尽致:从云端智算中心到边缘计算节点,再到 横跨 B、C 两端的桌面终端,这种纵贯产业链上下游的布局,几乎覆盖了计算生态的每一个神经末梢。

在推理生态上,摩尔线程与硅基流动的深度合作,展示了其基础库在开发者手中的实战潜力。据介绍,在 Prefill 阶段,单卡每秒可处理 4000 tokens,decode 阶段亦能达到单卡每秒 1000 tokens。

不仅如此,摩尔线程在生命科学领域利用 MUSA 平台开发出 Sponge 和 DSDP,试图在自己的生态里生长出原生的应用场景。在前沿的 AI For 6G 赛道,摩尔线程与中关村联合合作,利用 S5000 的算力,让 6G 通信的算法优化与网络部署,加速通信与算力融合。

摩尔线程还打造的数字人「小麦」,开放了核心能力,支持开发者在 AIBOOK 上原生开发 2D 数字人应用。摩尔线程甚至提供了云边结合的数字人制作工具,让 AI 生成的数字人能应用于服务与交互场景。

展会上引人注目的亮点之一,莫过于那台被摆在各个站台演示位核心、甚至已成为摩尔线程公司内部主力办公设备之一的 MTT AIBOOK。通过后台参数性能监控可以发现,即便是在播放高码率视频或执行多任务切换时,其底层的全功能 GPU 波动依然保持平稳。这说明 AIBOOK 并非一个点到为止的「参考设计」,而是一款完成度较高、意图切入真实市场的硬件产品。与之相伴的还有针对个人数据中心打造的AICube,这些消费级终端的「小试牛刀」,背后折射出摩尔线程下沉算力入口的野心。

摩尔线程打造的 MTT AIBOOK和 MTT AICube| 图片来源:极客公园

然而,全能的另一面往往是业务重心的取舍难题。9999 元的定价背后,也是芯片厂商跨界生态位的巨大风险。这种看似「战线过长」的布局,其实隐藏着国产 GPU 厂商在现有国际霸权生态下的集体无奈。

在国际厂商生态已然坚不可摧、开发者习惯早已固化的今天,国产玩家想要突围,仅仅提供一颗芯片是不够的。现有的成熟平台就像是精密运转的钟表,所有外部齿轮都围绕其转动;而作为后来者的摩尔线程,必须亲自搭建起适配平台、开发库、解决方案甚至是硬件终端。这是一种「为了卖出芯片,必须先修好整条路」的战略自觉,只有将通路的工作做在前面,才能最大化地释放出国产化芯片的性能优势,为自己争取到进入核心赛道的门票。

这一切,最终凝结为摩尔线程前瞻且全面的业务体系。展会中,我们听到不少人将其称为「中国的英伟达」。诚然,从其展示的蓝图中,我们确实能看到一颗不甘追随、志在引领的雄心。然而,真正的破局者从不满足于成为另一个谁。在技术封锁与生态挑战并存的当下,我们期待摩尔线程这套「以全破坚」的方略,不仅能开辟生存之路,更能走出一条定义自身、通往算力自主的开拓之路。

浏览量: 3

52分钟订单破千,5小时登上热搜,Vbot用一只机器狗开启具身智能元年

 

头图来源:维他动力

 

 

在之前的科技展或短视频里,我们已经看过太多机器狗的表演——它们排队跳舞、后空翻、作揖。这些动作虽然炫酷,但在真实家庭中却显得格格不入。

 

一来,目前的机器狗大多是工业级场景所打造,二来,即便图新鲜买回家,等新鲜感褪去,它们大多变成了大号的遥控玩具或收藏柜里昂贵的「吃灰手办」。

 

为什么机器狗还没能像扫地机一样走进千家万户?

 

核心矛盾可能在于「智能」的错位。行业此前长期陷在「卷运动能力」里,却忽略了用户真正的需求——用户要的不是一个需要手柄操控的工具,而是一个能听懂指令、能自主决策的伙伴。只要还需要遥控器,它就永远谈不上「具身智能」。

 

相关话题登上微博科技板块热搜第7|图片来源:维他动力

 

现在,市场给出了最直接的反馈:12月23日,Vbot超能机器狗发布会全网直播热度超千万,相关话题冲上微博热搜第7位。更具冲击力的是,产品上线仅52分钟,在官方小程序订单即突破1000台,这也是市场上万元级具身智能产品,达到1000台订单的最快速度——可以看到,当「具身智能」真正落地为实用产品时,大众市场的爆发力远超预期。

 

52分钟订单突破1000台|图片来源:维他动力

 

当大头BoBo选择拿掉那个象征着操控的遥控器时,它实际上是在做减法,但恰恰是这个减法,帮它拿到了那张真正通往家庭场景的「通行证」。

 

产品的热销之外,这更是用户对「消费级具身智能」这个新物种投出的第一张信任票。

 

1为什么消费级具身智能的元年可能始于一台机器狗?

 

过往,具身智能长期局限于科研与工业场景,消费端缺乏「无需遥控」的实用化产品,传统机器狗大多为「展示级玩具」,难以融入日常生活。

Vbot要成为那个打破局面的先行者。

形态服务于场景。Vbot选择了四足形态,这是因为相比于人形机器人目前高昂的成本和复杂的平衡控制,四足形态是当下进入家庭的最优解。

家庭环境不是平整的工厂地面,这里有门槛、有地毯、有散落的玩具。Vbot的四足设计拥有全地形通过能力,能像宠物一样在复杂的家居环境中自由穿梭,这比轮式机器人更灵活,比人形机器人更稳健。

这里有一个参数细节:Vbot将大腿和小腿长度都设计为22cm。这是因为国标和美标中,绝大多数生活台阶的高度在16-20cm之间。22cm的腿长能保证它在跨越20cm台阶时,依然能形成一个稳定的三角形结构。

但形态只是载体,真正的拐点在于「技术成熟度」与「用户需求」的共振。

Vbot的创始团队里,创始人余轶南来自地平线,联合创始人赵哲伦来自理想汽车。他们做机器狗的逻辑不是「做陪伴」,而是要做一个有陪伴属性的智能机器人。

地平线创始人兼CEO余凯是Vbot超能机器狗的001号用户|图片来源:维他动力

 

以前的机器狗大多存在严重的「偏科」:要么是只有「底盘」(运动控制/小脑)的遥控玩具,要么是虽有「大脑」但价格高昂的科研设备。Vbot的突破在于,它沿用了智能汽车的逻辑,补齐了机器狗缺失的「智驾系统」(空间智能)和「智能座舱」(交互系统)。

在前段时间Vbot在奥森公园的测试中,发生过有趣的一幕:大头BoBo把一群孩子「硬控」了一个小时。孩子们不需要说明书,天然就知道怎么跟它玩——狗走在前面,孩子追在后面,家长在后面轻松地看着。这种让孩子「少触碰数字世界(手机),多回到物理世界」的愿景,是屏幕里的AI永远无法替代的。

当一台机器不再需要你告诉它「迈左腿」还是「迈右腿」,也不需要你时刻盯着它会不会撞墙,而是能自己规划路线去厨房拿一瓶水时,它就不再只是玩具,而是一个在大众市场拥有真实需求的「具身智能实体」。

这一刻,便是消费级具身智能市场打开的起点。

 

2Vbot如何定义消费级具身智能的核心门槛?

如果说「无需遥控」是Vbot提出的产品哲学,那么支撑这一哲学的,则是一套甚至超越了自动驾驶汽车算力密度的硬核技术底座。Vbot正在通过一系列参数与体验,重新定义这个品类的「及格线」。

首先是「真智能」的架构标准,Vbot构建了「本体-空间-Agent」的三重闭环:

本体智能(小脑):依靠自研的N45高永磁关节电机,Vbot超能机器狗拥有了24.5Nm的峰值扭矩,却将单电机重量控制在0.4kg。这让它不仅能跑出13.3km/h的马拉松配速(配速4分30秒,足以做专业跑者的Pacer),还能拖动100kg的重物——在测试中,它甚至能拉动一辆坐着成年人的露营车,同时还能实现全地形的稳定通过。

空间智能(大脑):这是其与传统遥控狗的本质区别。Vbot搭载了128TOPS的端侧AI算力,这个数字是目前主流消费级竞品(通常10-40TOPS)的3倍以上,如此高的算力不仅仅是为了快,更是为了隐私。Vbot将所有视觉数据直接在端侧处理完毕,无需上传云端,解决了家庭场景最敏感的监控隐私问题。

Agent智能(决策):基于空间基座模型,它能理解「陪我跑步」、「去拿快递」等复杂指令,并将语义转化为行动轨迹。

其次是解决「里程焦虑」的硬核参数。

没有续航的智能是空中楼阁。行业内机器狗的续航普遍在1小时左右,用户还没玩过瘾就没电了,不仅产生「里程焦虑」,更别说承担陪伴任务了。

Vbot机器狗则通过重构E/E架构,挤出了更多电池空间,将电池容量拉升至594Wh,实现了约5小时的超长续航。

为了让补能像手机一样方便,Vbot不仅支持家用无线充电站,还支持Type-C接口最高240W的超级快充,约2.5小时即可充满。这意味着它已经能成为一个真正能全天候待命的家庭成员。

不仅如此,为了真正适应家庭,Vbot还做了大量细节设计:特意留出的2.5cm关节限位防止夹伤孩子的手;采用2盎司铜厚主板散热以替代高噪音风扇,确保在卧室使用也不吵;它的语音也不是生硬的TTS,而是AI学习了电影《机器人总动员》中WALL-E(瓦力)的发声方式生成的「BoBo语」,让它听起来更像一个有生命的伙伴。

还有「万元级」的价值锚点。

在Vbot之前,想要拥有100TOPS级算力、激光雷达和深度视觉的机器狗,通常需要支付近9万元。Vbot则将这一配置直接下放到了9988元的万元级价位段。

在Vbot超能机器狗的预售方案里,用户在2026年1月10日前支付298元订金,即可优先锁定9988元的创始权益价,产品计划于2026年1月启动公测,3月起预定开始锁单,进入批量交付阶段,按锁单顺序交付。

9988元的创始权益价|图片来源:维他动力

这一价格击穿了「富人玩具」的壁垒,配合随行、负重(12kg)、安防巡逻、陪娃等真实落地场景,Vbot确立了消费级具身智能的性价比标准——只有让大众买得起、用得上的智能,才是真正的消费级智能。

 

32026,「消费级具身智能」的爆发前夜

首日即达成数千万元级销售额,Vbot成为了新品牌首款产品即获得规模化成交的首个案例。

单点胜利的同时,这也是一个强烈的行业信号:具身智能正在完成从「技术秀场」到「商业闭环」的关键跨越。

这一信号也将带动评价体系的转移。

过去,我们评价一只机器狗,看的是它后空翻稳不稳、跳舞整不整齐,这是「技术展示期」的审美。

现在,随着Vbot的热销,大众的付费意愿被「无需遥控」的实用性彻底激活。行业正式进入「商业验证期」,未来的竞争焦点将从炫技转向销量、出货量、交付能力以及用户留存率。

「技术平权」也将加速。参考智能手机和无人机的发展史,任何硬科技品类的爆发,都始于价格门槛的击穿。

Vbot以9988元的预售创始价打破了高性能机器狗的高价魔咒,赵哲伦在直播中坦言,这个价格是「零毛利」甚至亏本的,目的就是为了「交个朋友」,先把生态做起来。

而之所以敢这么定,是因为团队通过自研电机,将行业通用采购价约400-500元的单电机成本大幅打了下来,并对规模化后的供应链优势有所信心。

而这种定价策略或将产生连锁反应,促使供应链上下游加速成熟,推动成本进一步降低。Vbot正试图为2026年的市场规模化爆发,提前铺平那条最艰难的成本与供应链之路。

生态的想象力也已经打开。

Vbot在背部预留了1/4英寸的标准螺口(相机通用接口)和磁吸接口,Type-C接口同时也支持数据通信。这意味着它不仅是一只机器狗,还是一个移动的摄影台(架上Insta360)、一个能拖动100kg露营车的智能拖车。团队甚至在考虑开发「真空模式」或「挣脱模式」,以防止它在户外被陌生人抱走。

2026年,或许将成为消费级具身智能的「产业元年」。而Vbot率先跑通了从产品定义(无需遥控)、定价策略(万元级)到真实家庭场景交付(预售即量产)的完整闭环。

它向所有人验证了「消费级具身智能」不仅仅是一个PPT概念,而是一个真实存在的、有巨大需求的市场。

当机器狗开始像手机一样比拼算力、续航和应用生态,并真正融入我们的日常生活空间时,一个万亿级的新赛道,已经在爆发的前夜。

浏览量: 3

豆包Dau已过亿,瞄向“国民级应用”:证明Chat依旧是AI第一入口

 

12月24日,有报道称豆包的日均活跃用户数(DAU)已突破1亿。加上前两天豆包要上春晚的消息,看起来,豆包离一款国民级应用的距离越来越近了,而这也让所有怀疑Chat是否是AI时代超级入口的讨论,变成了“面向未来的终局探讨”,今天,字节已经用行动表明了自己的明确判断。

 

此前据报道,字节跳动旗下火山引擎将成为 2026 年中央广播电视总台春晚独家 AI 云合作伙伴,其智能助手豆包也将配合上线多种互动玩法。

 

有着十亿观众规模的春晚,依然是「流量放大器」,只是这次主角变成了 AI 应用。

 

十年前,微信摇一摇抢红包登上春晚,微信红包一举创下了达10.1亿次的收发总量,摇一摇互动峰值更是达到每分钟8.1亿次,此后,微信开始跟「国民级」应用画上了等号。

 

更早之前,火山引擎近日宣布豆包大模型日均 token 使用量突破 50 万亿,较去年同期增长超 10 倍。而根据 QuestMobile 发布的 2025 年三季度AI应用行业报告,豆包以 1.72 亿月活用户(MAU)力压 DeepSeek 的 1.44 亿,登顶国内 AI 应用榜首。

 

在这些宏大的流量战报与榜首光环之外,极客公园也发现了一组看似不起眼、却更能决定 AI 产品存亡的微观数据。

 

一个是Sora app 60天留存0%,一个是豆包 180 天留存率竟反超 90 天留存率,这是在2025年年底,我们了解到的两款AI产品大相径庭的留存曲线。

Sora app 60天留存0%|图片来源:X

 

虽然这两个产品分属不同的赛道,一个是垂直类的视频生成工具,一个是全能型的 AI 助手,但我们或许可以从这个鲜明的对比走向里,看出AI 应用从「技术尝鲜」迈向「场景落地」的必然规律。

 

在算法祛魅的下半场,谁能率先用「产品思维」解决生老病死、衣食住行的真实需求,谁才有可能将流量转化为真正的用户护城河。单纯基于「想象力」的技术炫技,越来越难以逃脱「用完即走」的宿命了。

 

豆包的表现,正在验证一个事实:在 Agent(智能体)时代,Chat 依然是通往超级应用的最佳入口。

 

1 豆包:走出微笑留存曲线

 

通常情况下,AI Chat类产品由于缺乏深度的用户忠诚度,往往面临「用完即走」或留存率持续下滑的困境。

 

然而,豆包在发布相当长一段时间后,却走出了一条罕见的「微笑曲线」——有网友在即刻称豆包Q2的新用户安装留存率,在Q4出现了翘尾现象。180天留存>90天留存,留存数据出现回暖和「翘尾」现象。

 

图片来源:即刻

 

那么,在这期间,豆包发生了些什么?

豆包在今年下半年以来的更新(一)|图片来源:极客公园

 

豆包在今年下半年以来的更新(一)|图片来源:极客公园

 

回顾豆包下半年以来的更新,会发现一个明显的趋势:它变得越来越「长眼睛」了 。

 

更新的重点不再局限于文本对话,而是大量围绕视觉的生成与理解展开。特别是图片处理(P 图)、修图及换背景等功能,精准切中了年轻女性用户的刚需,甚至在一定程度上成为了「美图秀秀」的 AI 替代品。

 

这正是字节跳动最擅长的打法——用多模态技术重塑经典场景。

 

过去,Chat 类产品的核心痛点在于「悬浮」:用户来这里主要是为了闲聊或娱乐,这种基于想象力的交互很容易枯竭。但当 Chat 接入了强大的多模态能力,它就具备了「干活」的能力。

 

豆包还展现出了一种「旧模式升级」的智慧。与其凭空创造全新的交互,不如去挖掘那些曾在移动互联网早期(如 2017-2018 年抖音爆发期)被验证过的热门玩法。

 

不仅是修图,豆包将 AI 的能力嵌入到「老照片修复」、「静态照片动起来」等打情怀牌的场景中,击中了用户为孩子庆生或怀念逝去亲人的情感软肋。

 

还有视频通话的进化,之前火爆的「虚拟好友打电话」功能,其实早在去年 11 月就已上线,前段时间又通过体验优化被用户重新发掘。

 

这种「内容驱动增长」的逻辑,本质上是寻找那些具有普适性的场景,用 AI 做到极致体验,从而激发用户的自发传播。同时,这种从「闲聊式」的弱连接,向「得力工具」的强连接的进化,或许正是豆包阶段性留存率回暖的关键。

 

火山引擎总裁谭待提到,字节跳动的一个很大优势就是「比较会把体验做好」。他认为,在 AI 时代,Agent 让个体体验变得关键,能否让用户用得顺手,是产品存活的核心。

 

而据业内人士透露,在豆包内部,这种判断标准变得更加务实:一个新功能是否成立,不再看大厂员工的内测反馈,而是进行「盲测」——找 10 个完全不懂技术的普通老百姓,如果其中有 7 个人不仅愿意用,还产生了忍不住「剁手」分享的冲动,这才是一个合格的 Aha Moment。

 

2 底层进化:让 AI 从「能玩」变「有用」

 

应用层的「接地气」,离不开底层模型能力的质变。豆包之所以能接住这些高频图像和语音需求,是因为其底层模型在今年下半年迎来了从「Demo 级」到「Product 级」的跨越。

 

今年下半年,豆包大模型迎来了多轮关键迭代,涵盖长文本、深度思考(多模态)、视频/语音生成、Agent 能力等方面。

 

首先是架构的统一与成本的优化。 6 月发布的豆包 1.6,首次将深度思考、多模态、长上下文能力统一进同一套稀疏 MoE 架构。谭待透露,火山引擎通过技术手段将模型推理价格降低了 99% 且依然保持毛利。 这意味着,在大规模 C 端应用中调用多模态能力的成本不再是天价,为「免费 P 图」提供了商业可行性。

 

其次是视觉能力的生产力化。 谭待认为,多模态代表着模型应用进入更深的领域,输入和输出往往都带有视觉信息。 9 月推出的 Seedance 视频生成模型,其在中文及方言的音画同步(如口型匹配、不吞音)上表现全球领先。这直接解决了过去视频模型「对不上嘴」的痛点,成为「虚拟通话」等实时互动场景体验爆发的技术基础。

 

最后是基于强化学习的自我进化。 火山引擎智能算法负责人吴迪在演讲中提到,强化学习是让智能体自我进化的关键。以抖音客服为例,通过构建虚拟环境和剧本进行强化学习,模型的问题解决能力提升了 10 个百分点。这种技术让豆包不仅仅是「答题」,更具备了解决复杂问题的「进化力」。

3 Chat :目前依旧是超级入口

 

豆包的阶段性成功,验证了「Chat作为超级入口」这一逻辑的可行性,Chat 并不会过时,它只是需要更强的手和眼。

 

在Agent(智能体)时代,Chat不再仅仅是聊天窗口,而是调用各种工具能力的调度中心。

 

谭待也提到,豆包 APP 的表象之下,本质上是一个「特别复杂的 Agent 集合」。他认为,未来的交互方式——无论是手机还是车机——都会是「自然的以 Agent 的方式」进行。

 

比如在车里,以前的指令很笨(必须说「打开遮阳板」),现在基于大模型的多模态 Agent 可以理解「把天窗开一下」其实是想打开遮阳板,甚至能理解「想听那首什么歌词的歌」这种模糊指令。

 

多模态能力让这个调度中心拥有了干涉现实的能力。通过整合视觉理解、图像处理等能力以及电商链接等功能,可以看到,豆包正在尝试走通一条「大一统」的超级应用之路。

 

在阿里通义千问、DeepSeek以及海外竞品都在激烈争夺入口的背景下,豆包这种「系统性」的打法及其取得的成果,为行业提供了一个关于「AI 入口如何 Make Sense」的重要样本。谭待预测,明年 Agent 将迎来爆发,仅企业内部的 Agent 数量就将从几十个增长到几百个。

 

据业内人士透露,豆包的竞争重点或将从「模型竞赛」转向「大众实用功能」。

 

一方面,产品团队正在吸纳更多 95 后、网感好的年轻人,试图复刻更多类似「虚拟视频通话」的爆款功能;另一方面,产品开始聚焦更具社会价值的民生场景,如央视《赢在 AI+》所倡导的方向,利用 AI 寻找走失儿童、服务视听残障人士等。

 

当 AI 能够真正解决「寻常百姓家」的具体问题时,产品才能真正穿透技术壁垒,构建起长效的用户护城河。

 

豆包在用户留存上出现的微笑曲线,或许意味着未来AI产品的分水岭,将取决于谁能更好地通过Agent能力解决实际问题,从而将流量转化为真正的用户价值。

 

而当 Chat 成为调度万物的指令行,它可以不再只是一个 App,而是通往 AI OS 的雏形。

 

 

浏览量: 3

俞敏洪敲定东方甄选接班人;库克首次自掏腰包买耐克股票;阿维塔回应南极测试争议:那比北京暖和

豆包日活用户数突破 1 亿

12 月 24 日,有报道称豆包的日均活跃用户数(DAU)已突破 1 亿。加上前两天豆包要上春晚的消息,看起来,豆包离一款国民级应用的距离越来越近了,而这也让所有怀疑 Chat 是否是 AI 时代超级入口的讨论,变成了「面向未来的终局探讨」。

此前据报道,字节跳动旗下火山引擎将成为 2026 年中央广播电视总台春晚独家 AI 云合作伙伴,其智能助手豆包也将配合上线多种互动玩法。有着十亿观众规模的春晚,依然是「流量放大器」,只是这次主角变成了 AI 应用。

更早之前,火山引擎近日宣布豆包大模型日均 token 使用量突破 50 万亿,较去年同期增长超 10 倍。而根据 QuestMobile 发布的 2025 年三季度 AI 应用行业报告,豆包以 1.72 亿月活用户(MAU)力压 DeepSeek 的 1.44 亿,登顶国内 AI 应用榜首。(来源:极客公园)

曝 OpenAI 正讨论在回复中引入「赞助内容」

据 The Information 报道,OpenAI 的员工正在探讨调整人工智能模型的方案,旨在当用户提出相关查询时,让 ChatGPT 的回复优先展示推广内容。

据一位自称「见过广告设计样稿」的人士透露,近几周来,OpenAI 员工还为 ChatGPT 设计了多种广告呈现形式的样稿。

目前,ChatGPT 的周活跃用户数已飙升至近 9 亿。但在公开场合,首席执行官 Sam Altman 一直淡化 OpenAI 打造广告巨头的野心。但在过去一年里,OpenAI 已陆续招揽数位数字广告行业资深人士,并新增购物功能——这些功能或将成为其布局零售广告业务的跳板。(来源:新浪科技)

 

中兴:目前已收到部分大模型厂商合作邀约

近期,搭载深度 AI 功能的「豆包手机」引发市场关注。中兴通讯相关人士在接受采访时,首次系统性讲述了中兴通讯与字节跳动的合作细节与战略考量。

谈及选择与字节跳动合作 AI 手机的原因,该人士称,首先是「战略同频」。双方均将 AI 手机视为确定的未来趋势,并共同认同「开放是促成创新的关键」。在当前行业创新节奏放缓的背景下,中兴希望携手顶尖 AI 厂商,实现「1+1>2」的协同效应,加速推出具有变革意义的产品。

被问及是否接触其他大模型厂商时,中兴通讯相关人士表示,公司秉持「开放即创新」的理念,这也是其「AI for All」战略的核心。目前已收到部分合作邀约,相关沟通正在推进。

这意味着与字节跳动的合作可能只是一个开端,中兴正逐步构建更加开放的 AI 生态体系。(来源:蓝鲸新闻)

 

理想汽车「第二产品线」总裁将离职

12 月 24 日,根据多家媒体报道,理想汽车第二产品线总裁张骁将于近期离职。张骁是理想的早期员工,于 2016 年 5 月加入理想任整车产品经理。在理想期间,张骁深度参与了理想 ONE、L9 等车型的产品定义,与 CEO 李想合作密切;他也曾在高级副总裁范皓宇团队内负责理想车型产品的型谱规划。

按照售价区间,理想将旗下车型划分为三条产品线,张骁负责的「第二产品线」覆盖售价 30 万至 40 万元车型,包括 L8、L7 和 i8,由张骁负责。

《晚点》在报道中推测,张骁离职可能是要创业。

另据《21财经》报道,张骁走后,其所管理的第二产品线和第一产品线合并,由原第一产品线总裁汤靖管理。(来源:晚点 LatePost、21财经)

Jim Fan:特斯拉 FSD 是首个可以通过「物理图灵测试」的 AI

12 月 24 日,英伟达机器人业务总监 Jim Fan 表示,特斯拉 FSD v14 版本首次通过了他提出的「物理图灵测试」。

Jim Fan 在体验 FSD v14 后指出,这套系统一开始让人惊叹,但很快就融入日常生活,效果类似智能手机,一旦失去,反而会让人感到明显不适。

Jim Fan 在 X 上表示,长时间工作后只需按下按钮,便能轻松回家,过程中几乎无法判断驾驶者是神经网络还是人类,这正是其认定 FSD v14 通过物理图灵测试的原因。

图灵测试最早由艾伦・图灵在 1950 年提出,用于判断机器能否展现出与人类难以区分的智能行为,重点考察文本对话能力。这一门槛已经被当今的大语言模型跨越,但语言交流与现实世界中的物理行动并不相同。

因此,Jim Fan 提出了物理图灵测试,要求 AI 通过真实世界的行动来证明智能水平。按照他的观点,特斯拉已经凭借 FSD v14 做到了这一点。马斯克随后在 X 上表示赞同,称 FSD v14 让人能够感受到「感知能力正在成长」,并认为特斯拉 AI 是当前最强的现实世界 AI。(来源:IT之家)

 

阿维塔回应南极-50℃冬测遭质疑

日前,阿维塔官方发文回应近期网友对阿维塔 12 南极测试的质疑。

阿维塔表示,极地中心 x 阿维塔 x 中汽中心工程院创新基地及车辆正式投入使用,阿维塔 12 将在南极度过长达 16 个月的时间,经历极地不同季节及环境变化的车辆测试及技术验证。

而在今年 12 月 8 日,阿维塔宣布,作为全球首辆登陆南极的新能源轿车,阿维塔 12 已抵达南极正式开启科考之旅,直面-50℃极寒,勇闯无人区。

但阿维塔的宣传文案引起网友质疑,因为阿维塔 12 抵达南极时正值南半球夏季(12 月),中山站实测气温仅约-1℃,同期北京为-6℃,实际温度甚至比同期北京更为暖和,宣传与实际温差达 50℃。

从此次阿维塔的回应能够看出,阿维塔并没有说已经完成了-50℃的极寒测试,而是表达创新基地和车辆投入使用并开始测试的意思。

随后,阿维塔 12 将在南极持续度过 16 个月的时间,历经南极不同季节,届时,阿维塔 12 将会直面南极-50℃的极寒测试。(来源:快科技)

 

俞敏洪敲定东方甄选接班人

据第一财经,12 月 24 日,东方甄选方面向第一财经确认:俞敏洪已敲定东方甄选接班人,由新东方教育科技集团副总裁孙进担任东方甄选执行总裁。

此前,东方甄选 CEO 由孙东旭担任。

2019 年起,孙东旭开始担任新东方在线的 CEO 和董事。2023 年年底因为和董宇辉有关的「小作文事件」,东方甄选在其抖音号发布公告,经东方甄选董事会决定,董事长俞敏洪兼任东方甄选 CEO 职务,免去孙东旭的东方甄选执行董事、CEO 职务。

今年 11 月,俞敏洪发文确认,前东方甄选 CEO 孙东旭因个人原因离职,这一消息引发了市场对东方甄选「接班人」的猜想。

公开信息显示,孙进于 2006 年加入新东方,为新东方教育科技集团副总裁、广州学校校长。(来源:虎嗅网)

 

库克 20 年首次自掏腰包买入耐克股票

苹果公司首席执行官 Tim Cook 于本周二向美国证券交易委员会(SEC)提交文件,披露其斥资约 295 万美元购入 50000 股耐克股票。

作为资深耐克董事会成员,库克此次增持后,其持有的耐克股份按周二收盘价计算,总市值大约达到 604 万美元。

耐克目前的处境并不乐观,其股价较 2021 年 11 月创下的 166.19 美元历史高点已累计下跌了 65.49%。为扭转颓势,耐克正处于转型的关键期。

科技媒体 benzinga 指出,这笔交易具有特殊的标志性意义。虽然库克自 2005 年起便一直担任耐克董事会成员,并在过去二十年间通过股权激励获得过价值约 17.9 万美元的股票奖励,但这却是他首次在公开市场上动用私人资金买入自家公司股票。这种打破常规的举动,通常被视为内部人士对公司未来价值极度认可的强烈信号。(来源:IT之家)

微信公众号上线「付费加热」功能

12 月 24 日,微信公众号正式推出「付费加热」功能,创作者可通过公众号后台的「广告与服务」板块进入功能页面,借助付费推广提升内容触达与粉丝增长。

据了解,该功能采用微信豆作为支付媒介,1 元可兑换 10 个微信豆,最低充值门槛为 50 元,充值后未使用的微信豆支持申请退还。创作者可自主设定投放金额、定向人群及推广时长,灵活控制推广节奏。

从投入产出数据来看,以 500 个微信豆(对应 50 元)为例,预计可带来 125-500 次新增阅读,单次阅读成本约 0.1-0.4 元;若选择「新增关注」推广目标,500 个微信豆可新增 4-10 个粉丝,单粉获取成本估算为 5-12.5 元。(来源:TechWeb)

 

小米 17 Ultra 徕卡版外观曝光

12 月 24 日,小米手机官方发布视频,首次公布了 17 Ultra 徕卡版机型的外观,并确认徕卡小红标将铭刻在新机的机身上。

从官方公布的真机细节来看,小米 17 Ultra 徕卡版的核心辨识度亮点当属镜头模组旁的红色徕卡 “可乐标”。在摄影圈,这个小红标堪称专业光学的代名词,此前徕卡虽与多个手机品牌有过合作,但从未开放过可乐标授权,

除此之外,新机镜头外圈还设计了复古质感满满的「大师变焦环」,目前官方尚未明确其是否具备实际变焦功能(来源:泡泡网)

 

阿里升级新一代语音模型 Qwen3-TTS

12 月 24 日,阿里升级语音模型家族 Qwen3-TTS,发布音色创造 Qwen3-TTS-VD(VoiceDesign)和音色克隆 Qwen3-TTS-VC(VoiceClone)两款全新模型,在生成效果上表现显著超越 GPT-4o。

官方介绍,Qwen3-TTS 新模型可实现 DIY 声音设计和像素级音色模仿,甚至让动物「原生」开口说人话,音色自然、效果稳定、生成高效,可大大加速语音大模型在有声小说、AI 漫剧、影视配音等多专业领域落地。(来源:雷锋网)

本吉奥:如果想让 AI 给出更真实的回复,不妨先对它说点谎

据《商业内幕》报道,研究科学家约书亚·本吉奥在一档播客节目中提到,AI 聊天机器人在评价研究想法时往往并不可靠,因为系统几乎只会说好话。

本吉奥说,自己真正想要的是直言不讳的建议和真实反馈,但由于 AI 存在明显的讨好倾向,结果反而变成了迎合用户的「谎言」。后来,自己索性改变方法,把个人想法伪装成同事的观点,来「对 AI 撒谎」,结果反而得到了更加坦率的回应。「如果系统知道提问者是本人,就会刻意想要取悦我。」

作为蒙特利尔大学计算机科学与运筹学系教授,本吉奥与杰弗里·辛顿、杨立昆齐名,被视为「AI 教父」之一。本吉奥在 6 月宣布成立 AI 安全研究非营利组织 LawZero,目标是减少前沿 AI 模型可能带来的危险行为,包括说谎和作弊。

本吉奥认为,讨好用户本身就是一种对齐失败(misalignment),「我们并不希望 AI 具备这种特性」。AI 不断给出正面反馈,可能会让用户对此类技术产生情感依赖,从而引发新的问题。(来源:IT之家)

 

浏览量: 2

对科技圈,小红书是个「新绿洲」

作者|张鹏

编辑| 连冉

我最近意识到,自己刷小红书的时间越来越多了,而且,原因很奇特:

我竟然是去刷科技动态和找创新产品的!

没错,虽然我有很多内容渠道和自己写的 Agent 可以做这些事,包括极客公园整个编辑部、社区团队、投资团队都在帮我做这件事,甚至连我的抖音都被自己「调教」为科技频道了,但是我统计了下我的小红书使用时长,今年上升最明显。

我仔细想了想,可能是因为小红书上有种比较独特的「人间视角」,看着许多真实的人在科技话题上「自然涌现」的讨论,和彼此间的「吵吵闹闹」,似乎能更好的支持自己一些更具体的「直觉感知」。

我甚至觉得,对于科技圈来说,过去大家觉得主要是为了「吃喝玩乐」的小红书,如今正在有一种「新绿洲」的即视感。

这个感觉不好一句说清,不妨写一篇出来看看大家是不是也有所共鸣吧。

 

01

从科技内容的「夜市烟火气」开始

 

不知道大家是否和我一样,在过去几年的 AI 浪潮里,因为要疯狂学习和跟上时代,阅读了大量科技内容,但逐渐也时不时会有一个厌倦感,有时候会感觉我们在谈论科技、商业资讯的时候,是不是在消费一种「工业快餐」?

因为 AI 热潮,也因为运用上 AI 能力,科技内容的生产流程已经有点高度标准化了——把类似论文成果和跑分成果、还有 ARR 和融资额、以及新出现行业术语这些内容打包,高效地生产后把信息填进读者的脑子里。

这种内容确实能「管饱」,解决你获取资讯的需求,但说实话,也带着一种因为信息过载而产生的焦虑感——根本读不完,但好像你不读你就要被时代抛弃了。

但我发现在小红书这样的社区里,科技内容的消费模式正在发生一些改变,如果说传统资讯是标准化的「快餐店」,那么现在的社区生态更像是一个喧闹、鲜活的「人间夜市」。

在这个「夜市」里,流量的逻辑变了,内容的逻辑也变了。这里的博主和开发者,正在做一件很有价值的事情——圈点和翻译。

或者更准确的说是:去中心化的编辑+跨世界观的翻译,也就是他们的选择和筛选,加上他们的跨世界观表达,去「降维」了那些晦涩的技术概念,甚至把技术变成立即马上的直观体验。

举个今年我印象比较深刻的例子。今年 AI 圈的核心一直在讲大模型的 Context(上下文)工程和 Agent 能力,显然是个非常重要的概念。

但我最近对这个概念印象深刻的圈点,反而是在小红书上看到的。有博主把其他平台上一位技术人对 Agent 相关的上下文问题和工作流问题的解读,在小红书上发了出来,这里面确实对技术概念做了很好的抽象,但更精彩的还在评论区——有人进一步将这些逻辑抽象,提炼为「来龙去脉」问题:

「来龙(context,背景信息、数据),去脉(workflow,任务指令/目标/路径),要思考两者在不同清晰度情况下该如何设计业务」。你看,这种来自真实用户的「神总结」,带来的启发是非常独特的,这个概念感觉一下子就鲜活通透了,有时候即便刚看完万字长文,也一样需要这种提纲挈领的。

再比如,大模型的生成能力,我们熟悉的是用来做分析,写文档。但在小红书上,它演变成了「小猫文学」——用户用 AI 模仿猫的口吻写日记、搞怪。甚至有人把 AI 调教成了「完美男友」或「人生导师」,这里面的技术或许谈不上多高深,但只要看看底下的评论,你对这个世界的「分辨率」依然会因此提升:你会看到用户眼里的 AI 是什么样,以及他们究竟需要什么样的 AI。 科技的解释权和方向感,同样需要来自那些能把「技术」翻译成「生活体感」的人。

另一个很直观的感受来自于已经举办 16 年的极客公园创新大会(GeekPark IF)。以前大会结束后我们最关心的是后续传播的阅读量、全网的分发报道数据。这很好理解,极客公园团队把自己一年对科技圈的判断理解做成一个「贺岁片」似的大会内容,当然特别希望看到这些努力的意义。

但从 2 年前我们开始邀请小红书一起参与 IF 大会,我每年都更加能从小红书上感受到,认真做一场科技大会是值得的。

比如今年我自己的小红书信息流里,就刷到了上百篇参会者发认真分享的 IF 大会的笔记。他们自己的视角和观点,他们的眼睛里看到的大会里那些具体的收获,是「原生」的、没有修饰的分享,它是如此的「真实而具体」,它能让你看到极客公园团队努力创造的东西,也真的有「真实而具体」的意义。

还有一个比较让我印象深刻的是小红书上强烈的「活人感」。就像你家旁边的夜市大排档还蕴含着「和有趣老板聊几句的乐趣」。你光顾一个摊位,往往不只是因为东西好吃,可能也是因为这个摊主是个「熟人」。

今年小红书发起的 AMA (Ask Me Anything) 活动就挺典型的,不少科技圈的大咖和创业者都参与了这个直接回答用户提问的活动。体验了科技圈内「坐而论道」之外的沟通方式。

在前段时间在极客公园创新大会 2026 的一场沙龙上,散兵(小红书科技运营负责人)提到一个细节,最初这些创业者和学者是很「i」的,过去不知道怎么社交,习惯的是用产品和思想征服世界,但 AMA 这种形式让他们发现,原来大众喜欢的是平等的对话,而对话本身就有意义。

在这个过程中,信息的密度可能不如一篇万字研报,但连接的强度和愉悦感是前所未有的。对此我深有感触,在参与 AMA 时,我发现大量提问都聚焦于创业起步期的核心认知——如何验证 PMF、如何实现增长、如何理解早期融资……

当你针对这些具体的困惑给出解答,你能清晰地感知到这对屏幕那头的人是真实有用的。这种传递认知与经验的过程,让意义变得无比「具体」。

以前写篇文章觉得自己能「帮所有人」,但其实你也不知道他是谁,他在哪里?但当你感受到真的帮到一个具体的人,这种「具体的意义」,就很开心。

这个「具体」还是来自于小红书上活跃着大量充满好奇、在生活中使用科技的普通人。 「活人感」也是小红书的底色之一——毕竟是 一个由真实需求交织而成的 UGC 生态。

当真实的人和具体的需求在这里高度聚集时,它改变的就不止是内容的消费模式,也深刻地重构了产品创造的逻辑。

 

02

当创业者在「街区」Build in Public

 

既然我们厘清了这里的底层「土壤」——海量的、带着具体需求的「人」,那么对于创业者,尤其是 AI 时代的超级个体来说,选择在哪里「出生」,逻辑也就开始变得不同了。

我有一个观察:传统的流量平台像是一个巨大的「公共广场」,而小红书像是一个充满左邻右舍的「街区」。

为什么会有这种差别?

有一个 Panel 里提到的细节,让我印象很深。在 2024 年初 AI 浪潮刚来袭时,面对技术圈一天一个样的迭代,小红书做了一个反直觉的判断: 追逐最新的资讯意义不大,因为技术迭代太快了; 「 科技里的人 」 ,才是最关键的。

所以,他们当时没有盯着技术参数,而是去放大了那些「普通人与 AI 的真实交互」——比如我们前面提到的 AI 恋爱、DeepSeek 玩法等等。

所以有了这些普通人脑洞大开的参与,有了前面说的那个喧闹的「夜市」。

而这个「夜市」里涌动的、最真实具体的「人味儿」和需求,也恰恰反哺了最核心的科技圈层,帮助「拆掉了」那堵技术走向大众的墙。

这就解释了为什么小红书会成为一个「科技街区」:

在广场上,你需要声量,需要拿着大喇叭喊,周围充斥着辩论、站队和噪音。但在街区里,你是邻居。邻居之间不谈宏大叙事,谈的是「这东西好不好用」、「能不能帮我解决这个问题」。这种场域属性的差异,直接决定了创业逻辑的根本性扭转。

过去做产品,创业者习惯「憋大招」。关起门来开发 1 年,然后开一场发布会,希望征服市场能买单。但在 AI 时代,有一种新的创业显学,叫 Build in Public(在公众面前构建)。

最近我在小红书上看到一个非常有意思的现象:营销正在变得极度前置。散兵在 panel 上说,现在很多开发者,产品还没写一行代码,甚至只是有一个 Idea,就敢发笔记出来「口嗨」。

这在以前叫「画饼」,但在今天的「街区」逻辑里,这叫低成本验证(MVP)。

Plan Coach 的开发者苏晓江|图片来源:极客公园

 

Plan Coach 的开发者苏晓江(机器猫),是一个独立开发者,而在做 Plan Coach 之前,他本来是一个技术主管,想做个产品治治自己的拖延症。然后他没有选择闷头写代码,而是先把「站起来去洗碗」这个痛点拆解成笔记在小红书上发了出来。结果一天之内,3000 多个陌生人给他点赞。

这 3000 个赞是什么?是需求,是信心,更是第一批种子用户。它说明只要你的产品足够 Amazing,能解决「邻居们」的具体问题,它就会被看到。

在「街区」里创业,还有很合理的一点在于反馈的及时性和颗粒度。

陈锴杰(Macaron AI 创始人)在同一场 panel 上分享过一个细节。他们在设计产品时,纠结了三天三夜要不要用粉红色。结果发到小红书上一看,用户不仅不反感,反而因为这个配色觉得「真香」。

更夸张的是,前面提到的苏晓江收到了 1000 多条用户反馈,这些用户是真的把自己当成了「精神股东」。他们会催更、会投票决定下一个功能做什么,甚至会因为开发者采纳了自己的建议而兴奋不已。

(Plan coach 在小红书上请用户投票新功能)

 

这种关系不再是冷冰冰的「开发者-用户」,而是有点变成了一种「养成系」的共生关系。用户看着产品从 0 到 1 长大,他们对产品的包容度和忠诚度,是那些靠买量砸出来的用户完全无法比拟的。

为什么这些看似微小的、垂直的「超级个体」能在小红书上活下来,甚至活得很好?因为 AI 能力实际上提升了商业世界的「分辨率」。

在传统互联网时代,为了覆盖开发成本,我们必须做几千万日活的「大产品」,必须去满足「最大公约数」的需求。但在 AI 时代,生产要素变便宜了,开发的门槛被空前拉低了。

这就意味着,我们可以把镜头拉得更「微距」,去服务那些曾经被视为「太小」、「太碎」的需求。

在 Macaron AI 上,我看到了 20 万个千奇百怪的小应用。其中有一个应用,专门用来记录「拉屎」。听起来是不是很荒诞?但这恰恰证明了世界的丰富性。在小红书这个「街区」里,哪怕你只服务 1 万人的垂直需求,只要你真的做到了,做好了,你也能找到这 1 万个「邻居」。

这里有足够真实的用户需求,有足够强烈的反馈机制。在这个时代,「流量」只会越来越昂贵,因为流量是平台的;但「共鸣」是免费的,因为那是开发者可以用自己的世界观、审美和能力换来的。

所以对于提升商业世界分辨率的独立开发者来说,这 1 万个精准用户提供的商业价值和逻辑自洽,更符合创新的本质——从解决问题开始。

我想这也是为什么在小红书,能看到许多 年轻的创业者,在小红书上完成了「从 0 到 1 再到 100」的蜕变。他们起初可能只是作为一个独立开发者,做出了一些初创产品,然后在社区里验证了想法,拿到了融资——像 Flowith 这样在小红书一路成长起来的案例,正在变得越来越多。

创业需要依托创新,创新需要从创造开始,而创造的起点,是解决你足够理解的,「具体而有意义」的问题。

过去十年,移动互联网教会了我们太多的「商业公式」。创业需要回归「创造」的本质。在小红书上,我看到很多开发者不再是为了「我们要切入一个百亿赛道」而出发,而是因为「我想解决一个让自己抓狂的小问题」或者「我想表达一种审美」。

作为一个创造的起点,这可能就足够了。很多了不起的人和事情,往往就是这样开始的。

浏览量: 2

深势科技完成超 8 亿元融资:AI for Science 如何叩开资本与产业的大门

一则融资消息,在深冬的创投圈激起了超出寻常的涟漪。近日,AI for Science(人工智能驱动的科学研究)领域的标杆企业深势科技宣布完成总额超 8 亿元人民币的 C 轮融资。这份出资方名单颇具份量:达晨财智、京国瑞基金、北京市人工智能产业投资基金、北京市医药健康产业投资基金、联想创投、元禾璞华等机构共同押注。这并非简单的资金输送,而是一次凝结了国有资本意志、产业资本眼光与财务资本信心的战略合围。它清晰地传递出一个信号:AI for Science 已从一个前沿的交叉学科概念,跃升为被主流资本市场系统性认可的战略性投资赛道,而深势科技,正站在这个风口的核心。

此次融资被定义为深势科技发展历程中的「重要里程碑」,其意义远超过金额本身。它发生在全球 AI for Science 进入规模化应用「快车道」的宏观背景下,是资本市场用真金白银对一家中国科技公司技术路径、商业化潜能及长期统治力的集中投票。在资本趋于谨慎的周期中,如此规模的多方联合注资,无疑为整个赛道注入了一剂强心针,也促使市场重新审视:AI for Science 的变现逻辑与价值闭环,究竟走到了哪一步?

政策的东风早已为这场变革铺平了跑道。从国家层面《新一代人工智能发展规划》的顶层设计,到六部委推动场景创新的指导意见,再到科技部专项部署明确将 AI for Science 视为「未来五年关键窗口期」,直至 2025 年国务院将「人工智能+科学技术」列为重点行动方向,一套多层次、连续性的政策框架已然成型。这不仅是方向指引,更是资源与信心的保障,为像深势科技这样的先行者提供了丰沃的土壤和清晰的时代脚本。

与此同时,资本市场的叙事逻辑也在发生深刻转向。投资视角正从追逐单点技术突破的「战术机会」,演变为布局下一代科研与工业基础设施的「战略配置」。科学大模型、智能科研平台、自动化实验系统,这些要素不再被视作孤立的工具,它们共同构成了未来十年乃至更长时间内,驱动生物医药、新能源、新材料等关键行业研发范式革命的「新底座」。深势科技此番汇聚的,正是深切理解这一趋势的长期资本,它们的入场,意味着 AI for Science 的投资正走向成熟与深化。

深势科技凭什么能赢得如此青睐?答案在于其构建的、难以被复制的「科学发现智能引擎」全栈能力。这家公司从不将自己定位为简单的软件服务商,其野心在于打造能够自主进行科学发现的「AI 科学家」系统。这要求它必须从底层颠覆传统的科研「手工作坊」模式。

其硬核实力首先体现在自主可控的「深势·宇知®」科学大模型体系上。这套与国际一流水平对标的模型,是公司将众多学科从「实验试错/计算机模拟」带入「预训练模型时代」的基石,赋予了机器理解、推理和预测复杂科学问题的通用能力。在此之上,深势科技做了一件至关重要且困难的事:将尖端能力转化为覆盖科研「读、算、做」全流程的标准化产品与解决方案。据官方透露,「深势·宇知®」科学大模型体系现已全面升级为科学发现智能引擎——以科学智能体为驱动,贯通「读—算—做」闭环,面向 AI4S 场景构建通往人类未知知识的最短路径。

科研人员可以通过「玻尔·科学导航」,获得集知识、算力与模型于一体的智能工作入口,目前已整合超过 1.7 亿篇高质量英文文献、超过 2 亿篇专利和 8000 万篇中文文献知识内容。「玻尔·智能计算」则集成了千余个基于原子、分子、基因、蛋白等方向 AI4S 大模型构建的垂类应用模型;药物研发团队能够依托「玻尔·智能计算」的 Hermite®平台和 RiDYMO®平台,系统性完成从靶点发现到分子优化的计算设计;能源材料领域的企业则能在「玻尔·智能计算」的 Piloteye®和玄铸平台上,加速电池电解液、正负极材料的设计验证循环。「玻尔·赛博实验室」的 Uni-Lab OS 智能实验室操作系统正致力于将纷繁复杂的实验设备统一管控,为「机器实验员」的登场搭建舞台,目前已整合接入百余款高频使用的实验仪器。而串联这一切的,是像 SciMaster 这样的通用科研智能体,以及深入生命科学、物质科学领域的 PharmMaster、MatMaster 等垂直领域「AI 科学家」,它们旨在理解问题、生成假设并调度资源完成任务验证。而底层支撑这一切的,是深势科技打造的面向科学智能的跨「云」、「端」、「超」统一算力调度平台——「玻尔·勒贝格智算」。

这套从底层大模型、中层专业化平台到上层智能体应用的完整技术栈,构成了深势科技坚固的竞争壁垒。它并非功能拼盘,而是一个有机协同的系统,其终极目标是显著缩短从科学问题提出到获得可验证答案的周期,将科研与工业研发的效率提升一个数量级。

技术优势必须经由商业变现的淬炼,才能转化为真实的估值与增长。深势科技的商业化路径呈现出清晰的「双轮驱动」特征:一方面,通过标准化、云化的 SaaS 平台(如 Bohrium®、Hermite®)实现快速的市场扩张与规模收入;另一方面,针对创新药、新能源材料等行业的头部客户,提供深度融合其研发流程的定制化解决方案(如 RiDYMO®、Piloteye®),从而切入价值量最高的核心环节,建立深度绑定的合作关系。

这种模式正在引发产业端的深刻共鸣。行业领导者们不再满足于仅仅采购工具,而是以「共建者」身份,与深势科技共同打磨面向未来的智能研发平台。这种从「用户」到「伙伴」的关系升级,意味着深势科技的产品已深度嵌入客户的价值创造链条,其商业化潜力从「提升效率」的工具价值,升维至「重构研发体系」和建立「研发共同体」的战略价值。本轮融资中多家具有深厚产业背景的基金入局,正是对这种价值潜力的最强背书。

完成此轮融资后,深势科技的航向愈加明确。资金将用于持续吸引全球顶尖的交叉学科人才,这是该领域最核心的资产;同时,用于「科学发现智能引擎」的迭代升级,进一步夯实从算法原始创新到行业解决方案的全栈能力。市场期待看到,在充沛资本的支持下,深势科技能在基础科研、生命科学、物质科学等已建立优势的领域,更快实现规模化应用,并将已验证的范式复制到更广阔的基础科学和工业研发场景中。

展望未来,深势科技的成长故事将与两大趋势深度交织:一是全球范围内以 AI 重构科学发现范式的不可逆进程,二是中国在战略科技领域自主创新、打造高端科研基础设施的迫切需求。它面对的,是一个由前沿技术、国家战略、产业升级与长期资本共同绘就的宏大蓝图。此次 8 亿元融资,是一个里程碑,更是一个新的起跑信号。它标志着深势科技已经从技术的开拓者,成长为生态的构建者和标准的定义者。在这条通向「AI 科学家」梦想的道路上,资本的加持让它的步伐更加稳健有力,而它的一举一动,也将持续定义 AI for Science 这条黄金赛道的宽度与深度。

浏览量: 1

这款硬刚 nano banana 的 AI 生图 Agent,凭什么让数万人每天都用?|AI 上新

作者| 金光浩

编辑| 靖宇

我的设计师朋友,上周甩给我一份文档:

「你不是天天吹 nanobanana-pro 吗?来,用它给我做一张这个。」

那是一张招聘海报的需求,密密麻麻全是文字。

我沉默了。

最近刷小红书,满屏都是 nanobanana-pro 生成的图:逻辑和视觉确实强,随便一张都像专家写的知识卡片,以及精修过的商业摄影。

但它强归强,问题也比较明显。

强如 nanobanana-pro 的文生图模型,面临我朋友给的这种「强文本、强结构、强排版」的需求时,基本束手无策。

做到 60 分可以,但要达到 80 分,你要么就是反复抽卡一小时,要么就是对着一张图按照你想要的效果跟大模型描述一下午。

我一直在找能解决这个问题的工具。

直到前阵子,我发现了一款叫 Seede AI 的产品。

Seede AI 主页|图片来源:Seede AI

 

它没有去卷「视觉设计」,而是走了一条完全不同的路。

这一周体验下来,我的感受是:

这东西可能不是在发挥创意「画图」,而是在对内容进行「排版」设计,这是两件完全不同的事。


 

栏目作者召集

极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!

现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例: 一码难求的动画 Agent 导演,离「疯狂动物城」还有多远?|AI 上新 ) 向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。

同时, 优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。

AGI 太久,只争朝夕,让一部分人先 AI 起来吧! 投稿、进群请扫描下方二维码添加极客小助手微信


 

01

让 AI 真正懂「排版」设计

 

第一次点进去,看到 Seede AI 公开展示的长图,真有点不像 AI 做的。

我甚至产生了一个大胆的怀疑。

该不会跟某款海外产品一样,AI 背后藏着真人吧。

Seede AI 主页的公开长图|图片来源:Seede AI

 

为了验证这个猜测,我决定直接用真实需求测试。

我没有用官方的 Demo,而是直接让 AI 生成了一段非常典型枯燥的企业招聘文案。

这种东西是所有设计师的噩梦:字多、层级杂、还得马上就要。

我把下面这段文字原封不动粘贴进去,没加任何风格描述,想看看它能做成什么样。

操作简单到让我有点意外。

大概过了 40 秒,屏幕直接渲染出了一套完整的海报方案。

这张图让我意外的有几个细节:

1、层级完全正确,「校园招聘」是最大的标题,「招聘岗位」是二级标题,具体的岗位变成了列表项。

2、语义理解精准,它自动给「薪资」、「保险」这些福利条款前面加上了勾选图标,而且给「北京/上海/深圳」配上了定位图标。

3、审美过关,不是那种 PPT 默认模板的土味,而是那种你在 Behance 上能看到的、经过专业排版的商业设计。配色舒服,留白得当。

4、当然缺点也很明显:有个装饰元素挡住了中间的公司介绍的文字。

我对这一次使用的整体评价是这样的:

Seede AI 出来的是一个拿去就能用的 80 分作品,而且花了我不到一块钱,确实能接受。

当然,如果让我直接做,可能是一个 45 分的作品。

Seede AI 的编辑器|图片来源:Seede AI

 

 

02

不是生图,而是可编辑的「源文件」

 

如果只是生成一张图,那它和 nanobanana-pro 区别也不大。

但当我把鼠标移上去时,我发现: 图上所有的元素都是可编辑的。

任意部分都可编辑,包括刚刚生成的有问题的地方!

这不像是生图啊,像是直接给我生成了一个矢量工程文件!

有点像爱情,当产生了意外,就产生了喜欢,刚刚的怀疑也随之烟消云散。

我把刚刚那个有问题的地方往下拉了一下,就好了。

当产生了喜欢,与之而来的,就是会产生兴趣。

Seede AI 对生成内容的二次编辑效果|图片来源:Seede AI

 

因为,这在 nanobanana-pro 里是绝对不可能实现的。

用 nanobanana-pro,图生成了就是「死」的。

改一个字?整张图的风格可能都跟着变。

可能编辑「这件小事」,看起来是个小细节。

但,对于真正要用这东西干活和工作的人来说,这是最重要的。

我好像明白为什么这款产品吸引到那么多用户每天在用了。

同样提示词,生成简历的效果图|图片来源:Seede AI(左)、nanobanana-pro(右)

 

我顺手算了一笔账,结果挺有意思:

1、使用 nanobanana-pro 的成本:

即刻上有位博主花了 587 块钱,评测了 686 张图,他认为其成片率大概在 61% 左右。

假设我要做这张海报,我需要先生成底图,再用其他工具加字。如果不满意底图,按现在模型约 1 元/张 的成本,我可能要抽卡 5-10 次才能找到满意的构图。

综合成本:10-20 元 + 至少 30 分钟(包含后期 PS 时间)+ 反复试错的时间+因为调试不满意被气到想砸键盘的精神损失费。

2、使用 Seede AI 的成本:

单次生成成本约为 0.5-1 元(每日有免费积分)。因为它不是在那「猜」像素,而是用代码在「排」版,所以文字准确率几乎是 100%。

综合成本:0.5 元 + 1 分钟 + 即时修改的灵活性+帮我省时间且不贵的情绪价值。

3、结论

对于一家需要每天发 50 张商品详情图的电商公司,或者每天要发 10 条干货卡片的自媒体,这其中的效率差距,差的不是几倍,是一整个量级。

算完这笔账,我开始好奇一个问题:它到底是怎么做到的?

 

03

设计界的 NoteBookLLM

 

我开始想一个问题:这玩意儿和 Canva 有什么不一样?

市面上并不是没有类似产品,Canva 早就做了「一键设计」。

但 Seede AI 给我的感觉完全不同。

Canva 的逻辑是「模板匹配」。你输入内容,它在后台几十万个模板里找一个最像的,把字填进去。这就导致如果你字数太多,或者结构太怪,模板就会崩坏,文字会溢出,排版会错位。

我带着好奇去请教了 Seede AI 联合创始人 Muji,他跟我分享了他们内容优先的产品理念:content in(内容进),design out(设计出)。

确实如此。

说白了,Canva 是给你一堆成品让你挑,Seede AI 是你给它原材料,它现场给你做。

有点像「选商品」跟「做定制产品」的区别那味。

Seede AI 的底层逻辑更像是一个懂设计的 AI 程序员。

如果你用过 Google 的 NotebookLM,知道它能把 PDF 一键变成播客/PPT,你大概就能理解 Seede AI 在做什么了。

它没有存储无数个写死的模板,那会限制用户的想象力和需求场景。

它是通过集成 Gemini3 等一众国际顶尖大模型去理解你的文本结构:

哪句是重点?这段话的情绪是严肃还是活泼?这是个列表还是段落?

输入论文 PDF、Seede AI 生成的 PPT 效果图|图片来源:Seede AI

 

理解之后,它现场写代码。

它用代码去控制布局、配色、字号、间距。

这就像 NoteBookLLM 把文档变成播客一样,Seede AI 是把文档直接「翻译」成了设计稿。

不同场景,同一个逻辑。你只管内容,它负责排版:

对自媒体来说,写好脚本直接生成小红书卡片;对电商运营,产品参数能直接变成详情页;对 HR,JD 贴进去就能出招聘海报。

这种「内容优先」的逻辑,实实在在地改变了设计工作流:原本是「人适应模板」,现在是「设计适应内容」。

 

04

给普通人的设计杠杆

 

从商业角度看,这家公司的打法有几点挺有意思。

1、这家公司有个聪明的地方:它不自己训模型。

很多 AI 创业公司死得惨,是因为跟模型厂商硬刚,你今天优化的问题,人家下个版本就解决了。

Seede AI 很聪明。它没有去训练一个比 nanobanana-pro 更牛的生图模型。

相反,它整合了所有最强的模型。

模型能力越强(比如 Deepseek 的逻辑能力提升,Gemini 的多模态能力提升),Seede AI 就越好用。

它解决的是模型厂商看不上但用户极其痛苦的「最后一公里」问题:排版和交付。

这是个讨巧但有效的生态位:即使模型进化了,赛道依然存在的护城河。

2、便宜才是硬道理

nanobanana-pro 商业化难在哪?贵,慢。

而 Seede AI 把原本人工设计一张图需要 50-500 元的成本,压到了最低 0.5 元。

当价格下降 100 倍时,需求就会爆发。

以前小老板为了省钱,可能直接用 Word 截图发朋友圈。

现在 5 毛钱能做一张专业海报,他一定会用。

这就是把非消费用户转化为了消费用户。

3、它的积分机制设计得很智慧:免费的才是最贵的

绝大多数 AI 产品,免费试用完了就没了,用户流失率极高。

但 Seede AI 做了一个选择题:你想免费用吗?

可以,但你的作品必须公开到社区。

Seede AI 主页的公开社交媒体图文图|图片来源:Seede AI

 

这意味着什么?

这意味着每一个想「白嫖」的用户,都成了 Seede AI 的数据贡献者和模板生产者。

用户为了用 AI,贡献了自己的文案创意和 AI 生成的精美排版。这些公开的作品,反过来又丰富了社区的内容库,吸引了更多新人。

如果你是公司机密,不想公开?没问题,请付费。

这是个挺智慧的商业闭环:免费用户提供数据和生态,付费用户提供现金流。

当然,它也不是万能的。

在测试过程中,我还是发现 Seede AI 还有些不完善的地方

1、专业有余,惊喜不足

它的设计非常规范,规范得有点像流水线出来的东西。

如果你需要的是那种偏视觉画面感的,极具艺术冲击力、打破常规、天马行空的创意海报,nanobanana-pro 更适合,Seede AI 目前还做不到。

它更适合商业、信息传达类的场景,也就是那些本身就有明确内容结构的需求。

2. 复杂的合成能力依然是短板

虽然它接入了 nanobanana-pro 级别的生图模型,但在「图文融合」上,目前这个版本还不太行。

比如你想让文字像藤蔓一样缠绕在产品上,或者做一个复杂的 3D 场景合成,Seede AI 目前的「图层叠加」逻辑还是太简单了,这部分还得靠 PS。

 

05

AI 创业的第一性原理

是找到自己的生态位

 

前段时间,MiniMax 的创始人在罗永浩的播客里分享了一个观点:

AI 正在赋能两个大方向,一个是内容创作,一个是代码生成。

这个观察很准确。我们看到:

1、一键出代码的产品越来越多,Cursor、Windsurf、Antigravity 层出不穷。

2、一键出文案的产品在不同方向开始发力,从豆包、星月写作、到 GetDraft、创伴等多种垂直写作工具。

3、一键出播客的产品不断迭代,NotebookLM 、Listenhub 做到了。

4、一键出视频的产品随着 Sora2 的发布开始涌现,OiiOii、flova、medeo、到最近的通义万相 2.6。

当模型能力足够强,AI 创业的核心问题就变成了:如何找到自己的赛道?

Seede AI 给出的答案是: 不要试图在通用能力上跟大厂竞争,而是找到一个垂直场景,用自己的行业 Know How,把 AI 能力包装成用户真正需要的产品。

它没有做一个「更好的图像生成模型」,而是做了一个「让普通人也能做出专业设计的工具」。

这个思路,对于所有想在 AI 时代创业的人来说,都有借鉴意义。

Seede AI 主页的公开活动海报图|图片来源:Seede AI

 

 

06

结论

 

所以,为什么一个不做图像生成的产品,在设计场景里反而比 nanobanana-pro 更好用?

答案不是「技术」,而是「定位」。

nanobanana-pro 这类 AI 生图产品在做的是「AI 艺术家」,帮你把想象变成画面。

Seede AI 在做的是「AI 排版师」,帮你把内容变成设计。

它们解决的是不同的问题,服务的是不同的用户。

在模型能力趋同的今天,「我解决什么问题」可能比「我技术多强」更重要。

对于那些有内容、缺设计的人来说,这可能才是他们真正需要的 AI 工具。

至于我那个设计师朋友?

我把 Seede AI 生成的招聘海报甩回给他。

他沉默了三秒,回了一句:「行吧,以后简单的需求你自己做。」

不知道该高兴还是心疼他。

浏览量: 2

背靠通义大模型,这家阿里系公司正在重写体育场馆新的「定价公式」

最近,不止一个朋友在跟我聊起网球时,都推荐了他们身边的「乐动力」球场。

在他们的讲述中,除了选场地时大家最在意的距离、价格这两个传统因素之外,「乐动力」球场还可以在打完球之后直接生成赛后个人集锦。这成为了吸引大家订场的第三大决定因素。

老实说,听到这些描述的时候,我的第一反应是:这大概率是一个「good-to-have」的附加功能——就像两年前人们在买车时,讨论智能辅助驾驶一样,应该是一个听起来很酷,但未必完全好用和实用的功能。

但是,当我在小红书上查看了相关笔记,并在线下亲自打卡之后,我发现这套叫做「橙狮慧影 Smartshot」的方案,除了「出片」之外,竟然还可以提供包括击球落点、球速、跑动距离等一系列运动数据。

而我不用佩戴任何单独的采集设备,甚至现阶段居然不需要在场地费之外,再单独为这套服务付一分钱。

 

一个免费的「网球私教」

从「Good-to-have」变成「Must-have」,往往只隔着一层窗户纸:能否击中用户最隐秘的刚需。

Smartshot 的聪明之处在于,它同时扮演了球场上最稀缺的两个角色:一个随叫随到的「专属摄影师」,和一个从不缺席的「数据分析师」。

首先,它解决了用户最显性的痛点,大幅降低了球场出片的门槛。

以往,想出片要么需要一个很会拍照的搭子,在场边轮休的时候专门负责拍照或录视频;要么就需要自带一个手机支架,提前把电充满,再让它长时间自动录制。这两种方法前者「废人」,后者又受限于低机位+广角布局,很难得到好看的画面。

「Smartshot」提供的解决方案是:提前在场馆顶部安装至少 2 个 4K 高清摄像头,既解放了人手,又可以得到一个类似专业网球比赛里「战术机位」一样的全局视野。

而且,这套系统拍完之后,支持通过 AI 自动生成高光瞬间的切片,基本上打完球之后回家的路上,就可以快速筛选出朋友圈或者小红书素材。再也不需要纠结某个球没有被录下来,或者后期剪视频太麻烦了。

如果说「自动生成集锦」满足了用户外在的社交分享欲,那么对运动数据的深度挖掘,则回应了运动爱好者内在对于「变强」的渴望。

Smartshot 可以提供多种丰富的数据维度 | 图源:橙狮体育

例如,在「训练模式」里,用户可以在训练结束后得到击球落点分布图、平均球速和最高球速、最大击球回合数等数据统计。

除此之外,「Smartshot」还支持通过 AI 智能生成关键动作细节,对于希望纠正击球动作的新手可以起到一些参考作用。

而在「比赛模式」里,这套系统可以自动完成后台计分、出界判断等功能,甚至还支持「在线观看」等功能。对于小范围球友之间的定期切磋,我觉得这是一个非常实用的功能。

此外,基于视频采集和后台计算,「Smartshot」也可以在比赛过程中统计每位球员的击球成功率、正反手击球比例和跑动数据等更高阶数据。

总之,一句话概括就是:无论你是「1.0」的新手,还是「3.0」以上的熟练参与者,这套系统都可以给你提供过往在正式比赛或者运动队专业训练过程中才能得到的数据和影像服务。

 

AI,让大满贯走进日常

但问题来了:把这样一套看起来很「重」的专业服务搬进大众球场,它是如何跨越成本鸿沟的?

这套名为「Smartshot」的系统,中文名为「橙狮慧影」,是由阿里集团旗下的运动科技公司「橙狮体育」(原阿里体育)研发打造的。

实际上,第一代 Smartshot 在 2024 年就已经发布。但真正让它在能力和体验取得大幅提升的变化,来自于 2025 年 4 月,橙狮体育将通义千问开源推理模型 QwQ-32B 接入 Smartshot。

简单来说,接入开源大模型以后,Smartshot 可以算得更快、更准了。

在前 AI 时代里,顶级网球赛事中使用的鹰眼技术重点是「看得准」。所以,赛事方需要在场馆中布置多台高帧率相机(一般是 8-20 台),经过三维重建和即时计算,得到一个无限逼近绝对坐标值的物理结果。

专业的「鹰眼系统」,不仅硬件成本高,安装、操作和维护也需要专业的人力支持 | 图源:视觉中国

而相比物理层面的「绝对坐标」,诞生于 AI 时代的 Smartshot,更强调通过 AI 模型提高「语义理解」的能力。 它的核心逻辑变了:「看」不再是终点,「算」才是灵魂。

Smartshot 标准版,只需要 2 台专业级摄像机相机作为「眼睛」,把收集到信息先在边缘端完成识别,再将一系列结构化数据(例如每个球的落点坐标、速度、轨迹等)打包发送给开源模型,就可以利用模型的能力输出用户需要的数据。而在更高需求的非职业赛事中,应主办方需要,摄像头数量可提升至 6 个,大幅提升定位精准度。

所以,相比赛事级鹰眼提供的高精度「感知智能」,Smartshot 为大众运动提供了另一条利用「认知智能」获取智能化运动服务的新思路。

它的显性优势是:可民用、成本大幅降低。

目前,标准版的 Smartshot 全套定价仅为 61000 元,包含 5 年云服务和软件运维服务,折合一年成本万元出头,较国内外专业场地使用的同类型产品低至少 50%。

并且,对于普通运动参与者来说,这套系统现阶段完全免费开放。

Smartshot 可以在运动中和运动后提供了落点查看与统计功能 | 图源:橙狮体育

我们可以把它视作一种「B2B2C」的商业模型:

  • 橙狮体育基于阿里通义模型能力及云计算服务,提供一整套可复制升级的基础技术
  • 场馆方以相对较低的费用进行布设,作为场馆差异化竞争力的一部分,以期望赢得流量
  • 用户目前可以免费使用这套技术,获得专业化的服务

而对于行业来说,Smartshot 还有一重「隐形优势」:它让过往只可能存在于顶尖赛事的专业系统,变得更易于复制了。

前文提到,以「精准采集」为核心的鹰眼流派,由于各个球场的几何结构不同,所以单次的安装及调试成本很高,很难被标准化复制;而支撑 Smartshot 的,是一套强调通用能力的模型,可复用是这套软件的核心优势。随着 AI 能力上升和用户量提升,这套服务的边际成本有望进一步降低。

目前, Smartshot 已经在全国 150 多个网球场实现了布设。

根据极客公园的了解,除了可以在上述提到的网球场景下被运用在赛事、运动影响、运动分析等多个场景,Smartshot 目前也开始运用在了篮球、匹克球等运动中。

 

全民运动的数字化新时代

如果把视角从 Smartshot 这个产品中拆分开来,我们发现其实这个案例好像也并没有那么复杂:

在技术端,无论是背后的视觉采集,还是开源模型能力,都并非这家公司首创;而在产品端,为用户交付的 AI 高光集锦和运动数据也都是过往通过其他方式可以得到的成熟产品形态。

但橙狮体育的成功之处,恰恰在于它把两者成功地结合了起来。

首先,它巧妙地通过 AI 以及软件端的能力,把一套成本动辄数十万甚至上百万高昂的产品,转化成了万元级可复制的标准化服务,做成了普惠全民健身的赛事基建。

其次,更关键的是,Smartshot 并没有亦步亦趋地照搬「鹰眼」技术——它并不像顶级国际赛事那样强调判罚的准确性,而是针对普通用户最在意的「出片」(运动社交)和「数据」(运动提升)两个需求,包装出了新的功能点,从而得到了一个全新的产品形态。

Smartshot 让普通用户得到以往专业级运动员才拥有的运动体验 | 图源:橙狮体育

其实,关于 Smartshot 背后的「橙狮体育」,关注体育产业的小伙伴们可能会比较熟悉。2015 年,这家公司的前身阿里体育正式成立,当年阿里巴巴取代丰田成为国际足联世俱杯冠名赞助商,马云亲自为梅西队友苏亚雷斯颁奖,背后操盘的正是这家公司。

只不过,在后续的发展过程中,阿里体育并没有继续以顶级赛事赞助营销为主的高举高打路线,而是转向了一条依托数字化、科技智能等为主的发展路线。

截止目前,橙狮体育在全国 22 个省市落地了 75 处线下不同类型的体育场馆(乐动力体育中心),其中包括超大型场馆杭州奥体中心,所以了解用户需求对他们来说,是一种基本功。

极客公园曾在今年 9 月底和橙狮体育 CEO 穆旸有过一次线上交流,他认为比起单纯的「效率提升」,用户更在意 AI 带来的「体验提升」。

他说,AI 和运动的结合,价值一定不会体现在 AI 硬件和降本上,用户真正愿意付费的,是通过 AI 带来的增值服务。

在过去很长一段时间里,我们对于智能体育的理解,往往很容易陷入唯参数论的误区——追求更昂贵的传感器、更极致的精度。但橙狮体育的实践证明,技术的价值不只在于攀登「珠穆朗玛峰」顶端的极限高度,更在于低头看清用户的真实场景,进而填平专业赛场与大众运动之间那道巨大的鸿沟。

所以,Smartshot 的本质,是将大模型的能力封装进真实的场馆场景,从而让冰冷的技术变身为一个更懂球友的 AI 助理。

正如穆旸所言,用户愿意为体验买单。在 AI 硬件寻找落地场景的当下,与其死磕参数,不如像 Smartshot 这样,退一步思考:在一个具体的场景里,技术究竟能让普通人的体验变得有多好?

这或许才是全民运动数字化时代,最该有的样子。

浏览量: 2

MiniMax 港股 IPO 背后:被低估与被错读的中国大模型

作者|Cynthia

编辑| 郑玄

2025 年 12 月 21 日,港交所聆讯后招股书的披露,让 MiniMax 这家一直带着神秘感的 AI 公司,终于摊开了它的全部底牌。

在此之前,市场对它的认知始终处于一种模糊的敬畏中:

一方面,这是全球范围内,为数不多下场做全模态的大模型公司,而且全都做到领先的创业公司;另一方面,作为一家成立仅四年的创业公司,它在不参与大模型行业投流内卷的情况下,就实现了 C 端产品稳定贡献千万美金级别营收,B 端依靠标准的 API 业务,打造利润现金牛。

成立即全球化+爆款产品在手+全模态押注+成立四年就登陆资本市场,重重光环加身, MiniMax 的存在 不可谓不特殊。

那么,这样一个特殊的存在究竟价值几何?回答好这个问题,既是对过去相当长一段时间里中国大模型产业的阶段总结,也为接下来更多中国大模型企业的发展路径,指明了方向。

 

01

MiniMax 招股书背后:

被低估与被错读的

 

要对 MiniMax 价值进行讨论,始终离不开对其财务侧的表现拆解。

事实上,直到 MiniMax 招股书披露前,行业对它的判断始终存在两个偏差:一是低估了其营收的健康度,二是错读了其上市的动机。

先看被低估的营收与利润。 2022 年才成立,2023 年营收就已经达到 346 万美元,2024 年飙升至 3052 万美元,同比增速 782.2%;2025 年前九个月,营收同比增长 174.7%,达到 5344 万美元。

这样的增速,在过去的中国任何行业都是绝无仅有的。但更可怕的是,这一增速,还将继续维持下去。

更值得关注的是市场长期低估了 MiniMax 的经营能力 。随着技术发展,模型的参数连年膨胀,对应的训练数据、算力需求也随之水涨船高,但 2022 年迄今,MiniMax 的亏损率却出现不断收窄的趋势:

MiniMax2023 年、2024 年以及 2025 年前三季度,经调整亏损分别是 8907 万美元、2.44 亿美元、1.7 亿美元及 1.86 亿美元,整体数额虽然有一定上涨,但是与之相伴随的,是 2023 年 346 万美金到 2025 年前三季度 5344 万美元连年高速增长的营收,因而体现在毛利率层面 ,公司毛利从 2023 年的-24.7% 快速转正到 2024 年的 2.2%,并在 2025 年前九个月进一步提升至 23.3%。也就是说,从 2024 年到今年三季度,公司每单位收入对应的亏损额大幅下降了 60% ,进入高质量扩张轨道。

再看被错读的现金流造血能力。

在大模型行业,巨额研发支出是常态,过去几年,OpenAI 累计花费 400-550 亿美元,金额甚至远高于国内几家头部大模型公司的融资额之和,但是技术侧并未出现相较国内一众对手的断崖式领先。因此,当 MiniMax 宣布上市时,市场不乏研发支出过高导致现金流枯竭的猜测。

但招股书的数据打破了这种偏见:我们可以从研发成本、销售成本、现金流三个角度出发来看。

首先是研发成本,MiniMax 四年总研发成本仅有 4.5 亿美金 , 是 OpenAI 的百分之一不到。2025 年前九个月,MiniMax 营收同比增长 174.7% 的同时,研发开支同步仅增长 30%,研发效率处于市场领先水平。

更重要的是,销售及营销开支更同比下降 26%。

要知道同期大厂,仅仅腾讯元宝一季度的投流费用就有十个亿,强度达到 MiniMax 十倍多。这也侧面证明,即便投流强度连年降低 ,MiniMax 也能实现技术突破-口碑爆发-营收增长的正向循环,完成健康成长。

而现金流侧,截至 2025 年 9 月 30 日,公司累计融资 15 亿美金,但现金结余合计达 11.02 亿美元,包括 3.62 亿美元现金、6.44 亿美元短期理财、7022.8 万美元长期理财及 2509.7 万美元受限制现金,还有 3940 万美元未动用银行融资。按 当前现金消耗率计算,即便不考虑 IPO 募资,以及未来连年增长的营收预期,这些现金也能支撑公司运营超过 53 个月(约 4.4 年)。

那么新的问题来了,基于如此业绩营收,MiniMax 的估值体系应该如何对标?

 

02

一级市场如何对 MiniMax 进行估值?

 

成立迄今不过四年时间,对一级市场来说,无论用 PBPEPS 哪一种成熟模式对 MiniMax 进行估值,都会略显偏颇。

因此,对一级市场来说,寻找对标,就是最简单且行之有效的办法。

那么 MiniMax 的对标对象应该是谁?答案或许是 Anthropic + Runway + ElevenLabs + Suno 的总和,原因在于 MiniMax 是当前市场上为数不多的押注全模态,且全数取得成功的玩家。

文本侧,2025 年 10 月,MiniMax 发布并开源新一代文本大模型 M2, 一举刷新国产文本模型的全球排名——在权威的 Artificial Analysis 榜单中位列全球前五、开源第一,这也是中国开源大模型首次跻身该榜单全球前五。发布后,M2 在全球模型聚合平台 OpenRouter 上迅速爬升至国内模型 token 用量第一,编程场景排名全球第三,成为最受海外开发者欢迎的中国大模型之一:发布期间,M2 被 Cline、Kilo Code、秘塔 AI 在内近 30 家国内外开发平台与产品接入支持;随后又被亚马逊 Bedrock、谷歌 Vertex AI、微软 AI Foundry 等全球顶级云平台引入,成为海外开发者构建 AI 应用的首选基座之一。

语音侧, MiniMax 的语音大模型,是最早实现全球领先的领域。2023 年推出国内首个基于 Transformer 架构的语音大模型 Speech 01,2024 年升级的 Speech 02 综合性能跃居全球第一,力压 OpenAI、ElevenLabs 等国际巨头。到了最新的 Speech 2.6,已经支持 40+种语言,语音生成自然流畅,更关键的是在 Voice Agent 场景的突破,首包响应时间压到 250 毫秒,支持专业格式文本无障碍朗读,达到行业绝对头部水平。

这种技术优势,直接转化为商业合作。支撑 ChatGPT 高级语音模式的 LiveKit、GitHub 热门开源框架 Pipecat、YC 孵化的语音平台 Vapi,都选择 MiniMax Speech 作为底层技术引擎;智能硬件领域,Haivivi、Bubble Pal、Rokid Glasses 等新锐产品,也靠它实现自然语音交互体验。截至目前,MiniMax 语音模型已帮助用户生成超过 2.2 亿小时的语音,成为全球 Top 2 大规模商用的语音大模型。

音乐侧, MiniMax 的音乐模型 Music 2.0 也实现了突破,被誉为 AI 界的全能制作人。它支持生成长达 5 分钟、包含主歌副歌完整结构的专业级歌曲,用户可通过提示词定制唱腔、情感、男女对唱,还能独立控制多种乐器分轨,让普通创作者也能产出媲美录音室质感的作品。

视频侧, 2024 年 8 月,MiniMax 才发布了视频生成模型 Video 01 及海螺 AI 产品,彼时,行业普遍认为后发者难有机会。但到了 2025 年 6 月推出的 Hailuo 02,MiniMax 已经在 Artificial Analysis 视频评测中位列全球第二,累计生成视频超 5.9 亿个。通过聚焦文生视频、图生视频、主体参考、首尾帧控制等实用功能,海螺 AI 构建了全球最大的头部 AI 艺术家/创作者生态(超过 10000+名),并与戛纳电影节、上海国际电影节等国际节展,以及纽约大学艺术学院、中国传媒大学等顶尖院校展开深度合作,将 AI 视频生成技术融入专业创作场景。

然而,一个略显吊诡的地方在于:如果将 MiniMax 不同模型进行拆分,那么它的价值将是 Anthropic(文本大模型,3500 亿美金)+ Runway(视频大模型,60 亿美金)+ ElevenLabs(语音模型,110 亿美金)+ Suno(音乐模型,24.5 亿美金)=3694.5 亿美金。若四者合一,MiniMax 存在巨大估值空间。而要如何达到这个定价区间,未来更多的,还要靠一级市场与二级市场的叙事逻辑切换,来完成最后的闭环。

 

03

MiniMax 估值的二级参考系是什么?

 

一直以来,关于二级市场应该如何给 AI 公司进行估值,市场众说纷纭,整体分为三派:

相当一部分保守观点看来,AI 公司的估值应该参考中软这样的 项目制软件公司 。虽然存在一定的技术底色,但重投入、低护城河,长期的利润始终与 员工规模与成本 牢牢绑定。

温和派的观点,则更多将其与芯片、手机这样的 科技公司 并排比较:企业用持续的 研发投入 会换来源源不断的超额利润,但两者始终成正比。

相对乐观的观点,则会将其与 互联网公司 进行对比:研发投入与先发优势带来的成果,可以用极低的成本复制, 增速 是核心考量因素。

从市场现状来看,三种估值模式各有道理,分别对应项目制 AI 公司、模型即产品的 AI 公司,以及产品化 AI 公司三种企业形态。

毫无疑问,多个爆款 C 端产品在手,B 端走标准化 API 接口的 MiniMax,是第三类 AI 公司的典型代表。

先看 C 端,立足全球的爆款产品能力,是 MiniMax 最大的优势。

传统中国互联网公司的全球化扩张,往往遵从国内试水-扩张-海外复制的模式,但在此过程中,往往会面临文化冲击、用户习惯天差地别等困境。而 MiniMax 则是生而全球化的代表,其明星多模态交互产品 Talkie,在海外 AI 娱乐应用市场,占据统治地位之外;视频生成产品 Hailuo AI 也凭借猫咪跳水等现象级传播杀出 Sora、Runway 重围,仅用一年时间就帮助用户生成超 5.9 亿个视频。

截至 2025 年 9 月 30 日,MiniMax 已有超过 200 个国家及地区的逾 2.12 亿名个人用户,其 2025 年前九个月同比增长超过 170% 的营收中,海外市场收入贡献占比超 70%。

而在 B 端,相较一众同行将宝压在定制化项目上,MiniMax 的 B 端收入主要来自 API 调用,没有一笔依赖短期项目的定制化收入。

这也使得 MiniMax 前期模型研发成本,能随着调用量的增加而被摊薄,最终简化为算力+毛利的定价模式。 也是因此,MiniMax 的 B 端毛利可以做到近 70%,应收账款只有 806.3 万美元,应收账款周转天数也仅有 38 天,远低于 AI 及 SaaS 行业 60-90 天的平均水平,打造了近乎互联网式的低成本扩张商业模式。

 

04

MiniMax 的第三种估值模式:

未来价值几何?

 

如果说财务数据、模型表现以及商业模式的选择只代表了 MiniMax 的过去,那么接下来的这组数据,代表的则是 MiniMax 要走向何方的未来:

招股书披露的团队数据显示:这是一个仅 385 人的极致年轻化的团队。员工平均年龄 29 岁,以 95 后为主;董事会平均年龄 32 岁,全是 90 后;研发人员占比高达 73.8%,约 1/3 员工拥有海外教育背景。整体 CEO 以下,仅有三层架构,从实习生到一线研发,只要有想法、有创新,就能随时被看到、给机会,做出成果。

在 AI 领域,这种人员与组织形式的极度年轻不仅意味着精力充沛,更意味着对未来应该如何建设的 0 包袱与加速度。 95 后、00 后是伴随互联网和 AI 成长起来的一代,他们不会被传统软件的思维束缚,也自然能深入的理解 AI 产品的创新范式。

而基于这种极致的创新自由度与年轻的好奇心与胜负欲,带来的,不仅有 MoE(混合专家)架构、Lighting Attention(闪电注意力)机制、原创算法 CISPO 等方案,还有 MiniMax 被严重低估的创新效率。自成立至 2025 年 9 月,MiniMax 累计花费仅 5 亿美元,不及 OpenAI 累计花销的 1%,却做出了全模态全球第一梯队的模型。

也是因此,如何估值还在高速成长的 MiniMax,也代表着我们如何估值未来,以及如何估值关于创新的无限可能。

浏览量: 2

钉钉上新,想用 AI 教你点「工作切割术」

相信所有打工牛马,在看了苹果推出的科幻剧《人生切割术》(Severance)时,总会有点心有戚戚——那个蓝色调的办公室和压抑的隔板间环境,活活是办公室版的克苏鲁大戏。

打工人的这种心态,被钉钉妥妥的拿捏了。

钉钉 CEO 无招曝光企业级 AI 硬件 Ding Talk Real |图片来源:钉钉

12 月 23 日,AI 钉钉 1.1 版本发布会上,钉钉 CEO 无招终于把 4 个月前埋下的坑——Ding Talk Real AI 主机填上了。这个看起来十分像 NAS 机器的硬件,其实是一台「Agent 主机」。这个新产品的视频,就模仿了《人生切割术》的背景,但不同的是,有了各种 Agent 能力的帮助,打工人仿佛长出了脱离身体的无数双手,7X24 小时的帮助人们完成各种工作。

Ding Talk Real 更像是今年大货的 Plaude Note AI 录音笔,硬件的背后,其实是对于各个行业、工作流和场景的重新理解、并用 AI 进行重构。

 

Agent OS,新的工作流入口

此次更新的核心在于 Agent OS,这被定义为全球首个为 AI 打造的工作智能操作系统。对于 B 端用户而言,最直观的改变体现在交互界面——钉钉 ONE。

钉钉 ONE 集合了各种 Agent 能力和信息|图片来源:钉钉

传统的办公软件界面是基于功能的罗列,用户需要在一个个聊天窗口、文档列表、日历和待办事项中穿梭,人是信息的被动接收者和主动整理者。而钉钉 ONE 的逻辑在于利用大模型处理海量信息的能力,让系统自动识别并推送「当下最重要的事」。这种设计试图解决大模型在企业落地中的「最后一公里」问题,即如何让 AI 的计算能力转化为员工可感知的效率提升,而不是增加一个新的操作负担。

在这一系统中,AI 不再是一个悬浮窗或侧边栏,而是成为了调配资源的「大脑」。新发布的通用任务处理 Agent「悟空」,标志着 AI 从「对话者」向「执行者」的进化。它不仅仅满足于回答问题,而是能够自主规划任务路径,调用钉钉内的各类工具与其他 Agent 来解决复杂问题。这种「从问答到干活」的跨越,正是目前企业级 AI 最急需的能力突破。

 

DingTalk Real ,AI 的「物理抓手」

在软件定义一切的时代,钉钉反其道而行之,加重了在硬件领域的投入。这并非为了卖设备,而是为了给 Agent OS 寻找一个物理世界的「身体」。

发布会上引人注目的 DingTalk Real,实质上是 Agent OS 在物理环境中的关键延伸。在复杂的企业环境中,纯软件的 Agent 往往难以触达线下的真实业务场景。DingTalk Real 的出现,旨在解决 AI Agent 在执行任务时的安全与可信问题,为高价值 Agent 的规模化部署提供了必要的物理载体。

DingTalk Real 看起来确实很像 NAS 工具|图片来源:钉钉

与此同时,作为 2025 年国产 AI 硬件的一匹黑马,DingTalk A1 也迎来了升级。它从单一的个人办公助理进化为团队工作助理。在销售、招聘、法务等具体场景中,A1 能够贯穿工作流程,自动汇总并分析录音内容。更关键的一点在于数据的打通——企业统一配置后,这些录音数据可以直接导入业务系统。这意味着,语音不再是「死」的数据,而是成为了可被经营分析系统调用的结构化资产。

 

让一线业务「长」出 AI 能力

在应用层面,钉钉延续了其「低门槛」的产品哲学。升级后的 AI 表格试图让 AI 应用的搭建变得像搭积木一样简单。用户通过上传表格、拍照甚至手绘图,就能直接生成 AI 应用。

在蒙牛牧场的演示案例极具代表性,一位年长的巡查员工只需「随口说」,AI 表格就能自动完成填报;看似随意的文图复制粘贴,能被「万能贴」自动转化为结构化表格。目前,包括宁德时代、牧原集团、森马等在内的多家头部企业已经开始使用这一工具。这背后的逻辑是,AI 不应仅是程序员的专利,而应成为一线业务人员手中的工具。

钉钉的「AI 搜问」功能|图片来源:钉钉

此外,针对特定行业的「商业可交付 Agent」也展示了钉钉在垂类场景的深耕。制造业的「订单 Agent」可以将图片一键转为排产表格,「质量 Agent」能够预测故障;「AI 差旅」则能在极短时间内完成比价规划,帮助企业降本。这些产品不再是通用的聊天机器人,而是针对具体业务痛点的精准解法。

就连最高频使用的「AI 听记」也增加了跨文件问答和同声传译能力,这显然是针对出海企业和跨国沟通场景的定向优化。

在观察整场发布会的所有产品迭代时,一个隐蔽但至关重要的商业逻辑转变浮出水面。

钉钉在 B 端的思路,已经突破了过去软件按照功能收费,而转向结果付费,预示了 AI To B 行业的新趋势

长期以来,SaaS(软件即服务)行业的商业模式主要基于「账号」或「功能」收费。企业购买的是软件的使用权,至于软件是否真正为企业创造了价值,厂商往往不对此负责。然而,钉钉此次发布的「AI 差旅」等产品,明确提到了「帮助企业降本 15%」、「将对话沉淀为可识别商机」等具体的业务成果。

这意味着,AI 时代的 B 端服务,正在从 Selling Features(卖功能)转向 Selling Outcomes(卖结果)。

在 Agent OS 的架构下,AI 不再是一个辅助工具,而是直接参与生产的「数字员工」。当企业启用一个「AI 差旅 Agent」时,企业主心中对标的不再是一个办公软件的订阅费,而是一个人类差旅专员的薪资成本以及差旅费用的实际节省额度。

这种转变将彻底重塑 AI To B 行业的估值逻辑与生存法则。

钉钉 CEO 无招发布 AI 钉钉1.1 木兰|图片来源:钉钉

对于客户,付费意愿将不再取决于软件功能的多少,而取决于 AI 实际完成任务的质量和效率。如果 AI 能够直接带来订单的转化、故障的预测或成本的降低,那么企业将更愿意为此支付溢价。反之,如果 AI 只是一个聊天框,无法解决实际问题,那么在新鲜感退去后,客户的留存率将面临巨大挑战。

钉钉通过 Agent OS 搭建的不仅是技术底座,更是一个以「结果」为导向的交易市场。通过与合作伙伴共建行业模型和 AI 硬件市场,钉钉试图建立一种新的生态标准——在这里,AI 的价值是可以被量化、被考核甚至被交易的。

这或许才是 AI 钉钉 1.1 版本「木兰」最核心的破局点。它预示着 AI 应用正在走出「拿着锤子找钉子」的探索期,进入了必须「砸进墙里、挂住重物」的实战期。对于行业,这既是巨大的机遇,也是对技术落地能力的终极大考。

浏览量: 3

文章分页

上一页 1 … 6 7 8 … 100 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间