Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

分类: 科技

WPeMatico Campaign中添加的类别

大疆 OSMO Action 6 体验:完美进化,不止运动

作为相机领域最硬核的存在形态之一,运动相机从诞生以来,就是「可靠记录」的代名词。

也确实是因为在各种运动场景中,比起画质,抗摔耐磕磕碰才是运动相机目标用户最看重的性能。将创作者从「小心翼翼」的束缚中解放出来,不再需要担心雨雪风沙,也不必在极限运动的瞬间分心去呵护娇贵的镜头。

这个逻辑在大疆 OSMO Action 系列上也一直鲜明的存在着:即使是大疆这样擅长从用户细分需求中抓到新产品契机、从手持运动相机这个形态衍生开发出「电子茅台」OSMO Pocket 系列,以及外形更加特立独行的 OSMO Nano 系列,但 Action 系列一直紧扣「让记录在各种极限环境下都忠实运行」这个核心需求,去强化 Action 产品线。

 

OSMO Action 6 外观 | 图片来源:极客公园

 

你什么都不需要想,只需要按下快门,它就能以一种近乎顽固的姿态,忠实记录下肾上腺素飙升的每一秒。所有的创意决策——无论是冲入浪尖的惊险,还是穿过林间的极速——都建立在「拍得到」的基础之上。

也正是因为这种特性,运动相机在过去很长一段时间里,似乎都与「日光机」画上了等号:更高的帧率、更激进的防抖。然而,画质,尤其是暗光下的画质和光学层面的景深表现,始终是这类小底设备的阿喀琉斯之踵。在这种背景下,大疆带着 Osmo Action 6 破局而来。

在取代 GoPro、成为运动相机行业的新王之后,大疆显然并不满足于此。

Osmo Action 6 的诞生,不仅是大疆在尝试再一次「捅破行业天花板」,更是在宣告一种理念:一款旗舰级的运动相机,不应只有「傻锐」,更要承担起更多日常记录生活的属性,具备足以媲美专业相机的光学审美。而这一切,都始于那个在运动相机上堪称奢侈的机械结构——可变光圈,以及那块特立独行的方形传感器。

 

01

设计哲学:打破光学的「物理屏障」
 

熟悉大疆的朋友往往印象最深刻的就是他们一贯以来的产品设计逻辑:有点像是「为了解决一个痛点,不惜重构整个系统」。这种「功能主义」高度体现在 Osmo Action 6 的核心光学组件上。

 

OSMO Action 6 外观 | 图片来源:极客公园

 

Osmo Action 6 最核心的创新,无疑是行业内首次在运动相机上引入的 F2.0-F4.0 可变光圈系统。

传统运动相机通常为了保证大景深(让远近都清晰),被迫使用固定的较小光圈(如 F2.8 或更小)。这导致了两个极端痛点:一是暗光环境下进光量不足,画质噪点爆炸;二是拍摄近处物体时,背景杂乱,毫无光学虚化的美感。

大疆凭借其在无人机云台相机上积累的微型机械光圈技术,将这一结构塞进了 Action 6 紧凑的机身中。

 

在可变光圈的基础上,OSMO Action 还是通过模式切换的方式简化了光圈参数调整 | 图片来源:极客公园

 

虽然加入了可变光圈,但作为强调便捷使用需求的运动相机形态产品,大疆还是将可变光圈的操作进行了很大程度上的简化,

它将拍摄的选择权交还给了用户。在 F2.0 大光圈下,配合全新升级的 1/1.1 英寸传感器,进光量显著提升。在超级夜景模式下,即便是城市夜骑或极暗环境,画面依然纯净。

而当你需要拍摄 VLOG 或特写时——这正是大疆拓展运动相机边界的野心所在——大光圈配合全新的微距镜(最近对焦距离 11cm),竟然能在运动相机上实现「刀锐奶化」的浅景深效果,这是以往只有大底微单才能做到的事情。

除了镜头,Action 6 的机身设计也围绕着另一项核心突破展开——1/1.1 英寸方形传感器。值得一提的是,这块传感器也正是大疆在其全景相机 Osmo 360 上所使用的同款方形 CMOS。

知道这一点之后,你就能了解到为什么 Action 6 被定义为「全能旗舰」。这块 2.4 µm 融合大像素的传感器,不仅是为了画质,更是为了解决当下短视频时代的「构图焦虑」。

这与 Osmo 360 的设计理念如出一辙,都是为了最大化利用传感器面积,并赋予后期极大的灵活性。Action 6 的外观依然保持了经典的运动相机形态,但在使用逻辑上,它允许用户在一个拍摄模式下,后期自由裁切成 16:9、9:16 甚至 4:3 等多种比例,且全程无损。

随着一英寸大底的加入,OSMO Action 6 无论是从手感还是画质上,其实都已经涉足进传统手持街拍相机品类的传统市场,我在实际的使用中,就已经习惯将 Action 6 从快拆挂架上摘下来,徒手拿着 Action 6 进行一个街拍的动作。

 

手持 OSMO Action 6 进行拍摄也很好玩 | 图片来源:极客公园

 

虽然手感上接近了传统的街拍相机,但 Action 在焦段上可能还是需要你去适应一下:尤其是广角镜头还是会让你明显感觉到与传统街拍相机 24-35mm 焦段取景的不同,但这或许也能给你带来另外的视角。

 

大疆 OSMO Action 6 广角(10mm)/日常广角(10mm)/标准畸变(15mm)三种模式取景画面对比  | 图片来源:极客公园

 

比较遗憾的是,虽然我已经习惯了手持 Action 6 进行拍摄,但大疆目前暂时还没有针对这个场景,发布对应的配件进行更有针对性的适配,所以我还是很期待大疆未来能够像友商 Insta360 那样,未来针对运动相机这个形态,推出类似街拍手柄套装这样的配件。

在实际握持和操作中,Osmo Action 6 延续了双向磁吸快拆系统,这一设计在骑行、徒步等多机位切换场景中已被证明是目前最高效的解决方案。值得一提的是,它的电池和生态配件与前代通用,这对于老用户来说是一个极具诚意的细节。

 

02

硬件核心:旗舰画质的「降维打击」
 

在进入 Osmo Action 6 的硬件细节之前,我们必须意识到,它正在试图抹平「运动相机」与「专业相机」在画质上的鸿沟。

前面提到过,Action 6 搭载的是一块大疆今年定制的 1/1.1 英寸方形传感器,它拥有高达 13.5 挡的动态范围。这意味着在大光比场景——比如从昏暗的隧道冲向刺眼的阳光,或者在背光的日落时分——它能保留丰富的高光和阴影细节,而不是像以往运动相机「日光机」那样,在画面中留下一片死白或死黑。

Action 6 与竞品拉开身位的决胜局,在于其暗光表现。在「超级夜景」模式下,手动选择 F2.0 大光圈,配合 4K/30fps 的录制规格,它能够呈现出清晰锐利、明暗细节生动的城市夜景。相比之下,传统固定光圈的运动相机在夜间往往只能得到噪点满满的「记录级」画质。

对于专业创作者而言,10-bit & D-Log M 色彩体系的加入是一个决定性的优势。它不仅能更充分地记录色彩信息,更重要的是,它能与 DJI 的无人机(如 Mavic 3 系列)、Osmo Pocket 系列实现色彩统一。这意味着在多机位混剪时,后期调色的工作量被大幅降低,真正实现了「Osmo 生态」的协同效应。

视觉之外,听觉体验同样迎来了革新。Osmo Action 6 支持 OsmoAudio™ 生态系统,可以双蓝牙直连两个 DJI Mic 2 或 Mic Mini 发射器,完全无需接收器。这极大地简化了创作者的收音流程,无论是极限运动,还是日常的双人访谈 VLOG。

在摩托车骑行中,你可以将一个麦克风贴在排气管附近收录声浪,另一个佩戴在头盔里收录人声,同时开启机身收音备份收录环境风声。这种多轨收音的灵活性,以往需要复杂的录音笔和后期同步才能实现,如今变得轻而易举。

最后,作为生产力工具,可靠性也至关重要。Action 6 内置了 50GB 存储空间,忘带卡也能即刻开拍。而在续航方面,1080p 模式下可连续录制 4 小时,即使在 -20℃ 的极寒滑雪场景下,也能稳定运行。

 

03

场景体验:从「能拍」到「好拍」
 

硬件是基础,体验才是灵魂。

而 Action 6 在体验上,同样也清晰地展现了大疆的确不希望将 Action 系列运动相机局限在极限运动场景,而是希望为其加入更加好用的日常拍摄/录制能力,将这个产品线拉入更广阔的日常记录领域。

体现在配件上,则是 OSMO Action 6 进一步得到拓展的配件/镜组套装:例如我自己最常使用的微距镜,

 

OSMO Action 6 装载微距镜后外观 | 图片来源:极客公园

 

除了微距镜之外,大疆这次还提供了增广镜的选项,以及老朋友三档不同深度的 ND 滤镜。

 

OSMO Action 6 镜组| 图片来源:极客公园

 

在骑行场景中,除了前文提到的夜景优势,全新的增广镜可将 FOV 扩展至 182°,带来极具速度感的视觉冲击力。而在水下场景,大疆这次在「看不见」的地方也下了功夫。

Action 6 内置了行业唯一的色温传感器和水压计。入水瞬间,相机能自动感知色温变化,确保肤色和海水颜色还原准确,过渡自然;同时智能感知水压,实现入水自动开录、出水自动停止。这对于潜水爱好者来说,不仅是画质的提升,更是交互的减负。

 

OSMO Action 6 外观 | 图片来源:极客公园

 

即使你不会在日常所有使用时刻都去「追求极限」,OSMO Action 6 依然是一个(甚至更好用的)生活记录者。配合人物居中跟随功能,即便你独自出行,相机也能智能识别并始终将你置于画面 C 位。而机内内置的多种胶片影调,让你无需后期调色,也能直出极具氛围感的大片。

 

04

结语:全能运动相机的自我修养
 

Osmo Action 6 的发布,不仅仅是参数的堆砌。作为行业新王,大疆正在展现其定义市场的能力。从 F2.0 可变光圈到同款 Osmo 360 的方形传感器,再到 OsmoAudio 直连生态,每一个功能点都精准地击中了创作者的痛点——不仅是极限运动的痛点,更是「拿运动相机拍日常」的痛点。

它不再仅仅是一个被绑在头盔上、用来「抗造」的记录仪,而是一台真正具备光学审美、能无缝衔接极限运动与日常 VLOG 的全能旗舰。

它向行业证明:运动相机,也可以谈画质,也可以谈景深,也可以成为专业影像工作流中不可或 NTF8PA 缺的一环。

对于还在纠结「运动相机画质不行」的用户来说,Osmo Action 6 可能就是那个让你改观的转折点。

 

浏览量: 3

iOS 为微信小程序「正名」,腾讯移动生态的新转机

作者|张勇毅
编辑|靖宇

2017 年,马化腾、张小龙等腾讯管理层前往美国苹果总部,拜访 CEO 库克,并送上一份中国特色剪纸作为礼物。

 

 

2017 年 9 月马化腾等腾讯高管拜访苹果 CEO 库克 | 图片来源:网络

 

八年之后,库克已经习惯了每年数次前往中国这个重要市场,苹果也与腾讯再一次在应用生态上选择「握手」,一起推送下一次影响意义深远的变化。

11 月 14 日上午,苹果公司正式宣布推出小程序合作伙伴计划(Mini Apps Partner Program),首次为「小程序」这一在中国市场举足轻重的应用形态,建立起制度化的合规框架。

 

这个计划最核心的信息是:参与计划的开发者,在符合条件的小程序应用内购买销售额中,仅需支付 15% 的优惠佣金费率。

这一消息公布后,迅速在科技圈引发震动。考虑到苹果 App Store 标准的 30% 抽成(即「苹果税」),佣金直接「腰斩」,这无疑是对海量开发者,尤其是长期依赖广告变现的小游戏和轻量服务提供商的重大利好。

更重要的是,这意味着过去七年多长期处于 iOS 生态商业化「灰色地带」的小程序,终于进一步在 iOS 生态汇总获得了属于自己的生态位。

而就在昨晚,彭博社关于腾讯与苹果已达成协议的报道,似乎也预示着——这一计划在中国这个全球最大的小程序市场,已经扫清了最后的核心障碍。

 

01

「灰色地带」的终结
 

站在当下,无论是谁都无法否认的一个事实是:在中国 iOS 应用生态中,小程序早已不是一个边缘玩家。

它是在微信、支付宝等超级 App 内部繁荣生长的「轻应用」生态,承载着数以亿计的日活,是名副其实的移动互联网「基础设施」。

但在 iOS 上,它的商业化进程一直相对更加受限。

从技术上,开发者可以用 H5 和 JavaScript 把它塞进一个 App 里,但它几乎无法触及任何系统级能力。更致命的是商业上:不能使用苹果官方内购(IAP)、不能精细化管理年龄分级,更无法建立稳定的付费商业模式。

绝大多数小程序只能依靠广告这一条路「吃饭」——轻游戏加激励视频,工具类上 Banner 投放。想要靠内容或服务收费,几乎是天方夜谭。

这源于两大生态的利益冲突:苹果不希望任何超级 App 在 iOS 内部复制出一个「应用商店」,从而削弱 App Store 在 iOS 内的主导权。

这种紧张关系,在 2017 年春天被首次点燃:当时,微信宣布因苹果要求对「赞赏」功能抽取 30% 佣金,且交涉无果后,愤而关闭了 iOS 版微信公众平台的「赞赏」功能。

冲突最终在 2017 年 9 月迎来转折。据报道,马化腾、刘炽平、张小龙等腾讯核心高管集体赴美拜访库克。会面后不久,双方「鸣金收兵」:苹果调整规则,允许「打赏」这类赠予行为,且苹果不抽成;次年 1 月,微信恢复了「赞赏」功能。

小程序的商业化,对整个生态中赖以生存的玩家来讲都是绕不过去的利益核心所在。这次「七年之痒」的开端,为此后的小程序生态埋下了「灰色」共存的伏笔。

2024 年 1 月,苹果为小程序开放了应用内购买(IAP)的技术支持。2024 年五月据报道,苹果向腾讯施压,要求其堵住小程序将用户引导至外部支付以规避 30%「苹果税」的漏洞。这几乎是对小游戏生态的釜底抽薪,直接威胁到了其商业模式。

直到今天,苹果第一次在官方文件中正面写下了关于「小程序」的定义:

「基于 Web 技术,如 HTML5 和 JavaScript 构建的自包含体验」,它不直接出现在 App Store,而是分发在一个更大的宿主 App 内。

承认小程序的官方生态地位的同时,苹果也给了这个生态开发者最直接的回报:15% 的佣金。

苹果明确,符合条件的数字商品和服务,包括消耗品(如游戏道具、货币)、非消耗品、自动续期订阅等,均可享受这一优惠费率。对于收入主要来自长尾服务和小游戏的轻量应用而言,这一政策的吸引力是立竿见影的。

 

02

开放,但必须「可控」
 

15% 的低佣金不是免费的午餐,更不是苹果的「慈善」。

苹果的开放前提是,小程序必须从「灰色地带」,迁移进苹果指定的「审核流程」,并接入苹果的监管体系。

举例来讲,小程序开发者想加入该计划,托管小程序的宿主 App 必须支持苹果指定的多项关键 API:

 

  1. 高级商务 API (Advanced Commerce API)
    : 这是苹果专为「内容目录庞大、复杂、动态」的 App 设计的基础设施。接入它,意味着小程序的所有商品、价格、内容目录都必须对苹果完全透明。这不仅是为了促成交易,更是苹果监管底层数据、掌握生态全貌的核心方式。
  2. 声明年龄评级 API (Declared Age Rating API)
    : 这是一个精妙的「放权」与「集权」。过去,小程序的年龄分级完全依赖宿主 App(比如微信是 17+)。而现在,系统允许一个 13+ 的 App 安全地托管一个 18+ 的小游戏,系统会根据用户年龄自动进行拦截或放行。这让苹果的年龄管控能力,穿透了宿主 App,直达每一个小程序。
  3. 应用内购买系统 (In-App Purchase system)
    : 这是核心中的核心。你必须使用苹果熟悉且可信的支付方式,用户可以查询、修改订阅或申请退款。这是享受 15% 佣金的唯一通道。
  4. 消费 API (Consumption API)
    : 在用户退款时,宿主 App 必须向苹果发送购买信息,以优化退款流程。这是「售后服务」的统一化。

这一整套技术要求,几乎等于把小程序彻底拉进了 App Store 的监管系统。苹果用 15% 的佣金换来了对小程序生态的完整控制权:你可以进来,你可以赚钱,但你必须用我能理解、能监管的方式运行。

这不再是「围墙花园」外的「违章建筑」,而是被「招安」后纳入城市统一规划的「经济特区」。

 

03

生态的「相互依赖」
 

苹果此时选择「招安」,绝非偶然。这背后是全球监管压力、小游戏商业化浪潮,以及 AI 战略布局等多重力量共同作用的结果。

而其中最关键的变量,依然是腾讯。

苹果与腾讯的关系,可能是当今全球科技史上最独特、最复杂,也最「相互依赖」的共生体。

一方面,中国用户无法接受一个失去微信的操作系统。2010 年国行 iPhone 4 发售时,尽管设计惊艳,但在中国缺少「杀手应用」,甚至需要靠《会说话的汤姆猫》来吸引顾客。仅仅四个月后,微信 1.0 在 iOS 平台首发,这款划时代的应用迅速取代短信,成为移动互联网的真正入口。

某种程度上来讲,微信是让 iPhone 成为中国市场的「国民硬件」的重要推手。截至 2022 年,苹果在中国累计售出约 3.8 亿部 iPhone。微信的生态黏性,是这片江山最重要的基石之一。

另一方面,腾讯也无法放弃 iPhone 用户代表的庞大用户群体市场。iPhone 强大的性能、封闭的 iOS 系统和 App Store,共同催生了手游产业。腾讯作为「端游转手游」的最大受益者,其游戏帝国的崛起与 iPhone 的普及密不可分。

消费能力强劲的 iPhone 用户,是《王者荣耀》、《和平精英》等王牌游戏最重要的收入来源。据第三方机构统计,2023 年苹果仅在中国就收取了超 400 亿元的「苹果税」,其中腾讯贡献了相当大的份额。

两大生态的体量更是旗鼓相当:

截至今年第二季度,微信及 WeChat 合并月活高达 13.7 亿。

截至 2023 年底,微信小程序月活也达到 9.2 亿。

另一边,iPhone 全球保有量达 13 亿部,App Store 周均访问用户超 7 亿。

很难想象一款手机无法使用微信,即便它是 iPhone。这就是为什么当腾讯在推广《DNF》手游时,敢于踢开国内安卓厂商的「硬核联盟」;但在面对苹果时,它必须选择谈判。

同样,苹果在面对 Spotify 或 Epic Games 时可以强硬到底,甚至不惜将其下架。但面对微信这个「生态级」应用,苹果不到万不得已,绝不会降下铁幕。

因此,这次「小程序新政」,更像是两大巨头继 2017 年「赞赏」风波后的第二次关键「再平衡」。双方都清楚,在小游戏这个体量日益庞大的新战场上,与其继续内耗、引发监管关注,不如坐下来重新「分蛋糕」。

15% 的佣金,就是为腾讯这个体量庞大的「合作伙伴」量身定制的方案。

 

04

监管、游戏与 AI
 

当然,腾讯只是苹果战略版图中的一块。这次新政,同时指向了苹果更深层的三个目标:

苹果应对全球监管压力的又一张「缓冲垫」。

近年来,苹果的「围墙花园」也确实正遭受全球性的围攻:在欧洲,欧盟 DMA 法案开出了 18.4 亿欧元的巨额罚单,迫使苹果开放「侧载」和 NFC 支付;在美国,Epic Games 长达数年的诉讼,虽然未在根本上动摇苹果,但也迫使其在支付规则上做出让步;微软、Meta、X 甚至联名向法院递交文件,指控苹果违反禁令。

 

在「反垄断」成为全球主题的背景下,苹果此举更像是一种「主动防御」。它用一个「可控的开放」(小程序生态)来向全球监管机构展示其灵活性,以避免被迫接受更彻底的「失控的开放」(如全面开放第三方支付或侧载)。

在此之前,H5 游戏在 iOS 上几乎没有商业化空间,这是一个长达十年的痛点。如今,苹果打开了一个「合法」的变现通道,并给出了 15% 的优惠税率。

这将彻底改写小游戏行业。大量轻游戏团队将得以从单一的广告模式中解放出来,探索付费、订阅和道具内购。而苹果,则能从这个过去无法染指的庞大市场中,稳定地获取 15% 的收益。15% 的一个巨大增量市场,远比 30% 的零要好。

未来的应用生态,正在被 AI 拆解成一个个可被随时随地调用的「功能」,而非传统的原生 App 本身。

当未来的 Siri 变得足够智能,它帮你完成任务时(「帮我订一张明早去上海的机票并选一个靠窗座位」),它不需要唤醒一个臃肿的、完整的 Native App,一个轻量、自包含、功能单一的小程序组件,是最高效的载体。

小程序不是终点,但它很可能是连接未来「意图层」(用户的想法)和「功能层」(App 的能力)之间的关键胶合层。

苹果并没有复制微信的小程序生态。它是在 iOS 的技术传统里,为自己重建了一个「第二层」:

原生 App 是更加笨重、但具备深层系统能力调用的层;

Mini App 是轻量、快速、可分发的层;

而最上层,将是苹果正在全力押注的 AI 调度层。

从这个角度看,苹果今天所做的一切,都是在为未来的 AI 时代铺平道路。它要确保,无论应用形态如何演变,苹果的平台始终是那个最核心、最无法绕过的「调度中心」。

而这一切,都从今天这个「被迫」靠广告维生的小程序,获得苹果官方身份的时刻开始了。

浏览量: 3

GPT 5.1 发布了,但西方媒体准备「讲好中国故事」

作者|甘德

编辑| 郑玄

 

没有惯例的直播,GPT 5.1 迅速发布。而市场最关注的,可能还是上周另一件大新闻。

「或许除了银行和私募…… 联邦政府应考虑为 AI 芯片等数据中心投资提供贷款担保。」这是最近全世界「最贵」的一句话。

多贵呢?这句话的代价,是 5000 亿美金。

在上周的华尔街日报 Tech Live 大会上,OpenAI 首席财务官 Sarah Friar 一语惊天动地,几乎要把一场击鼓传花式的「AI 泡沫」做实。

从算力资源到应用场景,美国整条以 scaling law 为金律的 AI 产业链条,都建立在 OpenAI 能够跑通的前提下。而如果 OpenAI 都不确定自己能够独立行走,美国式 AI 的高成本、高估值模式便会引来质疑。

信心的下跌很快变成了美国 AI 整体股价的跳水。当地时间周四,美国科技股集体重挫,六大科技巨头及多家与 OpenAI 合作的算力厂商总市值一夜蒸发近 5000 亿美元。

5000 亿美金也正好是 OpenAI 目前的估值。

Sarah Friar 的一次失言,不仅让全球资本开始质疑美国 AI 的价值体系,更迫使他们开始寻找一个新的、更可靠的「价值锚点」。而当他们把目光转向大洋彼岸时,一个截然不同的叙事正在展开。

 

01

围绕 AI 估值的「去伪存真」

 

「Technocapital hyperobject(技术资本超实体)。」 这是一位软件工程师,对于近期围绕 OpenAI 所发生的一系列投资动作的定性 。

根据公开信息,为获取算力,OpenAI 今年已与 AMD、英伟达、甲骨文及 CoreWeave 等公司达成了总值超 1 万亿美元的合作协议。

但这几乎是一个左脚踩右脚让自己升空的行为:OpenAI 向甲骨文支付 3000 亿美元买算力,甲骨文拿这笔钱向英伟达购买芯片;英伟达同意向 OpenAI 投资 1000 亿美元,OpenAI 随即用这笔资金购买数百万快英伟达 GPU 来建设数据中心。

《大西洋月刊》描述这场围绕 OpenAI、参与方众多的投资热,「在金融层面上是虚无的」。 供应商和客户相互抬高彼此的估值,却并未创造真正的价值。

 

如果一切正常,这本该是一场毫无破绽的宏大叙事。这是为什么 OpenAI 突然跳出寻求美国政府兜底的行为,显得十分扎眼。这场叙事的锚点, 来源于业界对 OpenAI 盈利能力的信心,但 OpenAI 自身却已经显露出对于商业化预期的信心不足。

与此同时,市场正在用脚投票。Airbnb 在部分模型调用上也放弃了 OpenAI,而选择了国产模型。原因是中国模型在 Airbnb 的新客服系统中表现的非常优秀。而这句话,出自与 Sam Altman 私交甚密的 Airbnb 首席执行官 Brian Chesky。

这场围绕 AI 估值的全球「去伪存真」已经开始。

 

02

务实的「效率换增长」,被低估的中国 AI

 

与美国 AI 粗放的「资本换规模」形成鲜明对比,中国 AI 由于早期受到算力的限制,不得不在有限资源的处境下选择一条「效率换增长」的道路。

这种最初源于「资源受限」的被动选择,今天来看却逐渐成长为全球 AI 泡沫下的「高 ROI 孤岛」。

全球投行 Jefferies 在 11 月 11 日发布的最新 AI 报告中,用一组数据清晰地揭示了这种差异: 中国头部 AI 公司(2023-2025)的合计资本支出为 1240 亿美元,仅为美国同行(6940 亿美元)的 18%。然而,中国最好的 AI 模型(MiniMax M2)的性能,仅落后于美国最好的模型(GPT5)10%。

相比于大厂,中国创业公司的增长路线更加耀眼。Jefferies 在报告中明确将 MiniMax M2 列为中国性能最好的模型,已逼近 GPT-5 和 Grok4。而在开源模型的对比中,Jefferies 的数据显示 MiniMax M2 的表现已超越 OpenAI 的 GPT-OSS-120B。

报告进一步指出,美国在 Scaling Law 边际效应递减的情况下仍在疯狂投入,而中国则专注于「模型效率」。

当模型性能差距不明显时,性价比开始变得重要。

计算机科学家 Andrew Ng 的 AI 学习网站 DeepLearning.AI 周报中,用一张「智能 vs 价格」(Intelligence vs. Price) 图表将 M2 送上了「高智能、低成本」的最佳区间。 报告指出,GPT-5 等模型性能领先,但成本远远落后;而在成本、性能综合领先的区间中,MiniMax M2 与 Grok 4 Fast 难分伯仲。

 

DeepLearning.AI 周报

这种极致的性价比,正在被全球开发者清晰地感知到。

面向全球开发者的模型聚合平台 OpenRouter 显示,MiniMax M2 自 10 月底发布以来,日 token 调用量呈爆炸式增长,最高已突破 800 亿。在最体现模型能力的「编程」类别中,M2 已高居调用量第三名,仅次于 Grok 和 Claude Sonnet 4.5。

正如海外开发者在 X 上制作的一系列梗图:一边是标价 100 美元的 Claude,一边是标价 8 美元、表现却差不多甚至更好,用量更多的 M2。在一个正常的商业世界,会选谁自然不言而喻。

MiniMax 的强势崛起并非孤例,其背后是整个中国 AI 生态的全面爆发。

分析师 Nathan 在和 a16z 的一次对话中透露,80% 的 AI 创业公司都在用中国开源模型。比如头部的 AI 编程产品 Windsurf、在 AI Agent 领域的明星公司 Vercel、美国云服务平台 Together AI 等,纷纷向 Qwen、MiniMax、智谱等企业抛来合作的橄榄枝。

 

03

Long China AI:

当理性回归,重看价值洼地

 

随着美国 AI 泡沫显露破裂迹象,全球资本正从对 Scaling Law「大力出奇迹」的迷恋中清醒,回归到「商业理性」——寻找更高效、更具可持续性、且同样能通往 AGI 的产业带。

极致的性价比、务实的商业路线,以及在多模态综合实力上的全球竞争力——这三者共同构成了中国 AI 的核心价值。这不再是一个等待被发现的「价值洼地」,而是一个 正在重塑全球 AI 游戏规则的「效率引擎」 。

 

海外科技媒体 Venture Beat 报道中国开源模型

这种「效率」不仅体现在更低成本的文本模型上,更体现在通往 AGI 的关键路径——多模态能力上。

OpenAI CEO 将 Sora 2 定义为「世界模拟器」的开端,这代表了 AI 的终极前景。无论是 OpenAI 的 Sora 2、谷歌的 Veo 3(音画统一),还是 ChatGPT 的 LiveStream,行业趋势都在指向多模态技术的融合。

而这正是中国 AI 价值洼地论据的第二环: 中国不仅有更便宜、效率更高的模型,同样具备在关键技术上全球领先的多模态能力。

比如凭借 M2,在文本和 Coding 、Agentic 领域展现出顶级性能的 MiniMax,其 Speech 语音模型同样名列全球权威榜单的前列,ChatGPT 的高级语音模式 LiveKit、GitHub 的热门开源框架 Pipecat,以及 YC 孵化的语音平台 Vapi,都是用了 MiniMax Speech 作为其底层技术引擎。

还有在视频模型领域,其今年 6 月发布的 Hailuo 02 模型,让创作者发现,原来动物也可以跳水、做体操。

当然,OpenAI 的 Sora 2 发布后,全球视频生成领域的格局再次被这家万亿美元的超级巨头重塑,但可以肯定的是: 中国 AI 公司已经证明了自己在多模态领域具备快速跟上甚至超越美国顶尖同行的能力,并且这种追赶将在同样高的资本投入效率下完成。

更重要的是,这种技术上的高效率和 AGI 潜力,已经在中国市场得到了商业化的验证。据外媒,MiniMax 凭借极强的产品化能力,已实现了过亿美元的年化营收。当「MiniMax 们」把产品推向海外,放在同一个市场环境竞争,中国创业者展现出了完全不输给美国同行的竞争力。

AI 是一场效率革命。前几年,AI 的叙事更重「革命」,可以容忍高成本。现在,这场效率革命中的「效率」部分开始被重视。

极致的性价比、务实的商业路线,以及通向 AGI 的多模态综合实力,使得中国 AI 公司的真实价值被市场远远低估。当美股的 AI 泡沫开始破裂,寻求避险和高增长机会的全球资本,必然会重新审视并发现中国 AI 这片「价值洼地」。

对中国 AI 的估值校准,或许就在这场泡沫戳破之后,已经悄然开始。

浏览量: 3

AI、游戏双驱动,腾讯「赚麻了」

 

备选:头图来源:腾讯

 

11月13日,腾讯发布了2025年第三季度财报 。营收1928.7亿元,同比增长15% ;非国际财务报告准则下(Non-IFRS)的经营利润为725.7亿元,同比增长18% 。

 

本季度,腾讯主要板块收入均实现双位数增长。

 

其中,增值服务收入同比增长16%至958.6亿元,游戏业务收入增速为22.8%;营销服务在AI与微信商业生态持续提振下,收入同比提升21%至362.4亿元;金融科技与企业服务受益于商业支付活动与企业服务需求增加,收入同比增长10%至581.7亿元。

 

腾讯三季度财务表现摘要|图片来源:腾讯财报

 

AI应用生态方面,腾讯元宝已全面打通微信、QQ、腾讯会议等数十款内部产品,覆盖社交、办公与消费等核心场景。

 

此外,腾讯国际化业务增长强劲,其中国际游戏收入大幅增长43%达到208亿元。

 

数据稳健增长的背后,一个更清晰的信号是腾讯战略重心的变化。本季度,腾讯的研发支出达到了228.2亿元,创下历史新高,同比增长28% 。这笔投入的流向非常明确:AI 。

 

这一季的财报表明,AI正在腾讯内部扮演一个贯穿性角色。它开始系统性地融入到游戏、广告和企业服务等各个核心业务,其战略价值正从「研发投入」转向「业务驱动力」。

 

此外,财报显示,本季度腾讯的研发支出达到了228.2亿元,创下历史新高,同比增长28% 。截至2025年9月30日止九个月,累计研发开支已达619.83亿元,较去年同期的508.45亿元同比增长约21.91%。

 

与此同时,本季度腾讯的资本开支(主要用于IT基础设施)为129.8亿元,同比下降24%,环比下降超过32% 。

 

1 混元打底,元宝「铺路」

 

本季度,腾讯的AI战略展现了清晰的两层结构:以「混元」大模型为技术底座,以「元宝」为应用先锋,加速渗透进腾讯的核心场景 。

 

首先是「混元」的底层能力建设。 腾讯正持续升级混元基础模型的团队和技术架构 。

 

马化腾在财报中表示,混元的图像和3D生成模型已处于行业领先水准 。财报数据也印证了这一点:混元图像3.0模型在国际权威榜单LMArena的文生图评测中排名第一 ;混元3D模型升级后,建模精度提升了3倍 。

 

但对腾讯而言,模型能力再强,也需要场景「喂养」和「落地」。 这就是「元宝」的核心任务。

 

本季度,元宝的生态打通进程明显提速 。元宝在被「植入」到腾讯系的流量腹地:微信、QQ、腾讯会议、腾讯文档等数十款内部应用的基础上,融合得更加场景化、原生:

在公众号和视频号的评论区,用户可以直接@元宝进行提问和内容总结 。

在腾讯会议中,元宝可以「代开会」并自动生成会议纪要 。

在元宝内,可以直接搜索并跳转到腾讯视频和QQ音乐 。

 

腾讯AI能力形成循环|图片来源:腾讯

 

这种「毛细血管」式的渗透,一方面让元宝获得了巨大的用户基数(目前元宝日活跃用户已跻身行业前三) ,另一方面也用海量的真实反馈反哺混元模型。

 

更重要的是,这展现了腾讯对AI的目标。腾讯高管在电话会中透露,微信最终将推出一个AI智能体(Agent) 。这个智能体将能理解用户意图,并利用微信生态内的小程序、支付和内容闭环执行任务 。

 

腾讯总裁刘炽平具体描绘了这一蓝图:微信生态拥有通信社交、内容(公众号/视频号)、小程序、商业(小店)和支付五大生态系统。它既能掌握用户意图,也能闭环执行任务。

 

这样一个能理解用户需求,并能在生态系统内直接执行所有任务(如预订、购物、支付)的智能体,就是「理想的个人助手」。

 

关于如何实现这一蓝图,刘炽平在电话会中也坦言,目前还处于非常早期的发展阶段。

 

他谈到微信正并行地做很多事情来逐步推进,包括测试独立功能,首先是将元宝能力引入微信,以便在微信生态内测试许多独立的AI功能;其次是利用AI增强搜索,以更高效地满足用户的搜索、信息收集和分析需求;同时,团队也已开始着手开发「垂直领域的智能体能力」。

 

刘炽平表示,腾讯会逐步开发这些功能,并最终将所有这些智能体能力及AI功能整合起来,从而创造出这个微信智能体的理想蓝图。

 

他还提到了「智能体商务」的远景。他认为,腾讯在构建小商店等电子商务生态方面已取得良好进展。随着垂直领域智能体的发展,在某个时间点,腾讯也将拥有「智能体电子商务」,但这将是进程中的稍后阶段。

 

元宝在微信内的种种尝试,正是通向这个「理想个人助手」的必经之路。

 

2 游戏现金牛的新燃料:全球化「收割」与品类「制霸」

 

AI的投入不仅是为未来布局,也在为腾讯的「现金牛」——游戏业务,提供新的燃料 。本季度,腾讯网络游戏总收入达636亿元 。这其中,国际和本土市场的增长故事同样精彩。

 

本季度国际市场游戏收入同比增长43%,首次突破200亿大关,达到208亿元 。这种爆发式增长可以说是腾讯过去几年全球化战略布局的阶段性「收割」 。

 

增长主要来自三个方面:首先是长青游戏的「第二春」: Supercell旗下的《皇室战争》通过玩法创新和运营,在9月创下了平均日活和流水的新高 。

其次是3A大作的贡献: 2023年入股的波兰工作室Techland,其新作《消逝的光芒:困兽》销量表现强劲 。

最后是工作室矩阵的合力: 无论是Funcom的《沙丘:觉醒》还是Grinding Gear Games的《流放之路 2》,都展现了腾讯投资工作室的强劲产品力 。

 

本土市场射击品类则「全面开花」。三季度,本土市场收入428亿元,同比增长15% ,表现稳健。除了《王者荣耀》和《和平精英》等长青树的稳定贡献外 ,最大的亮点在于射击(FPS)品类 。

 

阿萨拉赛季开启|图片来源:三角洲行动官网

 

腾讯在这个赛道上正呈现「全面开花」的态势 。新发布的《三角洲行动》位居行业流水前三 ,《无畏契约:源能行动》(手游)则成为今年中国市场最成功的新手游 。

 

在电话会上,有分析师针对射击游戏品类提问,认为《三角洲行动》的良好表现似乎带来了「交接班」的意味。

 

腾讯高管詹姆斯·米歇尔对此做出了回应。他用一个巧妙的比喻否定了「交接班」的说法,称其更像是「御前侍卫的扩充」。

 

他谈到,虽然《三角洲行动》表现出色,且《瓦罗兰特》今年异常强劲,但腾讯旗下的其他核心射击游戏,如《和平精英》、《Arena Breakout》(暗区突围)和《穿越火线:枪战王者》,在2025年至今的日活跃用户数或货币化方面也几乎都在增长。

 

因此,他认为这并非老游戏的衰退和新游戏的接替,而是整个产品矩阵的集体扩充。

 

这意味着腾讯并不满足于单点爆款,而是试图通过《和平精英》、《三角洲行动》、《瓦罗兰特》等差异化产品组合,将在中国尚非领先品类的射击游戏(第一人称动作游戏)推向其应有的地位,即拓宽并「制霸」这个高价值赛道。

 

此外,腾讯三季度财报发布当晚,有报道称腾讯与苹果达成小程序游戏支付协议,并从微信小游戏和小程序付费中抽取15%分成的报道,对此,腾讯总裁刘炽平在电话会上回应称。「腾讯与苹果一直在不同领域展开良好的合作和沟通,也一直在持续地沟通来推动小游戏生态更进一步的健康发展,让其更加活跃。到目前为止,我们会保持建设性的态度,等待事态的发展。」

 

第二天也就是今天上午,微信就官宣将支持接入iOS虚拟支付关于小程序将在iOS端支持接入虚拟支付,苹果抽成15%的公告。

 

图片来源:微信公开课

 

3 To B的「甜蜜负担」:AI驱动增长与供应制约

 

To B业务(金融科技与企业服务)本季度营收582亿元,同比增长10% 。其中,企业服务收入保持了双位数增长 。

 

10%的背后,深入财报和电话会可以发现,AI正成为影响该业务的关键变量,带来了增长机遇与供应层面的挑战。

 

首先,体现在增长质量的转变。腾讯To B业务的增长动力,正从过去的基础云服务,转向由AI驱动的高价值服务 。财报显示,企业服务增长的动力之一,就是企业客户对AI相关服务需求的上升 。

 

客户需要的不仅是算力,更是配套的数据基础设施(如云存储COS、数据库TCHouse和VectorDB) ,以及能快速开发智能体的平台(如腾讯云智能体开发平台ADP) 。腾讯正在服务华住、伊利等客户,帮他们打造自己的AI管家和导购 。这是一种比卖服务器更稳固、更深入的业务绑定。

 

与此同时,该业务也面临着清晰的战略挑战和制约。在电话会上,腾讯高管坦诚地指出了一个关键制约因素:AI芯片(GPU)的供应短缺 。

 

腾讯总裁刘炽平表示,如果芯片供应不受限,腾讯的云收入「本应增长得更快」 。但面对短缺,腾讯做出了一个战略抉择:优先满足内部使用(如混元和元宝的开发),而不是向外租赁 。

 

这体现了一种清晰的战略权衡。 腾讯选择牺牲部分短期的云收入增速,来保证核心AI战略的资源投入。这清晰地表明,在腾讯内部,AI基础能力的战略优先级已经高于短期的企业服务营收数字。

 

这一战略权衡也清晰地体现在腾讯的资本支出上。财报显示,本季度腾讯的资本开支(主要用于IT基础设施)为129.8亿元,同比下降24%,环比下降超过32% 。

 

这一下降在财报电话会议上得到了进一步解释。腾讯首席战略官詹姆斯·米歇尔表示,公司2025年全年的实际资本支出预计将低于之前的指引范围,但仍将高于2024年的金额。

 

将「研发支出创历史新高」和「资本支出低于指引」两相对照,腾讯的策略更加清晰:在AI芯片供应受限的背景下,公司将资源高度集中于提升内部AI能力的研发,同时更高效地利用其声称「足够内部使用」的GPU储备 ,而不是盲目扩大硬件采购。

 

不过,整体上看,截至2025年9月30日止九个月,腾讯累计研发开支已达619.83亿元,较去年同期的508.45亿元,同比增长了约21.91%。

 

腾讯正以超高的研发投入,将AI输入进了业务:它在内部提升了研发效率(CodeBuddy覆盖90%工程师) ,在外部优化了广告的精准度(eCPM增长) ,在游戏上提升了用户参与度 ,在微信上酝酿着下一代「超级智能体」 。

 

从三季度的腾讯财报可以看出,AI正成为这家公司的「新基建」。它正被输送到腾讯的每一个业务板块,成为一个「元能力」层。

 

在AI + 广告中, AI驱动的广告定向和智能投放产品(AIM+),正在提升eCPM(千次展示收入) ,让流量变现更有效率。

在AI + 游戏中,AI辅助编程(CodeBuddy) 提升研发效率,AI驱动的用户参与度提升 则在延长游戏生命周期;AI + To B中: AI将企业服务从「卖资源」的IaaS模式,升级为「卖能力」的MaaS(模型即服务)和「卖方案」的AI平台(ADP)模式 。

AI + 微信则是最大的想象空间。AI正在重构微信的「连接」,从「人与人」、「人与内容」,升级到「人与智能体」。

 

过去的腾讯,其叙事核心是「连接」;而未来的腾讯,其叙事核心正在转变为「智能」和「效率」。这家公司正在利用其雄厚的资本(研发投入)和最深的护城河(微信生态),全力押注AI。

 

「新叙事」的路径已经展开。而那个在电话会上被高管们详细描绘的、能够调动整个微信生态的「AI智能体」,则会是这个新叙事的重要节点。

浏览量: 3

对话李彦宏:Chatbot 不是一切,我在 AI 上看到了更让人兴奋的未来

作者|张鹏

 

作为参加了多年百度世界大会的「老观众」,今年这个大会给我的感觉有点不一样。

以前的心理预期是李彦宏一般会先讲上一个多小时,会涉及百度很多条线的产品圈点。毕竟是「百度世界大会」嘛,基本上百度主要产品线的进展多少都要涉及下。

今年的不同,是李彦宏主要扮演了「串讲」的角色,台上具体讲产品和技术演示的,出现了不少新面孔,甚至竟然还有应届毕业生的主讲。

而李彦宏的串讲,感觉一直在努力在把百度的进展,与百度对未来的世界观连接起来。他自己也说:「百度世界大会,更应该是一个百度与大家分享世界观的大会。」而我感觉李彦宏在这个角色上,确实发挥得不错。

其时这次大会核心的技术和产品重点很聚焦——定义「数字人」是未来交互的底层技术、发布「伐谋」、以及体现了百度长期技术投入成果的的「萝卜快跑」,好像是李彦宏几年来首次讲了「不再纠结」的「搜索」,还有文心 5.0 的发布。

无论是李彦宏说的未来 AI 价值的「倒金字塔结构」断言,还是「效果涌现」这个大会主题,感觉百度虽然咬定「AI 全栈」能力的不放松,但其战略聚焦,正在出现明显的变化。

简单来说,从人的状态看,李彦宏比以前更「放松」了,而从事儿的角度看,百度似乎有意识的聚焦了。

让人印象深刻的是一个小插曲。由于这次的产品演示都是现场真实连线演示,结果在实时数字人演示环节,就很「玄学」的真出了联网问题,造成演示没成功。后来据说是李彦宏希望团队再试试,结果后来临时插入的第二次演示效果非常好,这个不完美,但是足够真实的过程,反而激发了所有人的兴趣,后来在展区去体验和数字人罗永浩的实时交流的观众简直爆棚。

这些和以往不一样的细节,让我确实有点好奇,百度这段时间是出现了什么思想上的变化了吗?带着这些好奇,我和李彦宏在会后做了一次长谈,

以下是我们这次交流的部分内容,分享给大家。

 

01

百度世界大会的意义是什么?

 

张鹏: 今年的大会,我记得是第 20 年吧?

李彦宏: 今年确实是第 20 年。

张鹏: 今天你一上来就讲: 这个大会其实不是让大家来看看百度的世界里发生了啥,而是想把百度的世界观分享给更多的人。在 20 年的节点,这句话是有什么特别的讲究吗?

李彦宏 :其实我们一直是希望百度的创新、技术,能够被外界更多地使用。 我一直在强调,技术的价值,一定是解决现实社会当中的问题。 我们做了这么多,我们要充分地展示给大家,让大家发现当中有什么可以用的、能够更好地产生价值的地方。所以百度世界大会每年就是在展示这些,我们特别希望跟大家进行开放的交流,你告诉我你有什么问题,我看看能不能帮助你去解决;或者能不能共创,一起去解决一个有意义的问题,其实一直是这样的理念。

这不是一种炫技——虽然大家可能更喜欢那些炫技的展示,但是我们更关注的,还是说这些技术创新到底在哪儿能用上,用上之后能产生多大价值?

张鹏 :我观察到,这次相对以前,你改变了一些演讲形态,以前,可能一开场听你讲一个小时,这次发现你讲了一会儿,然后就换了不同的人。这有什么特别的设计吗?为什么改变了这样一个形式?

李彦宏: 我觉得两点考虑吧。

第一,就是希望给年轻人更多的曝光的舞台,你可以看到今天有不少产品经理,其实都是非常年轻的,让他们去讲,其实今年年初的时候,Create 大会时也已经开始在这方面做一些尝试,发现效果挺好的,大家对这些年轻人的表现,都赞赏有佳。他们确实现场表现都挺惊艳的,所以我们更希望给这些人曝光的机会、学习成长的机会。

另外一个,我觉得我更希望扮演一个串场的角色,因为很多这些个工作、创新,本来就是他们做的,那么,谁做的让谁讲,其实讲得更加原汁原味、更能够反映事情的真实情况。而我来串场呢,我确实更加有一个 overview 吧,这样串的话,我认为大家的注意力也不太容易被分散,反正他总之还是会回来,还是会期待下一个产品的发布。

张鹏: 你自己也会轻松一点。

李彦宏: 我中间更有机会去看一看别人怎么讲的。

张鹏: 挺好,CEO 其实在一个组织里就是那个「串联全场」的角色

李彦宏: 是的。

 

02

为什么那么看重「伐谋」这个产品

 

张鹏:不过我记得有 2 个产品是你自己亲自讲的,其中一个就是「伐谋」。 为什么要把「伐谋」这种算法自我演化机制的技术,选择推向用在千行百业,特别是中国庞大的工业体系,而不是海外比较普遍共识的 AI for Science 领域?

李彦宏: 从 2022 年底、2023 年初开始,大家觉得这一波 AI 就主要是聊天机器人,但我觉得 AI 的能力应该,远不止是一个聊天机器人。但如果不是聊天机器人,到底是什么?一开始我也说,我特别关注效果,特别关注技术在哪儿能够产生价值。

所以, 我这几年一直在看,除了聊天之外, AI 的技术到底还能在哪儿产生价值? 你刚刚讲,伐谋这种可能更适合 AI for Science,AI for Science 当然重要,我们也在跟一些高校、研究机构也在合作探讨,看看怎么能够帮助 AI for Science 往前去推进。

但是我觉得这套技术的应用场景,远不止是 AI for Science。尤其是像中国是一个制造业大国,我们这么齐全的工业门类,在各个应用场景,在各个领域,其实效率的提升都是很重要的,之所以中国制造有这么强的竞争力,不就是我们做出来的东西又好又便宜嘛?那你凭什么又好又便宜呢?过去说我们中国人勤劳、聪明,能学会去干各种各样的活儿,所以能够跟别人去竞争。但是随着时间的推移,随着我们的经济越发展越壮大、强大,我们的核心竞争力不能永远是这个,我们需要在效率的提升上,怎么能有更先进的技术,明显地去提升效率。

我认为中国一个非常明显的优势,就是我们应用场景多,很多需求我们知道、很多场景我们有,在这些场景当中,如果能大幅度提升效率的话,竞争力就完全不一样了,对经济增长贡献也是会显而易见的。

所以我更多的是从这个角度考虑,我觉得伐谋重要。所以你刚才说今天我自己在讲伐谋这个产品,因为我觉得它重要,我自己也很有激情,想把它表达出来、想把它讲得足够的清楚,让足够多的人都知道,这是一个什么技术、什么产品。

张鹏:所以你是希望像「伐谋」这样不只是 AI 局部提升效率,而是在企业系统,甚至是产业系统里去寻找全局最优解的 AI 能力,能带来「工业 5.0」吗?

李彦宏 :我也想说这个,工业 4.0 我们可能已经实现了,那么 5.0 长啥样?或者说它的哪些方面还有巨大的提升空间?我觉得类似这种寻找「全局最优解」,实际上就是一个已经看得比较清楚的、巨大的提升空间。

张鹏: 如果今天要定义 5.0 的话,它可能会是什么样的一些根本性的变化?它背后什么样的引擎?

李彦宏: 伐谋其实还是有很大的通用性,我今天上午讲,对那些你要想解决的问题,解决方案好不好,它容易验证,伐谋一定能够迭代出来一个过去你不知道的、更好的解决方案。你想想这样的描述,其实在社会经济生活的方方面面,都可以去应用到,越复杂的问题,它可能越能够显现出来它的威力,或者说,它跟别的解决问题方法的差别就会越大。它有一个非常广的适配性,只需要去在各个领域积极地探索,就能把这里的价值充分地发挥起来。

张鹏:无论是宏观的经济体系,还是 一个微观的组织、企业,它所在的行业、工作流、业务组织、商业模式的变化,面临着复杂系统是,有可能会需要一些这样的东西帮他们能够跳跃出原有的惯性,去做进一步「超越努力」的进化。

李彦宏: 是的。 越复杂的问题、你越要想着用这种方法;简单的问题,可能别的方法也能解、甚至解得更好。但是复杂的问题,这种方法威力就明显是不一样的。

我自己的认知是说,AI 不应该像人。现在社会上可能很多人,甚至主流意见都是说,我们怎么样构建一个 AI,让它具备人的能力,让它越来越像人。我自己不觉得, AI 从来就跟人不是一个物种 ,我们有时候讲硅基生命、碳基生命,其实都是想把它共性找出来,让 AI 去模仿人,去做人该做的事。

我始终觉得,这有点像比较人和老虎一样,你说要让人像老虎一样,爪子那么锋利,没必要;那么反过来,你说要让老虎像人一样有那么聪明的大脑,或者说每天吃那么多素食,其实也没必要。AI 是一个不同的物种,我们没有必要老是拿人这个物种、这个「模子」往里塞它。

有些东西确实是 AI 擅长的,那我们尽情地让它去发挥;有些东西确实 AI 不擅长,今天我们的大模型很厉害了,但是大模型耗电太多了,做一个很简单的事,可能 AI 耗电就很多,但人脑耗电很少,很多事情完成任务的能量消耗是远远低于这些 AI 模型的。

张鹏: 所以人和 AI 按道理应该做更好的分工?

李彦宏 :对。所以,我们最好不要把 AI 当成跟我们一样的东西,AI 在不同的场合下,它扮演三种不同类型的角色:

一种角色叫做「助手」,这种情况下,AI 完全处在辅助的角色,人处在主导的角色。我想要怎么样,我就指挥这个助手做什么事情。

第二种角色我们叫做「搭子」,搭子就有点平等了,就是你有什么想法、我有什么想法,我擅长干啥、你擅长干啥,就是合作一起来干一个事情,或者一起去玩个游戏。。

但除了这两个角色之外,我认为还有第三种角色,就是在某些问题上,AI 的能力是远超人类的,所以这个时候你就信它就完了,你没必要去多想,为什么不能信 AI 呢?可以信 AI 啊,它在很多问题上它就是比人类要厉害很多,比如你跟它下围棋,你真下不过它。

张鹏: 回到伐谋的角度去看,它能够对复杂问题、海量信息,可以持续进化的、用强化学习的方式去寻求全局最优解,我确实认为,这件事按道理人是很难做到的,就是应该它去发挥的,所以它至少应该是个很好的「参谋」。

李彦宏: 没错。很多部门 AI 都能够起非常重要的作用。现在我觉得,还是我们的想象力被限制了,所以我非常希望大家积极地尝试,我上午也讲「内化 AI 能力」,就是说,现在不管 AI 具备什么样的新能力,你怎么把它变成你的「原生能力」,怎么把它变成你组织里一个不可或缺的、像神经系统一样的,它是贯穿你整个身体的,它不是你的某一个器官,它完全是渗透性的。怎么真正做到这一点,我觉得对每一个企业来说都是很重要的。

张鹏: 当年我们打比方说手机是人的一个外部器官延伸。听起来,AI 未来它肯定不是个器官的概念,它更像是某种「原力」,如果你能很好的运用它,就变成了《星球大战》里的杰达骑士。

李彦宏:对,AI 应该是一个渗透性的,无处不在的力量。

 

03

「萝卜快跑」长大成人的意义

 

张鹏 :今天你还有一个产品是自己从头讲到尾的——「萝卜快跑」,这个自己讲是出于什么考虑?

李彦宏 :确实挺不容易的。我们无人驾驶技术从 2013 年开始做,十几年的历史,这中间其实绝大多数时候,外界不仅是不看好百度的萝卜快跑,甚至是整个这方向都不认同。我记得有一个图灵奖获得者,就说无人驾驶是不可能解决的,你即使实现了 AGI,无人驾驶也解决不了,讲得很悲观。

但是我们总觉得,这个东西 (无人驾驶)它一旦要解决了之后,对人类的意义实在是太大了。如果它意义这么大的话,我们难道不应该去冒点险吗?即使是 90% 的概率都会失败,10% 的概率会成功,那我也值得啊!万一成功了呢?就是这种信念一直支撑着往下走。

到这一两年,大家慢慢开始对这个行业或者说对这项技术越来越看好。可能这里头也有我们的原因:比如说,我们从 2022 年开始,大规模地部署萝卜快跑,证明了它确实是能跑通的。在这种人口密度非常高的大中型城市里头,它能够跑起来,能够比人类司机安全十倍,我觉得还是意义很大的。

虽然今天上午我们没讲,但我一直特别在乎的就是——每年有超过 100 万人在交通事故当中死亡,这里头 94% 是人为原因造成的。所以很多时候我看到新闻讲,哪儿又出了一个交通事故,我自己就想,如果是无人驾驶在操控这台车的话,它不应该出这个交通事故。

所以不断的有这个外界刺激,让我觉得说,做成这件事真的是太重要了!所以我想试试。那么一直试了十几年,现在看起来越来越多的人开始信,这是代表趋势的,是可以实现的。未来 10 年、15 年之后,街上跑的车可能大多数都会是无人车了。我觉得到了这个时间点,我上午讲说已经到了这种临界点,所以我还是很希望自己跟大家来传递一下这个信息。

张鹏 :「萝卜快跑」把技术本身变成了规模化交付的有效服务。过去在中国科技领域确实不多见。

李彦宏 :确实 比较少这种先例,就是一项技术一个企业坚持投入十几年,最后慢慢还真做成了,还进入了实用阶段, 收获很大价值 ,就是这种例子过非常少。 据我的了解,一方面社会对于企业的研发投入非常关注;另外一方面,他们也有一种大致的划分,比如说中小企业基本上就不用再研发,你就拿成果来做产品化;再大一点的企业,可能为未来两年到五年能够进入实用阶段的技术进行投入;那么五年到十年才能够有效果、才能够有收益的技术,可能就是那种超大型企业才会愿意去提前投入。那么十年以上才能够见到效果,一般就是学术界做学术研究,他就不建议企业在这个方向上去投入了。我觉得一直到今天,大多数人的认知还是这样的。

但是今天我们也看到另外一个现象,就是 AI 相关的投入,学术界其实不太能做,上来就要万卡才能训练一个模型。

张鹏 :但他们确实没有那么多卡。

李彦宏 :所以不大可能让学术界去做这样的投入,反而是工业界由于有不少公司还是有一定的积累。所以我投十年就十年吧,如果真的有很好的回报,有很大的社会意义的话,我们是可以的,我们能够投得起这个资源。所以我是希望,当未来的人再看到比如说萝卜快跑、昆仑芯,这些投入都十年以上才见到效果的话,他们可能更愿意去做这种十年以上的投入,我认为这是一个良性的引导,应该给大家更多信心去做这样的事情。

 

04

对「起大早,赶晚集」的复盘:

要去做「更纯粹」的探险

 

张鹏 :我很认同百度在自动驾驶上的前瞻投入,这个长期主义的闭环也很让人欣慰。不过我也问个不知道是不是有点冒犯的问题,外界有人会说,百度也曾经在很多事情上「起大早、赶晚集」。你肯定听过这样的说法。

李彦宏 :当然,别人说我们「起大早赶晚集」,这不冒犯,一些也是事实。甚至我在内部也让大家研讨说,我们为什么会「起大早赶晚集」。

张鹏 :过去确实不是每一件事都会有像萝卜快跑这样的结果。那么你怎么在内心在去坚定自己的信念?这些复盘后来有什么结论吗?

李彦宏 :我们不能够指望所有的创新尝试都是成功的,创新的特点就是,大多数创新会失败,我们要接受这样一个现实。所以百度内部可能起过十个不同的创新项目,如果九个都失败了,我认为是很正常的,它就应该失败,从概率上讲就应该失败,如果有一个成功了,那就非常好。这是一方面。

另外一方面, 百度这些年有做成的、有做失败的。如果有什么规律性的话,当这件事的成败几乎完全取决于它技术的先进性的时候,我们的成功概率就会大不少,尤其是这个技术需要很多很多年的投入和迭代,那我们成功的概率就会更大一些 。

但是当这件事情,仅仅是因为它市场大,或者说技术在这里头虽然有一定作用,但不是起决定性作用,我们冲进去之后,失败的概率就会高很多。所以未来, 我们在起新项目的时候,我可能更多的会关注,技术在这里头是不是起决定性作用?如果是,我愿意尝试,十次有九次失败,我认。那如果不是呢,咱们最好别再去做这样的尝试了,因为它无论成败,对这个公司的意义其实也没有那么大。

张鹏 :你认为核心实际上是那个起心动念应该纯粹,它技术纯度越高,百度做成的机率就越高,

李彦宏 :是。哪怕它需要很长时间,十年也 OK,我们可以,我们有这个耐心。

 

05

数字人技术与下一代交互

 

张鹏 :我好奇的八卦一下,今天数字人在演示的过程中是不是遇到了一些问题,具体发生了什么?

李彦宏 :我后来问了,团队为了保证效果,他连了一条专线,没有用 5G,因为现场有好几千人,怕网络拥堵,结果反而那条专线不是很稳定。

张鹏 :反而是专线出了问题是吧?所以第一次就没能及时演示出来。

李彦宏 :是的,当时我觉得特别遗憾。我昨天下午彩排的时候,我看它走过一遍这个流程,我觉得还效果挺好,所以我本来准备他演示完了之后,我上去讲实时互动数字人有这个特点有那个特点。结果当时演示了好几下没成,我就在旁边跟我们同事讲,我说咱们再去尝试一下,再来一遍也没关系,一定要真实演示一下我们的技术。

张鹏 :如果第二次还出问题,估计网上就炸了。团队是不是压力很大?

李彦宏 :我觉得我们的技术是过硬的,我当时并不知道是网络的原因,只是觉得如果是比较边缘的原因造成没演示成的话,这个东西太遗憾了,所以他们就赶紧去准备,后来可能再测试一下说可以了。我听说后来就直接转到 5G 网络就可以了。

张鹏 :效果确实挺好,我刚才看展区里,就那个展位是人排得最多的,都去体验罗老师的实时对话技术,反而让大家激发了兴趣。其实现场的演示大概率就是会遇到七七八八的问题,这次我看你们基本都是用的现场的演示?

李彦宏 :我觉得现场演示其实更有意思吧。

张鹏 :这个都要现场演示的板儿得你拍吧,要不然办会的同学们敢冒这么大风险吗?

李彦宏 :说实话好多都不是我拍的,只是我有时候会问,这个为什么不是现场?像比如说连线中东那个,彩排的时候一开始说我们已经录好了给你看一下,我说别录好,咱能不能直接连线?他们说当地网络不稳定,我说那试试看呗。

张鹏 :回到数字人,你在说数字人的时候定位它是未来交互的底层的技术,我们以前对数字人的理解,它是一种应用,我们可以在电商、直播各个维度都可以用起来,但是你把它定义到交互,交互对于咱们科技圈是一个很大词,因为我们一旦说交互有变化,就意味着是一个时代的更迭。我们怎么去理解它会是一个新一代交互的底层?

李彦宏 :因为你看这一波 AI 起来之后,尤其是 C 端主要的产品形态就是所谓的 ChatBot,它是一个对话机器人或者聊天机器人,我觉得这个肯定不是最佳的人机交互界面,因为对于用户的要求还是太高了。不管是说话也好、打字也好,我得说一串或者输入一串东西,才能够跟 AI 进行交互。这个门槛是很高的,这跟你刷抖音完全不是一回事,你只要一刷就变,一刷就变,太容易了。中国十几亿人,可能绝大多数,99% 都会干这个事。但是你让一个普通的用户跟 AI 进行对话,其实还是有点门槛的。所以我认为,这个(交互方式)应该不是最佳,至少不是唯一的人和 AI 交互的方式。

那么除了这个方式之外,还有什么方式?我现在能想到的就是数字人。数字人一方面它仍然非常依赖自然语言,另外一方面,它这种互动感,它这种情景沉浸感,甚至加入了视觉模态感知后,数字人他能够看到你拿的东西是什么,这会降低对用户精准输入的难度,也会增加交互中对用户的情绪价值,这个交互我觉得要自然得多、门槛要低得多。所以我很看好数字人技术作为一个全新的交互形态的日底层技术的发展潜力。

张鹏 :所以你觉得数字人的「类人」形态,本身就在交互体验上对人有更大价值。

李彦宏 :我完全同意。当然了,它是「类人」,它又跟「真人」有不一样的地方。你在跟一个真人交互的时候,其实还是多多少少有一点压力感的:该谁说话?谁来挑头发起一个新的话题?如果中间沉默了会不会尴尬之类的。你跟数字人其实没有这种压力,你不说话,它也不说话,也不会觉得尴尬。它不停地说,或者你就坐在那看或者听,也没问题,你想插话也没问题,所以这个自由度我觉得反而更大一些,压力更小一些。 它真的可以变成一个比 ChatBot 更高级的人机交互方式 。

 

06

搜索的「纠结」与「不纠结」

 

张鹏 :我感觉你对火热的 ChatBot 有一些自己的「保留意见」,不过今天确实越来越多的用户在接受和大模型对话问答,甚至很多时候正在改变他们获取信息的习惯。这就让我很好奇搜索正在面对的挑战。你在台上今天提到搜索曾经面对 AI 是有过「纠结」的,你当时在纠结什么?现在找到的目标又是什么?

李彦宏 :我首先并不反感 ChatBot。我只是觉得它不应该是唯一形式,就是这么大一个产业浪潮,最后大家都聚焦到一个 ChatBot 上,这个我觉得是有问题的,但是你说用不用?反正我天天用。

然后对于搜索,某种意义上讲,新的这种 AI 的能力对搜索是一种颠覆。过去传统的搜索,一个检索词,然后是个蓝色的链接,越来越显示出来,它不能够比 AI 生成的内容更好的去满足用户的需求。纠结之处在于什么呢?还是有很多用户已经非常习惯了百度搜索这样的一个呈现形式,当你改,比如说最直接的就是它响应速度可能没有那么快了,过去你搜一个什么东西,0.1 秒它就出结果,你还没来得及反应了,结果已经出来了。今天你要用 AI 生成,尤其是稍微复杂一点的问题,它得等好几秒钟才出结果,这对于习惯了搜索的用户来说呢,实际上我们看用户实验,就是说留存、时长什么的,都是负的,我所说的纠结很多时候就是指的这方面。

但是一方面,这个大模型推理成本在迅速下降,推理速度也在急速的提升。另外一方面,当越来越多的人用过 ChatBot 之后,他说这样也挺好啊,我稍微等个两秒钟,我就能够得到更直接的结果,不用我一条一条上滑去看了,也挺好。 所以用户在逐渐接受这个新的技术带来的这种新的交互形态 。

与此同时,除了文字内容之外,我们还可以生成图片,还可以生成语音,还可以生成视频,还可以有数字人等等,那就没有那么纠结了嘛,不管什么样的形态,如果能够很好的满足用户的需求的话,那就是好的产品,那就是代表未来方向的。所以我们就努力往那个方向去跑就好了。

张鹏 :所以不纠结是因为把这件事往底层去推,到底搜索过去在解决什么问题,今天结合 AI 怎么更好的解决。

李彦宏 :本质是你到底有没有满足用户的需求?而不是说用户已经习惯了这个产品形态,让他改,要付出一定的代价。

张鹏 :搜索它是一个方法还是一个目标?这件事在今天我们该怎么描述它?那个最本源解决的问题,可能大概率没变,但它可能描述会有变化,有没有想过这个问题?

李彦宏 :其实在搜索引擎这个词诞生之前,我学的那个专业叫做信息检索,或者说在我一开始接触这套东西去解决人们寻找信息的这个问题的时候,还没有搜索引擎这个产品形态。所以在我看来, 没有什么叫做搜索引擎就是正确的产品形态这个观念,我们一代一代的技术都带来新的可能性,那我们就要极致的利用这个技术的能力,更好地去满足人们的需求。

所以百度早年的时候,我们使命叫「让人们最平等便捷的获取信息、找到所求」。

张鹏 :其实这里面没有「搜索」俩字,但是我们那个时代对实现形态的理解就是搜索。

李彦宏 :对,那时候理解就是搜索引擎,今天你看这些 ChatBot 其实类似,只不过它是更加 powerful。今天百度使命,我们说「用科技让复杂的世界更简单」,就是你很复杂的需求,你扔给它,它也能懂,它也能给你一些 Solution,这个技术演进的过程,我觉得某种意义上讲,对我来说是很正常很自然的。我觉得它就应该是这么一个规律,就应该往这个方向上去变,就应该能解决越来越多的人的信息获取、内容消费,甚至是任务执行等方面的需求。

张鹏 :听起来搜索就是手段,不是目标。

李彦宏 : 当然是手段,甚至它是个壳,它的实质其实不停的在变的。

张鹏 :如果有机会,我们打个响指,让整个社会对百度的认知,就是从搜索这个壳里出来,你更希望大家怎么今天去理解百度?因为过去搜索太成功了,我觉得绝大部分的人都把对百度的认知固化到这个壳上,如果有机会改变,你更希望这个时代大家对百度的认知是怎样的?

李彦宏 :百度一直是一个技术公司,我们这个技术基因其实还蛮强的,所以 今天的百度,是一个什么公司呢?我们是一个「拥有强大互联网用户基础的 AI 公司」。所以你看它的本质,其实就是一个人工智能公司,是一个科技公司 ,只是由于我们的技术力量使得每个月有超过一半的中国人都在这儿找信息,所以它确实有一个比较强大的用户基础,这当然是好事。就是对于我们想要研发的这个技术来说,我有很多机会去让人们尝试一下,或者说去测试一下,人们对这个技术的接受程度怎么样,或者效果好不好,或者说当我有好的技术的时候,我能够以必须快的速度推广到很大的一个人群范围当中去。

所以你刚才说 去掉壳的百度是什么?百度是一个技术公司,是一个什么技术公司?是一个 AI 技术公司,是一个什么样的 AI 技术公司?是一个有强大的互联网用户基础的 AI 公司。

张鹏 :如果这个社会能给个机会把百度看成是一个 AI 时代的创业公司,带着很多的用户、带着足够的资金储备,带着对这个技术很多的积累,那我觉得大家可能看百度的感觉会不一样。

李彦宏 :其实你说得这个特别对,我有时候也在想,百度就应该是这个样子,我们因为搜索有庞大的用户群体,但是呢,我们是一个技术公司,我想用技术去改变世界,有各种各样技术创新的方向,好多我都想去试一试,试一年不成,OK;试两年不成,OK;试五年不成,OK;试十年还没成,如果有意义,我还会接着试下去,我就是这样一个人,我们就是这样一个公司。外界只要理解我的产品就好了,你用了我的产品,给你创造了价值,我真的就很高兴。

 

07

什么是百度对下一个十年的「非共识」?

 

张鹏 :看来你不是很在意别人怎么定义你,关键是自己怎么定义自己。说到这一点,我觉得今天你提到了一个非常重要的词,叫 AI 能力的「内化」。你一直在告诉大家未来的企业一定要通过「内化 AI 能力」形成自己的竞争力。那么百度对自己是怎么推动「内化」的,你期待的结果是什么?

李彦宏 :其实我们内部有很多这样的讨论,我们叫做思研会,就是在各级组织,大家都要定期的去组织思研会。这个思研会的主题,其实多多少少都跟怎么内化 AI 能力有关系,就是你这个业务,你这群人,到底是怎么用 AI 的,怎么用 AI 来提升效率?大家比较容易想到的是,AI 作为一个个人的助力,不管是辅助编程,或者是你生成文档,今天比如说像 GenFlow 那些东西,这些比较容易想到,我也看到有不少其他公司在推进,就是内部在内化 AI 能力,或者说使用 AI 的时候大多数大家想的都是这样的,怎么样让 AI 去赋能企业里的每一个个体。但是我觉得这还是一个比较浅层次的、早期的内化。

真正的内化,是在组织层面,不是在个人层面 。当 10 个人一起工作的时候,用什么 AI 工具让大家的协作效率更高?当 100 个人共同去解决这个问题的时候,是不是有新的 AI 的方法帮助你更好地解决?再推广到整个集团公司,几万人,是不是有一个什么共同的 Backbone 支柱?它本身就是 AI 能力,你只是在这个支柱上处在不同的位置。这是我们真正去内化 AI 能力的时候,要去实现的一个结构。不是简单赋能个人,是赋能整个组织,是赋能你要去解决的问题,你要干的事。所以我今天上午说,未来对于绝大多数人来说,你的工作就是, 把你要解决的问题转换成 AI 能解决的问题 ,没有别的工作了。

张鹏 :其实这个「最后的工作」感觉还挺难的。

李彦宏 :是有挑战,不容易,但是有挑战才有乐趣嘛,如果是很重复性的工作,我宁愿就不做了。这个需要耐心,你对孩子是天然会有感情的,会培养他,但你对 AI 天然有感情吗?如果说你试了一次,它不 work,绝大多数就放弃了。

张鹏 :所以面对 AI 的内化这件事,或许每个组织都不能是单纯的「甲方心态」,需要有点「为 AI 父母」的觉悟,才能真的培育好自己的「AI 继承人」的感觉。

李彦宏:是的, 但说实话我认为这个过程会很快,你可能今天觉得说脱胎换骨不容易,但明天就会发现说其实也没有那么不容易,当你的同行做了,为什么你不能做呢?

张鹏:10 多年前你 投入 AI 是当时的非共识。那么今天,你对未来十年还有哪些「非共识」的坚定判断?

李彦宏 :有。其实也不是什么新东西,就是从 2023 年开始,我就一直在讲的四个字叫做「应用驱动」。今天大家在卷芯片、卷模型等等,我一直是说要卷应用,应用才是真正创造价值的地方。很多年前我说 AI 很重要,但是今天 AI 已经成了一个共识,但是 AI 又分不同的层次,我认为机会最大的是在应用层,不在模型层、不在芯片层。我希望未来很多年以后,能证明我这个观点是正确的。

浏览量: 3

传苹果从微信小程序抽成 15%,腾讯回应;特斯拉考虑支持 CarPlay;iPhone Air 成功支持实体卡 |极客早知道

消息称苹果从微信小程序消费中抽取 15% 分成,腾讯回应

苹果公司今日正式宣布推出「小程序合作伙伴计划」(Mini Apps Partner Program),旨在扩展 App Store 对小程序的支持。该计划强调通过特定技术接口确保用户安全和流畅体验,同时为开发者带来业务拓展机会。

彭博社报道称,腾讯公司已与苹果公司达成一项协议,根据该协议,苹果将处理微信小游戏和应用中的支付事宜,并从中抽取 15% 的分成。

在今日举行的腾讯集团 2025 年第三季度财报电话会上,腾讯管理层对此消息进行了回应,称腾讯与苹果有着非常好的关系,在很多方面都进行了合作。腾讯和苹果一直在讨论如何使小游戏生态更活跃,「我想在某个时候可能会有一个正式的批准」。(来源:IT 之家)

 

特斯拉或将考虑支持 Apple CarPlay 以提振低迷销量

据悉,特斯拉已就引入 CarPlay 支持讨论数月,不过目前尚未有最终方案,短期内也不会有相关宣布。正值其他车企纷纷取消 CarPlay 之际,该消息也引发业界关注。例如通用汽车就公开表示,未来新车型将全面移除 CarPlay 和 Android Auto 支持。

与此同时,苹果仍在努力优化 CarPlay,吸引用户和厂商采纳。最近发布的 iOS 26 增加了导航、通信等多项 CarPlay 新功能。苹果还在推动 CarPlay Ultra 的普及,这一增强版体验可接管汽车的多块屏幕。但不少车企对让苹果全面接管车载显示器持保留态度。

有业内评论认为,CarPlay 和 Android Auto 的缺失正是特斯拉潜在车主最常吐槽的问题之一,其 Reconsider(重新考虑)这一战略无疑是重大变化。不过外界猜测,特斯拉有可能只会推出「精简版」CarPlay 镜像功能,使其显示于特斯拉自研操作系统的一部分窗口,并不会开放完整的 Ultra 体验。无论如何,这都标志着特斯拉在信息娱乐系统上的重要转折。(来源:cnBeta)

 

阿里巴巴据悉拟全面改造旗舰 AI 应用 力争赶超 ChatGPT

阿里巴巴正准备在未来几个月对其主要的移动人工智能(AI)应用程序进行全面改造,使其更接近于 OpenAI 的 ChatGPT,这是该公司更广泛努力中的关键一步,旨在追赶竞争对手,并最终实现从个人用户中盈利。

据知情人士透露,阿里巴巴计划首先在 iOS 和安卓系统上更新现有的「通义」应用程序,并将其重新命名为「通义千问」——以该公司著名的 AI 模型命名。这些知情人士表示,阿里巴巴将在未来几个月逐步增加 AI 代理功能,以支持包括淘宝在内的主要平台上的购物。

知情人士透露,最终目标是试图使通义千问成为一个功能齐全的 AI 代理,这也是中美两国业界的首要目标。知情人士称,阿里巴巴计划最终推出海外版本向全球扩张。知情人士称,过去几个月,公司内部已有 100 多名开发人员参与这次改造,这是首席执行官吴泳铭 9 月份透露的额外 AI 投资的一部分。(来源:新浪科技)

 

百度文心 5.0 大模型发布,支持多模态理解

11 月 13 日上午消息,今日举办的 2025 百度世界大会上,百度创始人李彦宏宣布文心 5.0 大模型正式发布,该模型支持多模态理解、创意写作及智能体规划等能力。

据百度 CTO 王海峰介绍,文心 5.0 是一款原生全模态大模型,具有原生全模态建模、理解与生成一体化等特点。在多项国际测评中,该模型均取得了领先成绩。(来源:新浪科技)

滴滴自动驾驶宣布出海,首站落户中东阿布扎比

11 月 13 日下午消息,滴滴自动驾驶宣布与阿布扎比投资办公室(ADIO)达成战略合作。滴滴自动驾驶加入阿布扎比智能和自动驾驶汽车产业集群 SAVI,双方将在自动驾驶技术创新应用、AI 人才培养、生态建设等领域开放合作,共同支持阿布扎比建设领先的智慧出行和可持续交通生态,并逐步将合作拓展至更广泛的中东地区。

阿布扎比 SAVI 产业集群,由阿布扎比经济发展部和阿布扎比投资办公室主导发起,是中东和北非地区的智能交通枢纽。SAVI 产业集群旨在推进海、陆、空自动驾驶技术创新和商业化,加速构建智慧城市。ADIO 预计,到 2045 年 SAVI 产业集群将为阿布扎比贡献 440 亿迪拉姆 GDP,创造 4 万个就业岗位。(来源:新浪科技)

 

国际标准化组织明确 6G 时间表和路线图,业内预计 2030 年左右开始部署

今日在北京举行的 2025 年 6G 发展大会发布的消息显示,制定全球移动通信标准的国际组织「第三代合作伙伴计划」(3GPP)已启动网络架构、无线空口、安全技术等 6G 研究项目,形成了 6G 标准化时间表和技术路线图。

当前 6G 技术研发已取得阶段性进展,关于 6G 服务需求的研究已完成 77%,涵盖人工智能集成、计算、感知等方面的架构研究正在推进。业内预计,6G 网络将在 2030 年左右开始部署。到 2040 年,6G 连接数有望超过 50 亿,占全球移动连接总数的一半。(来源:IT 之家)

 

淘宝闪购率先开通国内首个海岛无人机航线

11 月 13 日午间消息,近日,在花鸟岛,淘宝闪购已开通四条无人机航线,可满足岛屿上的消费与应急需求,极大方便了游客和岛上居民。

资料显示,花鸟岛是嵊泗列岛最北端有人居住的岛屿,形如展翅欲飞的海鸥,是沪杭周边最受欢迎的旅游目的地之一,年游客量超 50 万人次。由于地理位置特殊,岛内无桥梁与大陆相连,居民和游客进出需依靠轮渡。随着无人机航线完成覆盖,对于居民的餐饮、医药、紧急物资和小型包裹等需求,淘宝闪购无人机也能够提供快速应急响应能力。(来源:新浪科技)

宇树推出首款轮式人形机器人

11 月 13 日,宇树科技在官网上线了一套人形机器人数采训练全栈解决方案。该方案基于一款轮式机器人 G1-D,由高性能人形机器人本体、系统化的数据采集工具和全面的模型训练及推理工具组成。

G1-D 机器人身高范围约 1260-1680mm,头部配备高清双目相机,手部配备高清相机。G1-D 分为通用版和旗舰版,旗舰版可选配移动底盘,移动速度≤1.5m/s。

G1-D 通用版和旗舰版分别有 17 和 19 个整机自由度(不含末端),单臂自由度(不含末端)为 7 个,单臂最大负载约为 3kg。G1-D 采用轮式与升降相结合的移动升降设计,垂直作业空间为 0-2m,腰关节运动空间为 Z±155°、Y -2.5°~+135°。(来源:新浪科技)

 

2998 元起:大疆 Osmo Action 6 运动相机发布,首搭 f/2.0-4.0 可变光圈、1/1.1 英寸方形传感器

11 月 13 日消息,大疆现已发布 Osmo Action 6 运动相机,其最大亮点是搭载了 1/1.1 英寸方形 CMOS 传感器,新增 4K 自由裁切模式,可让用户在横竖屏视频间自由切换,同时还是大疆首款配备可变光圈的运动相机。《大疆 OSMO Action 6 体验:完美进化,不止运动 》

硬件方面,这次 Action 6 搭载全新升级的 1/1.1 英寸方形 CMOS 传感器,其像素大小为 2.4μm,最高动态范围可达 13.5 挡,最高可拍摄 4K 120FPS 4:3 比例视频,支持超级夜景模式,可在低光照环境下以最高 4K 60P 的画质拍摄。

而超级夜景模式则会开启最高 f/2.0 光圈,提升进光量,降低噪点对画面的干扰的同时还可在较小对焦距离下营造虚化效果,增强氛围感,用户还可以在灯光明亮的场景下开启星芒模式,这时光圈会缩小至 f/4.0,让画面的点状光源呈现星芒效果。(来源:IT 之家)

OSMO Action 6 外观 | 图片来源:极客公园

 

华强北再发力:超雪团队成功实现苹果 iPhone Air 改实体 SIM 卡

11 月 13 日消息,超雪团队今日发文,宣布苹果 iPhone Air 改实体 SIM 卡成功,并且已经成功读上了实体卡。有用户询问:「工程版还是量产版?」超雪团队回复:「支持实体卡出信号还是首次呀。」

值得一提的是,今年 10 月,超雪团队发文,称其 eSIM 小程序「bleuicc」已正式上线,目标是「让所有手机都支持原生 eSIM,包括有锁机」。参考小程序页面,其中显示该团队使用蓝牙写入 / 启停 eSIM。(来源:IT 之家)

浏览量: 4

雷军:小米YU7改名,被误会是丐版;传淘宝闪购周末峰值超美团;低价 MacBook 或年底亮相,599 美元

雷军征求小米 YU7 标准版改名意见:很多人误以为是入门或丐版,配置绝不输于竞品 Pro 和 Max 版

8 月 11 日消息,小米创办人、董事长兼 CEO 雷军在微博向网友征求小米 YU7 标准版是否改名的意见,称标准版很多人误以为是入门版或者丐版,但实际上非常强大,续航高达 835 公里,700 Tops 算力的 Thor 芯片和激光雷达等等,配置绝不输于竞品 Pro 版和 Max 版。

目前,该投票已有 2404 名用户参与,有 1794 票投给了「低调一些,继续叫标准版」、610 票投给了「对齐竞品,直接叫 Pro 或 Max 版」。

据此前报道,小米 YU7 于 6 月 26 日晚上市发布、7 月 6 日交付首批车主,提供 YU7 标准版、YU7 Pro、YU7 Max 三种车型配置,售价 25.35 万-32.99 万元。该车开售 3 分钟大定突破 20 万台,1 小时大定突破 28.9 万台,仅 18 小时锁单量便突破 24 万台。(来源:IT 之家)

OpenAI 申请 GPT-5 中国商标遇挫,相关申请均被驳回

8 月 11 日消息,OpenAI 上周正式发布新一代人工智能模型 GPT-5,该模型已在中国提交商标申请,国际分类涵盖科学仪器、网站服务,目前所有相关申请均已被驳回。

具体来看,OpenAI 公司已通过两家关联公司在中国提交了商标申请,其中:

欧爱公司申请注册两枚「OPENAI GPT-5」商标,国际分类为网站服务、科学仪器,目前均处于等待驳回复审阶段;

欧爱运营有限责任公司申请注册两枚「GPT-5」商标,国际分类同样为网站服务、科学仪器,商标状态也均为驳回复审中。

据悉,「GPT」全称为「生成式预训练转换器」,已被全球多国商标机构认定为通用技术术语,缺乏显著性。美国专利商标局(USPTO)曾两次驳回 OpenAI 对「GPT」的注册申请,理由是「阻止竞争对手正确描述其产品」。

发现,欧爱运营有限责任公司还在 2023 年申请多枚「CHATGPT」「GPT-4」「GPT-6」「GPT-7」商标,国际分类为科学仪器、网站服务,当前商标状态均为「驳回复审中」。(来源: IT 之家)

 

事关稳定币,蚂蚁集团辟谣

8 月 11 日消息,蚂蚁集团今日在其官微发文:关注到网络上有消息宣称「蚂蚁集团与中国人民银行、中国稀土集团共建全球首个稀土人民币稳定币」,并以此诱导投资者关注相关板块,蚂蚁集团从未与相关机构有此类计划,请公众注意甄别,谨防上当受骗。

(来源: TechWeb)

 

微软 GitHub CEO 托马斯・多姆克离职,将再次创业

8 月 12 日消息,微软 GitHub CEO Thomas Dohmke(托马斯・多姆克)晚间发文,宣布将卸任 GitHub CEO 一职,去开启他的下一段冒险。

托马斯表示,GitHub 正在蓬勃发展,未来前景光明。

托马斯在发给 GitHub 员工的内部帖子中表示,十多年前,他的初创公司被微软收购后,他和他的家人从德国搬到了美国。从开发移动开发者工具,到与 Nat Friedman 一起运营 GitHub 的收购,再到成为 GitHub 的 CEO 并引领公司进入 Copilot 和 AI 时代,「这真是一段难忘的旅程」。

然而,经过这么长时间,托马斯表示他的初创公司根源开始拉扯他,因此决定离开 GitHub,再次成为创始人。GitHub 及其领导团队将继续作为微软 CoreAI 组织的一部分执行其使命,更多细节将很快公布。(来源:IT 之家 )

美团上线「点外卖看鹿晗演唱会」活动,鹿晗工作室:平台活动非官方授权

8 月 11 日消息,近日,美团 App 内出现点外卖看鹿晗演唱会相关活动信息。对此,2025 鹿晗 Season4 亚洲巡演活动官方微博 @ 这就是 Season4 发文并配图表示:

如下某平台活动及话题,均非我方及鹿晗先生官方授权合作,已侵犯鹿晗先生的人格权及我方对该演唱会的独家合法权益。对此我方已完成取证,并保留依法追诉的权利。

随后,鹿晗工作室官方微博也转发了该消息并提醒网友:「请认准官方渠道,勿轻信此类未经授权的营销信息,保护好自身隐私及财产安全,谨防权益受损。」

值得一提的是,笔者在美团平台搜索发现,相关页面也出现了用户获得鹿晗演唱会门票信息。另外,有媒体就此事向美团方面求证,截至发稿,官方暂未回应,客服表示「相关问题会详细记录反馈给相关部门。」(来源:快科技)

 

消息称淘宝闪购上周末峰值首次超过美团

8 月 12 日消息,据晚点 LatePost 昨日晚间报道,在 8 月 7 日立秋这天,淘宝闪购的日订单量在当天 20 点就创下了新纪录,但这一天的日订单量,美团仍比淘宝闪购多出了约 2000 万单。

8 月 7 日 – 9 日,在「秋天的第一杯奶茶」「88 会员日」「大会员体系」「超级星期 6」各种促销活动以及居民楼办公楼商场车站随处可见的橙色广告的共同推动下,淘宝闪购的日订单量连续在这三天都超过了 1 亿单。据该媒体了解,8 月 8 日和 8 月 9 日,这两天淘宝闪购的日订单量份额首次超过了美团。

报道称,双方统计日订单量的口径并不统一:

  • 美团的口径是完成履约的订单,即当天配送到消费者手中的订单;
  • 淘宝闪购的口径是完成交易的订单,即当天消费者支付的订单,这其中也会包括预约第二天配送的订单,8 月 7 日那天淘宝闪购的预约单占比接近 10%。

而那些奶茶店最后倒掉的饮料,或者消费者付款后迟迟收不到货然后退款的订单,在美团和淘宝闪购都属于无效订单,不被统计在总单量。

根据淘宝闪购及饿了么官方发布的数据,8 月 7 日立秋当天,有 30 多万餐饮小店在淘宝闪购平台上成交突破峰值,饿了么骑手数量达到去年的 3.5 倍,平均收入是去年的 1.4 倍。(来源:IT 之家)

 

马斯克的最强 AI 模型 Grok 4 现已免费开放,非订阅用户每天可限量使用

8 月 11 日消息,马斯克上午宣布,Grok 4 现在对所有用户免费开放。免费用户每天可完成少量查询,超过限制则需要订阅。

根据 xAI 官方 X 账号的介绍,只需使用「自动」模式,Grok 就会将复杂的查询路由到 Grok 4。若用户偏好「掌控一切」,则可以切换到「专家」模式。在限定的时间内,xAI 将提供「慷慨的」使用额度。

据 IT 之家此前报道,马斯克曾宣称 Grok 4 是全球最强 AI 模型,在处理学术问题上的表现已经达到博士级别。

从官方公布的跑分数据来看,Grok 4 模型具备非常亮眼的成绩,在实时速度、推理能力和高级视觉等方面,将和 OpenAI、Anthropic 顶尖模型同台较量。(来源:IT 之家)

 

「全球首个孕育机器人」预计一年内面世,定价不超 10 万元

8 月 11 日消息,据潇湘晨报 8 月 10 日报道,国内某机器人公司创始人张其峰正在研发全球首个孕育机器人和传统的试管,这套系统模拟了子宫环境,还装进仿人类的机器人体内,让「机器人妈妈」从怀孕到分娩,全流程复刻人类体验。

报道称,目前该技术就是孕育箱的技术,只是将其与机器人的肚子相结合,预计「样机」一年内推出,定价不超过 10 万元。

张其峰是广州卡伊瓦机器人科技有限公司的创始人、董事长兼 CEO。该公司成立于 2015 年,推出了餐饮服务机器人系列、迎宾讲解机器人系列等多款产品。(来源:IT 之家)

长城全新坦克 500 Hi4-T / Hi4-Z 智享版汽车预售发布:带激光雷达、Coffee Pilot Ultra 驾驶辅助系统,36 万元起

8 月 11 日消息,长城全新坦克 500 Hi4-T / Hi4-Z 智享版汽车今日预售发布,新车配备激光雷达、搭载 Coffee Pilot Ultra 驾驶辅助系统,预售价 36 万元起。

  • 全新坦克 500 Hi4-T 智享版:36.00 万元
  • 全新坦克 500 Hi4-Z 智享版:38.88 万元

据介绍,全新坦克 500 Hi4-T / Hi4-Z 对车辆外观进行调整,配备激光雷达。外观方面,新车身轮廓与在售车型保持一致,采用举折中网 + 琉璃珀车标,配备斗拱大灯 + 宫阙之眸尾灯,辅以承天腰线设计;内饰方面,全新坦克 500 配备山水画卷中控台 + 丹陛石副仪表板、Coffee AI Sound、5.4L 智能冷暖双用冰箱、50W 双无线充电,并改用怀挡式换挡设计。

新车搭载长城汽车第三代智能辅助驾驶系统 Coffee Pilot Ultra,拥有 27 个辅助驾驶传感器(激光雷达 + 摄像头双冗余方案),包含 1 个激光雷达、3 个毫米波雷达、12 个超声波雷达、11 个高清摄像头。新车拥有全融合泊车系统,支持自定义泊车、记忆泊车、遥控泊车、倒车循迹等功能,同时还拥有 Coffee Night Vision 远红外夜视系统。(来源:IT 之家)

 

低成本 MacBook 或将于 2025 年底上市,售价 599 美元

据《电子时报》报道,预计新款 MacBook 的至少部分零部件将于 2025 年第三季度末投入量产。该报道援引供应链内部未透露姓名的消息人士的话,进一步称新款 MacBook 的售价将在 599 美元至 699 美元之间。

这样一来,新款 MacBook 的价格将与台式机 Mac mini 持平,并且比目前 13 英寸 MacBook Air 的起售价(999 美元) 低 300 至 400 美元。

据报道,新款 MacBook 的显示屏尺寸将略小,为 12.9 英寸。据 MacRumors 首次报道,生产计划意味着它将在 2025 年末或 2026 年初发布。这也与郭明錤之前的报道相符。

郭明錤没有透露更精确的发布时间表,也没有具体价格。但他表示,这款设备将配备约 13 英寸的屏幕,并有银色、蓝色、粉色和黄色四种颜色可供选择。(来源:cnBeta.COM )

法国最大核电站因水母入侵导致暂停运营

8 月 12 日消息,法国电力集团于当地时间 8 月 11 日宣布,位于法国北部的格拉沃利讷核电站因设备系统附近出现大量水母而停机,整座核电站暂停运营。

法国电力集团发表声明说,大量水母聚集导致水泵站过滤设备触发保护机制,4 台反应堆机组于 10 日晚至 11 日清晨相继停机。这座核电站其余两台机组因接受维护,先前已关机停运。

格拉沃利讷核电站位于法国北部省,临海而建,是法国最大核电站,共配备 6 座反应堆,总装机容量 5.4 吉瓦。

这次事件未对核电站、人员或环境造成安全影响。工作人员正进行紧急诊断和维修,以确保核电站安全重启。

据央视新闻援引法国媒体报道,全球变暖导致海温上升,有利于水母繁殖。格拉沃利讷核电站发言人说,水母入侵导致反应堆停机「相当罕见」,但历史上也发生过类似事件。(来源:IT 之家)

 

浏览量: 3

世界机器人大会:笨拙的今天,与狂奔的明天

作者| Li Yuan

编辑| 郑玄

笔者刚刚从今年的世界机器人大会回来。

「人,实在是太多了。」这是今年世界机器人大会上,几乎每个人见面的第一句开场白。

世界机器人大会人潮年年汹涌,但今年,那种摩肩接踵的压迫感格外强烈。

不过,比人多更震撼的,是你几乎无处不遇的机器人。去年,它们绕场走一圈,还得三五个「保镖」在旁牵绳护送;今年,尤其是开展第一天,你一个转身,就可能与一台两条腿、甚至四条腿的新物种擦肩而过。

今年的机器人,变得前所未有地渴望与世界互动——叠衣服、拉被子、和观众比试拳击、踢球、和观众互动递送物体……同时,这种急切也带来了大量的翻车现场——你几乎能在社交媒体上找到所有顶尖公司的翻车现场,无论是鬼畜的机器人倒地抽搐,还是自信满满地抓取眼前的东西,结果一直在努力地抓着空气。

但是比起前几年机器人展会上,很精心编排的机器人舞蹈,固定交互中慢速的把一个东西抓到另一个地方,你能明显感觉到有活力从里面生长了出来。

相比于其他行业,机器人企业似乎更不避讳翻车现场。这种不精心编排的演示,带着一种经济上行的美感:一种「我知道我会出错,但我依然是未来」的自信。它混乱,却迷人,属于高速增长行业独有的美感。

这也是这次笔者从世界机器人大会回来最深的感触:只要有未来,只要长得足够快,人们愿意等待一个暂时无用的机器人。

01

加速的进化:

为何行业如此振奋?

人们之所以如此宽容,是因为机器人这个行业,尤其是人形机器人这个赛道,仍然在以一个极高的速度,同时进化着它的「两翼」。

两翼的一端,是双足人形机器人的运动能力。

这是笔者来过的第三年世界机器人大会,在 2023 年的世界机器人大会上,宇树机器人的 CEO 王兴兴还在和在场的机器人同行们解释,为什么前一年开始入局做人形机器人的算法, 在接受极客公园采访的时候,提到当时「波士顿动力的软件层面遥遥领先」 。当时整场的人形机器人,能直接行走的屈指可数。

而短短两年,人形机器人的运动能力已经大大升级。

宇树机器人一如既往地展现出了第一流的运动控制能力。现场观看搏击比赛,机器人的力度真的有点令人震撼。

而这种运动能力并没有限于宇树,是多点开花的。

众擎机器人长项在于拟人动作,跳舞的动作像人的可怕。

逐际动力最新发布的全尺寸人形机器 LimX Oli,有 1 米 65 高的全尺寸人形结构和 31 个主动自由度。也在现场完成了轻快步、模特步和正步,包括高动态的舞蹈和功夫表演。

松延动力也展示了一个机器人翻跟头的现场演示。

而在另一端,机器人的灵巧泛化操作能力也在快速进化。

往年,一个机器人能听懂语音指令,然后慢慢抓起一个特定的小球递给你,就已经是顶级演示。今年,多家公司的展示,已经将目标指向了柔性物体的操作——这是从「会抓」到「会用」的关键一步。

柔性物体的难度在于它的不可预测性。一个刚性的瓶子,物理属性恒定;而一件衣服、一个香囊,是无定形的、柔软的,每一次抓取都可能呈现不同形态。要拿稳它,不仅需要「看见」,更要「理解」,还得在毫秒之间预判它的形变,并即时调整力度。刚性物体的抓取,在日常生活中只占一小部分;而柔性物体,才是通向家庭和服务场景的必经之路。

今年,已经有多家公司在这一领域展现出令人惊讶的成果:

比如星海图此次展示的拉被子演示。视频虽然有加速,但是能够把被角收起的情况下机器人自主推理找到被角拉开,且多次随机重复下都能成功,也是很精彩的演示。

自变量的做香囊也是全程柔性物体操作。

以年为单位来看机器人的进步,无疑是巨大的。

更重要的是,这些能力并非由某一家垄断。在这个高速发展的赛道中,新玩家持续涌入,带来更多可能性。比如,长期以服务机器人闻名的擎朗智能,今年也推出了自己的双足机器人,计划在酒店等熟悉场景中进行商业落地。擎朗 CEO 李通在极客公园采访中表示,双足研发的技术壁垒已不再高企,「看到机会就可以做」。

在高速发展的赛道中,大批成立于 2024 年,甚至成立于 2025 年的等实力选手纷纷入局,各自带着独门绝技,在这片丛林中占据自己的山头。

当然,促使这场进化的,还有嗅到商机的源源不断的投资人。他们用真金白银投票,确保这场关于进化的豪赌,有足够的燃料,以当前这令人眩目的速度,继续狂奔下去。

02

略显尴尬的落地:

双足提供情绪价值,操作只能找小场景

「这机器人能落地吗?」

这是展会现场空中飘荡着的最响亮的问题,从投资人到创业者,再到每一个好奇的观众都对这个话题很是关心。

但当笔者逛遍世界机器人大会,一个略显尴尬的落地现状是:在当下,人形机器人在很大程度上仍是「无用」的。

一位资深投资人向我估计,今年全行业的人形/类人型机器人总出货量也许在三万台左右。

而笔者走访各家展台得到的体感甚至更为保守:大多数公司的年出货量目标都只在几百台,能突破一千台的,已是金字塔尖的佼佼者。

宇树 CEO 王兴兴一直表示,研究机器人,最终是希望它来干活的。不过当被问及当下双足机器人的价值,除了情绪价值之外,还有什么?

宇树创始人王兴兴的答案坦诚得惊人。他表示,之所以做双足,是因为它技术上更简单,是一种「Why not?」(为何不呢?)的逻辑。哪些技术先成熟,哪些技术就优先做。

情绪价值没有对标,在双足机器人领域,市场竞争目前似乎也在变得更加激烈,让“无用之用”的接受度更高。

宇树 R1 WRC 表演 |图片来源:宇树科技

如果说两条腿的机器人,目前主要在提供情绪价值;那么,长着两只手的操作型机器人,则面临着另一种更棘手的困境——「有用之难」。

工厂、智慧零售、酒店餐饮……这些宏大的叙事谁都懂,但现实是,技术还远远达不到。

一方面,机器人的「大脑」还不够聪明。目前的模型训练,大多只能完成几个孤立的动作,要让一个机器人在一个真实场景里,成功完成多项任务,暂时还不太容易做到。

另一方面,灵巧操作仍是巨大的瓶颈,需要依靠数据、硬件等多方面技术一起进步。

目前行业比较认同的 VLA 路线,严重依赖于数据。而实际上,数据的高质量的操作数据又极度依赖高精度硬件来采集。而硬件的迭代,本身也需要一定的时间和操作来反哺迭代。

今年,一些公司已经意识到这一核心痛点,开始试图解决这一问题。

比如,2025 年才成立的零次方,据称今年已出货 200 台,能在 2025 年成立后迅速就出货的原因之一,就是其核心技术能力之一就是做高质量数据采集。

笔者也在展台体验了星尘智能的数据采集工具。展台人员介绍,他们采用绳驱传动、极度丝滑的硬件结构,才能采集出更「干净」的数据,进而训练出动作同样丝滑的模型。

在宏大场景迟迟难以马上落地的当下,一些公司的展示策略很是巧妙:他们会上演刷马桶、收拾屋子等看似酷炫的任务演示,但真正销售的,并不是家政机器人,而是面向科研人员的开发平台。这些高难度的演示,就像精心设置的「诱饵」,用来吸引最有购买力的客户,为这场「有用之难」的探索买单。

也仍然有许多公司,选择在真实环境中硬碰硬,实地采集数据,力图找到那个能真正撑起商业化的切入口。

这个场景或许需要有点苛刻——需要一定的泛化操作能力,以至于此前工业机械臂无法覆盖;同时又要避开与人频繁接触、过高速度要求,以及廉价人工过于容易替代的可能。

条件虽然苛刻,但这样的场景并非不存在,例如工厂某些特殊的上下料环节,比如服务业的某一个整理行为。各家各擅其场,都在找自己的细分领域,也都在相信自己可以从一台两台试验机,慢慢涨到十台几十台试点机,慢慢开始逐渐渗透一个场景。

所以说,无论是「无用之用」,还是「有用之难」,为什么行业对这种落地的尴尬似乎并不在意?

答案简单而纯粹——因为虽然距离真正的「有用」还很遥远,但每一家的出货量,都在实实在在地增长。

只要曲线还在上扬,技术还在进步,就有希望。

03

为何等待?

一场可以「寸进」的长跑

在今年的世界机器人大会上,笔者观察到一个迷人的悖论。

几乎每一位机器人公司的 CEO,在描绘未来两三年的宏伟蓝图时都充满了不容置疑的乐观,但话锋一转,又都会真诚地补上一句:「请给我们一些包容,成长不会那么快。」

这种略微矛盾的姿态,也精准地投射到了公众的认知里。

在网络舆论场,人们对人形机器人的观感几乎是撕裂的:要么是顶礼膜拜,视其为下一个时代的序章;要么是嗤之以鼻,断言它不过是昂贵的遥控玩具。

行业内部也远未达成共识。有人坚信,VLA(视觉-语言-行为模型)就是技术的「奇点」,通往通用智能的康庄大道已然铺开,剩下的只是时间和算力的问题;也有人认为,技术仍在混沌中爆炸性发展,行业还在等待一个能定义范式的、天才式的突破。

机器狗戏水 | 图片来源:现场拍摄

那么,在这种遍布着矛盾、分歧与误解的喧嚣中,行业那股不可动摇的信心,究竟从何而来?

答案或许只有一个,那就是相比其他前沿科技,机器人产业有着一项无可比拟的特权:「寸进,亦是胜利。」

自动驾驶的宿命,是「L5 或一无所有」,在抵达那个完美终点前,每一步商业化都如履薄冰。而机器人不同,模型能力每向前推进一毫米,就可能撬开一个细分到极致的新场景——哪怕这个场景,仅仅是支撑一家企业多卖出几百台机器人,获得活下去的燃料,奔赴下一场更艰难的战役。

或许资本,也是看清了这场增量游戏的本质,才愿意不断加注。他们愿意忍受更长的周期,去赌一个可以被「分期兑现」的未来。

但耐心是有额度的,他们究竟能赌多久?

在一场英伟达举办的论坛中,宇树王兴兴和银河通用王鹤同场对谈,对行业未来做出预测。

宇树的王兴兴给出的答案是每年至少翻一倍;而王鹤的预测,则是每年翻十倍。

从一倍到十倍,这道巨大的裂谷,就是对行业未来不确定性最诚实的度量。

它意味着,没有人真正知道终点线有多远,也没有人知道通往终点的正确路径。

他们唯一确信的,只有一件事:

在一个高速成长的行业中,速度是唯一的通行证。

*头图来源:视觉中国

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

浏览量: 2

昆仑万维发布新模型 SkyReels-A3,开启五天技术发布周

 

作者|Li Yuan

编辑| 郑玄

 

笔者最近的 guilty pleasure,是沉迷于刷《甄嬛传》的二创和解析视频。

刷着刷着,就发现了一个有趣的现象:现在用《甄嬛传》的原声直接给产品打广告,已经成了一门新显学。前一秒祺贵人还在说「臣妾要告发熹贵妃私通」,后一秒可能就在用同样的声线推荐某款咖啡。而且,和早年的 AI 视频不一样,现在祺贵人的嘴型都已经可以对准地相当自然了。

不过,虽然在一两句台词上已经以假乱真了,只要超出一两句的范畴,「娘娘带货」基本上还是翻车的。

现有技术生成的视频,一旦拉长时间,各种问题就暴露无遗:人物的动作和手部常常僵硬扭曲,与商品或环境的交互极不自然;画面质量会随着时间推移出现视觉伪影甚至「崩坏」;镜头语言更是死板单一,无法满足专业场景需求。

用这种技术生成一两句带货视频插在一个长视频里,是猎奇的亮点,但真要让「安陵容」完整地唱一支 MV,或者让「皇后娘娘」做一场半小时的直播带货,观众很快就会因为这些挥之不去的瑕疵而感到疲劳,就算是《甄嬛传》这样的顶级 IP 也拉不住。

不过,AI 的进展,当然是很快的。你永远可以相信 AI 的发展速度。

8 月 11 日,昆仑万维就正式发布其在 AI 视频生成领域的最新力作—— SkyReels-A3 模型,似乎就是为了精准解决上述所有问题而来。

据悉,昆仑万维 Skywork AI 技术发布周正式启动,8 月 11 日至 8 月 15 日,每天将发布一款新模型,连续五天发布覆盖多模态 AI 核心场景的前沿模型。

基于 DiT(Diffusion Transformer)视频扩散模型,只需要输入参考图像/视频,文本 prompt 和音频, SkyReels-A3 模型就能生成长达一分钟的可以用文本控制的数字人视频。

SkyReels-A3 模型专门对手部动作交互、运镜控制和美感表达进行了增强,瞄准的是包括口播导购 带货、MV/演讲等 情景。

当前 SkyReels-A3 模型已上线,欢迎登录 SkyReels 官网体验,登录后在左侧导航栏中选择 Talking Avatar 工具。

 

 

这意味着,娘娘们也能带货了?

 

01

直播介绍商品可用,

和物体交互十分自然

 

在 SkyReels-A3 模型生成的视频中,笔者注意到一个很大的特点是,生成的数字人可以和物体进行自然的交互。

比如在这个桌游带货的场景中:

这段 SkyReels-A3 生成的桌游介绍视频中,桌游盒子保持了很好的前后一致性,主播和桌游的交互也很自然。桌游本身封面如下图:

虽然看着容易,但其实在测试中,其他模型的生成效果,很可能是这样的:

SkyReels-A3 之所以能让数字人自然拿起桌游,主要是对广告主播等业务场景,进行了手和商品的交互优化。

SkyReels-A3 直接针对手部动作的自然度和清晰度,构造了针对线上直播等场景的数据,并采用了不同 seed 和训练过程 ckpts 来生成大量候选。通过 reward model 来挑选 top-1 最好最差的结果,采用直接偏好学习来进一步优化模型的生成结果。

除了带货,同样的能力,也会让模型在其他方面表现更突出。

比如在下面的 mv 场景中,SkyReels-A3 模型生成的数字人歌星很自然地就握起了话筒,真实感一下子就提升了。

除了与话筒的交互,这个视频也能感受到,整个模型的上肢运动十分自然。

目前可以看到的有些数字人模型,虽然已经能够做好嘴形对齐,但是稍微经过一点时间,就会感觉到只有嘴巴在动,很假。而 SkyReels-A3 已经做到了不错的效果。

 

02

有美感、无限长的长视频正在解锁

 

除了能与物体进行自然的交互,要让数字人视频真正摆脱「玩具感」,迈向「生产力」,还必须攻克两大难题:如何让视频在拉长时间后依然保持稳定,以及如何打破固定机位的呆板视角。

而这,也正是为什么现在《甄嬛传》的 AI 二创仍然通常只能在一两句台词的长度内,维持极高的真实感——时间再长,就容易「露馅」。

SkyReels-A3 在此也进行了一些优化。

 

 

图丨 Skyreels-A3 实现音频驱动人物对话视频生成技术框架

传统 AI 视频生成,最大的痛点在于误差累积。模型就像一个记性不太好的学生,一句接一句地往下说,说到后面就忘了前面,导致画面出现肉眼可见的劣化、扭曲,也就是常说的「崩坏」。

而 SkyReels-A3 选择采用了一种聪明的插帧方法。简单来说,它不再是傻傻地根据前一帧猜下一帧,而是能预先锚定一个未来的、清晰的「关键帧」,再高质量地补全中间的视频片段。这种机制确保了即使视频长达一分钟,人物的面部和画面也能保持高度的一致性。

这带来了什么直接的好处?简单来说,就是彻底打开了视频时长的枷锁。 从技术上讲,这种架构甚至支持无限长的视频生成,虽然在实际产品部署中可能会限制单次上传的音频文件大小,但 生成一段单镜头、分钟级别的视频已经毫无压力。

如果说长时稳定解决了「能不能看」的问题,那么丰富的镜头语言则决定了视频「好不好看」。

以往的数字人视频多是「大头贴」式的固定视角,非常乏味。SkyReels-A3 则内置了一个基于 ControlNet 的镜头控制模块 ,直接赋予了创作者「导演」的权力。根据其技术文档,模型预设了推镜 (push in)、拉镜 (push out)、左摇 (pan left)、右摇 (pan right) 等 8 种常见的专业运镜,且每种运镜的强度都可以从 0 到 100 连续调节。

从左到右的运镜在直播带货的场景下,显得更自然。

手持镜头效果则可以模拟 vlog 的效果。

虽然生成完全的长视频,数字人技术目前仍然不能完全以假乱真。但笔者在看完在 SkyReels-A3 时长和运镜上取得的突破后,已经看到了未来的潜力。

一个稳定、可控、具备镜头感的长视频数字人,已经足以叩开许多过去难以想象的应用场景的大门。短期内,上半身自然的长视频数字人,似乎可以被用在 mv 等场景中。未来,则更不可限量。

 

03

昆仑万维技术周重磅推出,

SkyReels-A3 首日亮相

 

昆仑万维此次还公布了 SkyReels-A3 的技术指标。使用了基准 A-Bench 上(涵盖日常对话,唱歌和口播等不同场景),测评了多个维度:Sync-C 和 Sync-D 用于精确测量生成视频中唇部动作与音频的同步程度。IQA 和 ASE 则是通过专门训练的 MLLM 来评估视频画面的质量和艺术性。ID similarity 则是通过 cosine 相似度,计算生成视频和参考图/视频的人脸相似度。

 

 

可以看到, SkyReels-A3 在衡量唇部同步精准度的 Sync-C 指标,画面的艺术性和人脸相似度上,都达到了行业先进的水平。

实际上,SkyReels-A3 这样一个在多个维度上都带来惊喜的模型,仅仅是昆仑万维本周技术发布会的「开胃菜」。它背后所展现的,是昆仑万维作为中国 AI 领域第一梯队的深厚积累与全栈能力。

回望过去,昆仑万维的 AI 战略始终呈现出「开源贡献」与「产品落地」双线并进的鲜明特色,这使其不仅成为勤勉的「基础设施建设者」,更是锐意进取的「顶尖产品经理」。

一方面,作为「基础设施建设者」,昆仑万维以持续的顶尖开源模型,为行业「修路搭桥」,彰显其技术硬实力。

过去数月,昆仑万维密集开源了多个在行业内取得 SOTA(State-of-the-Art)成就的大模型:

早在 2025 年 2 月,其开源的中国首个面向 AI 短剧创作的视频生成模型 SkyReels-V1,便已在 Hugging Face 总排行榜上连续多日稳居前十。今年 4 月,更是发布了全球首个使用扩散强迫框架的无限时长电影生成模型 SkyReels-V2,不断突破技术边界。

除此之外,在多模态领域,其不仅推出了成功将强文本推理能力迁移至视觉模态的思维链推理模型「Skywork-R1V」系列,还发布了集图片生成、理解和编辑于一体的化模型「Skywork UniPic」,以 1.5B 的轻量级规模性能逼近同类大参数模型。

针对专业领域的挑战,昆仑万维也毫不示弱,其数学代码推理模型「Skywork-OR1」在同等参数规模下实现了业界领先的推理性能。而软件工程自主代码智能体基座模型「Skywork-SWE」也是在开源 32B 模型规模下实现了业界最强的仓库级代码修复能力。不仅如此,昆仑万维还前瞻性地布局了空间智能领域,推出了工业界首个开源的 10B+空间智能大模型「Matrix-Game」。

另一方面,作为「顶尖产品经理」,昆仑万维毫不掩饰其商业雄心,亲自下场打磨直面用户痛点的惊艳产品,将最前沿的技术迅速转化为生产力。

集成了视频大模型与 3D 大模型的 AI 短剧平台 SkyReels,搭载了最新的 SkyReels-A3 模型,让创作者能够「一键成剧」,轻松制作高质量 AI 视频。

当第一天的发布就已经为 AI 数字人视频的种种顽疾提供了如此有说服力的解法,我们不禁对未来充满期待:在接下来的四天里,昆仑万维还会拿出怎样的杀手锏?

这场从 8 月 11 日持续到 15 日的技术发布周,或许正是昆仑万维在向外界宣告——其 AI 全栈能力已然成熟,并且准备好在牌桌上亮出更多底牌。对于整个行业和所有 AI 关注者而言,好戏,才刚刚开始。

*头图来源:昆仑万维

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

浏览量: 3

小红书为什么要做“漫展”?

2025 年夏天,小红书第一次以线下漫展的方式进入了游戏与二次元产业的舞台中央。

8 月 8 日开幕的 REDLAND,是小红书首次线下大型漫展。与大部分漫展选在会展中心不同,首届 REDLAND 将场地选在了上海复兴岛——一个曾经的船厂遗址,小红书把它打造成为了「全球首个痛岛」。

REDLAND 拥有整整 80000 平方米的户外空间,涵盖三大沉浸式展区与 50 多个游戏与动漫 IP。更特别的是,它以「开放世界冒险岛」的方式构建了一套高度拟游化的观展机制:从角色设定、任务系统,到徽章收集与沉浸式互动体验,小红书显然不满足于复刻传统漫展模式,而是在探索打造一座沉浸式的「2.5 次元主题乐园」。

如果你对小红书的印象还停留在「自拍、种草、美妆护肤和旅游攻略」,那么你可能会对它举办一场大型漫展感到惊讶。但 REDLAND 的出现,恰恰说明了这个平台正在经历一次更深层的社区兴趣结构重组。

事实上,在 REDLAND 举办之前,小红书平台的内容生态已经发生剧烈变化。过去一年,平台上二次元内容同比增长 175%,游戏内容增长 168%,成为小红书继时尚、美食之后的第三、第四大垂类。今年 7 月,小红书平台也正式完成品牌升级,从「你的生活指南」转变为「你的生活兴趣社区」。

在这一背景下,REDLAND 更像是小红书社区升级后的「一场线下考试」。在二次元与游戏内容成为平台新引擎的当下,这场展会既是一次对用户文化的响应,也是小红书试图建立线下 IP 影响力的开始。’

REDLAND 嘴硬博物馆丨来自:极客公园

REDLAND:不只是漫展,还是「箱庭世界」

在正式逛展前,REDLAN 的主创团队先与受邀媒体进行了简短的交流。项目团队对于展会整体设定的介绍迅速勾起了我的兴趣——它听起来与传统的漫展、游戏展有明显的区别。

REDLAND 采用了非常规的展览结构,将整个复兴岛划分为三大展区:

  • “翻身时空港”(船台):以米哈游的御三家(《原神》《绝区零》《崩坏:星穹铁道》)、腾讯的《王者荣耀》、网易的《蛋仔派对》等热门 IP 为核心,搭建上也与船厂遗迹相融合;
  • “重生试炼场”(老仓库):《和平精英》的「天降帅锅」展、《苏丹的游戏》的撅卡体验,以及育碧、小众独立游戏试玩集中于此;
  • “发呆小森林”(复兴岛公园):主要展示《剑网三》《永劫无间》《逆水寒》等古风 IP,隐藏有宝可梦彩蛋任务和多个自建社团展台。

重生试炼场的独立游戏试玩丨来自:极客公园

不同于传统漫展或游戏展常见的「标准展位+舞台演出」结构,REDLAN 的整体动线、互动机制乃至世界观设定,都更像是一场线下 RPG 游戏。

为参观者,我在入口处领取了「新手装备包」,其中包含防晒喷雾、补水饮料等户外必需品,一枚初始徽章和一张角色身份卡。徽章像是经验条,参与展位互动集齐三个后可兑换金徽章;角色身份则分为五类(穿梭者、探索者、鉴赏家、体验者、决胜者),我拿到的是「决胜者」身份。很明显小红书希望用选游戏职业的方式增强观众的代入感,不过直到结束我也没弄明白这个身份有什么作用。

进入展区后,玩家们需要沿着「翻身时空港-重生试炼场-发呆小森林」这条动线移动,沿途可以选择自己感兴趣的展位去体验,带有一定的开放世界结构。但与其说是沙盒式逛展,我更愿意形容 REDLAND 像一个「线下箱庭游戏」:区域不大但内容精巧,动线虽固定却有一定节奏。

REDLAND 的展区地图丨来自:小红书

展位的玩法设计上,REDLAND 整体也更强调互动性。几乎所有参展 IP 都设置了与玩家的互动机制,而且这些机制大多参考原作游戏的经典玩法。例如,《原神》展台是游戏里经典的打靶小游戏,《苏丹的游戏》则模仿游戏里经典玩法——抽卡然后做任务撅卡,《柯南》则是复刻了动画里的电梯杀人案,需要玩家在现场找线索推理……

《苏丹的游戏》REDLAND体验丨来自:极客公园

在搭建风格上,REDLAND 同样体现出不同于传统漫展的思路。一方面,每个 IP 展位更像是一个沉浸式主题空间,观众仿佛步入一个小型的迪士尼或环球影城。例如「发呆小森林」中的《剑网三》《逆水寒》,借助公园原生态环境还原了古风世界观,给玩家们带来不错的沉浸感。

发呆小森林唯美国风展区丨来自:极客公园

另一方面,REDLAND 也有强烈的统一性。比如整个展区到处都有补给站、徽章点、NPC、任务板等有着 REDLAND 世界观元素的区域,甚至各个 IP 展位大多也以像素 RPG 风格进行再创作,使整个展区在风格上更趋一致。相较之下,传统漫展更多体现为参展商自有逻辑主导,展馆之间主题可能不同,但展位之间风格参差,而 REDLAND 则有更统一的叙事语境和空间秩序。

REDLAND 互动体验丨来自:极客公园

当然,作为首届活动,REDLAND 仍有不少待改进之处:8 月的户外高温对观众与 Coser 来说都颇具挑战,部分展位互动较浅,动线与任务引导还可优化。但整体观感上,它确实在一定程度上实现了为用户「搭建一个现实版二次元世界」的目标——这是一场融合了「真人游戏」与「沉浸主题乐园」概念的线下试验。

REDLAND 背后,小红书如何理解「新二次元」?

逛完展后,我自己的感受是:REDLAND 背后连接的是小红书对新一代二次元文化的一种系统理解。

前文提到,二次元和游戏已成为小红书第三和第四大的内容垂类。其快速增长背后,我认为有三个关键要素:女性向二游如《恋与深空》的迅速崛起;主机游戏和独立游戏玩家在小红书找到兼具「用户-用户」「用户-创作者」属性的社区交流场域;以及最重要的,对 2.5 次元人群需求的深入响应。

与传统 ACG 社区侧重 OGV 与 UGC 内容不同,小红书并未试图复制原有模式,而是在 UGC 生态中发掘出「2.5 次元人群」的表达路径:他们不再只是观看者,而是将 IP 融入日常生活——为角色庆生、cos 角色出行、痛服拍照、快闪团建等,形成了一种介于虚拟与现实之间的生活方式。

过去一年小红书兴趣热点笔记增长情况丨来自:DT 商业观察

这些表达方式本就存在于二次元的线下文化中,但在此前,国内并没有一个线上社区能完整承接这类用户的日常表达。而小红书的打卡机制、内容发布形态与兴趣社群组织能力,天然适配这一类「沉浸型表达」,并伴随泡泡玛特、乙游、漫展等二次元周边文化的兴起而快速放大,最终延伸到主机游戏、男性向二游等更广泛的 ACGN 圈层。

逛漫展/游戏展是这类热爱线下和周边的 2.5 次元群体非常重要的文化生活方式,但传统漫展越来越难以满足这些用户,尤其是抛开收集吧唧(徽章)、coser 集邮、线下打卡等社交货币层面的需求,当同人内容、IP 资讯转向线上传播下,线下展会要提供真正的差异化价值,必须突破「打卡/集邮」的表层机制,构建更具内容密度与社交能量的空间。

在这方面,主题乐园是一个可借鉴的方向。比如日本环球影城中的动漫 IP 体验区、VR ZONE 等虚拟现实乐园,均在提供「沉浸体验」上获得二次元群体的青睐。REDLAND 项目组也提到:「我们想给非现充用户一个痛的空间,就像迪士尼是给现充造的童话,而 REDLAND,是为游戏与二次元用户搭建的开放世界。」

这也解释了为什么 REDLAND 并未采用传统「漫展招商」逻辑,而是从场景出发倒推展位策划:厂商需结合地貌设计展台,每个展位必须设计互动机制,平台原创展位与主线任务共同强化「整岛游乐场」的沉浸体验。

在国内 ACGN 线下内容渐趋固化的当下,这种具备「社群意识+互动机制」的平台型实验,无疑具备探索价值。当然,这也对资源调度、策展能力提出了更高要求:高质量沉浸展往往投入巨大,如何平衡二次元群体的文化诉求、互动设计的体验感、以及漫展运营的现实产出,这或许是小红书在持续推进大型漫展项目时必须长期思考的问题。

REDLAND 入口丨来自:极客公园

结尾

最后一个问题是:小红书能否成为二次元和漫展的新变量?

就目前来看,小红书并未将 REDLAND 定位为商业化重资产项目,更多是在完成一场「兴趣文化的空间实验」——洞察了快速增长的 ACGN 社区需求,进而尝试将二次元世界和小红书社区文化结合并搬到线下,打通线上线下的内容链路。

从平台的角度看,这次实验释放了几个明确信号:小红书正在形成自身的内容美学与空间表达方式;它愿意为用户的兴趣建构一个「可感知的、可游玩的」物理空间;它希望用这样一场岛屿级的策展行为,来捕捉用户的情绪价值与文化认同。

REDLAND 不是传统漫展的对标物,也不是谁的挑战者。它更像是这个时代内容社区探索「虚实融合」的一次尝试。

它的完成度还不够高,但它的想象力足够新。

而这,或许已经足够。

浏览量: 2

文章分页

上一页 1 … 5 6 7 … 86 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间