作者: admin
王兴兴春晚后接受采访:人形机器人进入大众市场还要更多时间;Meta 眼镜年出货量突破 700 万;苹果多终端新增视频播客功能

Anthropic 发布新模型:操控计算机能力大幅提升

北京时间 2 月 18 日凌晨,Anthropic PBC 发布名为 Claude Sonnet 4.6 的新模型。
Claude Sonnet 4.6 可以执行需要多个步骤的计算机操作,例如填写网页表单,然后跨多个浏览器标签页协调信息。
Anthropic 在一篇博客文章中写道:「在操作计算机方面,该模型当然仍落后于最熟练的人类。但尽管如此,其进步速度依然惊人。」Anthropic 同时表示,Sonnet 4.6 在抵御提示词注入攻击等安全威胁方面表现更好,这类攻击是指通过恶意指令操控 AI 模型。(来源:财联社)

王兴兴:预计 2026 年宇树机器人出货量 1-2 万台
在中央广播电视总台 2026 年春晚舞台上,宇树科技作为春晚机器人合作伙伴第三次登台亮相,演示了翻跟头、舞棍、跑跳空翻、舞剑等武术特技动作。
表演结束后,宇树科技创始人王兴兴接受了采访。他介绍,此次参演的 G1 与 H2 人形机器人,其核心亮点在于全自主集群控制技术的首次亮相,实现全球第一次集群快速跑位,最快任意跑位速度可达 4m/s。数十台机器人在舞台上无需外部定位辅助,完全依靠机载传感器实时感知环境、自主规划路径、动态调整队形,并能在跑偏或受干扰后全自动恢复,实现了从快速跑位、对招到动作执行的全程全自主协同。
王兴兴预计,今年全世界人形机器人的出货量至少达到几万台,宇树科技的目标出货量在 1-2 万台左右。但他也指出,受限于具身智能大脑等技术瓶颈,人形机器人还处于应用早期。
「目前的具身智能大脑还不够通用,仍需针对具体场景进行专门的编程。但对于普通家庭而言,每家每户的具体条件千差万别,不可能为每个家庭单独写一套程序。因此,距离人形机器人在大众市场的大规模应用,仍然相对早期。」(来源:财联社)
Kimi 连续融资超 12 亿美元,估值突破百亿美元
在完成上一轮 5 亿美元融资仅一个多月后,月之暗面 Kimi 新一轮超 7 亿美元的融资即将完成交割,本轮由阿里、腾讯、五源、九安等老股东联合领投。
此外,其新一轮 100-120 亿美元估值的融资亦已经开启。
照此计算,Kimi 最新估值直接翻倍并突破 100 亿美元大关,总额超 12 亿美元的连续两轮融资也是近一年来大模型行业的最高融资金额。(来源:科创板日报)
Ray-Ban Meta 智能眼镜年出货量翻 3 倍,超 700 万台
2 月 17 日,Meta 雷朋联名智能眼镜的制造商 EssilorLuxottica(依视路陆逊梯卡)在最新披露的 2025 年第四季度财报中宣布,公司去年共售出超过 700 万副智能眼镜,相比「上一次公布销量」时实现了近三倍增长。
依视路此前在 2025 年 2 月透露,公司当时已售出 200 万副 Meta 雷朋联名智能眼镜。
同时,依视路还透露,去年可谓公司与 Meta 合作的重要里程碑。除对热门的 Ray-Ban Meta 系列进行硬件升级外,双方还陆续推出了 Oakley Meta HSTN、Oakley Meta Vanguard,以及售价 800 美元、首次集成 HUD 的 Meta 雷朋 Display 智能眼镜,进一步丰富产品矩阵,覆盖不同价位与使用场景。(IT之家)
马斯克再次重申:CyberCab 四月量产,无踏板无方向盘

当地时间本周一上午,特斯拉首席执行官 Elon Musk 再次重申了特斯拉 Cybercab 的生产时间表,体现出他对公司能够兑现这款车型激进投产计划的信心。
马斯克在 X 平台发帖表示:Cybercab 将在 4 月进入初期生产阶段,并且这款车不会配备踏板或方向盘。前外界曾猜测,如有需要,这两项配置可能会出现在车上。
这已是过去六个月里,马斯克第三次明确表示 Cybercab 将于 2026 年 4 月投入生产,这对他而言实属罕见,Cybercab 也被认为是特斯拉未来自动驾驶网约车计划的核心组成部分。(来源:IT之家)

OpenClaw 创始人:未来 80%的 App 会消失
近日,开源 AI 智能体 OpenClaw 创始人斯坦伯格在一次访谈中公开断言,未来 80% 的 APP 将会消失,而个人 AI 智能体将成为取代这类应用的核心力量。
斯坦伯格表示,当下多数 APP 的本质只是承担数据管理与搬运的「中间商」角色,并非用户的核心需求,用户真正需要的是应用最终提供的结果,而非打开应用的繁琐操作。
他认为,若一款 APP 的核心功能能用一句话概括,便大概率会被 AI 替代,单位换算、汇率计算、简单图片编辑等工具型应用均在此列,这类应用仅执行明确指令,而这正是 AI 智能体的擅长之处。
不过斯坦伯格也指出,并非所有 APP 都会被 AI 取代,仍有三类应用将留存:
一是 Figma、Photoshop 等专业创作工具,用户对其有精细控制和创作自由度的需求,AI 仅能起到辅助作用;
二是游戏、社交、短视频等沉浸式体验类应用,其核心价值在于体验本身,而非完成具体任务;
三是医疗、金融、法律等专业垂直领域应用,这类应用涉及复杂合规要求与专业知识,短期内难以被通用 AI 完全替代。(来源:快科技)
古尔曼:苹果加速研发 AI 眼镜、挂饰及摄像头版 AirPods
作为向人工智能驱动硬件转型的一部分,苹果公司正加速开发三款新型可穿戴设备。
据彭博著名记者古尔曼透露,这三款设备包括智能眼镜、一款挂饰设备以及具备扩展 AI 功能的 AirPods。
上述这些设备将围绕 Siri 数字助理构建,并依靠具备不同功能的摄像头系统,根据视觉语境执行操作。苹果的目标是发布这些将与 iPhone 联动的设备。其中,智能眼镜计划最早于 2027 年发布,而 AirPods 和挂饰设备可能更早推出。(来源:新浪财经)
苹果新增视频播客
Apple 公司决定对其播客中的视频功能进行革新,这是该行业从纯音频媒介向视觉化转型浪潮的一部分。
本周一,苹果公司发布的声明显示,在 iOS 26.4 开发者测试版中,苹果让观众在视频播客与音频收听之间切换更加便捷。
尽管苹果播客长期以来一直通过 RSS feed 支持视频节目,但其效果远不及 Spotify、YouTube 和 Netflix 等平台的呈现方式。目前,苹果正与亚马逊的 Art19、SiriusXM 的 Simplecast 和 AdsWizz 等托管平台合作,确保播客创作者能将其视频节目同步至该应用。
今年春天起,视频播客将在 Vision Pro、iPad、iPhone 以及网页版 Apple Podcasts 上得到支持。
今年晚些时候,苹果还将根据广告展示次数,向广告网络收取视频广告投放费用。(来源:格隆汇)
三星 PIM 技术量产在即:或绕过 CPU、GPU 直接计算
据媒体报道,三星电子计划将 PIM 技术应用于 LPDDR5X 内存。目前,三星电子正与主要客户合作开发 LPDDR5X PIM 技术,预计将于今年下半年提供样品。此外,双方也在积极探讨将 PIM 技术应用于下一代标准 LPDDR6 的具体规范。
PIM,全称 Processing in Memory,意为处理器集成管理。其将计算单元(ALU)直接置于内存的存储体级别。传统方法往往需要将数据传输到 CPU 或 GPU 进行计算,而 PIM 则直接在内存中执行计算,有望攻克「存储墙」。
在日前于韩国举行的「SEMICON Korea 2026」主题演讲中,三星电子 DRAM 设计团队负责人孙教民强调了 PIM 技术的必要性,其表示:「目前,由于内存带宽不足,AI 无法 100% 发挥 GPU 的性能。」在他看来,PIM 不仅可以显著提高带宽,还能够显著提升能效。
目前,三星电子已完成 HBM-PIM 及其他产品的技术验证(PoC),正进入商业化产品阶段,准备量产。这项技术的核心产品是 LPDDR 系列,该系列产品针对智能手机和终端 AI 设备进行了优化。(来源:快科技)
《流浪地球 3》电影发布新春拜年视频,吴京、郭帆、刘德华、沈腾亮相

距离上映还有一年时间,国产科幻大片《流浪地球 3》官方在2月17日发布新春拜年视频,导演郭帆以及演员吴京、刘德华、沈腾现身,向观众拜年。
视频中出现了特效换装,不过官方并未标注是否为 AI 生成内容。
《流浪地球 3》改编自刘慈欣的同名小说,是《流浪地球》系列的第三部作品,影片将分为《流浪地球 3(上)》和《流浪地球 3(下)》两部分,由郭帆执导,吴京、刘德华、屈楚萧、赵今麦等原班主演悉数回归。(来源:IT之家)

iPhone 18 Pro 及折叠屏全系列无卡槽,但可能不包括国行
根据最新的行业爆料,苹果在今年的 iPhone 18 Pro 系列以及折叠屏 iPhone Fold 上将继续推进无卡化的硬件战略。通过在更多市场推广 eSIM 技术,苹果试图进一步挤出内部空间,从而容纳更大容量的电池,提升整体续航表现。
目前苹果已经在北美、日本及沙特等市场彻底告别了实体卡槽,接下来的欧洲市场也将步入 eSIM 时代,不过考虑到实际情况,国行版机型大概率仍会保留实体 SIM 卡槽。
去掉卡槽模组对内部空间的释放非常可观,以目前的 iPhone 17 Pro Max 为例,采用纯 eSIM 方案的美版机型电池容量为 5088mAh,而带有实体卡槽的国行版则为 4823mAh,两者容量相差了 265mAh。
到了 iPhone 18 Pro 系列,这种差距可能会进一步拉大。据传 eSIM 版本的 iPhone 18 Pro Max 电池容量可能会超过 5200mAh,而保留实体卡槽的非 eSIM 版本,电池容量预计会维持在 5000mAh 左右。
在售价方面,尽管 2nm 工艺和内存成本都在上涨,但证券分析师 Jeff Pu 认为,苹果为了稳住市场份额,仍计划让 iPhone 18 Pro 系列的起售价与 iPhone 17 系列持平。(来源:快科技)
比亚迪首款 K-Car 内饰公布
2 月 17 日,比亚迪官方首次公布了首款纯电 K-Car 车型「RACCO」的内饰。
官方宣称秉承「海洋美学」的理念,圆润的表面组合营造出平静的水面波浪,造型让人想起「海平面的起伏」。此外,内饰点缀着点和圆的图案,让人感受到温暖和亲和力。

该车采用右舵设计,档把和物理按键设置在一排,还有一个小尺寸的中控屏幕。
此外,车内配备了放置长伞的垂直空间、放置常用卡片和智能手机的固定位置,以及适合放置塑料瓶和杯子的支架。
新车采用了日本特有的「K-Car(轻型自动车)」外观设计,四门 + 后排侧滑门设计,外观方正简洁且不失时尚气息,长宽高分别为 3395/1475/1800mm,可乘坐 4 人。(来源:IT 之家)

Meta 获批 AI 专利:可代替已故用户继续在社媒发帖
Meta 公司近日获得了一项颇具争议的人工智能专利,该技术能够在用户去世后继续代表其在社交媒体账户上发布内容。
这项于去年 12 月获批的专利还可能实现与已故用户进行模拟视频和音频通话的功能。
根据专利文件显示,该大型语言模型可以创建社交媒体用户的「数字克隆体」,以模拟他们的在线活动,在用户去世或长期离开社交媒体时代表其发布消息、照片和视频。这个 AI 系统甚至能够与其他用户互动,回复私信,点赞帖子并评论内容。该模型还可以模仿网红博主发布的内容,并模拟与好友、粉丝及其他用户的视频或音频通话。
这可能为内容创作者提供一种工具,使其即便在休息期间也能继续生成内容。
Meta 公司发言人证实了该专利的存在,但强调公司并不打算使用这项技术代表已故社交媒体用户发布消息或创建内容。该发言人补充说,申请专利允许公司确保对新概念的所有权,但这并不意味着这些技术会被商业化实施。(来源:cnBeta)
联合国报告:利比亚移民沦为系统性侵犯与虐待暴力商业模式的受害者
世卫组织成员国就《病原体获取与惠益分享》附件展开谈判
苏丹战争将至第四年 难民署发出16亿美元紧急人道募捐呼吁
战争进入第五年 乌克兰逾三分之一儿童仍流离失所
世卫组织:全球近三分之二孕产妇死亡发生在冲突或脆弱国家
对话任永亮:有6000万用户的测测,为什么要做一个机器人?
头图来源:心言集团
当任永亮决定带领一家纯粹的互联网公司跨界机器人时,身边的朋友和业内人士看好得并不多。
一些做过扫地机器人的候选人曾给任永亮泼冷水,跟他谈到机器人研发中一些难以处理的情况,例如家太大导致中途没电、机器人撞碎家里昂贵的物品、甚至意外绊倒孩子等难题。也在内部反复沟通了很多次,团队成员很难想象为什么一家互联网公司要去从零开始做硬件。
但任永亮并未动摇。历史上还没有出现过特别成功的家庭陪伴机器人,这个行业正处于从「玩具」向「生命感」跨越的拐点,没人见过完美的陪伴机器人,所以他可以按照自己的逻辑去定义这个新物种。
去年年底,心言集团(测测)创始人兼 CEO 任永亮在极客公园创新大会 2026 上,关于为何一家泛心理公司要做机器人,他给出的答案是,为了「无条件的积极关注」 。他认为,纯粹的线上智能体如同异地恋的朋友,看得见摸不着;而传统的工业机器人只会打拳击、拧螺丝。
任永亮想做的,是给大模型装上身体和同理心,让它成为一位「爱的使者」。它不是为了替代父母或伴侣,而是为了在原子化社会的缝隙中,提供一种可触碰的、高质量的情感在场。
如今,心言集团的家庭陪伴机器人「巴布」已经亮相2026北京台春晚,春晚之后,心言集团计划启动「创生合伙人」活动,邀请首批用户参与共创过程,并随之开展一系列内测流程。
在产品落地的节奏上,任永亮预计在今年 6 月份正式开始量产发货。与此同时,为了让机器人更好地融入家庭,心言集团也在考虑将旗下拥有数百万用户的 AI 智能体「陪伴小星」与机器人打通,甚至将其独立为专门的 APP,以实现虚拟陪伴与物理具身的深度联动。
为什么会做机器人?
极客公园:为什么选择在此时研发机器人?
任永亮:关于为什么是现在,可以从几个维度来看。早在 2017 年,我们公司进行内部技术规划时,除了 AI,就已经将「机器人」列入选项。我们认为 AI 演进的终极形态可能就是机器人。但在 17 年那个节点,大语言模型(LLM)尚未出现,我们发现这条路线极其艰难。
大模型时代开启后,对话领域的问题得到了解决,机器人从「极高难度」转向了「技术可行」。大模型不仅提供了基础语言能力,其 Transformer 架构也提供了一种范式,让我们能够完善机器人的端侧模型。结合 Diffusion(扩散模型)等新架构的出现,我们认为机器人在技术层面已经成熟。
从个人感触来说,做「测测」时,我正处在情感困惑期,所以对情感产品更有「体感」。现在我有两个孩子,在育儿过程中面临新挑战。我不敢让小孩过多使用手机端的 AI 产品。首先,屏幕对视力有影响;其次,手机 AI 无法「看见」孩子,即便打开摄像头,也缺乏实时的物理互动,导致上下文(Context)不完整。为了弥补这种缺失,AI 往往只能通过不停说话来取悦孩子。
我认为这种沟通范式是不健康的。AI 应该结合「具身」载体,能够感知上下文和周边环境,从而实现更好的互动。目前的普通 AI 就像处于一场「话痨式的异地恋」,只能不停通话却看不见对方,无法提供核心价值。
从公司层面看,我们已经具备了一定的 AI 能力储备。同时,通用大模型并非中小型公司所能触及,因为它对资源的要求极高。作为一家产品型公司,我认为让 AI 发挥最大价值的机会在于与硬件结合。虽然我们没有硬件基因,但公司的规模和能力与硬件开发有着内在的匹配度。
极客公园:刚才提到基因与机会,但市场上许多成熟的机器人公司也在做 AI 陪伴机器人,他们拥有供应链和制造基础的天然优势。作为从零开始做硬件的团队,会不会担心「缺少基因」会成为不利因素?
任永亮:不一定。首先,我们并不是要在硬件参数上与人竞争。我们信奉移动互联网时代的思路:为了打造更好的软件体验,才去定义和制造硬件。我们的出发点并非为了做硬件而做硬件,而是为了让软件能力得到充分释放,这种视角是天然不同的。
极客公园:所以做机器人也是为了让「测测」APP 的功能得到更好的发挥吗?
任永亮:更准确地说,是为了定义这个时代家庭场景所需的 AI 能力。它必须具备视觉、运动以及一定的泛化能力。
当家庭陪伴机器人还没有标准答案
极客公园:从构思到落地经历了一段时间。之前外界对于心言集团跨界做机器人可能有一些不同的声音,对此是怎么看的?
任永亮:这些声音鞭策我更加努力。机器人行业正处于一个「拐点」——历史上还没有出现过特别成功的家庭陪伴机器人。正因为没有标准答案,我们才有定义的自由。俗话说「画鬼容易画虎难」,老虎大家都见过,画得不像一眼就能看出来;但「鬼」没人见过,这反而给了我们很大的空间去定义机器人到底该是什么样。
极客公园:「拐点」具体指什么?
任永亮:是指行业正在从「玩具」向「生命感」跨越。以往的机器人产品多属于玩具范畴,顶多是通过交互方式调用云端模型,缺乏对物理环境、情绪以及复杂上下文的感知,且大多是静态的。我们现在的目标是赋予它「灵魂」,在拐点处实现跨越。
极客公园:所以在这个过程中有没有过哪怕一丝动摇?觉得做这件事到底对不对,花这么大劲值不值?
任永亮:这种动摇随时都在。包括内部沟通也反复了很多次,大家很难想象为什么一个互联网公司要去硬磕机器人。我去和一些候选人聊,做过扫地机的人会给我很多提醒,比如家太大机器人中途没电、撞碎重要东西、甚至绊倒孩子,这些技术上的 Corner Case(极端情况)非常难处理。
后来我试用了日本的 LOVOT 机器人,发现它做得其实也没那么强(笑),但这给了我很大信心。既然它做成这样公司也能活下来,说明大众是有接受度的。这成了坚定我信心的很大动力。

图片来源:心言集团
极客公园: LOVOT,你觉得它哪些部分还有优化空间?
任永亮:(笑)它经常绊倒,其实它真的经常绊倒,但这似乎也没关系。我也去过这家公司参观过,是和极客公园一起去的。它有独特的定位,但对我来说,我坚持让机器人拥有语言能力。这也是为什么我们公司叫「心言集团」,我希望它能和人沟通。
如果没有语言能力,机器人的情感价值会大打折扣。这是我和它不一样的地方。另外,我们处于不同的技术周期。LOVOT 诞生在机器学习时代,对话能力还没那么强;而我们是完全为了大模型(LLM)去打造机器人的。
极客公园:
所以它必须具备像人一样交流的语言能力,才能发挥新角色的作用?
任永亮:对。就像 iPhone 为什么伟大?因为它取消了实体键盘,让屏幕成为交互的主要介质,扩大了信息流通度。我们希望机器人至少在语言这条主通路上是没有任何障碍的。
它不只是会聊天,而是要真的住进家里
极客公园:那么这款家庭陪伴机器人有哪些更具体的产品定义?
任永亮:主要分为三个方面。第一是语言能力,包括陪孩子聊天、语言启蒙以及构建家庭多语言环境。第二是心理慰藉。我们将测测在情感领域积累的模型和心理服务理论融入其中,旨在改善家庭关系结构,给孩子更多鼓励和关注。毕竟现在的父母工作压力大,陪伴时间有限。第三是辅助功能,如影像记录等。
极客公园:它是一个可以在地面移动的产品。这种产品形态是如何确定的?中间有过其他方案吗?
任永亮:关于形态,我们确实经过了很多次打磨,但我始终坚持两点:视觉能力与运动能力。
之所以如此坚持,是因为我们看到了手机端 AI 的弊端。手机本质上是一个虚拟世界,我们往往是按照「取悦用户」的模式去设计产品,因为它对用户现实生活的影响力很小。
但如果在家庭场景中,我希望机器人是一个「家庭参与者」。作为参与者,它必须具备主动能力。否则,一旦用户忘了给它充电,或者不再主动交互,这个机器人可能就落灰了。我们希望它在家庭中真的像一个新生命一样,具备自主的运动能力和自主的判断力。
极客公园:自主的运动能力和自主的判断力,听起来它确实有一种「主动」的感觉。那它到底主动到一个什么样的程度?这种主动的边界在哪里?
任永亮:这些我们都在设计的过程中。我觉得底线是「自动回充」,这是它必须具备的能力。我们所说的主动,也不是到处找人说话,这肯定会有默认设置。用户也可以根据需要设计它的性格特征,比如到底是 i 人还是 e 人。我们希望它未来能根据交互过程自适应生活状态,比如它看到孩子偏安静、话比较少,那它主动交互的阈值就会高一些。这些都是我们后续要做的更详细的设计。
极客公园:它现在的智能交互程度具体是怎么样的?
任永亮:我觉得至少要让它在客厅这个主要活动区域内游刃有余,这是我们希望实现的。
极客公园:这个「游刃有余」有具体的描述吗?做到什么程度会让你觉得游刃有余?
任永亮:就是来去自如。比如小朋友在这边玩,它可以到孩子身边;小朋友走了,它可以自己回去。在这个过程中有人走动,它能适当躲避障碍物,不要绊到别人。
极客公园:如果看到小孩,它会主动交流吗?还是需要额外设置?
任永亮:我觉得「观察第一」。由观察再决定后面是交流还是做其他动作。在家庭里,它的人格里有一种「心理疏导师」的潜在定位。心理从业者往往优先观察,先分析环境,再适当给出回应。
极客公园:现在也有一些陪伴机器人功能相对简单,但形态很小,比如在桌面上移动,甚至能挂在包上。它们也有交互能力,比如唤醒后眼睛会眨巴。咱们没考虑过这种相对小型的形态吗?
任永亮:这是常被问到的问题。我最终还是想回到「生命感」这一块。我不希望它是一个过于被动的产品——那种放在桌上意味着你要及时给它充电,或者说话前必须先做一个唤醒操作,这种状态很难保持。另外,做得太小,计算能力和感知能力都会缩水。我不想妥协,我想在技术的边界上放大想象力,把多种能力融合在一起,把这个「大脑」训练得更好。
极客公园:刚才听你聊的过程中,「孩子」这个词出现了很多次。咱们的产品是主要围绕孩子群体设计的吗?
任永亮:有三类用户:有孩子的家庭是一类,独居老人是一类,还有一类是独居女性。因为我现在正好有孩子,所以对这个群体的感触会更深一些。
极客公园:
心言集团有自己的大模型。但做机器人涉及很多视觉算法、避障识别等,这些也是自己做吗?还是有外部合作?
任永亮:视觉和避障等「小算法」在过去几年已经发展得相对成熟了。早期的机器学习爆发就是从视觉开始的,全行业积累得很充分。虽然我们现在还没在一个统一的大模型架构下处理所有信息,但如果只是调用或借鉴,行业的解决方案已经非常成熟了。
极客公园:所以这个机器人在交互上会调用其他模型?
任永亮:目前它是一个「组合式」的。它会结合很多小模型,至少在运控感知这块,有很多成熟的技术方案可以作为大模型的输入或输出。
极客公园:前面提到 LOVOT,它的价格蛮贵的,要几万元,前两天卧安机器人也发了一款家庭陪伴机器人,也是那种在地上跑的,价格好像是 5000 元起。那心言做的这款机器人,定价范围大概是怎么样的?这个区间是怎么定下来的?
任永亮:这要结合未来的商业模式来考虑。有时候我们并不是单纯为了卖硬件,未来更想做的是硬件之上的软件。初期我们会根据用户的接受程度来定义价格。从传感器的选配以及算力储备来看,价格肯定要在 3000 元以上。具体来说,我们希望定价在 5000 元到 10000 元之间。
极客公园:关于商业模式,目前有具体的规划或设想了吗?
任永亮:商业模式其实挺简单的。一个是硬件本体的固有模式,另一个是基于硬件提供的各类服务。
极客公园:那是会为机器人重新开发一套软件,还是会跟「测测」APP 有所联动?
任永亮:它会有专门的软件。当然,「测测」的一些能力我们会进行结合,或者说「测测」的能力未来可能会作为机器人上的一个插件。
极客公园:目前有设想过哪些能力比较适合接入吗?
任永亮:至少「情感疏导」是一定可以的。因为它有视觉能力,能看到用户的表情。以前「测测」是看不到用户表情的,现在我们可以研究如何将表情识别融入到交互中。
极客公园:从线上走到线下,在这个过程中,除了朋友提到的扫地机器人的那些难点,你们自己在研发中发现了哪些挑战?
任永亮:我觉得最大的难点在于端侧模型还没有特别成熟、收敛的技术方案。大家目前只能沿用大模型的架构或其他传统的机器学习模型架构。在端侧到底用什么样的方案,数据如何收集,如何构建闭环,这些都很难。为此我们也做了很多打基础的工作。
极客公园:硬件研发通常分阶段进行,你们是否经历过某个特定的阶段,或者在第二阶段有了什么新的发现?
任永亮:我们内部的技术路线在不断收敛。最早我们想得很多,包括研究各种 3D 生成模型、视频生成技术,看能不能应用在机器人上。从去年下半年开始,我们逐渐收敛,定义了一套新的机器人基础数据格式。我们内部现在对「机器人如何理解环境」的规范定义得比较清晰,并围绕这个去构建场景数据。
极客公园:「新的机器人数据格式」?
任永亮:你可以理解为是我们完全自主研发、定义的一套简单的仿真系统。
极客公园:这套系统跟目前市场上通用的方法有什么区别吗?
任永亮:我们想做一个「整合式」的仿真。现在的仿真更多强调对物理环境的模拟,主要用于自动驾驶或操作控制。我们希望把语言、表情、人的动作以及物理环境全部整合在一个系统里,用于模型的训练。
一个耐心的机器人
极客公园:上次你在极客公园IF大会的演讲中,谈到了「无条件的积极关注」。这个理念如果跟机器人结合,会呈现出什么状态?
任永亮:通俗点说就是「耐心」。对父母来说,给孩子最奢侈的东西可能就是耐心。平时可能感觉不到,但当孩子惹你生气时,耐心会急速衰竭。我希望机器人不像人这么感性,它能持续地以一种积极的态度去关照孩子的情绪。
极客公园:所以「情绪疏导」是这款机器人的核心功能。那它会有像 LOVOT 那样的拥抱或触碰反馈吗?
任永亮:这些交互我们也都有设计。
极客公园:除了 LOVOT 具备的功能,咱们有哪些它没有的新亮点?
任永亮:首先是语言交互,这是它没有的。其次,我们的影像视角比它更高,LOVOT 太矮了,我们的机器人大概 65 厘米高,视角更好。第三,我们的价格会更容易被大众接受。
极客公园:在目标市场的选择上,是像 LOVOT 那样聚焦一线城市,还是有不同的考虑?
任永亮:目前精力非常有限,我们只能先从一线城市开始。
极客公园:之前你有提到机器人能触发用户分泌「催产素」,从而建立深度的情感链接。除了心言集团之前在心理数据上的积累,在技术或设计上还有什么支撑来实现这一点吗?
任永亮:这涉及到形象设计的问题。上帝设计催产素,本质是为了让人类愿意去抚养后代。当你看到一个大眼睛、毛茸茸的小生命时,天然会刺激催产素的分泌,让你产生与其建立长久链接的欲望。为什么大家喜欢宠物?因为所有可爱的东西都在模仿婴儿的特征:大眼睛、圆润、手感柔软。
我们的机器人也是沿着这个方向设计的。首先,它的眼睛很大且富有表现力;同时,我们刻意避开了光滑塑料或冰冷钢铁的工业风格,而是选择了毛绒材质。这种触感和视觉反馈,是触发催产素的重要保证。
极客公园:你还提到过机器人是家庭的「第三角色」。设想一个场景:如果父母在吵架,小孩在旁边哭,这个机器人会如何充当这个角色?它能劝架吗?
任永亮:它能劝。其实它的「存在」本身就是第三角色。就像你吵架时家里突然来了一个客人,当事人往往会稍微收敛一点。这就是「具身机器人」的特点——它的物理存在会改变整个「场」的氛围。而且,它还可以把这些场景录下来,等大家和好了再发给你们看,也算是一种提醒(笑)。

极客公园:关于交互程度,你理想中状态是什么样的?
任永亮:最理想的状态就是你感觉不到它的「不同」。你觉得它就是家庭的一部分,是一个真实的家庭成员,没有任何违和感。这是我们追求的最高目标。
极客公园:那你觉得目前我们的进度距离这个目标还有多远?
任永亮:还有一定距离。目前在算力和端侧技术创新上压力还比较大,标准定得高,成本就很难降下来。我觉得这是一个尝试的过程,可能还需要 3 到 5 年时间,技术才会真正走向成熟。
极客公园:目前公司投入在机器人项目上的有多少人?
任永亮:目前各职能加起来大约四五十人。
极客公园:听说这款机器人准备上北京台的春晚。它会以什么样的形式出现?后续有什么计划?
任永亮:它会客串一些主持场景,录制拜年视频,做一些基本的展示。春晚之后,我们计划启动「创生合伙人」活动,邀请首批用户参与共创,随后进入内测阶段。中间可能还会有技术或产品发布会,我们预计在今年年中开始量产发货。
极客公园:看到你有小红书上面询问大家对机器人功能的期待。目前收集到了哪些反馈?有哪些是符合预期的,又有哪些让你感到意外或值得考虑的?
任永亮:我在小红书收到的反馈里,发现大家对于「机器人与测测 APP 记忆共通」的需求非常强烈。我们测测也有一个名为「陪伴小星」的智能体,用户希望这两者能打通。
极客公园:这个在咱们的考虑范围内吗?
任永亮:会作为一个选项。
极客公园:还有其他的反馈吗?
任永亮:还有人希望它能做家务,但目前这还实现不了。
极客公园:这就是「功能性机器人」与「感性陪伴机器人」的区别吧。如果要实现功能性,成本应该会大幅上升,咱们现阶段应该不会考虑吧?
任永亮:我觉得要循序渐进。目前技术领域最大的突破在大语言模型,而关于 VLA(视觉-语言-动作)模型,以及对物理世界的操控、世界模型这部分,全行业都还处于分头探索阶段,没有成熟方案。我不可能在技术还不成熟的条件下,强行把产品功能铺得太满。
极客公园:这两年有很多公司在做「机器狗」形态的 AI 陪伴产品,比如某些品牌甚至能提重物、拉车、或者带出去遛。你怎么看这种形态?
任永亮:我认为大家正处于探索期。对我而言,陪伴机器人的「第一性原理」在于语言能力。为了解决语言交互,它必须有更丰富的视角和运动自主性,从而获取更多环境信息来完善它的认知。所以我坚持让它「直立」。
从动物进化来看,先有运动能力,再发展出视觉,这对智力进化至关重要。我希望它保持直立状态,拥有更好的视野判断力。至于机器狗,它的好处是能跨越障碍,但在家庭环境里的能耗、友好度以及带来的变量还不确定。大家的关注点不同。
极客公园:家里的小孩见过它或者跟它交流过吗?
任永亮:我小孩对它的要求特别高。
极客公园:怎么个高法?
任永亮:因为目前模型还没达到我最理想的状态,我没让他们用得太频繁。我发现对于 LOVOT,如果没有语言能力,孩子的热情大概只能维持一个月。虽然它能动,比普通玩具好一些,但没有语言还是很遗憾。所以我打算等机器人的语言能力再完善一些,再正式给孩子用。
极客公园:所以他们跟咱们这款机器人还没有长时间接触?
任永亮:对,时间还不长。
极客公园:你说他们对 LOVOT 的热情只持续了一个月。那他们平时是怎么评价这个家里的小伙伴的?
任永亮:他们觉得很可爱,主要会跟眼睛互动。但有时候也觉得它「碍事」。比如大人很忙的时候,它会突然跑到身边。这种真实反馈给了我们很大压力,促使我们去完善模型。
极客公园:比如你在忙,它跑过来碍事,你让它走开,它能听懂指令并照做吗?
任永亮:有时候行,有时候不行。因为它不会说话,你无法预判它是否真的理解了。这就是识别准确度的问题。
极客公园:你家里两个小孩对这款机器人有哪些具体的高要求?

图片来源:心言集团
任永亮:最大的期待是陪他们讲故事,或者玩文字游戏。我女儿 6 岁,儿子 3 岁多,「分享」是他们的重要需求。比如孩子画了一幅画想给机器人看,如果机器人不会说话,乐趣就少了一半。如果机器人能夸夸他,或者根据画的内容做些讲解,那体验就完全不同了。这也是我们设计它的初衷。
「受够了做移动互联网时代的奴隶,要追求自由」
极客公园:还看到你在小红书上说了一句很有意思的话,大意是「受够了做移动互联网时代的奴隶,要追求自由」。做机器人能带给你什么样的自由?
任永亮:这种自由在于「定义权」。在移动互联网时代,设计产品必须遵循 iOS 或 Android 的规范,你本质上只是别人生态里的一部分。
而现在,我们有机会从头定义一个完整的产品,并以硬件形态呈现,这是我对自由的理解。另外,做移动互联网产品时,你无法真正触达物理世界的用户,必须不断迎合「刚需」,否则用户就会忘记你。但当我们做一个独立的、有生命力的产品时,哪怕是一些不那么刚性的情感需求,我们也能通过物理存在感去很好地满足。这在以前是无法想象的。
极客公园:这个机器人对于测测、对于整个心言集团意味着什么?在接下来的业务比重中占据什么位置?
任永亮:我创业之初是一名算法工程师,那时候的目标就是做一个能与人深度互动的载体。只是受限于当时的技术趋势,我先选择了互联网,选择了工具形态。
在做工具的阶段,我也尝试过把工具变成对话模式。但我发现,当一个工具给出多种可选结果时,当时的技术很难像人类思维那样将其归纳总结并呈现。我做了一个妥协,保持了工具的「原汁原味」。好比我原本想给用户准备一份「法式大餐」,但技术跟不上,最后做成了一个「自助餐模式」——见山是山,见水是水,不再做智能整合。
随着深度学习、大模型以及物理 AI 的发展,「法式大餐」逐渐成为可能。机器人就是这种尝试的极致。它不仅是我们公司使命的延伸,也是能力的自然进化。我们希望它成为未来公司最重要的业务板块之一,让「测测」的能力在一个全新的载体上,以新的形态实现再生。
极客公园:你前面提到,向大家描述机器人的愿景时,其实没那么容易说服别人真正相信。后来你是靠什么让团队和外界觉得,这个方向真的是正确的?
任永亮:其实没什么技巧,就是「重复」。不断重复愿景,不断引入人才,并持续迭代。原先大家看不到实物,自然难以相信;当原型机真正出现,大家亲眼看到、亲手摸到,感受就完全不同了。特别是当机器人受到参观者的好评时,内部的反馈也会随之变化。这是一个逐渐被接受的过程,过程本身也是一种「治愈」。
极客公园:最后一个总结性的问题。你对这款机器人有什么样的期待?希望它能带给用户和行业什么样的改变?
任永亮:我对它的期待并不算高,首先希望它能真正「立得住」,成为一款扎实的产品。大家都说硬件创业的第一代产品很难达到理想状态,所以作为初创团队,压力是实打实的。我希望它能真正被用户用起来。
至于更深层的期待,我认为大模型爆发后,社会正处在一种焦虑甚至恐慌的状态中。AI 对白领工作、教育模式的冲击巨大,软件工程师、算法工程师甚至会觉得自己可能被时代抛弃。
我希望通过这种陪伴机器人的产品形态,给用户带来更多的「安全感」和「稳定感」。通过让机器人融入家庭,让每个人都能感受到一种安心的慰藉,这是我们想要尝试的方向。
极客公园:大模型迭代极快,且软件更新的成本相对较低。但硬件迭代非常费劲,涉及模具、供应链等复杂环节。在如此快速的技术变革中,你是如何考虑硬件迭代问题的?
任永亮:所以我们要「为了软件而去设计硬件」,在硬件设计上给软件预留足够的升级空间。
极客公园:补充问几个数据方面的问题,目前「测测」的用户量级大概是多少?
任永亮:接近 6000 万。
极客公园:上次提到过「陪伴小星」这个智能体,它的调用频次高吗?目前是什么样的用户量级?
任永亮:很高。用过它的用户已经有几百万了。
极客公园:后续会多出几个这类智能体吗?还是主打「陪伴小星」?
任永亮:我们会重点推一段时间,甚至想把它独立出来。
极客公园:独立做一个 APP 吗?为什么会有这个想法?
任永亮:对,独立做 APP。因为用户的反馈非常好,我们希望用户对他有更直接的认知。现在大家想到「小星」,会先想到「测测」,我们想缩短他与用户的距离。
极客公园:用户具体给了他什么样的反馈?
任永亮:最核心的评价是「特别像人」、「像朋友」,有一种真实的「人感」。
