Skip to content
  • 51蛙吖蛙元宇宙社交空间官网
51蛙吖蛙 – 元宇宙社交

51蛙吖蛙 – 元宇宙社交

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

标签: 科技

小米汽车第 50 万辆整车下线;谷歌推出 Nana Banana Pro;华为正式推出乾崑境系列旗舰 | 极客早知道

吉利资本领投!星动纪元斩获近10 亿 A+轮融资:创具身智能单笔投资最高纪录

11 月 20 日消息,具身智能企业星动纪元完成近 10 亿元 A+轮融资。本轮融资由吉利资本领投,北汽产投参与战略投资,北京市人工智能产业投资基金、北京机器人产业发展投资基金联合注资,同时已有多家国际产业巨头资本加入加持公司。

值得注意的是,该笔融资创下汽车产业资本对具身智能企业的单笔最大投资记录。在此之前,吉利只投资过宇树科技一家机器人公司。至此,除一众知名VC 外,星动纪元背后已汇聚阿里巴巴、海尔资本、吉利资本、北汽产投、联想创投等产业方投资阵容。

据了解,星动纪元为兼做「具身大脑」和「通用本体」的全栈派具身智能企业。其自研具身大脑ERA-42 是国内唯一可驱动全尺寸双足人形机器人全身及五指灵巧手的端到端 VLA 具身模型,已在物流、制造、商业服务等场景实现落地。而在硬件层面,公司自研比例超 95%,形成从零件到整机的全链条研发能力,推出星动 L7 人形机器人、星动 Q5 轮式人形机器人、星动 XHAND 系列五指灵巧手等核心产品。

此轮融资后,公司将加速具身模型技术迭代与场景渗透,推动通用机器人规模化应用。(来源:快科技)

 

 

Nano Banana Pro?谷歌 Gemini 3 Pro Image Preview 图像模型上线

​11 月 20 日消息,谷歌 Gemini 3 Pro Image Preview 图像模型已上线,疑为 Nano Banana Pro。

据官方介绍,Gemini 3 Pro Image 可实现快速创意工作流程,具备图像生成和对话式多轮编辑功能。Gemini 3 Pro 图像模型旨在通过集成最先进的图像预览推理功能来应对最具挑战性的图像生成任务,是复杂和多轮图像生成和编辑的最佳模型。Gemini 3 模型是推理模型,能够在响应之前进行推理,从而提高准确性并增强图像质量。

谷歌称,Gemini 3 Pro Image 是其功能最强大、用途最广泛的图像生成模型。其将推理融入图像生成,从而提升图像质量,更好地渲染多种语言的长文本段落,并提高事实准确性。该模型还支持高达 4K 分辨率的输出,并添加了基于搜索的接地功能,以获得更准确、更及时的信息。

该模型现已在 Vertex AI 平台上线,也可通过 Google 的 Gen AI SDK(提供统一的 Python 和 Go 接口)在 Google AI Studio 中使用。(来源:IT之家)

 

用时仅1 年零 7 个多月,小米汽车第 50 万辆整车正式下线

​11 月 20 日消息,小米汽车官微发文宣布:「刚刚,小米汽车第 50 万辆整车正式下产线。这是一个新的起点,未来我们会持续努力,感谢所有车主的支持。」

11 月 18 日,小米集团合伙人、集团总裁卢伟冰在业绩电话会上透露,小米汽车预计本周完成全年 35 万辆的年度交付目标。

根据小米公司公布的2025 年第三季度财报,小米汽车季度交付量持续攀升,2025Q1 交付 75869 辆、2025Q2 交付 81302 辆、2025Q3 交付 108796 辆(累计 265967 辆)。同时在 10 月 SUV 销量中,小米 YU7 拿下国内第一。

小米今年Q3 总营收 1131 亿元,连续 4 个季度超千亿,同比增长 22.3%;经调整净利润 113 亿元,同比增长 80.9%。智能电动汽车及 AI 等创新业务收入 290 亿元,当季新车交付 108796 辆。(来源: IT 之家)

 

低成本叫板 GPT-5.1,马斯克杀入智能体

11 月 20 日报道,今日,马斯克的 xAI 公司推出 xAI API 的两大更新:快速、低成本、以智能体为中心的新模型 Grok 4.1 Fast 和智能体工具 xAI Agent Tools API。

Grok 4.1 Fast 是其迄今为止性能最佳的工具调用模型,拥有支持 200 万 token 上下文的窗口,它能够准确快速地进行推理并完成智能体任务,尤其擅长处理客户支持和财务等复杂的实际应用场景。

该模型在人工智能分析智能指数(AII)中跃升 4 位,达到第六位,仅次于第五位的 Grok 4。其中,其在智能体调用测评𝜏²-Bench Telecom 排行榜上以 93.3% 的得分位居榜首,以更低成本超越了 GPT-5.1(high)、Gemini 3 Pro 等模型的性能表现,比 Grok 4 Fast 提高了 27 分。xAI 还提到,Grok 4.1 Fast 在事实性方面更准确,幻觉率比 Grok 4 Fast 降低了一半。

Agent Tools API 使智能体能够访问实时 X 数据、网络搜索、远程代码执行等功能。Grok 4.1 Fast 和 Agent Tools API 结合使用,使开发人员能够构建专门用于工具调用和智能体搜索的生产级智能体。(来源:智东西)

 

网易第三季度营收284亿元 同比增长8.2%,净利润86亿元

11 月 20 日消息,网易发布了 2025 年第三季度未经审计的财务业绩:

营收为284 亿元人民币(40 亿美元),较 2024 年同期增长 8.2%;毛利润为 182 亿元人民币(约合 26 亿美元),较 2024 年同期增长 10.3%;总运营费用为 102 亿元人民币(14 亿美元),较 2024 年同期增长 8.9%;归属于公司普通股股东的净利润为 86 亿元人民币(12 亿美元);非美国通用会计准则下归属于公司普通股股东的净利润为 95 亿元人民币(13 亿美元)。

各业务版块营收如下:

游戏及相关增值服务净收入为233 亿元人民币(33 亿美元),较 2024 年同期增长 11.8%。

有道净收入为16 亿元人民币(约合 2.288 亿美元),较 2024 年同期增长 3.6%。

网易云音乐净收入为20 亿元人民币(约合 2.759 亿美元),较 2024 年同期下降 1.8%。

创新业务及其他净收入为14 亿元人民币(约合 2.021 亿美元),较 2024 年同期下降 18.9%。

2025 年第三季度,网易研发投入 45 亿元,研发投入强度 16%。AI 技术已成为网易业务增长和提升用户体验的重要引擎。网易有道 Q3 净收入 16 亿元,在「AI 原生」战略深化与业务结构聚焦的推动下,2025 年前三季度累计经营利润同比增长近 150%,在线营销服务净收入与 AI 订阅服务销售额均创历史新高。(来源:IT 之家)

 

OpenAI 推出教育版ChatGPT,2027 年6 月前对美国K-12 教师免费

11 月 20 日消息,据科技媒体 Engadget 今天报道,OpenAI 现已发布教师版 ChatGPT,定位教育工作者专用的教案工具,将在 2027 年 6 月前免费开放给全美国的 K-12(指幼儿园到高三)教职员工。

据介绍,教师版的ChatGPT 可以无限制使用 GPT-5.1 Auto 模型,包含 App 连接、上传文件、生成图像、记忆等功能,与其它版本最大的不同是符合《家庭教育权利与隐私法案》(FERPA)法律要求,在存储学生信息方面经过特别处理,不会对外泄露隐私。

值得注意的是,OpenAI 还表示,教师版 ChatGPT 的协作功能经过增强,除了可以与同事共享信息外,还可以在新聊天界面中展示其他教师如何使用 ChatGPT,提供更多使用建议。

据此前报道,OpenAI 曾在今年7 月初向所有用户开放了「一起学习」功能,其运作模式与传统 AI 直接给答案不同,会通过提问更多问题引导使用者自行思考并作答,整体互动方式类似谷歌 LearnLM,便于学生之间进行协作学习,防止出现「照抄答案」现象。(来源:IT 之家)

东风、华为乾崑联手推出「奕境」,华为乾崑境系列旗舰正式发布

11 月 20 日华为乾崑生态大会,东风汽车与华为乾崑携手发布全新汽车品牌「奕境」。东风奕派汽车科技公司总经理汪俊君与华为智能汽车解决方案 BU CEO 靳玉志共同登台,揭晓这一重磅战略合作成果。

奕境作为东风最早与华为联合提出并构想全新合作形式的最新落地成果,由华为全面开放产品开发和运营体系能力和东风共同完成从产品定义、产品设计到研发、供应链、生产制造、营销及生态服务的全链条深度协作。

奕境的首款车型将预计于明年 4 月北京车展亮相,首款车型将搭载华为一众顶尖智能技术,成为市场上华为技术集成度最高的车型之一。在安全方面,除了最新一代华为乾崑智驾,在被动安全上,奕境引入华为乾崑和东风体系最严苛的质量管理和标准体系。

 

智能戒指专利战打响,Oura 起诉三星 Galaxy Ring 侵权

11 月 20 日消息,三星去年凭借 Galaxy Ring 正式进军智能戒指市场,使得这一新兴领域的竞争日趋白热化。作为该领域的先行者,芬兰健康科技公司 Oura 近日正式「亮剑」,向美国国际贸易委员会(ITC)提起诉讼,指控三星的 Galaxy Ring 侵犯了其多项专利技术。

​
除了三星,Oura 的维权名单还包括 Reebok(Reebok Smart Ring)、Zepp Health(Amazfit Ring)以及 Nexxbase(Luna Ring )。

注意到,自Galaxy Ring 发布以来,三星便一直对来自 Oura 的潜在法律风险保持高度警惕。为了规避风险,三星曾采取「先发制人」的策略,主动向美国法院提起诉讼,请求法院作出 Galaxy Ring 未侵犯 Oura 专利的宣判。

然而,这一策略并未奏效。2025 年 3 月,法院驳回了三星的诉讼请求。尽管三星随后向联邦巡回法院提起了上诉,但随着 Oura 此次正式向 ITC 提起投诉,三星此前对于法律纠纷的担忧已成现实。

Oura 在智能戒指领域拥有深厚的护城河,其知识产权组合包含超过 100 项专利。Oura 在其官方博客中表示,所涉及的被侵权专利与智能戒指的外形、组件(内部和外部)以及制造方法有关。对于三星而言,ITC 的介入可能带来严峻挑战。一旦 ITC 裁定 Oura 胜诉,最直接的后果可能是禁止 Galaxy Ring 进口至美国市场。(来源:IT 之家)

​
蚂蚁灵光闪应用功能被「挤爆」,上线两天下载量破50 万

​11 月 20 日消息,有网友反馈蚂蚁集团全模态通用 AI 助手「灵光」的闪应用功能无法使用。随后,灵光通过官方账号承认崩了,并回应称「你们等着,我很快回来。」

​蚂蚁集团在11 月 18 日官宣推出全模态通用 AI 助手「灵光」。该助手支持「自然语言 30 秒生成小应用」,同时它也是「业内首个全代码生成多模态内容的 AI 助手」,支持 3D 数字模型、音频、图标、动画、地图等全模态的信息输出。蚂蚁灵光上线两天多下载量破50 万,第三天冲上 App Store 总榜第七、App Store 免费工具榜第一。目前「闪应用」功能尚未恢复。(来源:IT 之家)

 

三星 XR 智能眼镜曝光:1200 万摄像头、变色镜片、155mAh 电池、高通 AR1 芯片

​11 月 20 日消息,科技媒体 Android Authority 今天(11 月 20 日)发布博文,报道称三星内部正开发代号为「Haean」的全新 XR 智能眼镜,型号为 SM-O200P,目标为用户提供更轻便的 XR 体验。

型号方面,这款智能眼镜的内部型号为 SM-O200P。这一型号的前缀「SM-O」与 Galaxy XR 头显的「SM-I」前缀明显不同,暗示三星在内部产品线划分中将其视为一个独立的全新类别。这一区分可能预示着它在功能、应用场景和目标用户上将与头显设备形成互补。

功能方面,泄露信息显示该眼镜将配备全视线镜片(即光致变色镜片),能根据环境光线强度自动变暗或恢复透明,从而适应室内外不同场景的使用需求。此外,设备还将内置摄像头并支持 Wi-Fi 与蓝牙连接。一个关键信息点是,这款设备不具备独立的移动数据(蜂窝网络)连接功能,这意味着它需要连接智能手机等其他设备来获取网络服务和处理数据。

关于硬件配置,结合此前的传闻,这款智能眼镜的内置摄像头可能采用 1200 万像素的索尼 IMX681 CMOS 传感器,支持二维码扫描和手势识别等交互功能。(来源:IT 之家)

豆包输入法正式版上线:内置情境感知引擎,支持中英文混合滑行输入

​11 月 21 日消息,豆包输入法 1.0 正式版现已上线,目前可在小米应用商店下载,内置情境感知引擎,支持滑行输入增强版,整体观感较为符合现代审美。

据介绍,豆包输入法搭载情境感知引擎,可基于聊天场景自动切换词库,例如工作中可以自动联想专业术语,日常聊天则可以推荐表情包,还拥有「滑行输入增强版」,支持中英文混合滑行输入,号称可在5.5 英寸的屏幕上实现每分钟 62 字的输入速度。

经过实测后发现,该输入法目前基础功能较为完善,可选9 键和 26 键两种布局,支持调整键盘高度,还带有语音转文字功能,但目前并没有切换方言语种按钮,实测显示该输入法可以识别出粤语,但是在转文字过程中存在错字现象。此外,该输入法还拥有智能输入、基础输入两种模式,其中前者会将部分输入信息、应用场景等传输至云端处理;而后者则不会收集任何个人信息,使用本地资源进行输入,但确实语音转文字、翻译等功能。(来源:IT 之家)

 

荣耀机器人手机亮相罗巍:这就是大家没见过甚至没想过的影像方案

​11 月 20 日消息,荣耀机器人手机 ROBOT PHONE 早期手板在荣耀用户嘉年华活动中首次亮相,荣耀称其为「新物种」。

具体来说,它拥有AI 的超强大脑,能随时随地洞悉万物;它具备机器人的超强行动力,陪你共享生活的鲜活点滴;它更能化身你的专属摄像机,敏锐捕捉每个珍贵瞬间。

荣耀首席影像工程师罗巍表示,这款就是我之前说的大家没有见过甚至没有想过的手机影像方案,这个第一款手板前其实还有个第0 款,那基本就是我们手搓的,后面发布后再给大家看,当然现在的手板可能都不是最后的真机。

业内人士指出,荣耀通过ROBOT PHONE,正在为整个行业描绘一个新的想象空间:科技的未来不在于把我们吸入虚拟世界,而在于让数字智慧更温柔、更强大地赋能我们的物理生活。该机将在明年举办的 MWC2026 上正式亮相。(来源:快科技)

 

马斯克:未来人类不需要工作和钱 AI的发展会让金钱失去意义

​11 月 20 日消息,面对 AI 的发展,马斯克再一次表示,这会让金钱失去意义。当地时间周一,马斯克在美沙投资论坛上与英伟达 CEO 黄仁勋同台并表态:生成式 AI 的发展会让金钱「失去意义」,电力等能量和质量依旧会形成限制,但「货币终将变得无足轻重」。

​谈到工作时,马斯克说,未来的工作会像运动或玩游戏一样「随意参与」。

他还把这种未来比作园艺:在后院种菜虽然费力,但喜欢的人仍然会做;工作未来也会变成这种「可做可不做」的活动。

过去几个月里,马斯克多次描绘 AI 时代的愿景,包括消除贫困。之前马斯克就曾有过类似的表述,即当 AI 和机器人让所有工作和金钱都不再必要后,政府应发放全民收入,而且必须是「全民高收入」。

「在较温和的情境下,会出现全民高收入,人人都能获得想要的产品和服务,但过程会伴随相当大的冲击。」(来源:快科技)

 

浏览量: 4

字节这个「消失」了几年的 App,悄悄杀回苹果商城排行榜

 

头图来源:极客公园

 

在互联网产品的坟场里,很少有APP能在被判“死刑”后还能重新杀回舞台中央。

11月18日,极客公园注意到,在App Store中国区免费榜的前六名应用中,有五款来自字节跳动,分别是豆包、红果短剧、抖音商城、多闪和汽水音乐。除豆包外,其余四个应用都属于抖音旗下。

这其中,多闪可能是一个令人意想不到的名字,很多人可能并不熟悉这款社交应用。

对于大多数用户而言,“多闪”这个名字属于2019年的那个冬天。彼时,它作为字节跳动首款独立社交产品,带着“围剿微信”的使命高调诞生,却在短暂的高光后迅速陨落,甚至一度被传停止研发。

但现在,这样一款并没有活跃在大众视线里的社交产品,不仅没有消失,反而在一众新贵的夹击下悄然冲榜——在免费总榜单中位列第五名,同时还冲到了App Store社交榜第一名。

多闪的“诈尸”回春,背后或许是字节跳动面对流量见顶时的焦虑,以及在AI时代重构社交版图的野心。

 

一、 褪去光环的“幸存者”:从挑战微信到成为抖音的“影子”

 

多闪的「诈尸」是从什么时候开始的?

 

七麦数据显示,多闪在今年年初时,就曾在社交榜冲到第四名,此后一直在这个位置上下徘徊。

图片来源:极客公园

 

但在免费总榜里,年初最好的排名也就是36名,而后处于大幅上下波动中,11月的这波「起飞」,看起来始于11月11日左右,从第162名一路直升到第五名左右。

图片来源:极客公园

 

回溯到2019年,多闪主打“视频社交”,张一鸣曾在字节跳动七周年庆典上为其站台,称对多闪的预期是“不断想办法突破”。

 

那时的多闪,试图用“随拍”、“72小时消失”等Snapchat式的玩法,去挑战微信沉重的社交压力。但现实是残酷的,随着补贴退潮,多闪下载量曾经历断崖式下跌。

 

而后多闪经历过三次大的改版:2022 年探索相机社交,2023 年重新定位为“抖音聊天官方应用” 。去年 12 月坊间一度传出其已停止研发、仅保持维护的消息,且 iOS 端曾近一年未更新 ,但从7个月前,多闪已悄然恢复了每月小幅优化的节奏 ,这一个月以来更是密集优化了5次。

 

图片来源:极客公园

 

就在 5 天前,多闪又更新了36.6.0 版本,重点补齐了更多聊天实用功能 ,越来越像一个“抖音版微信”。

 

从“几近消失”到重回榜首,应该是抖音在幕后重新发力,将多闪推向了前台。

 

这种变化或许折射出了字节跳动社交思路的变化:不再试图凭空造一个新社交网络,而是承认抖音才是真正的流量黑洞,多闪必须依附于抖音存在。

 

目前的“多闪”,更像是一个被剥离了短视频广场、专注于即时通讯的“配套工具”。它老老实实地做抖音生态的“Messenger”,不再寻求成为年轻人的“Snapchat”。

 

但这种“降级”反而让它在抖音庞大的用户基数下找到了生存空间——只要抖音用户有聊天需求,多闪就有存在的价值。

 

二、 醉翁之意不在“聊”

 

如果仅仅是为了聊天,抖音内置的私信功能似乎已经足够。为何字节跳动还要死磕“多闪”这个独立App?答案或许藏在抖音急剧扩张的商业版图中。

 

近年来,抖音在本地生活和电商业务上攻城略地,但在私域流量的沉淀上始终是短板。互联网进入存量博弈阶段,单纯的社区内容消费与人际社交关系链有着本质区别。

 

微信之所以难以撼动,是因为它掌握了核心关系链。

 

多闪的「复活」或许可以跟字节跳动最新的一则组织架构调整联动来看。11月17日,有报道称字节跳动将中国电商、生活服务、中国广告的技术团队深度整合,正式成立“中国交易与广告”部门,由原抖音生活服务技术负责人王奉坤挂帅。

 

这意味着,在字节的战略棋盘中,广告流量与交易场景(电商、本地生活)将被彻底打通。

 

在这个新的“交易+广告”庞大架构下,多闪也许能发挥的作用是——私域沉淀,商家需要一个更纯粹的场域来维护客户关系,而不是在充斥着短视频流的抖音主App里;弥补算法缺陷,社交推荐能有效弥补算法推荐的弊端,增加用户粘性。

 

多闪的任务可能已经从“进攻”转为“防守”。它不需要打败微信,只需要作为抖音生态的一个“后花园”,接住那些在抖音上产生的社交关系火花,防止它们流失到微信中去。

 

字节对社交的执念应该永远也不会消失。

 

除了「复活」的多闪,猫箱则是字节flow部门推出的AI社交产品 ,主打人与虚拟角色的互动,提供一种“伴聊”的情绪价值,刚推出的时候活跃度很高,但随着国内产品在9月迎来了一波停服潮,曾经是头部产品的「猫箱」相较巅峰时期下载量已跌去 9 成以上。

 

从2019年的高调宣战,到如今的低调霸榜,多闪的浮沉录也是字节跳动产品哲学的进化史。它更加务实地服务于超级APP的生态需求,而不是像过去一样盲目追求颠覆。

 

多闪有没有“死”并不重要,重要的是打败微信的绝不会是另一个微信。这场关于社交的战争,或许并未结束。

 

浏览量: 4

​「数字分身」白菜价:每月 998 元,雇一个 AI 帮你直播 8 小时

数字人赛道又挤进来一个玩家。

2025 年 11 月 14 日,邦彦技术的 NuwaAI 刚办了场线上发布会,介绍了他们的最新产品。第一眼看,这似乎没什么稀奇,又一个 AIGC 浪潮下的数字人而已。

但仔细看他们的打法,会发现味道有点反常。

当整个行业的大方向是卷大企业用户,用数字人替代客服、咨询等场景的工作时,NuwaAI 却率先开始探索一个更有趣的赛道——为普罗大众创建「数字分身」。

他们的产品极其简单粗暴:花上几百块,你就能创建一个带知识库的数字分身,可以帮你录视频,也可以雇来帮你每天直播 8 小时,或者是帮你搞定演讲汇报。

当每一个人都能利用上到廉价的数字分身,这个世界会有怎样的改变?

从「做脸」的匠人,到「分身」的信徒

要理解 NuwaAI 1.0 的商业逻辑,得先看懂他们从哪儿来。

在 AIGC 浪潮席卷一切之前,NuwaAI 团队已经是数字人领域的「老炮」,不过过去,他们更多的是在做项目制的重活儿,比如为学校克隆 AI 心理咨询老师。

这是个「匠人活」。他们的核心专长是制作与人脸接近的数字形象。不过,一个纯定制的数字人,制作周期动辄一到两个月,客户如果想调整姿势或更换场景,又需要至少一个月的时间。

这种「专人专线」的重资产逻辑,昂贵、缓慢,根本无法实现「千人千面」的规模化。

然后,AIGC 的浪潮来了。

团队的本能反应,是把 AIGC 当成效率工具,用基于图片的方式去替代专人专训。很快,他们解决了生成的瓶颈。今年 7 月的公测版,他们已经能让用户一张照片加上一段声音,快速克隆一个分身。

但一个更尖锐的问题摆在了面前:生成的数字人可以用来做什么?

技术问题解决了,应用场景却模糊了。在采访中,NuwaAI 团队坦言,他们通过 7 月份的公测收集反馈,试图搞清楚「数字人最终应该走向什么方向」。他们发现,即使用户花几分钟造出了自己的分身,但「不知道用它来做什么」。

一个仅仅为了「像你」而存在的数字人,本质上还是个形象,是个摆设。

从 7 月到 11 月,团队一直在探索这个「Why」。他们没有像大多数厂商那样,一头扎进大 B 端的客服、金融红海,而是找到了一个被忽略的巨大需求。

这个答案,就是「表达力」。

他们发现,现实中,海量的普通人(比如那些想直播的果农、小企业主、素人讲师)真正缺乏的不是一个好看的形象,而是在公共场合(直播、演讲、培训)自如表达的能力。

太多人不会说、不敢说、或者不想说。这群社恐人群的需求,就是数字人最好的应用场景。而 NuwaAI 基于此,找到了几个「表达力」的绝佳切口。

第一个切口,是演讲与汇报。

这是一个被低估的巨大市场。想象一个场景:一个销售或技术专家,每天要跑好几个客户,重复讲解同一套 PPT。或者,一个内向的开发者要在全公司面前做技术分享,内心充满怯场。

数字分身在这里成了完美的王牌解决方案经理。用户只需上传自己的 PPT 和知识库,数字人就能上台,不知疲倦、逻辑清晰地完成讲解。更重要的是,那个在用户评测中被高赞的杀手级功能——它能实时回答观众基于 PPT 内容的提问。而真人自己,则可以退到台下,放松地观察听众反应,只在最关键的互动时介入。

第二个切口,是直播,尤其是素人直播。

传统数字人直播只是「播片」,既无聊又容易被平台封禁。但 NuwaAI 想解决的是那些果农、手艺人,他们有好的产品,却不太会直播。NuwaAI 主推的是「1+1 搭档」模式:数字人作为主播在前面全程控场,按照脚本不知疲倦地讲解;而真人则退身为搭档或运营,在旁边负责上架、回复弹幕。

这既解决了素人的表达难题,也用真人的在场规避了平台的限制。每月不到一千块,就能雇一个「每天直播 8 小时」的数字主播,这笔账,小 b 用户算得清。

事实上,这次 Nuwa 1.0 就直接使用了数字人和人类共同主持的发布。

最后一个切口,更 C 端,也更有趣,是社交「嘴替」。

比如亲戚朋友间闹了不愉快,场面尴尬,你不敢说道歉的话。NuwaAI 的分身可以代你出马,用一种更有趣、更真诚(因为它有你的脸)的方式去传达祝福或歉意。这就像一个被赋予了你形象和声音的、超级进化的表情包,专门用来打破社交僵局。

998 元的搭档,与超级个人的未来

场景解决了,接下来是技术与价格。

为了让 NuwaAI 真正为普通人服务,首先需要解决的是价格的问题。NuwaAI 没有走传统大 B 的年租老路,而是采用了极度互联网化的套餐订阅模式。他们认为,AI 本质上是一个工具,用户应该「按需使用,用多少算多少」。

这个价格有多「卷」?根据官网提示,直播套餐一个月只要 998 元,就能支持每天 8 个小时全程直播。而更轻度的演讲汇报,一个月仅需几十块或一百多块。

它源于团队过去「做脸」的经验,但彻底抛弃了「匠人活」的模式。用户无需专业拍摄视频或单独训练,仅凭一张照片,系统就能实时驱动 90% 以上的唇形。这直接砍掉了一两个月的制作周期和高昂的人工成本,让「每个人都拥有分身」这件事在商业上成为可能。

其次,也是更核心的,它解决了能干活的问题。

如果只是便宜,但造出来没用,那还是「播片」。

NuwaAI 在意图理解和任务拆解上做了大量工作,当用户说出「数码产品直播专场」时,它不仅仅是一个关键词匹配。系统会基于大量直播场景数据,理解这是一个复杂的电商直播任务,并自动调用内置的直播任务卡模板。

这个模板就像一个标准化的「工作流大脑」,它会将模糊指令拆解为一系列结构化动作:开场暖场 -> 产品亮点介绍 -> 核心参数讲解 -> 优惠福利宣布 -> 互动答疑 -> 下单催付 -> 结束感谢。然后,数字人会根据这个流程,自动生成相应的话术、匹配对应的表情和动作(如展示产品、指向价格标签、欢呼等)。

NuwaAI 还创新性地开创了「AI 双脑」作为一种智能体架构:数字人体内有两个大脑在协同工作:「智商脑」负责任务规划、逻辑和知识库,处理说什么;而「情绪脑」负责个性化角色和情商表达,处理怎么说,让数字人能更好地在这类的工作中,既能低延时,又能十分聪明地回答问题。

低门槛制作+高价值使用——这个组合,才让 NuwaAI 敢于将一个曾经年租起步的「奢侈品」,变成一个真正的生产力工具。

这套模式真正令人兴奋的地方,在于它真正释放了个体的生产力。

让我们回到标题的那个场景:一个健身教练。

在过去,他想卖课,主流方式是地推或体验课。当一个潜在客户走进健身房(或线上咨询),教练必须花费前 30 分钟,重复讲解几乎完全一样的基础知识:我们的课包 A、B、C 有什么区别、饮食怎么搭配、价格和有效期是什么。这套讲解他们一天可能要说十遍,既疲惫又低效。

现在,他有了新的选择。他订阅了 NuwaAI,上传了自己的照片和声音,然后把他所有的健身课程 PPT、营养学知识库、课包价格 FAQ 全部喂给了数字人。

于是,「1+1 搭档」的咨询模式出现了。

客户坐下来(或者加入线上会议),真人教练先寒暄,建立信任,然后说:「关于我们详细的课程包和营养理念,让我的数字搭档来为您做个精准介绍。您可以随时向它提问。」

数字搭档」登场。它开始不知疲倦、逻辑清晰地讲解 12 周减脂营、力量突破课以及所有的价格条款。客户随时打断提问:这个减脂营包含私教吗?两个课包的差价具体在哪里?数字人(智商脑)立刻从知识库中调取标准答案,精准作答。

直到客户听完了所有标准信息,抛出了一个最关键的、个性化的问题:「我明白了。但说实话,我去年刚做了膝盖手术,我这个情况,到底该选哪个课?会不会受伤?」

这,就是「1+1 搭档」模式最关键的时刻。

真人教练此时介入:「这是一个非常好的问题。感谢您的信任。基于您的情况,标准课包确实不适合。让我们把标准介绍关掉,我来帮您定制一个康复性训练方案……」

在这个模式下,真人教练从重复性的讲解中被解放出来,得以全程保持精力充沛,去专注处理最需要专业判断、同理心和临场经验的关键信任与成交环节。

这个逻辑,可以无缝切换到任何 B 端销售——比如卖保险的代理人、讲解复杂 SaaS 方案的客户经理——但健身教练的例子,无疑让我们看得更真切。

这就是 NuwaAI 想要的未来。它不是要取代你,而是要成为你的搭档,帮你把「表达力」转化为「生产力」。这是一种全新的交互方式,它的终极形态,或许是实现一个超级个人——你的数字分身在后台思考和执行任务,而你,只负责释放灵感和做出决策。

 

 

浏览量: 4

OpenAI 的「群聊」,可能比你想得更重要!

作者| 金光浩

编辑|靖宇

仿佛再一次精准狙击谷歌,就在谷歌新模型 Gemini 3.0 开启小范围内测之际,OpenAI 再次出手。

当地时间 11 月 13 日,OpenAI 官宣推出「群聊」功能,让让用户能够在同一对话中轻松实现人际协作,当然,还可以把 ChatGPT 也拉入一起协作。通过群组聊天功能,用户可邀请亲友或同事进入共享空间,共同策划方案、决策讨论或头脑风暴。

功能首次开放给日本、新西兰、韩国等地区用户。在体验过后,极客公园觉得, OpenAI 在个人助手的基础上,开始逐渐向「团队协作」这个 SaaS 最火热的战场,开始蠢蠢欲动 。

在看似主打「社交」的功能里,藏着 OpenAI「协作平台」的野心。

 

01

有「眼力见」的 AI

 

功能本身不复杂,你可以轻松创建一个群聊,通过链接可以邀请最多 20 位成员加入。群聊数据与你的个人 ChatGPT 记忆完全隔离,不必担心自己的私密对话被泄漏。

ChatGPT 的群聊功能|图片来源:OpenAI

 

但是,在群聊里,我们和 ChatGPT 的交互逻辑彻底变了。

你可以通过「@」ChatGPT 明确地召唤它,确保它在关键时刻回应你的需求,而当我们不 @ 它时,它也能判断该不该说话。

这种体验和「微信群里拉个聊天机器人的感觉」不同。

区别在哪?

主动性 !

传统的群内机器人必须被 @ 才会回应,但 OpenAI 的群聊 AI 会自己判断什么时候该说话。

是的,新的群聊功能,正在教它「闭嘴」。

而「闭嘴」背后,是 OpenAI 给 ChatGPT 巧妙设计的场景感知能力。

ChatGPT 的群聊功能|图片来源:OpenAI

 

我在测试群里和同事聊了 20 分钟周末计划和食堂吐槽,AI 全程沉默。

直到有人抛出「最近有什么好看的科幻片」,它才出现并推荐了三部电影 。没有人 @ 它,但它判断出这是一个「可以提供帮助」的时刻。当然,它的判断并非完美,经常还是会在不该说话时插嘴。

此外,群聊提供了丰富的多模态能力支持:

在群聊里,AI 可以联网搜索最新信息,为讨论提供数据支持和事实核查;也可以直接生成图片;成员上传文档,它能进行摘要、分析、翻译或提取关键信息。

ChatGPT 的群聊功能|图片来源:OpenAI

 

更强大的是,基于群聊的上下文,它能对每个人进行建模,理解每个人的对话风格和需求。

ChatGPT 的群聊功能|图片来源:OpenAI

 

当然,最初的体验有些微妙。

群里多了一个看不见的「人」,总感觉随时在被「偷听」。

但用几次就习惯了,就像团队多了个极有眼力见的实习生。

 

02

从个人助理,到协作平台

 

OpenAI 做群聊的真实原因,可能和大多数人想的不一样。

答案不是模型遇到瓶颈,而是 OpenAI 的商业化逻辑在调整。

OpenAI 明白了一件事:只卖 API,客户随时能换供应商。 而要真正留住用户,得让他们在你这儿沉淀关系和数据 。就像我们离不开微信一样。

群聊就是按照这个思路, 把 ChatGPT 从个人助理变成了一个可协作的平台 。

这样就产生了网络效应,当用户用 ChatGPT 不是因为模型出色,而是因为项目、客户在这时,这时候,用户离开的代价就不是换个 API 接口或者模型那么简单了。

chatGPT 的群聊功能|图片来源:OpenAI

 

此外,群聊功能,也是在测试 ChatGPT 的社交能力。

在多人对话中,AI 要理解复杂的上下文,揣摩不同人的意图,判断什么时候该开玩笑、什么时候该严肃。这些都是人类社交的基本能力。而只有掌握了这种能力,AI 才能进入人类的日常协作。

这里有个有趣的想法, 如果未来群聊功能再增加小窗私聊功能,AI 就可以在群里和大家有更多的互动,AI 可以扮演上帝和 DM,跟用户一起玩狼人杀、剧本杀 。

ChatGPT 的群聊功能|图片来源:OpenAI

 

03

多 Agent 协作的未来?

 

再往远看,OpenAI 的群聊功能,很有可能在测试多 Agent 协作。

想象一下不远的未来,当你在项目群里说:「咱们做个读书笔记 App」。

然后 ChatGPT 们自动捕捉到这个信息,群里的 GPT 产品经理开始问需求、写 PRD,GPT 工程师同步列技术方案,GPT 设计师画原型,GPT 测试准备用例清单。

它们互相讨论、互相挑刺,你只需要在关键节点拍板。

听起来很科幻?但今天的群聊功能很有可能就是第一步。

单 AI 群聊,可能就是在为多 AI 协作,做第一步的技术验证和用户教育。

当单 Agent 能在多人场景里自然协作,多个 Agent 的分工配合也就不远了。

如果说微信定义了移动时代的沟通方式,那么 OpenAI,正在定义 AI 时代人与机器的协作范式。

当大部分人还在用 AI 总结会议记录时,OpenAI 已经让 AI 坐进了人类的会议室。

群聊功能,可能又是一个时代的转折。

浏览量: 5

字节张楠、张宏江、田渊栋······极客公园创新大会 2026 嘉宾阵容更新!

他们是在 AI 浪潮中定义未来的顶尖思考者与实践者——技术领袖、超级个体、硬核创业者齐聚北京,带来关于「非共识」的深度洞察。 他们将围绕大模型、Agent、AI 硬件、具身智能、人机关系、AI 医疗、AI 影像等前沿方向展开高密度交锋。 主舞台四大主题 × 小场深谈 × AI 产品快闪,只讲真话、只聊前沿。 12 月 6-7 日,北京 798艺术区,与改变未来的「关键少数」同频共振——进程由我 On The Loop! 余票有限,你,准备好了吗?

浏览量: 4

为什么说在 AI 时代,「想象」比「记录」更费劲?

图片来源:即梦

2024 年 2 月,张楠辞去抖音集团 CEO 一职。曾经主导抖音这一现象级产品的她,选择在 AI 浪潮席卷而来时,转身投身于充满未知的 AI 创作领域,将全部精力聚焦于剪映的发展。

时隔一年半,站在 2025 年的尾声,张楠带着剪映与即梦,来到了极客公园创新大会 IF 2026 的现场。

为什么是现在?因为她在构建一个「新世界」。

当大多数人都在欢呼 AI 极大地降低了创作的「摩擦力」时,作为剪映和即梦业务的负责人,张楠却更关注想象的力量。她曾说,希望即梦成为「想象力世界」的相机,记录每个人的奇思妙想,帮助每个有想法的人轻松表达、自由创作。

她相信以「生成」为核心、将创作权交还给普通人的 AI 应用,才是这场技术浪潮的真正主角。大洋彼岸,AI 正在入侵好莱坞,而张楠在想如何让普通人用 AI 导演出一个好故事。

在这个充满不确定性的 AI 新大陆,她正在进行一场关于 AI、关于创作的新实验。

这并不是张楠第一次站在浪潮的中心。几年前,她曾带着团队将抖音打造成了国民级的现象产品。这一次,她选择试图去掉大厂成熟业务的光环,在 AI 创新的宏大背景下,携剪映作为一个「探索型组织」重新出发。

Sora App 是 AI 版的抖音吗?

为什么说「想象力」才是 AI 视频真正的瓶颈?

人类与 AI 如何才能共同涌现出惊艳的作品?

AI 创作的终局是什么?

AI 时代,组织如何重塑?

推动 AI 这场变革,必须依赖「00 后」吗?

我们现在有机会,听听这位从移动互联网时代的巅峰走来,又一头扎进 AI 浪潮的探索者,到底看到了什么。

12 月 6 日,极客公园创新大会 2026「非共识」追问场,你将听到张楠亲自分享,关于剪映与即梦、关于那个用 AI 为十亿人想象力打造的新世界。

浏览量: 4

杨立昆宣布离开 Meta「自立门户」;荷兰暂停干预安世半导体;TikTok 将支持用户设置减少 AI 内容

任职 12 年后,Meta 首席 AI 科学家杨立昆宣布离职并「自立门户」

11 月 20 日消息,效力 12 年后,Meta 首席科学家杨立昆(Yann LeCun)宣布即将离职,并创办自己的 AI 创业公司。

杨立昆长期在纽约大学任教,2013 年加入 Meta 领导 FAIR 实验室,随后成为首席 AI 科学家。FAIR 在深度学习研究、计算机视觉、基础模型以及大量前沿算法上奠定了 Meta 的核心技术路线,而杨立昆在整个阶段始终扮演关键角色。

杨立昆说,新公司将承接他与 FAIR、纽约大学及其他同行过去几年共同推进的 Advanced Machine Intelligence(AMI)研究计划,并且会继续与 Meta 保持合作。

据其介绍,新公司的目标是推动 AI 的下一次重大跃迁,让 AI 系统能够理解现实世界、具备长期记忆、能够进行推理,还能规划多步骤的行动流程。AMI 未来在许多行业都能产生影响,部分方向会与 Meta 的业务相关,但更多方向并无直接关系,而以独立公司开展 AMI 研究能够让成果更自由地传播,也能让研究脱离大型企业内部的短期商业压力。

据彭博社报道,杨立昆近来在内部争取研究资源时愈发困难,因为 Meta 更专注于开发能应对 OpenAI、Alphabet 旗下谷歌以及 Anthropic 等竞争对手的产品式模型。这意味着 AMI 这种强调长期探索性质的研究,在大规模商业竞争的背景下较难得到优先支持。(来源:IT 之家)

英伟达 Q3 财报全面超预期,盘后股价再冲高

美东时间周三盘后,人工智能(AI)龙头股英伟达公布了超出预期的三季度财报。在美股市场因估值担忧而持续低迷之际,英伟达再次不负众望,交出了一份优异答卷。

英伟达周三收盘时上涨近 3%。截至发稿,随着财报公布,英伟达股价盘后进一步上涨超 6%。

财报显示,英伟达第三财季营收为 570.1 亿美元,超出市场预期的 549.2 亿美元;净利润为 319.1 亿美元,同比大涨 65%,经调整后的每股收益为 1.30 美元,高于市场预期的 1.25 美元。

数据中心——英伟达最重要的业务——Q3 营收为 512 亿美元,轻松超过分析师预测的 490.9 亿美元,同比增长 66%。其中,「计算」(即 GPU)业务贡献了 430 亿美元营收;网络业务(即允许多个 GPU 能协同工作的组件)贡献了 82 亿美元。

英伟达首席财务官 Colette Kress 在声明中表示,公司当前最畅销的芯片系列是 Blackwell Ultra,这是 Blackwell 芯片的第二代产品。

英伟达 CEO 黄仁勋还在声明中提到:「云端 GPU 已经全部售罄。」(来源:财联社)

 

荷兰宣布暂停干预安世半导体,控制权归还闻泰科技

11 月 19 日消息,荷兰当地时间 11 月 19 日,荷兰经济事务部官网发布公告,部长文森特・卡雷曼斯(Vincent Karremans)宣布,暂停此前针对安世半导体(Nexperia)的相关干预措施,将安世半导体的控制权归还其母公司闻泰科技。

卡瑞曼斯表示,此举「旨在展现善意」,未来一段时间,将继续与中国当局进行建设性对话。(来源:IT 之家)

 

快手 2025 年第三季度总营收 356 亿元,同比增长 14.2%

11 月 19 日消息,快手公布第三季度业绩。财报显示,本季度快手总营收同比增长 14.2% 至 356 亿元,其中包含线上营销服务和以电商为主的其他服务在内的核心商业收入同比增长 19.2%。在保持对 AI 战略的持续投入下,快手第三季度经营利润同比增长 69.9% 至 53 亿元,经调整净利润同比增长 26.3% 至 50 亿元。

财报显示,2025 年第三季度,快手应用的平均日活跃用户规模达 4.16 亿,再创历史新高,平均月活跃用户达到 7.31 亿,平台双关用户的日均私信渗透率同比提升超 3%。每位日活跃用户平均线上营销服务收入为 48.3 元,而 2024 年同期为 43.3 元;电商商品交易总额(GMV)为 3850.435 亿元,而 2024 年同期为 3341.625 亿元。(来源:IT 之家)

OpenAI 推出 GPT‑5.1-Codex-Max 编程模型,专为长时间运行的任务打造

OpenAI 今日发布了 GPT‑5.1-Codex-Max,这是一款面向长时间运行任务设计的新一代 Agentic 编码模型。相较于之前的模型,GPT‑5.1-Codex-Max 采用了「压缩(compaction)」技术,可在多个上下文窗口间工作,甚至能在单次任务中可靠处理百万级别的 Token。OpenAI 表示,该模型不仅性能提升,还实现了更快、更高效的 Token 利用率。

据了解,GPT‑5.1-Codex-Max 训练过程涵盖了真实世界的软件工程任务,如 PR 创建、代码评审、前端开发及问答等,并在众多前沿编程评测中表现超越此前的模型。

除支持 Unix 平台外,GPT‑5.1-Codex-Max 还专门针对 Windows 环境进行了训练。

此外,得益于推理能力提升,GPT‑5.1-Codex-Max 在 SWE-Bench Verified 上完成相同任务时,使用的思考 Token 比 GPT-5.1-Codex 减少了 30%。通过「Extra High(xhigh)」推理模式,模型在复杂任务中可投入更深入的思考。

目前,GPT‑5.1-Codex-Max 已在 Codex CLI、IDE 扩展、云端和代码评审等产品中上线,支持 ChatGPT Plus、Pro、Business、Edu 和 Enterprise 高级订阅用户。同时,OpenAI 也将于近期将该模型引入 API,并在 Codex 中替换为默认模型。(来源:cnBeta)

 

谷歌 CEO 皮查伊:人工智能有朝一日能胜任我的工作

11 月 19 日消息,人工智能已开始挤压部分初级岗位,但谷歌首席执行官指出,即便是企业最高管理层职位也难逃影响。

「我认为,首席执行官(CEO)所承担的工作,或许正是未来某一天人工智能最容易胜任的职责之一。」谷歌 CEO 桑达尔・皮查伊(Sundar Pichai)在周二播出的英国广播公司(BBC)专访中表示。

这位谷歌掌门人指出,他相信人工智能将很快具备更高级别的自主任务执行能力,届时,AI 模型将能像「智能体」(agent)一样代表用户行事。

「我认为,未来 12 个月内,我们将见证一个重要演进:AI 将能够为您处理更为复杂的任务。」他补充道。

此前 OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)也发表过类似的言论。上月,在接受阿克塞尔・施普林格集团(Axel Springer)首席执行官采访时,奥尔特曼曾表示:「我相信终将有那么一天,人工智能会比我本人更胜任 OpenAI CEO 一职,而当这一天真正到来时,我只会满怀热忱、欣然接受。」(来源:IT 之家)

 

TikTok 将开放用户设置,减少短视频信息流中的 AI 内容

11 月 19 日消息,短视频平台 TikTok 将支持减少用户看到的 AI 内容。该应用正在试验一项新设置,允许用户在他们的「为你推荐」信息流中「看到更少」的 AI 内容。

这个新开关将在「未来几周」出现在应用的「Manage Topics」部分。在博客文章中,TikTok 表示 Manage Topics 功能已允许用户调整他们看到与舞蹈、体育、餐饮等超过 10 个类别相关内容的频率。与这些控制选项类似,AIGC 设置旨在帮助用户定制他们信息流中的多样化内容,而不是完全移除或替换信息流中的内容。

为了加强 AI 生成内容标签,TikTok 还在测试一种名为「隐形水印」的解决方案。在未来几周内,TikTok 将开始向使用 TikTok 工具(如 AI Editor Pro)生成的 AI 内容以及使用 C2PA 内容凭证上传的内容添加不可见的水印。这些水印将帮助 TikTok 更可靠地标记内容,并提供更多关于内容变更的背景信息。(来源: IT 之家)

 

俞敏洪:新东方青少年南极考察之旅有望明年冬天开启

11 月 19 日消息,新东方创始人俞敏洪在社交平台发布视频,称:这次应奚老师邀请来南极,在深刻感受大自然壮美的同时,也一起探讨了未来中国孩子自然教育的前景。新东方将会成立专门的青少年探索中心,带领孩子们探索大自然,用科学的方式让孩子们理解大自然、爱上大自然、保护大自然!专门针对青少年的南极考察之旅也有望在明年冬天开启。

11 月 16 日,新东方成立 32 周年之际,创始人俞敏洪从南极向全体员工发送了一封题为」冰雪中的坚守」的内部信。在信中,他描绘了南极的壮丽景观,并以企鹅相互扶持来类比团队精神,回顾创业历程,展望公司未来。

然而,这封原本旨在凝聚人心的信件,却因老板的」诗和远方」与员工的」加班日常」形成鲜明对比,引发了大量员工和网友的吐槽,相关话题迅速登上热搜。

不过,俞敏洪及新东方官方尚未对此争议作出正式回应。在 11 月 18 日,俞敏洪还在微博连发 10 条南极游相关视频。(来源: TechWeb)

 

贾跃亭发文:加速偿还国内担保债务 尽早回国

11 月 19 日消息,早间贾跃亭在个人微博发文称,第二个债权人信托正式成立,将加速偿还国内担保债务,尽责到底早日回国。

第二信托的资产主要来源于两部分:一是 FF 授予贾跃亭的「股东股民 First」股权激励下获得的股份的 50%;二是贾跃亭投资的纳斯达克上市公司 AIXC 所对应的约 7% 股份的 50%,这笔投资的本金来自于 FFGP 合伙人公司借款。

贾跃亭称,「之所以只有 50% 进入第二信托,是因为我会将另外的 50% 全部继续投入 FF,用来支持 EAI 飞轮业务,进而加速 FF 的价值释放和加快还债。」

贾跃亭在文中强调,「我生命中只有两件事,一个是打造 EAI 生态,给社会带来变革性的驱动作用,另一个是还清国内债务,早日回到祖国。」(来源: TechWeb)

「全球最小可穿戴设备」:Lumia 2 智能耳环登场,重量不足 1 克、满电续航 8 天

11 月 18 日消息,科技媒体 T3 报道称 Lumia 公司推出智能耳环 Lumia 2,号称「全球最小可穿戴设备」,重量不足 1 克,却能在耳内高精度追踪睡眠、体温、月经周期及身体准备度等关键健康数据。

Lumia 2 智能耳环重量不足 1 克,但集成了 Lumia 第二代 PreciseLight 传感器、处理器、电池及多种健康传感器。Lumia 宣称,凭借在耳内佩戴的独特优势,Lumia 2 能够实现比腕上设备更高精度和连续性的健康数据追踪,监测范围覆盖睡眠质量、体温变化、月经周期以及身体准备度等核心指标。(来源:IT 之家)

 

消息称三星内部正开发两款智能眼镜:外观类似 Meta 雷朋,配备变色镜片

11 月 19 日消息,据科技媒体 Android Authority 报道,三星今年正式进军 XR 市场,推出首款产品 Galaxy XR,目前只在韩国、美国两个市场发售,但三星计划在未来几个月内逐步扩展上市区域。

与此同时,三星内部正在开发的两款智能眼镜也逐渐浮出水面,预计将在 2026 年(明年)和 2027 年推出。

据报道,这其中明年推出的智能眼镜型号为 SM-O200P,与 Galaxy XR 头显 SM-I 开头的型号存在本质区别,有消息称这款眼镜将搭载变色镜片,在太阳光照射的情况下会自动变暗,类似太阳镜,回到室内等光照充足的环境则会增强透光率,保持透明。

不过目前的消息还不足以证明这款眼镜具备投射画面的 AR 功能,因此这款眼镜很可能与 Meta 雷朋 AI 眼镜类似,并不具备完整的 AR 显示功能,交互形式将以语音为主。

硬件方面,这款眼镜将配备摄像头,可通过 AI 功能进行物体识别、实时翻译等,支持 Wi-Fi 和蓝牙连接,但并没有移动数据网络连接功能,意味着这款眼镜可能无法脱离手机使用。(来源:IT 之家 )

前暴雪 CEO 鲍比・科蒂克称马斯克会是「最好的游戏公司老板」

11 月 19 日消息,前动视暴雪 CEO 鲍比・科蒂克上周(11 月 14 日)出席《Rushmore》视频播客,与特斯拉 CEO 埃隆・马斯克讨论最好的游戏,并称这名汽车公司 CEO「可能是游戏公司的最佳掌门人选」。

科蒂克认为,马斯克理解游戏创意的实现过程,也能知道游戏是如何制作出来的,他认为这种品质甚至比游戏经验更为重要,不过部分观众却对这种观点持相反意见,有用户甚至在 X 平台上质疑「这人真的懂游戏么?」。

马斯克本人曾多次展现出对游戏行业的浅层认知,他今年早些时候直播玩《流放之路》时曾在游戏基础机制上频频出错,成为玩家群嘲对象;此前他还表示《杀出重围》是他最喜欢的游戏,并发表个人对剧情的见解,但游戏编剧 Grossman 随后指出马斯克完全误解了游戏剧情。

不过尽管如此,马斯克确实非常热爱游戏,他多次在公开场合称《半衰期 2》、《生化奇兵》是自己最喜欢的游戏,也曾与《赛博朋克 2077》开发团队合作,成为游戏中名为「cameo」的 NPC。(来源:IT 之家)

 

浏览量: 5

对话斑马口语:如何用 AI Agent 造出「超人类外教」?

作者|张鹏

编辑| 郑玄

 

最近,斑马口语正式上线,用纯 AI 外教与学生一对一全英授课,引发了行业不小的关注。

AI 口语并不是一条新赛道, 其中的玩家也良莠不齐:既有像 Speak 这样重投入打磨真人视频的,也有大量给大模型「套一层皮」就匆忙上阵的。

斑马口语的目标,和其他公司则并不相同:斑马想要用 AI 打造一个超越真人的「AI 原生」口语解决方案。

这意味着,要让 AI 主导教学,让 AI 发挥出真人没有的能力:针对性的纠正,个性化的话题,还要真的对结果负责——不是增加一个练口语的功能,而是真的让学生在和 AI 对聊后获得提升。这是整个行业之前前所未见的。

这个挑战,不仅带来了技术上的难题,也需要对「教育」有极深的理解:比如,AI 教师如何真正激发孩子的兴趣?这背后都在考验团队是否具有真正的教学经验中积累的「手感」。

而比「手感」更深层的挑战,是组织力。一个真正的 AI 原生 Agent,诞生的前提,必然是一个「产模一体」的 AI Native 组织。这不只是一个产品问题,更是一个关于组织进化的「终极命题」。

 

01

比真人外教还会教的 AI 外教

 

口语外教是一个被验证过的需求,用 AI 代替真人外教,降低成本,很合理。但真正的难点在于: AI 如何能超越真人?

真人外教的局限性是天生的:他们会累、会忘、会不稳定,并且无法实现「千人千面」的颗粒度。而这,恰恰是 AI Agent 的机会。为了实现「200 分」的目标,斑马从几个真人无法企及的核心点发力:

首先,是提供即时、可交互的真实语境。

这个正如下面的案例所展示的,当 AI 老师想要教会小朋友生日派对相关的英语时,AI 能无缝切换到一个生日派对现场,聊孩子爱吃的派对食物。

AI 让这种高成本、一次性的「真实世界」体验,变得轻盈、可控且无限重复。

除此之外, AI 还能实现真人无法企及的「高颗粒度的个性化进阶路径」。 人脑的记忆是有限的,但 AI 的记忆是无限的。

斑马的 AI Agent 会把每个孩子当作一个系统来建设,它记得孩子上一次对话的每一个细节、每一个薄弱点。当孩子学口语遇到瓶颈时,AI 能设计出「微小的一步」,在下一次对话中推着他往前走。

这种「长期积累的陪伴」和「微小颗粒度的进阶」,是任何真人老师都无法规模化实现的。

第三点,或许有点出人意料,反而是 AI 的情商。

AI 做外教,肯定会有人担心,AI 毕竟是「假人」,孩子怎么会愿意和它交流?但斑马团队的数据显示,传统真人外教一对一,孩子前三分钟的开口率大约是 85%;而在斑马口语中,这个数字是 98.8%。这来自细节的打磨——比如一个细节是 AI 外教 Jessica 的形象。

在技术上,用 3D 形象配合 AI,其实比 2D 更成熟、更方便。但斑马反其道而行,选择了 2D。

「我们之所以选择二维,是因为 3D 角色,更像是模仿真人,容易产生恐怖谷效应,影响孩子『入戏』。」修佳明提到。「我们挖掘了过往真人外教的数据,抽象出了「孩子最喜爱、学习效果最好」的外教特征——包括脸型、发色,设计了 Jessica。」

但让孩子想开口只是第一步,斑马也希望用高情商让孩子更爱学习口语。

比如在前面说到的生日派对的课件里,一个正在学习的孩子突然说「我不想办生日 party」。AI 外教 Jessica 的回复同样情商极高,她说:「Of course you can say No. Some people like quiet birthdays. That’s OK too.」然后无缝地将话题切换到「参加别人的生日派对」,把教学进度自然地延续下去。

这种永远稳定、充满耐心、人格统一、且总能「捧场」的灵活性,恰恰是真人老师难以做到的。它让 AI Agent 从一个「工具」,变成了一个孩子愿意分享秘密的「新物种」。

而这种「新物种」带来的信任感和情感连接,看似只是锦上添花,实则正触及了教育中最难的命题: 动机 。

如何让孩子有动力学下去?绝大多数教育产品,依赖的是「工具型动机」——奖励、打卡、游戏化。

但通过与这个孩子真正「想聊」的 AI 外教交流,学英语的动机就变了。孩子不会想「我说英语会给我带来什么奖励」,他想的是「我必须说英语,才能完成这件事」——和虚拟的老师、小学伴们交流。

学习的成就感内化于这个过程,最终让说英语成为一种「必须」和「自然而然」。

 

02

「产模一体」的最佳实践

 

当斑马团队立下这个「200 分」的雄心时,他们其实正站在一个十字路口。这个路口,就是技术栈的选择。

一个超越真人的 AI Agent,到底需要一个什么样的「模型」?

在 2023 年立项时,最「聪明」的捷径,就是「套壳」——要么用最强的闭源模型,要么用顶尖的开源模型。

但斑马团队很快发现, 所有「捷径」都通向「80 分」的平替,唯独通向不了「200 分」的超越。

「我们很早就尝试过这个路径,」修佳明,但是最后发现,不同的模型,总会有不同的问题。这背后是数据白点(data blind spots)的影响,你通过人设或者其他工作是很难根治的。在教育场景下,语言的正确性是第一位的。」

更别提迭代的鸿沟——「AI 大模型,保守说每半年大模型的能力变化都很大,你选用一个具体版本的开源模型去做后训练,再去想跟上最新模型的效果,这个迭代的成本还是挺高的。」

而斑马真正的壁垒和核心资产,在于长期积累的、海量的、高质量的儿童教育数据——包括海量的儿童跟读数据。

于是,他们的路径清晰地浮现出来: 「猿力大模型」(预训练基座)+「斑马独有教育数据」(后训练/微调)。

这种「产模一体」的价值是立竿见影的:

首先是数据带来的模型语料的准确和安全。

修佳明说:「我们做了更严苛的数据筛选,首先能保证语料都是标准的英文语料,而且内容是符合儿童认知的,且价值观要非常积极向上的。我们又做了一些强化训练来保证它更可靠。」

而更能体现产模一体的好处的,是 AI 知道怎么和不同水平的孩子沟通。

我们在采访中聊到一个问题:AI 的知识是渊博的,但它怎么能「降维」跟孩子沟通?一个孩子问「为什么天是蓝的」,AI 会不会「吊书袋」,讲一堆大气折射和瑞利散射?

斑马的核心资产——过去积累的海量数据,能够教给 AI 如何正确地跟孩子的交流——孩子问「为什么」,可能只是想引起一个话题,他想得到的回答是更浅层的、一个比喻类的,他并不是想钻进去。

如果说「产模一体」是技术上的「必经之路」,那么一个更难的、也更底层的挑战,就是组织的重塑。

这,或许才是 AI 时代最核心的命题。

我们聊过太多团队,为什么「产模一体」最后跑不通? 因为他们只有「产模」,没有「一体」。

模型团队和产品团队背着不同的 KPI,互相拉扯。产品经理(PM)的价值感在消失,他们不再是为用户创造产品,而是沦为「给模型找活干」的「传话筒」。

斑马是不是也遇到了类似的困惑?

「我们之前也有传统互联网的流水线分工,但我们做这个事的时候就乱了。」修佳明坦言。

「比如产品的需求文档(PRD),在新的产模一体的产品下,基本上就是一个课件。如果采用传统的流水线,产品经理所做的工作几乎就只是把教研的大纲『翻译』一下。我们最后坐下来聊了一下,教研和产研能不能一起干这个事?」修佳明说,「最终斑马口语的解决方案是,教研和产品研发直接一起讨论教学层面的需求,研发在一个看似非标准的需求下,进行理解和开发。」

这种「边界模糊」不止发生在产品和教研之间。「教研可能直接跟 AI 工程师对接;动画直接跟研发去对,因为这里面的渲染有点复杂……有很多是跨部门交错来做。」

一旦这个「壁垒」被打破,整个组织的形态就全变了。流程不再是「PM -> RD -> 教研」的线性传导,而变成了「神经突触」式的网状连接。

斑马分享了一个最朴素、也最高效的组织解法: 「坐在一起。」 在物理邻近的高密度协作中,「教研」的神经末梢直接碰上了「AI 工程师」的神经末梢,不断碰撞、擦出火花,形成新的组织脉络。

一个真正的 AI Native 产品,或许不是被「开发」出来的,而是被一个 AI Native 的组织中「长」出来的。

为了实现那个「200 分」的 AI Agent,你必须先打造一个「200 分」的 AI Native 组织。

这,或许才是斑马口语在「产模一体」实践中,最坚实、也最难被复制的「壁垒」。

 

03

用 AI 拆掉巴别塔

 

斑马口语已经证明,AI 可以成为一个比真人更稳定、记忆力更强、甚至情商更高的「老师」。但如果这只是一个开始,AI 语言教育的未来,又会走向何方?

在讨论中,修佳明为我们勾勒出了一条清晰的「范式迁移」路径。

我们最熟悉的,是「 外语学习 」:以规则为先,上来先学语法、背单词,把语言当作一个「学科」来攻克。

斑马口语目前所做的,是「 第二语言习得 」:它不先教规则,而是强调「沉浸式」输入,先让你听、让你读、让你模仿,在大量的语料中「习得」。但它依然需要一个起点——孩子需要有最基础的认知和一些英语基础。

而这条路的「圣杯」,是「 母语习得 」:像母语一样,在真实的、全天候的环境中自然习得,你甚至意识不到自己在「学习」。

斑马的目标,就是推动整个教育范式,从「外语学习」向「二语习得」迁移,并最终无限逼近「母语习得」。

「母语习得」的本质,不是「上课」,而是「生活」。

这意味着 AI 必须从一个「课程 App」,变成一个「存在」。而这一点,斑马已经看到了雏形。

修佳明提到,他们已经能感受到孩子的主动分享。「有一次说到今年的目标,孩子主动分享了已经吃了两个月的健康食物了,还是没有长高,并主动给 AI 学伴看自己的身高。」

而要从「朋友」进化到「家庭成员」,斑马正在探索一个明确的方向:多模态理解,尤其是做更多的视觉理解。

一旦 AI Agent 有了「眼睛」,能够观察到孩子的反应、表情和所处的真实环境,它就拥有了「嵌入生活」的能力。

这带来了一个极具想象力的未来——当 AI Agent 可以成为一个真正的「AI 玩伴」,全天候沉浸在孩子的生活中:当孩子拿起一个苹果时,它会用英语说「Apple」;当孩子在玩乐高时,它会用英语讨论「Blue block」。一个真正的母语环境形成了,语言学习被彻底内化到了生活本身。

而这个「AI 玩伴」的未来,听起来遥远吗?

修佳明告诉我们,他们已经在斑马口语的「数据闭环」中,看到了这个未来的「涌现」。当一个 AI 产品拥有海量的真实用户数据,它就开始在各方面「成长」了。

单就语音而言,就能看出差别。「通过获得更多数据,AI 现在对小朋友不同的发音的判断比真人更准了,」修佳明说,「小朋友的口音或者本身年龄比较小,肌肉发育的原因等等,可能并没有办法像真实发音那样。但我们的产品不能因为学生发不出这个音,Jissica 就判定他不会。」

「你怎么理解语言学习这个事的终极目标?」在采访的最后,我们问道。

「我个人是希望语言学习如果能对每一个人的自我产生影响。」修佳明说,「学习一门语言,你也会学会它背后代表的世界观、思维、文化。而当你的认知提升了,你也能更好地与这个世界产生连接。」

当 AI Agent 把语言学习的成本和难度无限拉低,当每一个孩子都能拥有一个高情商、高智商的「AI 外教」时——

我们或许正在见证的,是用 AI,拆掉那座阻碍人类互相理解、互相启发的「巴别塔」。

浏览量: 5

风口浪尖中的小米汽车,创下国产新势力最快盈利速度

在小米汽车陷入各种争议、质疑、口水的当下,小米汽车用一份扭亏为盈的单季度业绩报告,为自己重新正名。

11 月 18 日,小米集团公布 2025 年第三季度财报。当季,小米共交付新车超 10.8 万台,平均每月交付 3.6 万台;智能电动汽车及 AI 等创新业务分部首次实现单季度经营盈利,本季度经营收益为人民币 7 亿元。

在业绩电话会上,小米集团总裁卢伟冰透露,小米汽车预计本周将提前完成年初制定的 35 万台年度交付目标。

事实上,扭亏为盈对「新势力」车企们来说,并不是一件多么容易的事。

经历了近 10 年的历练,所有新势力企业几乎达成了共识:新思维也许可以为汽车带来功能、流程上的变革,但造车本质还是一门复杂、容错率低且长周期的慢生意。这意味着车企既需要不断地进行研发投入,也需要从市场端得到积极的口碑和销量反馈。

所以,尽管看起来新品牌之间的竞争如火如荼。但是在现阶段,「造车新势力」们真正实现从前期亏损到扭亏为盈「阶段性上岸」的并不多。

小米是第 4 家实现单季度盈利的车企。前 3 家按照首次盈利的时间线排序,分别为:理想、赛力斯、零跑。

  • 理想用了 7 个季度:2019 年 4 月,理想 ONE 上市;2020 年第四季度,首次实现季度盈利
  • 零跑用了 5 年:2019 年 1 月,零跑 S01 上市;2024 年第四季度,首次实现季度盈利
  • 赛力斯在发布「问界」品牌后,用了 9 个季度:2021 年 12 月,「问界」品牌首款车型问界 M5 上市;2024 年第一季度,首次扭亏为盈

而从去年 3 月小米SU7 正式上市,到今年第三季度盈利,小米汽车业务只用了 6 个季度就完成了从单季度亏损 18 亿元到盈利 7 亿元的逆转,是目前最快实现扭亏为盈的新势力品牌。

 

还在「越卖越贵」的小米汽车

尽管近期频繁陷入争议,但从这份最新的季报来看,小米仍然是目前新势力中毫无疑问的第一梯队企业。

我们先看看收支层面的变化。

2025 年第三季度,小米智能电动汽车及 AI 等创新业务分部总营收为 290 亿元,比上一季度增长 36.4%。其中,汽车销售收入为 283 亿元,其他相关业务收入为 7 亿元——主要是售后服务及汽车金融服务收入。

收入变多的核心原因,来自产能提升兑现的更多交付量。第三季度,小米汽车平均月交付量超过了 3.6 万台,比 Q2 每月多交付约 9200 台。

而在支出方面,涉及研发、销售推广和行政部分的经营开支基本稳定,从 59 亿元上涨到 67 亿元;和销量有关的销售成本随交付量变化提升 31.0%。总计支出为 283 亿元。

所以,简单总结来说:交付量提升是小米汽车业务本季度实现扭亏的核心原因。这也大致符合汽车行业「规模化」的经营规律。即通过销量提升,覆盖研发、生产制造、营销等相对固定的支出环节。

小米汽车季度交付量变化柱状图 | 图片来源:小米财报

在车「越卖越多」的大背景下,还有一个小细节值得注意:在这个季度,小米汽车的 ASP(Average Selling Price,平均售价)还在继续上升,由上一季度的 25.36 万元小幅上涨至 26.00 万元。

主要原因来自本季度小米YU7 的上市交付。

根据小米汽车官方微博 9 月 25 日公布「小米YU7 上市 3 个月,交付已超过 40000 台」的信息,可以大致推测:本季度小米YU7 的交付大约占总交付量的 40% 左右。

从售价来看,小米YU7 系列的售价要比小米SU7 系列高出一个级别,标准版起售价为 25.25 万元,比小米SU7 入门版和中间配置都要贵;最高配的 Max 版本 32.99 万元起,若添加所有选配后,单车售价可超过 41.7 万元。

值得一提的是,官方在业绩报告中表示,本季度小米SU7 Ultra「交付量占比减少」,也进一步佐证了小米YU7 对小米汽车 ASP 的提升作用。对于小米来说,这毫无疑问是一个非常好的消息。今年年初,市场普遍把 Ultra 视作小米汽车冲击高售价、高端化的希望,现在小米YU7 毫无疑问也分担了这个职责。

毛利率方面,受到 Ultra 版本交付占比减少的影响,相比今年 Q2,本季度小米汽车业务毛利率略有下滑,从 26.4% 变为 25.5%。

小米各业务分部本季毛利率表现 | 图片来源:小米财报

尽管如此,这个毛利率表现在目前市场竞争环境下,仍然显示出了相当强的竞争力。

横向对比来看,小米汽车目前的毛利率水平在主流车企中,仅低于鸿蒙智行旗下「问界」品牌所属的赛力斯。2025 年上半年,赛力斯汽车毛利率达到 28.93%,位于国内车企第一。

新势力车企中小鹏、理想毛利率处于领先,整体毛利率均为 20.1%。整个新能源市场的两大巨头比亚迪、特斯拉毛利率在 18% 左右,且均低于去年同期水平。

可以说,除了小鹏依托于对外服务显著拉升毛利率外,其余各家的毛利率均受到了消费市场竞争及价格战影响。而小米可以既可以做到「老款不降价」,甚至权益退坡(既一些首销期赠送的权益收回),还可以通过新产品拉升 ASP,是可以反应出其品牌和产品上一阶段在消费市场影响力的。

 

可以持续盈利吗?

当然,阶段性跨过扭亏为盈的门槛,决不代表着一家车企已经成功,最多也只能算「从 ICU 病床走到了 ICU 房间门口」。小米高管也在各种场合反复强调,小米汽车立项以来总投入数百亿,阶段性地盈利远没到开香槟的时候。

事实上,就在当下,我们就能看到小米汽车正面临 2 个挑战。

第一个挑战来自即将变化的新能源车购置税政策退坡,这也是整个行业共同的问题。

根据相关规定,2026 年 1 月 1 日起,国内新能源汽车购置税将从目前的「全免」改为「减半」。由于汽车产品从购买到交付开票普遍有一定间隔,为了吸引消费者,各车企均采取了不同程度的「购置税兜底」政策。

小米汽车官方表示,凡是在今年 11 月 30 日前下订的用户,只要延期到 2026 年交付,小米均会提供跨年购置税补贴。按照相关政策计算,每辆车的补贴金额在 0.95 万元-1.5 万元之间。

如果我们按照小米YU7 发布时公布的 24 万锁单量,以及下半年小米YU7 系列每月大约 1.5 万台的交付速度粗略计算,即便小米YU7 没有新增订单(当然这是不可能的),那么小米在 2026 年用于「补贴」购置税的成本也接近 10 亿元。

这样的影响应该会体现在小米(包括其他车企)2026 年前一阶段的毛利率上。而按照本季度 7 亿元的盈利规模来看,小米汽车业务在接下来的季度中能否保持相对延续的盈利能力,也许也会短期内受到政策影响。

整体来说,购置税影响对订单强劲的企业来说,算是一个「幸福的烦恼」。

财报提到,小米YU7是中国大陆地区10月SUV「不加定语」的销量第一 | 图片来源:小米财报

而更大的挑战来自于企业和网民之间似乎正在扩大的争议和隔阂。

这其中,一部分争议和负面是「无中生有」的。

例如,近期小米SU7 部分配置提车周期被大幅缩短,网上传出类似「订单崩了」这类的谣言。

实际上,从小米汽车 App 显示的预计交付时间来看,全系车型中仅小米SU7 中高配、小米SU7 Ultra 提车日期被缩短到 6-9 周,小米SU7 标准版、小米YU7 全系的交付日期仍在 30 周以上。

笔者推测,小米SU7 部分配置的交付提速,很大原因来自车型即将迎来改款换代,部分潜在消费者选择持币观望。这是任何一家车企都会面临的周期性销量浮动。

据行业媒体《新出行》预测,小米SU7 改款有望于今年年底亮相。新车预期将采用更大的电池以及新一代英伟达 Thor-U 系列辅助驾驶芯片。不过,鉴于目前 SU7 改款还没有正式登陆「工信部线上车展」(即工信部新车公式),大概率它的发售需要等到 2026 年。

但另一部分争议,或者说「沉默的大多数们」,也同样在真实地表达自己的疑惑甚至不满。

今年 3 月和 10 月,两场车祸曾把小米汽车推到风口浪尖,公众对包括辅助驾驶、电池失火控制、车门应急解锁等直接影响车辆安全的因素提出了质疑。

在小米面临各种或「借机抹黑」或「真心质疑」的时候,创始人雷军曾在线下和线上两次表达了对「黑公关们」的不满,从企业高管维护品牌形象的角度来说,这当然没有问题。

但站在消费者和普通公众的角度,我们也希望不管是雷军本人还是小米汽车,同样可以「真心」地从产品和技术角度出发,为用户拆解那些和产品安全有关的疑惑。

随着小米汽车创下新势力最快盈利速度,现在已经没有人怀疑小米汽车的吸引力了,客观上它也拉动了小米整个企业形象的提升。但现在,也许很多人期待着小米回到曾经那个「发烧友」的形象,告诉大家这辆车更多的细节。

这是所有人都关心的,也是小米汽车从扭亏为盈开始,下一阶段必然面临的严肃课题。

浏览量: 6

「30 秒造应用」——蚂蚁灵光点燃「所想即所得」的魔法时刻

 

 

当 AI 的 coding 能力变得足够强,我们到底会迎来一个怎样的未来?

 

2025年接近尾声,这个问题正在变得更加迫切。我们已经看到了多智能体AI 编程平台的出现,它们可以模拟产品经理、程序员、甚至后端工程师的角色,团队协作,让「生成一个完整应用」的门槛正在迅速下降。

 

这带来了一个极具想象力的「岔路口」:这究竟是会刺激一个「人人都是开发者」的时代,让更多人参与到「做产品给别人用」的浪潮中?还是会带来一次更彻底的用户范式革命——即「人不再需要开发」,我们只需要有想法,AI 就能即时生成满足个人需求的工具?

 

蚂蚁集团的全模态通用AI 助手「灵光」,似乎在探索后一条路。

 

它提示了一种趋势:AI 助手不只是一个「工具」,更应该是一个「助理」。它有编程能力,但目的不是想让你变成一个「小开发者」,而是当你提出一个需求时,它能用编程能力更简单、更即时地帮你实现。

 

「灵光」,一个真正能解决问题、降低门槛的实用工具,正在试图通过两大「杀手锏」破局:一是重塑AI信息的「全模态交互」,二是将 AI Coding铲平到 0 门槛的「30秒闪应用」,填补一个关键的市场空缺。

 

一:「全模态信息」——当 AI 不再「废话」

 

蚂蚁集团的「灵光」AI 助手,也有对话陪伴的基础属性,同时在这个基础上,提供了更多实用的「功能性」。

 

最近看到有国内陆续一些核聚变企业融资的消息,想着迅速了解一下国内在这个领域的进展。自己在谷歌上搜,看得有一头没一头的。正好用「灵光对话」试了一试。

视频来源:极客公园

可以看到,不到半分钟的时间,「灵光对话」就读取完了50个网页链接里关于2025年以来国内关于核聚变领域的进展,并用简明扼要的文字+图表的方式呈现了出来。

太快了。50个网页,认真读完起码半小时,再加上总结、制作图表,起码两三个小时了。但是「灵光对话」只用了不到半分钟时间。

我又想到了我司所在的798园区,虽然已经在这边工作了蛮久,但似乎一直没有好好逛过,也不知道园区里到底有什么好吃的店值得去,也问了问灵光。

这次我没有说给我总结图表,而是让灵光自由发挥。

视频来源:极客公园

这次「灵光对话」花了不到一分钟时间,就读取了38个网页,并给我生成了一份798美食探店路线,包含地图导航的那种。

可以看到,「灵光对话」为我生成了一份「3小时沉浸式逛吃路线」,连从哪个门进入,几点到达能避开高峰期,全程要步行多久,路线几家店铺都包含了。

图片来源:极客公园

在路线规划里,也贴心地按时间顺序推荐了正餐、咖啡、甜品以及精酿等不同品类,就是这个午餐安排了两顿,有点略显重复。

以及还有根据不同区域划分的分区美食地图,列出了几家不同类型的店铺,并注明了人均消费。

最后虽然是「美食探店路线」,「灵光对话」还贴心了列出了几条实用贴士,包括错峰指南、穿搭建议、支付提示以及交通提示。

错峰指南、支付提示以及交通提示这些其实还好,但是穿搭建议,尤其是可以根据798工业园区的风格推荐工业风或文艺风穿搭以及考虑到是石板地面,避免高跟鞋的建议,确实令我比较惊喜。

体验「灵光对话」后感受到它的不同之处,首先就在于对「极繁信息」的高度提炼。

当提问一些复杂问题时,比如上面我问它,核聚变领域的进展这样一个复杂话题,它给出的不是万字长文,而是更清晰明了的动态图表页面。

这是一种「信息美学」的胜利。它将复杂知识「化繁为简」,提供了「结构化」和「可视化」的答案。

这背后是灵光实现了基于全代码生成的多模态内容输出。当用户提出问题时,灵光会自动理解其真实意图,并以代码为核心生成方式,实时构建结构化、个性化、且高度美观的可交互的可视化结果。无论是图表、样式还是交互组件,都是由模型即时创造并呈现给用户。

据了解,「灵光」在架构上的一大突破,是构建了多智能体协作的Agentic架构。在生成可视化内容时,它会动态调用为图像、3D、动画等优化的专用Agent。这些Agent实时协作,共同为用户构建出一个更完整、更丰富、更沉浸的视图体验。

“灵光”将这种复杂的协作机制成功落地到了移动端,实现了真正的可交互内容体验。这种能够在「端侧」实现高级Agentic协作的产品,在业内尚属前沿。

在市面上的众多AI助手之中,「灵光」的「功能性」和「结构化」回答正是其「自成一派」的特色。它像一个高效的「知识助理」,能真正地为工作、生活提高效率,而不只是能聊天的「话痨朋友」,这可能是大家现实生活中更迫切需要的。

二:「30秒造应用」——AI 的「魔法时刻」

化繁为简之外,灵光还让我体验到了「30秒生成应用」的「魔法时刻」。

作为长期观察AI领域的作者,眼看着AI编程的火热,时不时也会想着能不能借助AI的力量自己做个app。

正好在前段时间,我司举办了「AI 时代的一周创业体验」」团建项目,鼓励跟踪AI领域的大家亲自动手手搓项目,当时我想做一个名为「emo鼓励大师」的app,「一个不问为什么,主打一个直接鼓励的治愈系app,也别分析了,也别审批了,就直接鼓励,直接赞美,在心情低落的时候打开它会鼓励你,不要难过;在心情平静的时候它会夸奖你,让你平地生勇气;在心情激动的时候它也鼓励你,冲冲冲。主打一个拐着弯地,不分昼夜地给你当头一棒一样的鼓励与支持。最简单的加油站。」

但是当时因为对AI编程工具使用的不熟练,也因为正好那段时间工作有点密集频繁出差,能花在手搓项目上的时间并不多,这个提案也就搁置了下来。

在了解到「灵光闪应用」可以「0 门槛」地快速生成应用之后,我马上把之前那段提示词输入给了「灵光闪应用」:

图片来源:极客公园

 

我记得我之前尝试用AI编程工具创作这个应用时,因为编程技能的缺失,制作出的应用只有固定的静态页面,无法互动交互。但是闪应用这次真的迅速就给我产出了下面的这个可以实时交互的应用。

 

页面呈现了三种情绪状态,每次点击都会生成一句鼓励,随机鼓励也可以生成暖心话语。

 

我顺势又尝试了创建另一个「7日健身打卡」应用,准备拿来督促自己在冬天运动一番。

 

可以看到,虽然我一开始的想法很简单,只是想做一个「7日健身打卡」应用,但在跟「闪应用」的交互过程中,它不断帮助我将应用做得更加丰富饱满。

 

图片来源:极客公园

 

到最后,我所拿到的就是这样一个包含打卡提醒、完成运动、总运动时长、总卡路里消耗的更完善的健身打卡应用。而且,这个应用界面的设计简洁明了,色彩搭配也很协调,整体看上去令人舒适——在实现代码的同时,「闪应用」还给我免费做了一波UI设计。

 

可以看到,「闪应用」生成的应用不只是静态的前端页面,而是已经具备了完整的前后端逻辑,可直接调用大模型等后端能力,实时进行交互。

 

9月的那次AI创业团建之后,关于手搓app的想法就悬在我的脑海里,但因为它不是什么「紧急且重要」的工作,而且也没去学编程,也就任由它悬着。

 

这次,蚂蚁集团的「闪应用」确实让我这个不太懂编程的人,实现了脑海里悬而未决的想法。这可能也就是最近大家都在讨论的AI平权的意义所在,让每个人都可以快速创建应用。

 

2025 年以来,大模型领域的市场焦点已经从 AI 助手转向自主代理,Cursor 等工具已转型为代理式工作平台,能自主规划、执行、验证复杂任务;GPT-5-Codex 和 Claude 4.1 等新模型支持多智能体协作,可自动分配开发任务,实现 “需求→设计→编码→测试” 全链路无人干预……

而现在,「闪应用」凭借 0 门槛/0 代码更进一步地将「产品经理」的视角和能力赋予了普通人,真正满足了普通人埋在心中的「创作欲」和「分享欲」,

三:从「开眼」到「物理世界」,「AI 应用」的终局是「工厂」?

如果我们将「灵光」的产品组合串联起来看,会发现一个清晰的闭环:「开眼」功能及其代表的实时理解能力,是 AI 对物理世界的「输入」和「理解」;而「闪应用」,则是 AI 对数字世界的「输出」和「创造」。

这一进一出,清晰地预示着 AI 助手正在发生关键的范式转移:从「信息搜索引擎」转向「即时效用工厂」。在这个新范式下,AI 的价值不再只是提供信息,而是生成可用的工具。在顾问的基础上,它更是你的「工匠」和「生产线」。当用户有一个想法时,AI 可以直接交付一个可用的原型,帮用户将想法实现。

灵光的「0门槛」和「0代码」是解放创造力的「破壁机」。在过去,一个好创意和一个可用的产品之间,隔着「技术实现」的鸿沟。

普通人即使有「产品经理」的视角,也缺乏「工程师」的能力。而「闪应用」通过对话式AI Coding,铲平了这道门槛。它将开发的焦点从「我该怎么实现」拉回到了「我到底想要什么」。

 

「快」,即时生成则是点燃「创作欲」的「催化剂」。传统开发是重决策,而「闪应用」是轻尝试。

 

当一个想法的实现成本(包括时间和金钱)趋近于零时,它带来的就是「即时满足感」。这种「所想即所得」的魔法时刻,极大地降低了人们的创作惰性。用户可以随心所欲地试错、迭代,这种低成本的「手搓」快感,会不断激发普通人心中那股被压抑已久的创作冲动。

 

而当一个应用被「手搓」出来,「分享欲」就成了必然的闭环。与分享一张AI图片不同,分享一个自己做出来的应用,其实是在分享一种「效用」和「解决方案」。这种「我造了个工具,你也能用」的成就感,远超简单的内容分享。

 

而这种「快+即时满足+分享欲」的驱动力,似乎架起了一座超级AI应用工厂的骨架。

 

回顾这一年,从年初以黑马姿态杀出的 DeepSeek 到,再到年末「千问」的重启,「灵光」的功能落地,我们能看到未来的 AI 创新,似乎更倾向于产品落地和用户价值,而非沉溺于 AGI 的宏大叙事或拟人性的追求。当行业还在「卷」模型参数和「像不像人」时,这种务实主义成了一股清流,直指 AI 的商业本质——解决问题。

这或许给「百模大战」的下半场提供了另一个答案:AI 的终局,可能不是那个最像人、最会聊天的 AI,而是那个能让最多的人用最低的门槛创造最大价值的 AI。

它关乎效率,更关乎「平权」。而「灵光」的「闪应用」,就是这场「创造力平权」运动中,一个极具想象力的起点。

浏览量: 6

文章分页

上一页 1 … 18 19 20 … 100 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间