Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

标签: 科技

这个 69 岁的「AI 硬件」创业者,正被数百万年轻人追捧

 

作者|苏子华

编辑|郑玄

 

曾德钧今年 69 岁。这是他创办「猫王品牌」的第十年。

从 2015 年发售至今,他们打造的外观复古的音响产品,成了慰藉近千万「弄潮儿」的科技潮牌,年销售额一度接近 5 亿元。

十年来,这位 60 多岁的创业者,总是能做出让年轻人追逐的新潮物件——一系列产品成为了电商平台、线下美学店铺里的爆款,其团队也成为了硬件江湖里的独特存在。

深圳的硬件从业者们提到曾德钧满是敬佩,他是行业人口中的「曾老师」。

「曾老师」到底有何魔力?

在 3 月 16 日的一场直播里,主持人抛出一个听起来有些冒犯的问题:未来十年,你对「猫王」和自己有什么规划?

曾德钧毫不避讳,憨憨地笑着说,先不说十年,那个时候我在不在还不好说,至少未来五年,我在一天,就努力一天。

他看着直播间的弹幕,发现有同行业的竞争对手进入了直播间,先是和对方打了声招呼,接着「语重心长」地向他们嘱托,收音机的未来要靠你们年轻人了,你们做得好,我就不做了,我就买你们的。

两天之后,我出现在猫王品牌的深圳办公室。当天是猫王品牌成立十周年,品牌升级并更名为「猫王妙播」,接着他们发布了四款接入了 DeepSeek、火山等大模型的智能音响,其中两款是收音机。

现场发布四款 AI 智慧音响产品,分别有面向年轻人的小王子 OTR-AI 智慧音箱、小岛 AI 数字人音箱,以及面向乐活中青年的 SR1Pro ·AI 智慧收音机、SR2 MKII· AI 智慧收音机。|图片来源:猫王妙播

 

如今的猫王妙播品牌涵盖耳机、复古收音机、时尚潮玩蓝牙音箱、AI 智慧音箱、AI 智慧收音机等多条产品线。我总有一种错觉,「曾老师」一直想复活收音机这个「过时」的产品。

猫王的「AI 智慧收音机」可以通过语音对话来识别用户的情绪,根据情绪给用户推荐内容,甚至还在探索根据用户习惯和喜好,由 AI 生成专属电台内容。

一个「过时」的品类为什么还要坚持,而且还要融入 AI 大模型、在「AI 应用」的方向上探索呢?

「曾老师」告诉我,在他们看来,收音机只是个载体,背后的需求是人对于获取有价值、有趣的信息的渴求,这个需求是一直存在的。

他们调研发现,中青年人其实是一群接受度很高的用户群体,对收音机有情怀,对声音陪伴生活的需求也很旺盛。

于是,他们做了一个选择:收音机系列产品,就要做给那些热爱它的人。利用 AI 去升级,让原本就热爱收音机的人,能够继续通过这一载体获得更好的服务。

然后,一个反常识的商业叙事诞生了。

价格不低,1000 元左右的「AI 智慧收音机」,首批一上线就斩获品类销量第一。购买用户以年龄在 35-45 岁左右的城市老师、创业者等高知群体为主。

猫王妙播推出的 SR2 MKII· AI 智慧收音机|图片来源:猫王妙播

 

「在直播间卖货的时候,成交率非常高。」业务负责人透露。——这是让如今无数的 AI 硬件创业者们羡慕的故事。一个过时的、快被时代抛弃的品类,在 AI 的重塑下,再次焕发生机。「这件事情也让我深受鼓舞。」

这不是猫王音响做成功的第一个「非共识」的事情。或者说,猫王这家公司的存在就是一种强烈的「非共识」。

那是 10 年前,行业最热闹的时候,曾经有投资人评价猫王走的路线天花板低,在激烈的互联网智能音箱大战中,会被颠覆掉。

曾德钧当时被邀请进入了一个音频创业社群,里面 100 多个创业团队在做智能音箱,现在回过头看,「最后剩下来的只有我了,其他不是死掉了,就是转方向了。」

如今,从爆发到归于平静,这个赛道只剩下了两种团队:

一种是互联网大厂,一种叫猫王。

实际上,曾德钧是中国最早涉足智能音箱领域的人,「我们 2010 年成立公司的时候,就是做智能音箱的操作系统,那时亚马逊的 Echo 还没有发布。」

后来,曾德钧陆续为多家互联网大厂打造智能音箱。也是在这个过程中,他意识到,「创业团队做智能音箱是死路一条。」

「大厂做智能音箱主要是为了争夺智能家居的入口,是服务于电器设备的,背后需要庞大的生态资源,创业公司不具备。」

于是,他果断放弃传统的智能音箱路线,认定猫王不能服务于 IOT 设备,要服务于人,将为用户创造情绪价值作为核心。用现在比较火热的概念来讲,相当于要打造「AI 情绪陪伴」。

避开互联网入口的逻辑,他觉得音响这种非刚需的硬件产品,核心在于情绪价值的传递。

「创业团队一定要知道,自己存在的逻辑是什么。」

猫王最终脱颖而出。

「社会上不缺蓝牙音箱、收音机,但是他们都是功能性的、传统的、前一个时代的,它的设计普遍是性冷淡的。而猫王的音响很好看,好看就是一种最简单的情绪价值。」

在有关情绪价值的生意上,曾德钧表达过一个观点:「我们首先要做自己认为好玩的东西,能够打动自己才能打动更多的人。产品要去满足人的想象,而不是去盲目地解决痛点。当人们对这种深层次的潜意识产生共鸣时,最终会选择购买。」

猫王妙播的案例证明了一个道理:关于情绪价值、审美的生意,大厂无法垄断,也很难做到极致。创业公司总有立足之地。

AI、智能、AI 原生等互联网概念或许能唬人,但一个实实在在的硬件产品骗不了人。「是否用心用户是很容易感受到的。」

「大模型出来之前,所谓的智能都不算智能,只是噱头。大模型真正兑现了过去的承诺、过去吹过的牛。」曾德钧说。

AI 大模型对硬件产品情感陪伴能力的增强,让曾德钧感到亢奋,他觉得对于猫王妙播的产品是重大拐点。他急迫地期待与行业造出「下一代音响」产品。

「已经快 70 岁的年纪,赶上大模型浪潮这么大的机遇,我感到特别幸运,激动。」无论在什么场合,曾德钧聊起「妙播的技术+AI」可能对音响带来的改变,眼里总是闪着光,总是兴高采烈。

他永远穿着一件工装马甲,「因为兜子多」。我问他兜子里都装了什么,他从不同兜子里掏出了 7 副 AI 耳机,3 个手机、两只手表、钱包、U 盘、以及两幅眼镜。这是当天的「随身携带」。

「百宝箱」就在曾德钧的马甲兜子里|图片来源:猫王妙播

「最近正在探索新的 AI 耳机嘛,一定要多体验才会找到感觉。」

见过曾德钧的人,总是能在他身上看到一股澎湃的生命力。

他总是慈祥地、高兴地和年轻人待在一起,「多亏了团队里的年轻人,我向他们学习,他们推着我往前走,才有了猫王妙播的今天。」

「前卫」这个形容词在他身上有了具像化的体现,前卫指的永远不是年龄,是思维。

不要小瞧了这个酷老头。

 

浏览量: 16

小米高速事故冷思考:相比于情绪宣泄,我们更需要「智驾共识」

2025年3月29日,一辆小米SU7标准版在德上高速公路池祁段行驶过程中,遭遇严重交通事故。

即便小米创始人雷军第一时间在社交平台宣布,小米将「负责到底」,但一时之间,小米公司和创始人雷军成为众矢之的,甚至连小米公司股价,也在最近下跌超过 25%,千亿港币市值蒸发。

在小米公布的事故详细说明中,事故发生前车辆处于NOA(Navigate on Autopilot)智能辅助驾驶状态。而随着事故细节的逐步披露,社会各界对智驾安全性的讨论和质疑再度升温。

事实上,不仅小米,国内外众多推出智驾产品的车厂,或多或少都遇到过用户使用智驾在路上出现事故的案例。

如今全民智驾正在成为浪潮,但对很多用户来说,智驾仍然是第一次接触,它的功能边界、使用场景和潜在风险尚未被充分认知。

小米SU7 的高速事故,再次将智驾和普通消费者的关系摆到了一个最显眼的地方:面对一个并非全新但并未普及的技术,消费者应该如何认知智能驾驶技术?在这个层面上,主机厂、消费者和监管层,还有哪些路径可选?

车企横跨八年的安全实验

智驾的发展过程,也是一个挑战人性的过程:一方面,智驾系统为用户提供了显著的行车便利;但另一方面,在遇到突发情况时,驾驶员被要求及时接手。

这种既依赖又戒备、有限信任的关系,让人在具体操作时很难把握「边界」。

早在2016年1月20日,中国发生第一起跟自动驾驶有关的致命事故。在京港澳高速河北邯郸段,一辆特斯拉Model S撞上前方作业的道路清扫车,23岁的驾驶者高雅宁因伤势过重不幸离世。特斯拉事后确认,事故发生时车辆处于自动驾驶状态。

这一事件及其后续的多个类似案例,引发了全球范围内对自动驾驶系统安全性的关注。事故的发生不仅暴露了当前技术的局限性,也反映了驾驶员在过度依赖技术的情况下,可能放松警惕,无法及时作出反应。

为应对这一挑战,车企其实并非视而不见,而是针对用户使用智能辅助驾驶,推出了不同的方案,加大对用户的智驾安全教育。

例如,特斯拉针对多次忽视安全提醒的用户,采取了功能限制的措施。

国内车企则大多采取「考试准入」策略,实施视频学习加考试的强制准入机制,希望让用户在使用辅助驾驶之前,掌握必要的安全知识。

处于辅助驾驶中的特斯拉Model Y|图片来源:视觉中国

目前主流车企对于用户智能辅助驾驶使用的要求:

特斯拉

特斯拉是车企中最早宣传和推广智驾的车企,它在国内的智驾被划分为三个层次:

  • 基础版辅助驾驶(AP 免费);
  • 增强版自动辅助驾驶功能(EAP,需额外支付3.2万元)
  • 完全自动驾驶能力(FSD,2025年刚推出,需额外支付6.4万元)

经历国内外多起安全事件后,特斯拉主动调整传播策略,开始淡化「自动驾驶」的表述,而是强调「辅助驾驶」的定位。

3月26日,特斯拉将原「基础版辅助驾驶」的名称调整为「基础辅助驾驶」,将原「增强版自动辅助驾驶」(EAP)的名称调整为「增强辅助驾驶」,将原「完全自动驾驶能力」(FSD)的名称调整为「智能辅助驾驶」等。

虽然特斯拉并不需要考试,但它对于忽视警告的规定非常严格。当系统检测到驾驶员注意力不集中时,触摸屏的车辆状态部分的顶部将会出现提示。在多次声音和图像警告被忽略后,当次驾驶会临时禁用智能辅助驾驶,连续触发五次临时禁用后,会禁用一周时间。这应该是当前最严格的「处罚」。

小鹏汽车

在国内车企中,小鹏是最早推出智驾技术的企业,也是首个要求用户完成智驾教程并通过考试的品牌。用户在启用小鹏汽车的城市NGP功能之前,必须观看安全教育视频并通过相应的考试,整个过程大约需要半小时。

此外,小鹏的城市NGP还有一个「新手模式」,用户需要在适宜的路段体验系统的能力与限制,逐步熟悉人机共驾系统的交互方式。只有当用户在城市NGP功能下累计行驶超过100公里,且距首次激活功能达到7天后,才能解锁全部可用路段。

为了进一步规范用户行为,小鹏还推出了XPILOT智驾分,这是一套驾驶员智能辅助驾驶行为评分体系。用户在第一次完成智能辅助驾驶安全考试后,将获得智驾分(初始值为100分),这有点类似传统驾照的考核体系,违规会扣分,扣到相应分数需要重新考核才能使用相关功能。

从用户的实际体验来看,小鹏的智驾分考核还是很严格的。

鸿蒙问界

问界是把智驾带到国内大众视野的车企。要开启它的高阶智驾,用户需通过AITO App或华为智驾App完成线上学习,并通过智驾考试后,方可解锁高阶辅助驾驶功能。

该课程涵盖五大科目,包括车道巡航辅助、智能领航辅助、智能泊车辅助、代客泊车辅助、遥控泊车辅助。

同时,完成智驾考试后,还需要车辆累积智驾里程达100km或订阅ADS功能包达14天,才能开启高阶智驾功能。

要开启小米的城市NOA,不仅需要完成智驾考试,还要累计1000公里的智驾里程 | 图片来源:小米

小米汽车

作为智能汽车行业的后起之秀,小米在2024年才推出首款车型——小米SU7,并搭载了NOA智驾系统。为了让用户正确地使用智驾功能,小米汽车引入了「智驾学堂」的学习机制,用户只有完成相应课程并通过考试后,才可以解锁智驾功能。

这些课程主要包括领航辅助(高速篇)、领航辅助(全域篇)和代客泊车辅助。课程内容覆盖了智驾的核心应用场景,包括高速行驶与城市道路行驶、自动泊车等。用户需要观看相关教学视频并通过考试后,也只能解锁高速智驾与自动泊车功能。

此外,针对城市NOA功能,小米汽车设定了额外的安全门槛:用户需累计行驶1000公里的安全智驾里程。因为相较于高速NOA,城市NOA面临更加复杂的交通环境。

比亚迪

2025年2月,比亚迪正式吹响了「全民智驾」的号角,推出了「天神之眼」高阶智驾系统。这也意味着,即便是7.88万元海鸥车型,也可以实现高阶智驾,加速了智驾的普及。

要启用领航功能,用户也是需要完成智驾学习并通过相关考试。

2025年1月,王朝/海洋系列的App上线了「智驾考试」功能。用户必须观看所有相关教学视频,并通过考试后,才能激活智驾功能。值得注意的是,首次观看时,视频内容不可跳过,确保用户全面了解各项功能和安全要求。

虽然在售后端,车企已经推出了各种各样的策略,但在现实生活中,智能驾驶常常处于一个「扭力场」中,在卖车宣传的需求与实际效果之间不断挤压。

一方面,很多车企强调,当前智驾技术仍处于辅助驾驶阶段,并非完全自动驾驶,无法应对所有天气和路况。驾驶员需时刻保持注意力,尤其在使用城市NOA功能时,必须对复杂路况进行及时干预,以确保行车安全。

然而,在具体的宣传和销售过程中,部分车企为了卖车,不惜夸大智驾技术的实际能力,忽视了技术和使用场景的局限。这在一定程度上容易导致消费者对智驾产生误解。

必将到来的智驾,如何共存?

事故发生后,国家应急管理部发文称,自动驾驶技术根据自动化程度的不同,被分为L0到L5六个级别。其中,L0级、L1级、L2级都只能称为辅助驾驶系统。

文中强调:

目前,市售车辆提供的智能辅助驾驶功能,最多也只属于L2级。

尽管部分车企宣称其智能驾驶技术已达到L3级别,但考虑到政策和技术成熟度,距离实现L3的全面应用仍存在不短的差距。这也意味着,在很长时间里,智驾系统仍将处于「人机共驾」的过渡阶段,简单说就是:

技术可以在部分场景下提供有效辅助,但驾驶者仍然是驾驶安全的最终责任方。

人类司机与智能辅助驾驶如何能达到理想状态,关键在于要弄明白智驾系统的能力边界,清楚技术的适用范围、局限性和可能的失效场景,从而在必要时及时接管,确保行车安全。

智驾的普及不仅依赖于技术的进步,更需要驾驶员与智驾系统之间的磨合。这是一个系统工程,需要车企端、用户端、监管端达到一种平衡。

智能辅助驾驶使用的错误示范,双手离开方向盘 | 图片来源:视觉中国

当前,首先要做的是从行业层面统一自动驾驶术语,术语应简洁准确,避免夸大宣传误导用户。随着智驾技术的发展,行业内出现了众多相关术语,如「智驾」「自动驾驶」、「高阶智驾」、「高级智能驾驶」等。

然而,这些概念在不同车企的宣传中缺乏明确界定,容易导致消费者对车辆功能的误解,甚至错误判断其自动化程度。部分厂商过度强调技术潜力,而弱化「辅助驾驶」的本质,可能使用户高估系统能力,影响行车安全。

此前,理想汽车创始人李想曾呼吁行业机构与媒体统一自动驾驶的中文命名标准,并提出以下建议:L2 = 辅助驾驶,L3 = 自动辅助驾驶,L4 = 自动驾驶,L5 = 无人驾驶。同时,行业应在推广上保持克制,在技术上持续投入,以确保长期健康发展。

其次,当前辅助驾驶的用户培训仍存在许多不足之初,比如过度依赖理论学习,缺乏真实驾驶场景模拟;教学内容没有针对复杂路况(如施工路段、恶劣天气)进行专项培训等,这些都需要车企加以重视,并不断补足。

再有,车企还可以考虑建立用户智驾能力档案,根据不同用户群体提供差异化培训方案。如果是小白用户,则重点讲解智驾系统的基本功能与操作方法;普通用户则采取进阶训练,涵盖复杂场景,如夜间驾驶、施工路段应对等;硬核用户则支持用户最大化发挥智驾系统的潜力。

特斯拉 FSD 测试视频截图 | 图片来源:特斯拉

特别值得一提的是,从行业监管的角度来看,需要推动建立第三方数据监管平台,推动行业透明化。

当前,每当智驾车辆发生事故,数据的归属权经常成为争议焦点。由于大部分数据掌握在车企手中,外界难以判断事故责任,甚至在一些情况下,企业与用户的利益诉求出现矛盾,导致信任危机。

要解决这一问题,建立国家层面的第三方数据存管平台非常有必要。这个平台要做的是确保事故数据的真实性,并赋予行业、监管机构更公平的调取权限,能够进行更加客观化的责任认定。

智能驾驶技术虽然已经发展了很多年,但对于主流大众来说,它仍然是一个新事物。随着技术的快速迭代,在某些场景下发生安全事件的概率会逐渐降低,但由于全面智驾带来用户基数增大,相关事件的数量可能仍然会增加。

然而,我们也大可不必因此过度恐慌。

人们习惯将带有智驾功能的智能汽车比喻为带轮子的 iPhone,事实上 iPhone 代表的智能手机和移动互联网浪潮中,人们也经历过手机上瘾、短视频上瘾、隐私泄露等众多事故。而随着技术发展,隐私保护法、防沉迷机制、屏幕时间控制等方法也随之出现。

智能驾驶、或者说自动驾驶技术,不会因为一场事故而停止进化,它终将进入到人类社会之中。不过,这场惹来热议的事故,确实再次提醒人们,对于一个尚未真正成熟的新技术,我们应该以怎样的心态和认知来面对。更重要的是,作为技术的研发者和终端使用者,是否在同样的共识之中。

因为,只有达成共识,才有可能让技术来得更早一些,也让人们的生活因为技术而变得更好、更便捷。

浏览量: 32

2 个月 10 万台,增速 300%,「AI硬件」闯出一匹黑马

 

作者|苏子华

编辑|靖宇

可能你也在短视频平台刷到过一块可以语音对话的简陋电路板、或者方盒子。

过去两个月,在 AI 硬件领域内生长出一个现象级项目——「小智 AI」。

视频中的「小智 AI」语音助手用台湾腔讲话。相比市面上其他语音助手,它反应迅速、声音逼真拟人、说话内容充满「人味儿」。这些短视频迅速引发病毒式传播,点赞量动辄数十万,甚至百万。

与「小智 AI」的聊天视频,引发网友的大量共鸣|图片来源:抖音截图

评论区的讨论热度持续攀升:有人惊叹它的回答所引起的情感共鸣,更多人则在追问——「这个东西在哪买?」

在 2 月份之前,「小智 AI」是一个鲜为人知的开源 AI 硬件项目;在 2 月之后,大量电子爱好者、AI 从业者、以及编程小白涌入,将小智 AI 接入不同的硬件。有人用「小智 AI」来聊天,有人用它来语音控制各种电器。

不过,「小智 AI」团队并不生产硬件。

极客公园获悉,过去两个月内,接入「小智 AI」的硬件设备快速增长了 10 万台,每个月的接入设备数量翻倍。其中,由官方售卖的「语音盒子」仅占一千多台,其余均由爱好者、开发者和商家 DIY 完成。

他们通过自行购买喇叭、麦克风、芯片和主板进行组装,赋予了小智 AI 各种各样的形态和应用场景。同时,也有很多开发者将组装好的成品放到抖音、淘宝、拼多多等电商平台上售卖。

没有人能想到,一块最简陋的、毫无设计感、但能语音聊天的电路板,成为了 2025 年以来,全网最火热的 AI 硬件。

芯片、麦克风、喇叭、电源、显示屏、开发版,构成「小智 AI」硬件的最基本单元|图片来源:受访对象

目前,限制「小智 AI」接入设备数增长的主要因素是产能。有电子硬件爱好者表示,不少售卖「小智 AI」成品或者相关电路板、元器件的店铺已经卖断货,并且价格翻倍。

「小智 AI」的持续火爆,正在卷入更多没有任何编程基础的小白用户、AI 硬件开发者,甚至专业的芯片厂商、消费品厂商。

如今,它已经演变为了一种值得研究的现象。小智 AI 是如何火起来的?还能火多久?这个项目到底要做什么?开源的「小智 AI」会给 AI 硬件产业带来什么影响?

带着这些问题,极客公园和小智 AI 的团队聊了聊。

 

「草根」的力量:网友自发传播,带火整个生态

 

「我们没有预料到它会这么火。」小智 AI 产品负责人凯峰对极客公园表示。

「小智 AI」最初是十方融海董事长黄冠(网名「虾哥」)的个人兴趣项目。「起初,只有他一个人在做,后来起量了,他忙不过来,才加入了更多人。」凯峰透露,「到现在,小智 AI 项目组也没有超过 10 个人。」

「虾哥」最初以一名硬件初学者的身份,自学了一些硬件资料后,做了一块能聊天的电路板,其接入的语音聊天机器人「小智」源自于十方融海研发的大模型 Emotional Model。

「除了顺畅的聊天功能,这个 AI 硬件还能具备些什么能力呢?他希望大家能一起共创,碰撞出更多想法,就在 GitHub 上将小智 AI 开源了。」

小智 AI 的官网和后台进入页面|图片来源:小智 AI 官网 https://xiaozhi.me/

用户可以基于指定的乐鑫 ESP32 芯片开发版接入不同的硬件模块。至此,小智 AI 成为了市面上为数不多的「开源 AI 操作系统」。

「我们把小智定义为』大脑』,硬件作为』手脚』由开发者自由发挥。」凯峰表示,团队的目标是搭建一个开放平台,「之后会做一些更普适性的协议,让更多设备可以接入小智。」

项目在 2024 年 9 月开源后,团队并未主动宣传,不温不火。直到今年 2 月左右,大量创客和电子爱好者将「小智 AI」的视频发布到网络,项目迎来爆发式增长。目前,GitHub 上的「小智 AI」项目已吸引 4 万名开发者。

而小智 AI 项目之所以最初选择乐鑫 ESP32 芯片,并不是技术最优性考虑,而是因为其足够「小白友好」。实际上,小智 AI 团队在开源这个项目之时,并不认识乐鑫团队。

「我们是软件团队,不懂硬件。乐鑫芯片开发版在网络上教程很多,而且支持温湿度传感器、摄像头等模块扩展,开源生态做得不错,自由度高,对初学者很友好。所以就选了这款来上手。」

回过头看,这种「低门槛」的选择也促成了「小智 AI」在项目声量、用户量上的大爆发。它吸引了大量非专业用户:大学生、产品经理、甚至科技爱好者家长带着孩子一起参与硬件改造。

「很多专业人士可能看不上我们这种东西。反而是普通人抱着极大的好奇,愿意去折腾一些新的可能性。」凯峰坦言,「我们也希望能够给他们提供一些帮助。」

 

开源引发的蝴蝶效应:AI 硬件迎来全新的开发逻辑?

 

据介绍,小智 AI 脱胎于十方融海自研的大模型——Emotional Model,多模态情感模型。「从 2023 年开始,我们在开源模型的基础上做了优化和微调,开始训练自己的模型。」

该模型起初并不是为了落地「AI 硬件」。

十方融海原本是一家做在线教育的公司,业务覆盖职业技能培训、中老年兴趣教育,旗下产品有技能实训平台「女娲云教室」、声音培训子品牌梨花教育等。

因此,训练自有大模型是为了服务其 AI 教育业务。

但有趣是的是,其后续的发展,却为「AI 硬件」行业带来了新的启示。

结合上述背景,小智 AI 项目爆火出圈的驱动力,我们可以总结为以下几点:

    • 基础功能免费。「小智 AI」基础的聊天功能免费,用户不需要支付 token 费用。相比之下,硬件厂商如果试图接入其他大厂旗下的 AI 语音助手,需要支付额外费用。

    • 语音聊天能力突出。这可能是它出圈的最主要原因。在网络上,小智 AI 的聊天视频打动了上千万网友,引发讨论。其响应速度快、情商高、声音更拟人化。

  根据测试,小智 AI 的回答响应速度在 300 毫秒左右,而其他主流 AI 语音助手的响应速度在 2-3 秒左右。

    • 足够小白友好,容易上手。其门槛之低让普通人能够真正将 AI 用于生活之中。横向来看,许多大厂推出的「开放平台」,面向人群仍然以专业开发者为主,而非小白群体。

  有硬件开发者评价,从互联网大厂举办的一些所谓的「开放活动」可以看出,报名的时候仍旧需要层层审核,他们的目的是为了找到专业的厂商,形成「示范案例」,完成团队考核的绩效 KPI。出发点并不是面向所有人的「开放」。因此很难形成广泛的参与。

对于「响应快、声音更拟人」,凯峰表示,「这是因为我们对大模型做了一些工程上的优化。」他进一步指出,这并不会持续地成为竞争优势,未来这些特征会变成所有语音助手的标配。

「就像移动互联网时代的安卓手机,早期的手电筒 App 能积累千万下载量,但最终被系统集成取代。」凯峰坦言,「AI 硬件也是如此,最终比拼的是语音助手与实际需求的契合度。」

目前,小智 AI 的日活跃用户数大概在 1.5-2 万之间,月活超过 9.4 万。团队计划在短期内保持免费策略,通过培养生态吸引更多开发者和用户,探索更多使用场景。

「智能」被解放,小智 AI 被网友接入到不同的硬件设备上|图片来源:网络截图

 

随着用户量激增,小智 AI 的开源生态正在快速扩张,更多产业的上下游被卷入其中:

  • 硬件生态:芯片厂商寻求适配,推动硬件生态多样化。据凯峰介绍,芯片品牌思澈、全志已经适配小智 AI,同时有更多芯片品牌正在适配过程中;

  • 文创与消费品:故宫文创、反诈吉祥物、冰雪奇缘玩偶等品牌希望将小智 AI 内置到产品中。一些玩具源头工厂也找上门,希望内置小智 AI。

小智 AI 的异军突起为 AI 硬件行业带来了新的变量。此前,阿里云、字节扣子、百度云、OpenAI 等大厂积极推动其 AI 硬件生态,AI 助手似乎只是巨头的游戏。

而「小智 AI」迅速收获大批用户,一方面,说明了硬件厂商未来选择哪家语音助手,还存在更多的选择空间,这不只是大厂的地盘;另一方面,「小智 AI」的出现也为更多同类语音助手创业项目呈现了破局的可能性。

另外,我们可以看到,开源、草根驱动的模式正在重塑 AI 硬件的开发逻辑。当 AI 与硬件的结合门槛降低到「小学生难度」时,用户可以更个性化地制作自己的 AI 硬件,用于智能家居、AI 陪伴等场景,这种模式或许正在催生一个全新的市场。

「生态内已有 4 万开发者,但可能缺乏成熟的 C 端产品经验。希望之后能够吸引更多垂直领域专家,比如声学专家、硬件设计师和消费产品操盘手进来,打造出消费级的 AI 硬件产品。」凯峰介绍,团队希望在小智之上,长出更多爆品。

过去,「AI 硬件」概念很火,主要源自于资本、云厂商、创业者的宣传推动,大家关心的是如何把握住下一个风口,是对未来的推演。

而当下,小智 AI 的爆火,是源自于个体开发者、爱好者们的动手实践。它不是由专业厂商推动,而是网友自发。

尽管 AI 硬件行业距离全面爆发仍需时间和沉淀,但「小智 AI」现象无疑预示着一个更加普惠和个性化的 AI 硬件时代的到来。即便从「开源硬件」到真正量产,中间隔着千难万险,但没人能否认,这些几十块钱的 AI 玩具之中,或许藏着下一个「AI iPhone」。

 

头图来源:淘宝商家截图

浏览量: 14

港科技股大跌 17%;美股崩盘,美财长甩锅 DeepSeek;微软回应停止中国区运营传闻

​港股收市:科指大跌超 17%,小米跌超 20%,阿里跌近 18%

恒指收跌 13.22%,恒科指跌 17.16%。成交额居前个股中,腾讯控股跌 12.54%,阿里巴巴-W 跌 17.98%,小米集团-W 跌 20.59%,美团-W 跌 14.95%,中芯国际跌 16.32%。(来源:富途牛牛)

现代汽车将购买数万台波士顿动力机器人

4 月 7 日消息,波士顿动力 4 月 3 日公告,该公司与现代汽车集团携手进入新的篇章,以提升制造能力,扩大合作以生产更多机器人。

现代汽车集团将在未来几年内在美国购买数万台波士顿动力机器人。它还将通过整合其制造能力,帮助波士顿动力公司成为「世界上领先的先进移动机器人制造商」。

现代汽车集团已经在其设施中部署 Spot 机器狗进行工业检查和预测性维护,并将未来在工厂中部署 Atlas 人形机器人。

此外,现代汽车集团宣布将在美国投资 210 亿美元(IT 之家注:现汇率约合 1530.63 亿元人民币),其中包括 60 亿美元(现汇率约合 437.32 亿元人民币)用于推动创新和扩大与美国公司的战略合作伙伴关系。

IT 之家注:现代汽车集团于 2021 年 6 月宣布从日本软银集团手中收购了波士顿动力公司 80% 的股份。2021 年 9 月,现代汽车集团宣布启动了一个试点项目,在其工厂部署波士顿动力的机器狗帮助检查安全,这是双方的首次合作。(来源:IT 之家)

 

微软回应停止中国区运营传闻:信息不实

4 月 7 日下午消息,今天上午,一张显示「微软停止中国区运营」的邮件截图在社交软件上流传,该邮件内容称:由于地缘政治及国际业务环境的变化,微软将调整其全球战略布局,并将于 2025 年 4 月 8 日起正式停止在中国区的运营。据了解,此邮件为上海微创公司信息。

对此消息,微软官方回应表示:「有关微软将停止在中国运营的报道,信息不实。有关微创 Wicresoft 公司的业务和运营的任何问题应直接向他们咨询。」(来源:新浪科技)

 

米哈游旗下多家科技公司接连大幅增资

4 月 7 日上午消息,天眼查 App 显示,近日,上海米哈游远望计划科技有限公司、上海米哈游万众一体科技有限公司发生工商变更,注册资本分别由 1000 万人民币增至 4 亿人民币、5.5 亿人民币,增幅分别为 3900%、5400%

据悉,上述两家公司分别成立于 2024 年 12 月、2024 年 11 月,法定代表人均为于晨曦,经营范围均包含软件开发、动漫游戏开发、数字文化创意软件开发、数字文化创意内容应用服务、信息技术咨询服务、信息咨询服务、人工智能应用软件开发等。股东信息显示,上述两家公司均由上海米哈游网络科技股份有限公司全资持股。

值得一提的是,近期,米哈游旗下上海蓝智盛丰科技有限公司发生工商变更,注册资本由 1.5 亿人民币增至 20.5 亿人民币,增幅约 1267%。(来源:新浪科技)

美股崩盘,美财长甩锅 DeepSeek

据路透社报道,在 4 月 5 日公开的一次采访中,美国财政部长贝森特将美股崩盘归咎于 DeepSeek,而非特朗普的政策。

贝森特表示,「对于所有认为这些股市下跌情况都是基于总统的经济政策的人,我可以告诉你们的是,这波股市下跌是从中国人工智能宣布推出 DeepSeek 开始的。我认为人工智能领域确实经历了一剂现实的清醒剂,但相信美国仍将在该领域保持领先地位。」(来源:京报网)

 

为规避关税,消息称苹果公司将从印度组装工厂进口更多 iPhone 至美国以降低成本

据华尔街日报报道,为减轻美国当局本月实施的关税影响,苹果公司将从印度组装工厂向美国进口更多 iPhone,这主要是因为在新关税政策下印度制造的 iPhone 运至美国成本比中国大陆制造的 iPhone 更低。

与来自中国大陆 54%、越南 46% 或泰国 36% 的关税相比,印度的 26% 关税对苹果的利润冲击较小。由于目前美国关税政策变化仍存在较大不确定性,苹果不打算对现有供应链进行重大调整,而是计划从印度组装工厂进口更多 iPhone 至美国以来抵消在中国大陆生产产品所面临的关税成本,这被视为一项短期应对措施,同时苹果正努力说服美国当局为其产品争取关税豁免。

苹果可能还会通过向供应商施压降低采购成本或者部分吸收关税成本来应对这一局面,但未来苹果也有可能选择上调售价。自美国当局宣布关税计划以来,苹果股票在过去三天内已大幅下跌,自上周三以来跌幅接近 20%。(来源:IT 之家)

 

小米公司发言人:有关小米 SU7 保险相关的谣言被有组织地扩散传播,已向公安机关报案

小米公司发言人 4 月 7 日晚发文:

近日,我们发现有关小米 SU7 保险相关的谣言被有组织地扩散传播,现严正辟谣澄清如下:

经与我司合作的五大保险公司:中国人民财产保险股份有限公司、中国平安财产保险股份有限公司、中国太平洋财产保险股份有限公司、阳光财产保险股份有限公司、中国人寿财产保险股份有限公司逐一确认,上述公司均表示从未出具过任何拒保通知,相关文件确系伪造。此外,经同业公司校验,该伪造文件亦不符合保险公司内部文件格式、行文标准和用章通行规范。

目前 SU7 车型的投保服务平稳正常,网传信息严重失实;此外,「SU7 出险率是同价位车型数倍」的谣言,同样毫无事实依据。

我司已对该内容进行证据保全,并依法向公安机关报案。(来源:IT 之家)

2025 款小鹏 X9 全球首秀暨预售发布会直播,定位「超舒适 AI 大七座 MPV」

4 月 7 日,小鹏汽车官方宣布,2025 款小鹏 X9 将于 4 月 8 日 14:00 亮相,届时将举行全球首秀暨预售发布会。新车定位「超舒适 AI 大七座」MPV,小鹏汽车 CEO 何小鹏表示,2025 款小鹏 X9 将全面升舱。

何小鹏发文表示:我知道很多「鹏友」为了给家里人买这台车已经等了很久,作为一年行驶里程超过 5 万公里的小鹏 X9 车主,我也同样期待。小鹏 X9 对我们而言是一款具有独特意义的科技旗舰,上市一年多,它在「智驾、操控、空间、安全、续航、能耗」六大领域做到了 MPV 行业天花板的水平,一年后依旧全面领先,凭借极强的产品力荣获「2024 纯电 MPV 年度销量冠军」。(来源 :手机中国)

 

OPPO Watch X2 Mini 智能手表支持实时定位分享、一键报警等功能

4 月 7 日消息,OPPO Watch X2 Mini 智能手表外观已公布,新品将于 4 月 10 日发布。

 

据 OPPO 官方最新预热,OPPO Watch X2 Mini 智能手表支持实时定位分享、身体异常及时同步、一键报警联系亲友等功能。据 IT 之家此前报道,OPPO Watch X2 Mini 智能手表拥有三款配色,分别是明日金、皓月银、星野黑。(来源:IT 之家)

川崎推出可骑乘四足机器人,驾乘丝滑「像骑马一样」

4 月 7 日消息,川崎重工(Kawasaki Group)在日本召开发布会,公布了旗下一款仿生概念车「CORLEO」,该款概念车配备了四条独立运动的机械腿,每条腿还装有橡胶材质的「底座」,能够吸收地面不平带来的冲击,具备防滑功能。「CORLEO」融合了川崎重工在摩托车领域的机动性能,驾驶者可以像骑马一样控制该车。官方还提到「CORLEO」的动力来源是一台 150cc 的氢能发电引擎,同时具备交互中控和导航功能,让驾驶者随时掌握骑行情况。(来源:界面新闻)

浏览量: 30

「9 块 9」AI 复活亲人,科技奇迹还是「情感幻觉」?

作者|Moonshot
编辑|靖宇
清明节到了,在过去上百年里,人们扫墓、烧纸、磕头、摆上供品、再对着墓碑诉说,希望借节日的仪式感,让思念跨越阴阳。
随着 AI 技术的发展,聊天记录结合语音,就能构建出一个定制的聊天机器人。那么逝者能否以 AI 的形式「复活」,让生者得以在赛博世界听得故人语,重见故人颜,仿佛他们从未离开过呢?
从 9.9 元让故人的照片开口说话的电商服务,再到 VR、AR 里的赛博重逢,乃至结合逝者生前语音与聊天记录,打造一个「追思 GPT」,最终发展至科幻剧集、游戏中「重生化作仿生人」的想象。
科技已经给这条路径铺好了路,但我们又该如何把握生和死之间的度。

几十元到上千元定制的「复现」服务|图片来源:电商平台

当科技开始介入生死,我们是在用 AI 缓解悲伤,还是无法学会告别,妄图在生死之间做拉扯。这是一种安慰,还是一种幻觉?

01

AI「复活」故人分几步
 
用科技复活人类,是科幻电影乃至整个影视界的「超级母题」。
2013 年的科幻惊悚剧《黑镜》第二季的《马上回家》,用一整集展现了 AI 复活逝者的技术路线。
玛莎的男友阿什去世后,购买了一项服务,该服务可以分析阿什生前的社交媒体、短信、邮件和视频,生成一个 AI 版的阿什,能模仿他的语气、习惯,甚至惯用的表情符号。
起初,阿什只作为聊天机器人存在,但这种仿佛阿什还活着的情感,让玛莎一步步升级服务,从文本到语音,再到一比一复刻的仿生人,阿什通过技术「复活」了。

《黑镜》S2E1 里,女主把男友生前的数据都上传到平台|图片来源:黑镜

十二年前,《黑镜》还是科幻剧集,当下再看,已经接近现实题材了。
阿什复活第一步是自然语言处理,如今只要把逝者生前的聊天记录、日记、社交媒体这些数据收录,用机器学习分析,再结合亲友们对他性格的描述(微调模型),就可以创建出模拟逝者的语言风格的 AI 聊天机器人。
实际上,这条赛道已经有很多公司入场了。
大公司诸如 Character.AI,主打个性化 AI 角色定制,尽管官方未明确提供「逝者复生」的功能,但用户已经开始用它来训练已故亲人的 AI 分身。
小公司如 Project December,口号就是「模拟逝者」。用户可以输入故人生前的资料、口癖、个性……AI 便会根据这些数据生成一个模仿逝者语气、表达方式的聊天机器人。10 美元能进行 100 条对话。
微软也曾在 2020 年申请过一项 AI 专利,描述了一种基于某人聊天记录、语音、社交媒体内容等数据,创建聊天机器人的技术。
专利中专门提到,这种技术可以用于纪念已故之人,或者为用户提供一种与特定人物(比如古人)「对话」的体验。

官网散发着简陋又悲伤的气息|图片来源:Project December

文字聊天再进一步,就是玛莎加钱开通的语音互动。
收集逝者生前的语音样本,比如微信语音、电话录音、视频音频等,再通过深度学习模型分析声学特征,就能训练出一个有着逝者口音、口癖、语速、语气的语音样本,再结合此前的文字模型,逝者就可以「开口说话」了。
这也是当下流行的语音合成(TTS)技术,从剪映的配音到此前各种名人语音 Bot,甚至许多以假乱真的诈骗电话,都依靠了 TTS 技术。
同样,这条赛道也已经商业化了。
诞生自 2023 年,口号是「你的故事和声音将永存」的 HereAfter AI 另辟蹊径,不走「重生流」,而是让用户先录下自己的声音和人生故事,比如童年回忆、人生经历、家族历史等,HereAfter AI 会整理这些录音并生成一个 AI 互动版本,可以作为数字遗产留给后人。它更像一个「生前存档」,而非赛博复生。

该公司最火的业务是年轻人买来送长辈……|图片来源:HereAfter AI

文本和声音有了,下一步就得是视觉形象了。这也是当下最热门的 AI 应用之一:AI 生成视频。
可灵、即梦、海螺、Sora、Runway……各类 AI 视频生成应用层出不穷,用户只需要拍下一张家里的老照片,不仅能生成为动态视频,还能赋予人物表情和神态。

照片摄于 1968 年,AI 让我第一次「见」到已故的姥爷笑|图源:作者供图

 

再高级一点,扩散模型(Diffusion Models)技术可以通过少量图像数据重建高精度人脸,神经辐射场(NeRF)技术可以用少量的照片推算出完整的 3D 形态。
用户用这些 3D 数据就能在计算机里给逝者建模,生成式对抗网络(GANs)还能模拟人的表情、动作,再融入上一步的语音合成技术。
至此,一个数字分身诞生了。
这些技术看似遥不可攀,但随着 AI 的普及,只要把各类 AI 应用串联起来,任何人都能为家人生成一个数字分身。

B 站 Up 主 @ 吴伍六 在 2023 年生成虚拟人奶奶|图源:吴伍六

现实中,也已经有大量难以承受失亲之痛的人,他们用 AI 重建了逝者的音容相貌。
在当下,AI 复活已经不再是一个技术难题,而是一个伦理讨论。

02

现实案例与科技伦理
 
《流浪地球 2》里的图恒宇对已故女儿丫丫的执念,让他走向了一条极端的 AI 复生之路。
他把女儿的记忆、声音、行为模式等数据完整记录下来,尝试在计算机里复现丫丫的意识,试图让丫丫以数字生命的形式「活」在计算机里。
然而,图恒宇的执念逐渐变成了极端的偏执,差点做出可能会威胁人类未来的选择。

图片来源:《流浪地球 2》

《黑镜》那一集的结局也并不美好,玛莎逐渐意识到,AI 阿什没有超出数据和算法范围的情感,他不会反抗,不会像阿什一样发脾气,甜言蜜语也像套公式。最终,玛莎把 AI 阿什锁进了阁楼。
影视剧中所呈现的数字复活,都是基于生者不接受逝者的亡故,执拗追寻去重现他们的身影,技术带来的幻觉,最终让生者陷入一种更孤独的虚幻感中。
然而现实的案例里,往往有着更多的温情。
早在 2020 年,AI 引领的聊天机器人尚未兴起,韩国一档叫《遇见你》的综艺,就用 AI 结合 VR 的形式,让一位母亲和已故的女儿实现了「重逢」。
哪怕 VR 里的小女孩像一个游戏建模,但母亲见到「她」的一瞬间就泣不成声,忍不住用 VR 手套去触碰她的脸。
她们一起在一个虚拟公园里,给小女孩度过了 10 岁的「生日」。最后母亲把女儿哄睡后,摘下了 VR 头显,露出了释怀的微笑。
该视频在 YouTube 有 3687 万次观看量,评论区也都是对这份亲情的动容,或是对已故亲人的怀念。

母亲通过 VR 和逝去的女儿相逢|图片来源:MBC

就像这位母亲在节目后发表的博文里写到的「虽然短暂,但见到了笑着叫我的娜妍,那是非常幸福的时光。就像做了一直想做的梦一样。此前的梦境里,她总是像在责怪我,为什么她要离开。」她终于放下了对女儿离世的无尽自责。
著名音乐人包小柏也用了两年时间,构建了已故女儿的数字分身。其中最大的难点就是声纹重建,他花了近半年时间才重建了女儿的中文声纹,这也成为了他博士阶段的课题:如何在短、少、残缺性的数据里重建声音。

在《妻子的浪漫旅行》里,韩庚为妻子卢靖姗准备了一段由 AI 生成的已故父亲的寄语视频|图片来源:芒果 TV

但包小柏并不想更进一步,他在采访里表示「使用 AI 技术不可能让人死而复生,所以说「重现」「还原」更为恰当。机器就是机器,我们从客观理性的条件上不能让它失控。」
他所设想的场景里,是让女儿再给妻子唱一次生日歌,帮助朋友在结婚的时候,重建已逝岳父的声音进行主婚,给新娘一个惊喜。
在商汤科技 2024 年的年会上,已故创始人汤晓鸥也以数字人的形式,给员工们照例表演了九分钟的脱口秀。单看视频,很难相信这是一个已经逝去的人。而汤晓鸥也在用这种方式,持续激励着商汤科技的员工们。

2024 年汤晓鸥以数字人的形式参演公司年会|图片来源:商汤科技

一家主营 AI「复活」亲人业务的公司的创始人曾表示「前来咨询的客户里,对数字永生这项服务接受度并不如想象中的那么高,更多的需求集中在让亲人说一段祝福的话。」
由此可见在现实案例里,和已故亲友短暂的重逢、偶尔的对话、特殊场合的寄语,才是目前 AI「复活」的主要需求。
我们对死者最大的哀思,往往来自于「再也不见」,如果 AI 能填补这个空白,哪怕只是聊以慰籍,依旧能给予生者一丝心理上的安慰,让那些未能说出口的话得以「传达」,让生者不再活在自责里。
就像 365 天会专门划出一天让人纪念逝者,AI「复生」或许也是如此,它并非为了让逝者永远停留,而是在某个特殊的节点,它能用另一种形式,或见证,或参与,或填补了生者们那份「再也不见」的遗憾。

AI 复活奶奶视频下的评论区|图片来源:B 站

毕竟斯人已逝,生者如斯。无论是墓前低语,还是数字世界里的短暂复现,亦或是在《模拟人生》游戏里创建一个逝者的角色,技术只是改变了悼念的方式,它不会改变生死的本质,但却可能给予生者更积极的情绪抚慰。
然而,AI 是如今最接近让人灵魂「复活」的技术,比起传统的悼念方式,它提供了一种近乎「永不结束」的哀悼,生者也有沉溺在赛博幻觉的危险。也有人会拿已逝的公众人物博取「复活」流量,伤害粉丝也误导大众,这种对逝者人格的侵权和操控,亦会对其家人造成二次伤害。
对 AI 复活的伦理讨论也不会停止,正如生者不会放下对逝者的哀思。
这是一场技术理性和人类终极情感的极致拉扯,没有人能给出最好的答案。
浏览量: 13

微软的「50 岁生日」,过得真不容易

作者|Moonshot
编辑|靖宇

2025 年 4 月 4 日,微软这家公司迎来了五十岁的生日。
还有比这个时间点,更让人尴尬的「五十岁」生日吗?
美国当天的发布会上,即便有盖茨、鲍尔默和纳德拉三位CEO「三世同堂」,甚至鲍尔默再次上演「咆哮帝」的表演,也抵不过最后被抗议者搅局,「生日会」草草收场。

微软 CEO 盖茨、鲍尔默、纳德拉「三世同堂」|图片来源:微软

同一天,美国总统宣布新的关税细节,美国股市领先全球股市一泄如注,几天蒸发掉超过 5.4 万亿美元。
环球同此凉热,在中国,刚刚「知天命」的微软不得不发表声明,证明公司在国内「停止运营」是谣言。
当然,眼前的困难和波折,对于微软来说,并不是真的挑战。
五十年来,微软屡次涉险:浏览器之战差点儿导致公司拆分;Zune 挑战 iPod 惨败;错判移动互联网趋势,Windows Phone 的起大早,赶晚集;错误收购诺基亚,同时错失收购 Yahoo、Facebook 的机会……这些失误虽未致命,却也让它在移动互联网时代几乎彻底缺席。
但近年来,微软从未缺席全球上市公司市值前五的排名,不仅如此,它常年稳居前三,在多个时间点登顶全球第一,是全球市值最稳健、成长性最强的科技巨头之一。
五十岁的科技巨头依然老当益壮,不仅是因为大而不倒,而是做对的事比做错的更多。
在微软五十周年生日之际,让我们以后见之明,回溯微软五十年历史中的关键节点——那些濒临悬崖却抓住续命机会的时刻。
这些转折不仅让微软化险为夷,还让它在漫长的科技洪流中,参与、见证、塑造了新的科技时代,成为了如今我们认识的「巨硬」的微软。

01

1980s:「哄骗」 IBM:拿下「世纪合同」
微软成为巨头的第一步,半哄半骗,并不体面。
1970 年代末,时任科技巨头的 IBM,计划推出一款面向普通消费者 IBM PC,但他们并不打算自研系统,于是找到了承接外包的一家小软件公司:微软。
然而,当时微软手上并没有现成的操作系统产品,于是灵机一动,从另一家西雅图小公司手里买下了 QDOS 系统,二次开发后包装成 MS-DOS,拿去给 IBM 交差。

当年的盖茨还没成为世界首富|图片来源:LinkedIn

比起做「改房后做二房东」,微软最绝的一步是,他们在和巨头 IBM 的谈判里,赢得了向其他厂商授权  MS-DOS 的权利。
即微软用「买来的」系统,哄过了当时最大的 PC 公司,还达成了不卖断的授权交易。
随后 IBM PC 成为行业主流,MS-DOS 成为行业优选的操作系统。微软一战封神,从一家小软件公司,一跃成为刚起步的 PC 行业基建师,为下一阶段的 Windows 帝国埋下伏笔。

02

1990s:人人嫌的 IE,救过微软的命
 
这是微软历史上最惊险的一次「续命级危机」。
上世纪 90 年代,Windows 已经成为了微软的金饭碗。1995 年,微软更是端出了革命性操作系统 Windows 95,引发了科技界的狂欢,上市仅一周就卖掉 700 万套。
那年,一家叫网景的公司推出了一款浏览器,它像 Windows 95 一样横扫市场,一度占据了全球超 80% 的浏览器市场份额。
然而,网景的愿景是:未来所有应用都会「在浏览器里运行」,只要能上网,装什么操作系统不重要。
这下微软坐不住了,网景的流行意味着 Windows 可能面临被架空的风险,甚至被免费且开源的 Linux 取代。

1994 – 2009 年浏览器市场份额变迁,绿色是网景,蓝色是 IE|图片来源:维基百科

于是,微软以近乎不计代价的方式,对网景发动了一场最具争议的浏览器之战:微软把并不好用的 IE 浏览器强制捆绑在 Windows 系统中,出厂默认安装,无法删除,还向 PC 制造商施压,要求他们不能在系统里安装其他浏览器。
这一策略简单、粗暴但有效,网景用户份额迅速被蚕食,最终被 AOL 收购后退出历史舞台。
然而,后来的事态发展表明,微软的这场胜利堪比杀敌一千,自损八百,差点儿把公司玩没了。

03

2000s:绝地逢生:Windows XP
 
浏览器之战的胜之不武,让微软差点儿分崩离析。
1998 年,美国司法部和 20 个州联合对微软发起了反垄断起诉,即大名鼎鼎的《合众国诉微软案》,官司打了整整三年,最终法院初步判决:微软构成垄断行为,必须被拆分为两个独立公司,一个管 Windows,一个管软件应用。
虽然后续在上诉中,「拆分令」被撤销,但微软仍被判违反《反垄断法》,需要公开 API、限制打压竞争对手的行为,并接受长达五年的监管审查。一时间,比尔·盖茨也被媒体讽刺为「科技界的克林顿」,微软品牌形象大大受损。

盖茨参加听证会|图片来源:维基百科

持续三年的诉讼案,也让微软内部的创新放缓,公司文化一度转向「律师优先,工程师靠后」。随着反垄断案接近尾声,微软推出了本不给予厚望的操作系统:Windows XP。
结果新系统直接卖爆,企业用它办公,网吧用它打 CS,政府、学校、银行统统采购 XP 作系统基座。
Windows XP 的爆火不仅顺应了时代,它深刻地塑造了时代。
微软恰巧踩中了 PC 普及、数字化浪潮刚刚兴起的节点,也因为 XP 的稳定、易用、开放,让 XP 陪着一代人,进入了数字化,见证了世界从离线走向联网。或许你、或许我,对电脑的初印象,都源自于那片蓝天白云、绿草如茵。

图源:微软

尚处于公司成立以来最低谷的微软,或许也未曾预料到:这套诞生于三年诉讼时期,发布于反垄断案和解前的系统,竟然成了公司历史上最成功(市场份额巅峰达 76%)、最受用户喜爱(用户使用时间最长、迁移新系统最慢)、生命力最顽强(13 年)的一代作品。

04

2000s:最大的豪赌:Xbox
 
千禧年互联网泡沫破灭,PC 出货量见顶,从 2000 年 18.7% 的增速直接跌落至次年的 – 4.9%。
微软需要新故事,经历了 9·11 的世界也需要新慰藉。
比尔·盖茨看到 PS2 从日本走向世界,进入千家万户的客厅,成为他们的家庭娱乐中枢。他也看到了普罗大众对 PC 主要的购置需求:游戏。
微软又一次生出了如对网景般的担心:PS2 不只是一台游戏机,它自带功能丰富的系统,能放 DVD、能联网、还能打游戏,对比当时的 PC 价格更低,娱乐性更高。
这次,微软面对同样体量的索尼,无法再像对网景一样故技重施,他们选择正面对攻。

初代 Xbox|图片来源:维基百科

于是,微软押下重注,启动主机项目,这也是作为软件巨头的微软,首次对硬件战场的全面出击。
2001 年 11 月,Xbox 问世,性能不仅远超同时代的 PS2,在当时购买一台类似性能的 PC 要花费约 1000 美元,Xbox 定价仅为 299 美元。
对主机来说,硬件只是秀肌肉,游戏阵容才是吸引玩家的关键,微软重金收购 Bungie 工作室,其打造的《光环》系列,不仅成为 Xbox 的首发独占神作,更在随后多年里成为 Xbox 的定海神针。

单看游戏效果,Xbox 更胜一筹|图片来源:Tio John

这场豪赌代价惊人。据估算,初代 Xbox 累计亏损高达 40 亿美元,几乎是「卖一台亏一台」。但微软的目的从来不是短期盈利,而是以资金砸出一张入场券,不惜亏损也要把 Xbox 生态做起来。
事实证明,Xbox 这步最初带有防御色彩的险棋,最终把微软带入了游戏这个潜力巨大的市场,并最终成长为公司重要的营收来源之一。24 年前半路杀出的微软,不仅做到和索尼、任天堂并列被玩家称作「御三家」,还能和索尼、腾讯长期稳居游戏行业收入榜前三甲。
当年微软卖一台亏一台的游戏业务,现在年收入高达数百亿美元。在未来,动视暴雪的在线游戏、堪称「游戏界 Netflix」的 Game Pass、对云游戏的前瞻性押注,还会成为微软游戏业务的第二增长曲线。
Xbox 的故事,至今仍是科技史上跨界突围与战略性亏损的经典范本。

05

2010s:鲍尔默走,纳德拉来
 
鲍尔默,大概是微软公司历史上最「难评」的 CEO。
自他 2000 年从盖茨手上接过 CEO 的交接棒后,微软股价长期停滞,市值十多年徘徊不前。
彼时的微软,像一个臃肿、内耗、迟疑的中年人,战略高度保守,创新节奏放缓,固守着 Windows 的成功路径,看着隔壁苹果公司从 iPod 到 iPhone 引领出整个移动互联网,Google 重新定义搜索引擎,Facebook 玩转社交网络。
而微软只能拿着手上的烫手的诺基亚,已死的 Zune,和被 Google 挤到边缘的 Bing,整个公司仿佛陷入中年危机,成为《创新者的窘境》的绝佳案例。
但鲍尔默也并非只懂销售,只会咆哮。在他微软生涯的后期,布局了 Azure 云服务,推动了 Office 365 的诞生。卸任前他宣布了微软重组计划,执行「设备与服务」硬件+云端的战略。
或许,鲍尔默对微软最重要也最被低估的贡献,就是把微软推向了云计算平台,以及发掘了接棒人——纳德拉。

2014 年,纳德拉上任,他不愿再做裱糊匠,而是要做建筑师。

他果断削弱了 Windows 中心地位,把「云优先」定为公司铁律。他砍掉手机业务,转向拥抱 iOS 和 Android 两大对手平台。
纳德拉全力推动 Azure 云计算,收购并拥抱 GitHub 所代表的开源文化,与 Linux 从对手变为伙伴,更在 AI 浪潮掀起前,下注投资 OpenAI。
微软的企业文化也悄然改变,从封闭保守转向开放合作,从单纯追求市场份额转向精心培育开发者生态。
大刀阔斧下反而遍地开花,云服务 Azure 从追赶者强势崛起,业务直逼 AWS;订阅制的 Office 365 成了微软的现金牛;GitHub 和 LinkedIn 覆盖了传统社交媒体外的职业生态圈;而对 OpenAI 的前瞻性投资,则彻底刷新了业界对微软创新嗅觉的认知,也把它推到了 AI 革命的最前沿。
纳德拉不仅是改革了微软,而是重新定义了微软文化和市值。
在他治下的微软,不再仅仅是警惕竞争对手的防守者,而是成为创新者和领军者。
大船难掉头,可纳德拉几乎是以一己之力,不仅避免了让微软撞向冰山,还把微软从 Windows 换到了云与 AI 的新航线。

06

2020s:注资 OpenAI,赌赢了未来
数年前谁能想到,是微软带出的 AI 时代。
即便 Azure 的云业务日益巩固,纳德拉治下的微软也从未忘记移动互联网时代起大早、赶晚集的惨痛教训,以及把 Windows 当成下金蛋的鸡后,微软陷入的惰性与惯性,他们必须确保在下一个计算时代浪潮中占据核心地位。
于是面对刚刚起势的 AI,纳德拉决定 All-in 入局,这并非无脑冒险,而是深思熟虑后的精心布局。

微软和 OpenAI 曾经亲密无间|图片来源:微软

微软敏锐地意识到,未来 AI 的发展将极度依赖强大的云计算能力,这正是其 Azure 平台的优势所在。
OpenAI 有人才和技术,微软有钱和平台,一拍即合下,2019 年微软对当时还是一家前沿实验室的 OpenAI 注资 10 亿。
这笔交易的核心不止是资金,更在于 OpenAI 把模型训练和研究工作独家迁移到了 Azure 平台,微软也成为 OpenAI 技术商业化的优先合作伙伴。
2020 年,微软拿下 GPT-3 模型的独家源代码许可,开始着手往自家业务 Bing、Micrsoft 365 和 Windows 中深度集成,试图在 AI 时代抢先起跑,重拾过去失去的市场。
2022 年,ChatGPT 横空出世,成为移动互联网之后第一个现象级的科技引爆点,生成式 AI 点燃了整个科技行业。

ChatGPT 问世后,微软股价一路走高|图片来源:Google 财经

微软近水楼台先得月,OpenAI 也投桃报李共成楼。
2023 年初,双方合作迈入第三阶段:微软追加百亿级美元新投资,继续锁定独家云伙伴、独享源码权限,并参与未来的商业化分成。
紧接着,以 Copilot 命名的 AI 功能和服务系列迅速落地,微软利用 OpenAI 强大的模型能力,把自家核心产品线进行了全面 AI 化改造。凭借与 OpenAI 的深度绑定,微软成功地将自己置于当前 AI 浪潮的核心位置。
押注 AI,绑定 OpenAI,不仅是一次成功的技术投资,更给微软注入了创新基因的强心剂。这既是微软对失落十四年的救赎,也是微软面向未来的信心。
五十年来,微软的叙事充满了戏剧性的转折,从软件巨头到平台霸主,再到错失移动浪潮后的失落十四年,最终凭借云和 AI 实现转型复兴。
五十年里,交织着商业的精明与算计,技术的探索与突破,也有过保守、懦弱和踟蹰。然而每一次的关键节点,凭借着对未来的判断和大胆押注,微软一次次给自己续上了命,闯出了路。
如今的微软,它既有巨头的实力和地位,又展现出初创公司般的开放、敏锐和锐意进取。这或许是它走过半个世纪,依旧站在科技行业之巅的关键所在,也是微软能再有下一个五十年的原因。
浏览量: 19

2030 年 AGI 到来?谷歌 DeepMind 写了份「人类自保指南」

对于所谓的通用人工智能 AGI,人们通常抱着「怕它不来,又怕它乱来」的矛盾心理。而这个困惑,对于正在 AI 军备竞赛中的硅谷巨头来说,就不仅仅是一个「梗」能概括的了。

 

4 月初,谷歌 DeepMind 发布了一份长达 145 页的报告文件,系统阐述了其对 AGI 安全的态度,DeepMind 联合创始人 Shane Legg 署名也在其中。

文件中最醒目的预测,是 AGI 的可能出现时间:

2030 年。

当然,Google 也补充说,这具有不确定性。他们定义的 AGI 是「卓越级 AGI(Exceptional AGI)」——即系统在非物理任务上达到或超越 99% 人类成年人的能力,包括学习新技能等元认知任务。

DeepMind 认为这个时间线可能非常短,发布报告的目的是说清一个问题:如果 AI 有问题,最坏的情况会是什么?我们现在能如何准备?

 

01

 

DeepMind 的 AI 安全保险

 

这份报告中反复出现的一个词是「严重伤害(severe harm)」,并列举了 AI 可能带来的各种灾难场景。

比如,操纵政治舆论与社会秩序。AI 可用于大规模生成极具说服力的虚假信息(如支持某一政党或反对公共议题);可在不疲劳的前提下,与数十万人开展个性化诱导对话,实现「超级社工诈骗」。

实现自动化网络攻击。AI 可识别软件漏洞、自动组合攻击代码,显著提升发现和利用「零日漏洞」能力;可降低攻击门槛,使普通人也能发起国家级网络攻击;DeepMind 提到,已有国家级黑客组织利用 AI 辅助攻击基础设施。

生物安全失控。AI 能帮助筛选、合成更危险的生物因子(如更强毒性的病毒);甚至能一步步教导非专业者制造并传播生物武器。

结构性灾难。长期使用 AI 决策可能导致人类逐渐失去关键政治/道德判断能力;过度依赖 AI 导致价值观单一锁定、隐性集中控制;人类无法判断 AI 输出是否可靠,陷入「AI 输出训练 AI 输出」的闭环。

自动武器部署与军事对抗。AI 被用于自动化军事系统,可能在无监督下执行毁灭性行动;报告强调极端情境下应禁止 AI 系统接触核攻击系统。

DeepMind 将各种风险分为四大类:

恶意使用(misuse)、

模型不对齐(misalignment)

AI 无意中造成伤害(mistakes)

系统性失控(structural risk)

DeepMind 缓解 AI 恶意使用的方法框架 |图片来源:谷歌 DeepMind

「恶意使用」和模型「不对齐」是他们最关心的,前者是坏人用 AI 做坏事,后者是 AI 做事的方式与人类期待不同,甚至 AI 自己偷偷改变目标。

例如,一个被要求预订电影票的 AI 系统可能会决定入侵票务系统,以获得已经占用的座位——要求它购买座位的人可能不会考虑这一点。「不对齐」就是这样产生的,AI 找到了实现其目标的解决方案,但不是人类指导的方式。

不仅仅是「不对齐」,DeepMind 指出了「欺骗性对齐」的风险,即系统意识到其目标与人类目标相冲突,并故意隐瞒其真实行为。最近的研究表明,当前的大型语言模型已经具备此类欺骗行为的能力。

DeepMind 还提到,AI 会「阿谀奉承」。例如,在最近的一篇研究论文中,用户要求模型对一个论点发表评论,并声明他们是否喜欢或不喜欢这个论点,模型对论点的评估与用户的观点 在 80% 的时间内保持一致,这表明模型有很强的谄媚倾向。

除了「讨好人」,当 AI 系统在一些允许自己修改设置的环境中接受训练时,比如通过说用户爱听的话来获得好评,它们甚至偶尔会将这种行为泛化为篡改自身代码,修改自己的奖励函数,让自己获得更多奖励。

为了应对不对齐问题,DeepMind 提出两条防线,灵感来自网络安全与高风险行业(如核能、航空)。

DeepMind 提出两道防线 |图片来源:谷歌 DeepMind

第一防线是在训练模型阶段,让 AI 尽可能「听话」,包括用「放大监督(Amplified Oversight)」和「稳健训练(Robust Training)」等策略,让 AI 监督 AI,使用对抗样本,打造尽可能「对齐」的模型。

第二防线是在部署推理阶段,让 AI 就算「不听话」,也要保证别让它乱来。DeepMind 假设,即使训练过程看起来成功,部署后模型可能依旧会骗过人类,因此需要在现实世界层面设限,将关键操作划分层级,建立多级监控,「将模型视为不值得信任的内部人员」。

这种结构强调:不是让 AI 永不出错,而是即使错了,也不能造成「严重伤害」,这将是底线。

 

02

 

AI 安全界派系

 

DeepMind 这份报告并未介绍很多新东西,各种提法如「对抗攻击」「红队测试」业内已有研究或做法。报告之外,主流 AI 企业和研究机构都在谈「安全」,但每家宣称的路线存在一定差异。

OpenAI 专注于「自动化对齐」研究,使用 AI 本身解决对齐难题,包括如利用 RLHF(基于人类反馈的强化学习)等对齐策略,使其更加符合人类意图与偏好。DeepMind 的报告也多次讨论到这一对齐方法。

但 AI 教父、诺贝尔奖得主 Geoffrey Hinton 明确对 RLHF 持批评态度,他最早曾说,「通过人类反馈进行强化学习,就像是在养育一个早熟得超自然的孩子。」

诺贝尔奖得主 Geoffrey Hinton 辣评 RLHF|图片来源:X

Geoffrey Hinton 还将 RLHF 比喻成「在生锈的车上刷漆」,暗示这只是一种表面功夫。他认为这种方法就像是在尝试修补复杂软件系统中的无数漏洞,而不是从一开始就设计出本质上更安全、更可靠的系统。

「你设计了一个庞大的软件,里面有无数的错误。然后你说我要做的是,我要仔细检查,试着堵住每一个漏洞,然后把手指伸进堤坝上的每一个洞里。」Geoffrey Hinton 如此描述。

Anthropic 提出建立「AI 安全等级制度」,类似生物实验室安全分级的框架。他们希望通过设定模型能力门槛,对应不同级别的控制规则与审查流程。这是一个强调「风险分层管理」的制度工程,但现实中问题在于「模型能力」如何界定,仍存模糊地带。

DeepMind 更像工程落地派,不同于 OpenAI 押注「自动对齐」,也不像 Anthropic 那样强调外部制度。他们的立场是,要建立一个在短时间内能立即部署的系统。

总的来看,DeepMind 并没有提出颠覆性的方式,基本沿用传统深度学习中训练-微调-部署-监控的逻辑,主张的不是「永远不出错」,而是构建结构性的缓冲层,把单点失败变成多级阻断。

「为了负责任地构建 AGI,前沿人工智能开发人员必须积极主动地计划减轻严重伤害。」DeepMind 报告称。

不过,尽管这份报告详细、警觉,但学界并非一致买账。

一些业内人士认为,AGI 概念本身过于模糊,缺乏科学可验证性,因此整套研究基础不牢。Meta 的 Yann LeCun 等人认为,仅靠扩大当今的大型语言模型还不足以实现 AGI。还有人觉得,安全从源头来说,就是不可能的。

另外有学者指出,眼下有更让人担忧的问题:

一个自我强化的数据污染循环,已经在互联网上形成。

牛津互联网研究院的 Sandra Wachter 称,随着互联网上生成式 AI 输出激增,真实数据被淹没,模型现在正在从他们自己的输出中学习,这些输出充斥着错误或幻觉。而目,聊天机器人常用于搜索,这意味着人类不断面临被灌输错误和相信错误的风险,因为它们以非常令人信服的方式呈现。

但无论理念倾向如何,大部分人有同一个出发点:在越来越多技术机构追逐算力、加速训练、攻占领域的今天,AI 需要安全气囊。

所有 AI 公司都在参与解题,但没有完美答案。

浏览量: 13

AI 在移动影像领域,搞了场「无声变革」

张磊,70 后,罗俊,80 后,两位早已超过 35 岁门槛的男士,眼神带着工作的疲惫,但身上却没有流出「中年焦虑」,反而更像刚毕业的学生一般充满了干劲。

张磊是 AI 算法大牛,香港理工大学讲座教授,在深圳带着一个有 30 多号人的实验室,琢磨着如何通过 AI 让手机影像更强。罗俊是他的搭档,任职 OPPO 影像算法总监,顶在前面,拆解各种需求,并把算法工程化,装到手机里。

在 OPPO 前海办公楼里,刚认识张磊不久,罗俊就意识到他是一个从学校里走出来的大牛,身上充满学术气息,他团队的不少人也都是门下学生,工作氛围与公司其它部门有些不同,但它更有凝聚力。

不过,对于具体的手机影像链路和成像等工程方面,张磊团队欠缺实战经验。他的团队强项在 AI,是底层视觉技术和理论的专家。罗俊则从索尼公司开始,已积累了 20 年影像工程经验。

小概率下,两个学识、技能互补的人聚在了一起,在 OPPO 公司携手做一件行业内几乎是从 0 到 1 的事:用 AI,把手机影像再做一遍。

「60 倍」的高难度开局

2022 年,张磊加入 OPPO。这一年底,ChatGPT 横空出世,掀起新风云,代表着 AI 从卷积神经网络向 Transformer 架构的代际跨越,孕育出各种可能。

对于手机端,AI 大模型如何装到小的手机里?更重要的是,AI 大模型能否真的可以帮助手机小尺寸的光学硬件「逆天改命」?这里隐约藏着变革机会。很多手机公司都在琢磨下一步的变化。OPPO 影像算法总监罗俊,对算法竞争力负责,「大模型对手机影像的影响比预判提前了两年」。

两人的第一场 AI 战役,赶上了 OPPO 的 Find X6 项目。通过这个项目,张磊和罗俊初步尝试了用 AI 模型,来处理传统的降噪超分计算,并且用 AI 的方式来替换传统的色彩重建过程。这是对移动影像计算架构的一次革新,用先进的 AI 计算方法,替换了手机中存在十几年的 ISP 计算方式。在传统 ISP 计算对降噪和色彩重建已经达到了极限的现在,OPPO 用 AI 计算开拓出了计算影像的新可能。

小试牛刀 AI 之后,他们决定探索长焦,尝试 AI 大模型。用大模型把 60 倍手机拍摄的模糊照片变清晰,就是一项突破(这个项目后来被称作 AI 千里长焦)。张磊和罗俊知道,对于手机有限的尺寸来说,他们永远不可能要求一颗能够直接拍摄出 60 倍的光学镜头。即使对于 Find X8 Ultra 这样最前沿的手机,6 倍的镜头已经是最长的距离极限。而大模型和光学的结合,甚至是对光学物理规则极限的改写。这让他们无比兴奋。

前提是代码写出来,算法跑通,成熟后再工程化落地,投到市场。

大模型「赛马」

执行任务落到张磊团队身上,成与败,关系到张磊的颜面,更关系到 OPPO 在影像业内的竞争力。

张磊让团队分头行头,利用生成式扩散大模型尝试不同的技术路径。

其中一个方案被称为 CCSR,迭代频数需要 50 步,后面不断优化,经过两个月迭代,降到 15 步,最终降到 3 步,已达到极限。

另一个方案,则被称为 SeeSR。虽然迭代步数略微少,可是输出图像稳定性不如 CCSR。只有减少步数,才可以减少手机能耗,缩短拍照成像时间。

有了初步算法,想试试效果。「最早拿算法效果给手机影像相关的部门的人看,跑完了,大家发现画质几乎没有提升。」但随着算法的演进,生成式大模型的优势逐渐体现,CCSR 达到了预期的效果。

根据项目进程,部署时间挺紧张。大家商量 CCSR 改到极限后,部署同事先着手工程化落地。这已经到了 2024 年 3 月中旬,离 10 月份产品上市只有半年时间。

但 AI 技术进化的频率,还是超出了大家的预料。

有一天,张磊团队看到在图像生成领域用 diffusion 做到单步生成也有不错的效果,这或许也同样可以让图像复原的多步迭代步数减少。在团队尝试做出第一版结果后,张磊颇为兴奋:推理只用了单步,优点明显。随后,张磊猜想另一位同学研究的「文生 3D」使用的分数蒸馏(score distillation)方法,可以加进来。

赶工几周,算法逐渐成型,最后取名 OSEDiff(单步复原)。4 月中旬,大家着手整理实验和写文章,经过团队一起一个月的努力,文章写好投到业内顶会 NeurIPS 上。手机界领先苹果和三星、首创的大模型复原 60 倍长焦图像项目,自此有了算法雏形。

过了一段时间,张磊组织了一次盲选会,准备了 100 张图,分别由单步 OSEDiff 算法和 CCSR 复原而成,发给了认知组、测试组、影像算法组、产品线等各个条线成员,让他们挑选质量更好的照片。单步算法完胜。OPPO 决定「高速路上换发动机」,在项目进度已经基本达到极限的情况下,毅然决定切换更优质的单步算法。

千里长焦项目在 2024 年 10 月发布的 Find X8 上面第一次成功落地,它应用生成式大模型,可以让 60 倍数码变焦拍摄的模糊图像,经过 2 秒钟本地运算后变得异常清晰;又在 2025 年 4 月 2 日发布的 LUMO 凝光影像系统中,脱胎换骨似地升级,把 60 倍甚至 30 倍变焦的效果都大大提升,就像给手机镜头又戴了一幅「AI 望远镜」。张磊与罗俊完成了苹果和其它安卓厂商都没有实现的行业首创。

没有先例的困局

做出千里长焦,张磊和罗俊不满足,虽然这项技术展示了超强的 AI 能力,但「只能算 OPPO 的一个阶段性成果」,真正能让 AI 展示实力、向行业证明 OPPO 的 AI 能力,搭载在 OPPO 全新推出的 LUMO 凝光影像系统,以及搭载这个系统的 Find X8 Ultra 上,里面有 AI 征服手机影像「纽北赛道」的一场新赛事。

设想在夜晚的重庆洪崖洞前,光线错综复杂,远处有各种霓虹灯光,近景有人脸,背对着暗处——夜景人像曾经是很多手机影像工程师的噩梦。兴许 AI 加持,才可以有所突破。

不过,罗俊知道内中难处,首先是数据。没有数据的供给,再力大无穷的 AI,也会力不从心。

一方面,夜间光线稀薄,即使对于手机中最大的镜头来说,采集到的光线数据都不富裕,AI 只能反复利用有限的数据,推理出该有的纯净画面,但结果往往令人失望。另一方面,夜间光线又过于复杂,特别是中国城市 LED 灯光近年来的高速发展,即使对于造价十几万的大块头的相机来说,将五光十色的城市夜景和人物同时拍出彩,也不是一件可以轻而易举完成的事情。

第一个问题,相对还算好解决,因为有既定的案例——相机代表的光学规律,就是答案。提升进光量,提升光源的品质,喂给传感器更多、更优质的数据,这意味着下血本地增加光学模组的性能——简单点说,就是用更大的镜头来吸收更多的光线数据,用更好的镜头把光学提纯,用更大尺寸的传感器去接收消化这些数据。「算法不能脱离光学,所以 OPPO 一直讲软硬结合,硬件决定了画质的下限,算法决定了画质上限。」罗俊一直强调。

在 LUMO 凝光影像中,OPPO 拿出了一颗全新的 70mm 焦段的人像主摄。这颗摄像头的进光量达到了前代产品的 150%,成为同级别中进光量数一数二的「大块头」。不仅如此,为了更优质的光源数据,罗俊的战友——光学团队,甚至「发明」了一种全新分子结构的玻璃材料,对红外光这种「杂质」的过滤性甚至比传统最好的一种玻璃材质还要高 81%,就为了给到 AI 更优质的原始数据。

但第二个问题,夜间光线过于复杂的带来的影响,即使在相机超过 100 多年的历史中,也找不到答案。

在相机还统治摄影的上个世纪,城市夜晚的人造光源,基本只有白炽灯和荧光灯两种类型。而进入 21 世纪,LED 迅速成为光源的主力军,甚至淘汰了前面的两种光源。

LED 光源色彩是多种多样的:暖黄的路灯(约 2700K)、冷白的建筑照明(5000K-6500K)、霓虹广告的彩色光(RGB 混合)可能同时存在。

传统相机的全局色温算法(基于单一白平衡预设或自动检测场景主光源)无法精准适配多区域色温差异,直接导致照片的局部色偏,也就是画面中不同区域因光源色温差异呈现割裂的效果,最典型的是在进行夜景人像拍摄时,人物的肤色会被多重色温的光源严重「染色」。

罗俊和他的同事们,最开始也考虑过使用 AI 技术对画面不同的区域进行理解和分割处理,但缺少原始的色温信息的数据,AI 模型也无能为力。

「不得不去发明一个新的摄像头,来给 AI 提供更精准的色温数据。」这就是在即将发布的 Find X8 Ultra 上,多出的一个摄像头——丹霞原彩镜头。它第一次能够对画面中的色温信息进行空间区域的分割,分别采集各个光源区域中的色温,这意味着后端等待的 AI,第一次对夜晚的光色,有了精准的数据源。对于罗俊来说,更精准的数据,让 AI,第一次在色彩这件事上有了大展拳脚的空间。

然而,被数据喂饱的 AI,又遇到了无法解决的新难题。即使 AI 已经因为丹霞原彩镜头,可以看透夜色的本质,可以将夜色和人物的肤色准确还原,但依然无法看透用户的心。

科学家不懂艺术家

就在张磊加入 OPPO 的第二年,为了让影像技术的角逐,回归摄影的审美,统一照片审美认知,OPPO 专门从一些美术学院、摄像协会挖来了一些摄影专家,成立了一个影像认知组,对好的效果给出定义。

「关于效果的文字性描述,很难量化,无法确定客观标准。」艺术圈与工程界跨圈层对话,中间隔着多少词语与定义的暗礁,谁也说不清。张磊感叹,「有时候,我盯着两张图片看,硬是找不到区别。」

罗俊同样感受到的 AI 算法叠加的困难:「算法是一个黑盒,一些照片输入进去,谁也不知道它会输出什么。而有时这些效果调好了,另外一些效果就因为互斥而出错。」

2024 年 4 月份以来,张磊与罗俊持续与认知组一起对齐标准。罗俊说,这项工作各厂家都在探索阶段,以前从来没有人做过,也就没有工程标准化流程(SOP),甚至连采集多大量的数据集算够,都没有人能说清楚。

而且诸多工作又多了一个核准维度。2024 年初,OPPO CEO 陈明永在内部发起了一项组织变革,「深入一线,创造价值」,所有的工作都要到第一前线去面向用户创造价值,反映到影像上面,调教出来的拍照,特别是人像照片,要以用户喜爱为牵引线,同时还要有 OPPO 自身影像追求。

这让科学家张磊感受到一个不大不小的挑战。比如,前一段时间用户受互联网平台影响,热衷于摆拍,过了一段时间,风潮陡变,年轻人又喜欢上转着圈抓拍。不要小看这一变动,它对影像 AI 算法的调教影响几乎是全方位的。

但好在,几个团队在不到一年的时间里,迅速解决了主观和客观评价不容易的问题。为此,OPPO 甚至全新开发出了一个评价体系的软件。通过这个软件,负责审美的认知同事,可以将用户的输入意见,以及经典摄影审美的案例,转化成客观的数据,交给技术人员来进行客观化地技术调整。比如对于 OPPO 凝光影像对夜景人像肤色的调整,其中包含了丹霞原彩镜头提供的技术上绝对准确的信息,也包括了认知审美对于亚洲各种肤色的研究,甚至还会包括与美妆机构联合研究的一些人因相关的因子。

有了多次的锤炼,张磊和罗俊们已经习惯摸索着进前。一遍遍尝试后,AI 算法成像逐步稳定下来,他们有信心在 4 月份发布的全新 Find X8 系列上推出来,接受用户检阅。

理想,不过时

回首三年多死嗑 AI 影像的过程,张磊有些感慨,教授「再就业工程」在一系列偶然与必然的碰撞之后,逐渐走上正轨。如果没有 OPPO 公司一再地坚持抛橄榄枝,没有 OPPO 对影像的执念,没有罗俊搭建起学术探索与工程实现之间的桥梁,没有 Y Lab 实验室里年轻的博士生们不知疲倦的探索……这里面缺了任何一环,他都可能铩羽而归,回到校园。

2018 年,通过中间人介绍,OPPO 副总裁刘畅找到张磊,邀请加入。OPPO 在技术研发的投入上雄心勃勃,有一系列研发上的大手笔蓄势待发,渴望顶尖人才加盟。

不过,刘畅来迟了,张磊当时已基本确定去一家华东的互联网大公司。刘畅叫上 OPPO CEO 陈明永,一起请张磊在深圳吃了一顿饭。陈明永给张磊留下了平易近人、务实的印象,「没有大老板架子」。

此后,刘畅一直和张磊保持着联系,出差到对方城市,会留出专门时间拜访。在延揽张磊一事上,刘畅把 OPPO 公司「坚持做正确的事」和「长期主义」信条发挥到极致。没有他的坚持,不会有张磊加入 OPPO。

三年过后,张磊打算换平台。跟了三年多的刘畅是他的第一选择,「我信任他」,张磊说:「刘畅是一个非常值得信任的人,我相信到 OPPO 可以实现我手机影像的理想」。

行业内,大家知道 OPPO 在影像上有相当多积累。2012 年,OPPO 第一次为手机上带来堆栈式传感器,极大提升手机传感器感光能力,让手机在暗光环境拍照成为可能。2016 年,OPPO 创造性地提出了四合一像素聚合技术,这甚至奠定了现在所有手机传感器像素使用的规则,让手机能拍出高品质夜景照片。

2017 年巴塞罗那的 MWC 盛会上,OPPO 拿出了世界上第一个潜望式长焦摄像头,这甚至颠覆了全球各大科技品牌和媒体记者的认知。当时的罗俊甚至没怎么听说过 OPPO 这个品牌。当他看到那颗潜望长焦摄像头后,觉得移动影像大有乾坤。

「我想,这也是打动张磊最重要原因」,刘畅认为,「牛人更看重舞台,更在意能否实现理想。」

 

*头图来源:OPPO

浏览量: 10

全球最富 500 人两天损失 5360 亿美元,马斯克最惨;小米 15 周年,雷军重发微博;清明国内短程自驾游是主流|极客早知道

雷军停更 5 日后更新:小米创业已走过 15 年,会继续努力

4 月 6 日,小米公司成立第 15 周年之际,小米公司创办人、董事长兼 CEO 雷军的微博在停更 5 日后更新。

雷军发文称:「今天,小米的创业路已走过了 15 年。这只是开始,我们会继续努力。」(来源:华尔街见闻)

美媒:科技与金融界知名人士组团赴海湖庄园,欲就关税问题与特朗普「讨论常识」

4 月 6 日,据美国消费者新闻与商业频道(CNBC)报道,多名消息人士透露,一批来自科技和金融行业知名人士正前往特朗普位于佛罗里达州的海湖庄园,试图就其推出的税收政策与其「讨论常识」。

报道称,消息人士向美国资深科技记者卡拉·斯威舍披露了相关信息。斯威舍在社交平台 Threads 发文称,「他们(为总统)就职典礼捐出的几百万美元,如今正变成数十亿、很快可能是数万亿美元的损失。」斯威舍还补充说,特斯拉首席执行官伊隆·马斯克也「成了他们的目标之一」。

报道并未透露上述知名人士具体身份。但报道称,由于科技行业严重依赖中国、印度等国制造业、电脑芯片和 IT 服务,特朗普关税政策对科技股造成重创。(来源:澎湃新闻)

 

Meta 新旗舰 AI 模型 Llama 4 Maverick 测试成绩遭质疑,被指针对性优化

4 月 7 日,Meta 公司新发布的 Maverick 的新旗舰 AI 模型,在 LM Arena 测试中取得了第二名的成绩。然而,这一成绩的含金量却引发了诸多质疑。据多位 AI 研究人员在社交平台 X 上指出,Meta 在 LM Arena 上部署的 Maverick 版本与广泛提供给开发者的版本并不一致。

Meta 在其公告中明确提到,参与 LM Arena 测试的 Maverick 是一个「实验性聊天版本」。而根据官方 Llama 网站上公布的信息,Meta 在 LM Arena 的测试中所使用的实际上是「针对对话性优化的 Llama 4 Maverick」。这表明,该版本经过了专门的优化调整,以适应 LM Arena 的测试环境和评分标准。

事实上,研究人员在 X 上已经观察到了公开可下载的 Maverick 版本与 LM Arena 上托管的模型之间存在显著的行为差异。例如,LM Arena 版本似乎更倾向于使用大量的表情符号,并且给出的答案往往冗长且拖沓。

Meta 公司以及负责维护 LM Arena 的 Chatbot Arena 组织暂未对此做出回应。(来源:IT之家)

 

摩根士丹利预测:苹果手机价格或飙升,美关税政策重创苹果公司供应链

美国总统特朗普宣布「对等关税」方案后,苹果公司股价连续两个交易日遭遇重挫,市值大幅缩水。

4 月 6 日,根据投行摩根士丹利的测算,对华加征关税将使苹果公司每年增加约 85 亿美元的成本。路透社则援引分析人士的话称,如果苹果公司将关税成本全部转嫁给消费者,iPhone16 Pro Max 的在美零售价将从现在的 1599 美元,上涨到 2300 美元(约合 16750 元人民币)。

在特朗普第一个任期内,苹果公司开始推动供应链多元化,但特朗普政府计划对东南亚国家普遍征收高额「对等关税」,无疑将重创苹果公司的供应链。(来源:央视财经)

 

亚马逊上线「Buy for Me」服务,用 AI 帮用户从其他电商平台代购商品

4 月 5 日,亚马逊宣布在美国市场向拥有 Prime 订阅的顾客逐步推出一项「Buy for Me」服务,主要帮助用户从其他电商平台代购商品。亚马逊声称相应代购服务完全由 AI 进行操作,以便保持用户隐私性。

用户可直接在亚马逊 App 中进行搜索,即可搜索到来自其他电商平台的产品,用户仅需输入收货地址等信息,即可下单要求亚马逊代购相应产品。

亚马逊声称,虽然该公司能够帮助用户代购商品,但该公司不对这些代购的商品质量负责,只负责交付,用户需要联系商品品牌本身进行退换货。(来源:IT之家)

全球最富 500 人两天损失 5360 亿美元,马斯克最惨

据彭博社 4 月 4 日报道,在美国总统特朗普宣布关税新措施引发全球市场暴跌后,全球最富有的 500 人两天内遭遇了「彭博亿万富翁指数」史上最大规模的损失。报道说,从 4 月 3 日股市开盘到 4 日收盘,财富榜上的亿万富翁们总共损失了 5360 亿美元。

其中,4 日当天,亿万富翁们的财富缩水了 3290 亿美元,创下 2020 年新冠疫情高峰以来的最大降幅。在「彭博亿万富翁指数」追踪的亿万富翁中,近 90% 的人的财富在 4 月 4 日出现平均 3.5% 的缩水。

报道称,马斯克成为损失最惨重的一位,特斯拉股价 4 月 4 日暴跌超过 10%,马斯克的净资产较 4 月 3 日股市开盘时缩水 310 亿美元,其今年以来的总损失达 1300 亿美元。亚马逊创始人杰夫·贝索斯损失 234.9 亿美元,Meta 首席执行官马克·扎克伯格则损失 273.4 亿美元。(来源:新浪科技)

 

飞猪:清明假期国内短程自驾游是主流,租车订单量同比增长 41%

4 月 6 日,据飞猪发布的《2025 清明假期出游快报》显示,国内游人均支付金额同比去年增加约 5%,省内跨市、邻省跨市的 500 公里中短程自驾游是主流。

清明假期国内租车订单量同比增长 41%,平均租车时长为 3.1 天。目的地方面,飞猪数据显示,上海、北京、杭州、广州、深圳、成都、南京、重庆、武汉、西安等城市最热门,张家界、景德镇、清远、舟山、台州等靠近热门城市圈的二三线城市增速最快。(来源:华尔街见闻)

 

任天堂 Switch 2 或通过「双重价格」防止倒卖

4 月 6 日,据日经中文网报道,任天堂针对定于 6 月 5 日发售的新款游戏机「Nintendo Switch 2」,分为只支持日语的「日语・国内专用版」和可使用英语等的「多语言支持版」,设定了不同的价格。

日本国内版价格为 49980 日元(约合 2492 元人民币),海外版价格为 69980 日元(现汇率约合 3489 元人民币)。报道称,虽然任天堂并未正式表态,但「双重价格」有可能是防止倒卖的措施。

任天堂 4 月 3 日发布消息称,将于 4 日下午以后在自家的官方销售网站上以抽签方式销售 Switch 2。销售对象包括日本国内版和海外版。能在日本国内的家电量贩店和电商网站上买到的产品仅为日本国内版,海外版只能通过官方销售网站购买。(来源:IT之家)

官方首次确认:小米 15S Pro 要来了

4 月 6 日,在小米 15 周年纪念日,小米联合创始人林斌发文后还在回复网友时确认了小米 15S Pro 新机的存在。这是该机第一次得到官方确认,预计本月发布。

小米 S 系列旗舰上一款还是 2022 年的小米 12S,时隔近 3 年时间终于回归。根据爆料,该机将继承小米 15 Pro 的外观设计,预计屏幕等配置也基本保持一致。正面配备 2K 全等深四微曲屏幕,后置徕卡三摄,内置 6000mAh 以上超大电池。

值得注意的是,这次小米 15S Pro 还肩负一个重要使命,爆料称该机很可能用上小米全新自研 SoC。

这款芯片基于台积电 N4P 制程工艺打造,采用比较传统的八核三丛集的设计,综合性与骁龙 8 Gen1 相当,甚至有希望对标骁龙 8 Gen2。

另外,UWB 技术也讲在小米 15S Pro 机型上回归,可以深度联动小米 SU7 系列汽车,让手机更精准的解锁和锁车。(来源:快科技)

 

 

苹果 iPhone 17 Air 新机模曝光,直观展示 5.5 毫米纤薄机身

4 月 6 日,博主 @i 冰宇宙 发文展示了根据传闻尺寸制作的 iPhone 17 Air 模型机对比照片,直观地展示了机身的厚度情况。

该博主此前称 iPhone 17 Air 含摄像头凸起总厚度 9.5mm(凸起 4mm,机身 5.5mm),与分析师郭明錤报告一致。对比现款 iPhone 16 Pro Max 厚度 8.25mm(不含凸起),若 Pro Max 保持现款尺寸,Air 厚度确可实现「减半」。

随后,博主 @ 数码闲聊站 发布一张机模渲染图,展示了苹果即将推出的 iPhone 17 Pro 系列手机设计,直观展示了该机「横向大矩阵」摄像头模组,考虑到该博主发布内容有较高准确度,该图预计可以反映最终的手机设计。(来源:IT之家)

 

比亚迪汉L、唐L 实车亮相,「划时代电动车该有的技术」即将揭晓

4 月 6 日,比亚迪官宣汉L、唐L 车型将于 4 月 9 日 19:00 上市。在最新预热视频中,比亚迪展示了两款新车的实车,并称:「超高转速、智能底盘,什么是划时代电动车该有的技术?」。

两款车型均基于比亚迪超级 e 平台打造,该平台具备 1000V 高充电电压、兆瓦闪充电池,可实现 5 分钟充电 400km,配备 30511rpm 全球量产最高驱动电机,单电机最高 580kW,零百加速 2 秒级,最高车速超 300km/h。

其中,汉L EV 预售价区间 27-35 万元,唐L EV 预售价 28-36 万元。(来源:IT之家)

男子开启辅助驾驶时双手玩手机:被交警拦下警告

近日,南京交警查获一名驾驶员在辅助驾驶模式下双手离开方向盘操作手机,于是将其拦下并进行了安全教育。

被交警拦截后,驾车男子还多少有些不服,辩称是车子自动走的,这才「解放双手」倒腾起了手机,民警现场对其进行了批评,由于男子是初次犯错,因此给予警告处理。

警方提醒,当前不少汽车具有辅助驾驶功能,成为驾驶人的得力助手,然而,部分驾驶人误将辅助驾驶功能当做分心玩手机的理由,不及时关注路况,形成交通事故隐患。

同时依据《道路交通安全法》,机动车驾驶人违反道路交通安全法律、法规关于道路通行规定的,处警告或者 20 元以上 200 元以下罚款。(来源:快科技)

浏览量: 8

AI 正在重塑快手商业化体系

大模型落地,还在加速。

3 月 31 日,快手在长沙召开 2025 磁力大会,宣布将磁力引擎打造为「下一代 AI 智能商业引擎」,从电商、内容消费、本地生活、品牌营销等核心业务场景切入,打造一条新的全 AI 商业链路。

自数字营销行业诞生之初,它就一直是个性化、智能化算法技术的「练兵场」,不仅因为这一领域需要算法,更在于这种效率提升能实打实地转化为商业效益。

现在,快手的磁力引擎,已经能够覆盖从内容生产、投放到匹配的全链路,并为各种垂直行业提供 AI 解决方案。可以说,整个数字广告行业正在进入一个全维度 AI 时代。

 

AIGC 让广告内容制作「升维」

过去 20 多年,广告是整个互联网行业最重要的现金牛,为技术发展提供了最多的动力。几乎所有的互联网巨头,都依靠广告作为最主要的收入来源。

但在数十年里,线上广告平台所有的革新,主要是投放和匹配的核心,即「让内容找到正确的观众」,广告制作本身依然停留在相对传统的阶段。因为高度依赖创意和素材生产,所以存在门槛高、周期长、试错成本高的问题,也存在一定的同质化。

过去几年,AIGC 技术已经在深刻改变这一领域。越来越多商业素材,特别是插图、配音,都开始广泛采用 AI 生成,以降低商用成本,规避版权风险。据华尔街日报报道,Meta 的 AI 图像生成工具上线后,帮助广告主规避了 90% 的版权风险。各家数字广告平台都在通过生成工具帮助中小广告主降低成本。近期,快手创始人程一笑在新季度财报电话会上表示:根据快手内部测算,AI大模型预计可以把客户的短视频营销素材制作成本降低60%-70%甚至更高。

现在,AIGC 已经开始融入到广告制作的每个环节,从创意脚本、内容素材,再到生成实时交互……这种变革意味着 AI 从单点的效率工具,正在演变为一种创意基础设施。它的意义不只在于降低制作成本,更增加了广告的投放维度,让广告不再局限于单纯的视频或图文,而是可以升维到具有情感互动能力的数字人直播,智能客服等等。

过去一年,快手的技术聚焦重点之一就是数字人的「情感表达能力」,迭代后的女娲数字人,能够实时响应观众提问并保持自然互动,显著提升直播转化效率。2024 年第四季度,快手全平台 AIGC 短视频素材和数字人直播服务的日均消耗量已超过 3000 万元。

对广告主来说,AIGC 最大的应用价值不只在于降低成本,即便今天的 AIGC 素材生成效果已达到了良好水准,也仍有大量内容在通过实拍等方式制作。但 AIGC 在传统广告的生产端,也能发挥很大的作用。

基于 AI 能力,广告主可以生成大量不同方向的创意脚本,通过大量素材的交叉投放、评估效果,最终确定未来内容制作的投入方向。

过去数字广告行业的大部分成果,几乎都归功于「效率优化」,通过精准投放和效果评估,实现投放的效果最大化。而现在,AIGC 可以从生产端就开始介入,使它不仅成为内容素材的生成工具,也可以为制作投入进行前置的「验证」。

 

AI buff 加成:投放从人工到智能

所有的数字广告系统,核心都是「流量效率」的优化,其中一侧是平台自身的分发调优,另一侧则是广告主的竞价和匹配。

「卖流量」的生意已经存在了数百年之久,从纸媒时代的平面广告,电视时代的视频广告,再到数字广告,它们都是在对广告和受众进行细分。这些「匹配算法」经过几十年的发展,已经变得非常成熟,比如体育节目后面总是跟着汽车广告,儿童视频则总是有玩具广告……

但问题是,传统的垂直匹配颗粒度太低了,其中还包括很多刻板印象。自从内容算法诞生之后,有越来越多的结果都是「反直觉」的,比如一些户外运动的爱好主力其实是女性而不是男性,看上去低龄受众的可爱玩具,实际备受年轻的成年人追捧。当下时代,可以说每一天都有新的意识在形成,新的场景等待被挖掘。今天很流行的一个词「网感」,其实就是感知和归纳这些新意识的能力。

所以,进入 AI 时代,下一代智能投放 agent 最重要的能力,应该是「发现盲点」的能力。

当下,广告投放操盘已经进入复杂的博弈阶段,数百个素材内容、数十个投放目标以及多元出价工具的叉乘组合,让投放的复杂程度远超人脑决策的极限。

所以,新的商业投放策略,应该是精细的、全域多目标组合,且可以多体裁、长周期地投放,在过程中不断逼近理想的转化效果。如果说过去的广告匹配是独立的多次「对焦」,没对上就再来一次,AI agent 则让这个过程真正变成了「连续追焦」的过程,更容易达成调控目标,也更便捷。

2024 年,快手基于大模型推理上线了全自动投放(UAX)能力,过去一年,UAX 的客户渗透率已接近60%、投放冷启成功率提升了25%。全站推广 Agent 为投放商家撬动了 60% 以上的自然 GMV 增长。

现在,快手的营销推荐大模型已采用思维链决策学习技术,能够模拟人类认知过程逐步分析复杂问题,洞察用户行为与商业行为的内在联系,从而匹配用户购买需求与商品核心卖点。它具有一种「俯瞰舆论场」的能力,发现那些最新的热点,甚至挖掘出盲点。

在内容匹配上,广告主也不再需要根据已有的市场调研结果来进行人群匹配。磁力引擎能对广告内容进行自主的多模态大模型理解、匹配,增加推荐精度和转化率,提升匹配效率,让冷启动变得更容易。

 

让大模型创造新的价值增量

当下,AI 落地的最大障碍,就在于它还没有创造出明显的「价值增量」。

大部分大模型应用,都依然停留在对人力的模仿、替代,对很多普通用户来说,AI 带来的「危机感」要大于「价值感」,这将是大模型进化成通用人工智能道路上的最大长期阻碍。

在那些相对垂直的场景里,如电商经营、内容消费、本地生活等领域AI 大模型对现有系统的优化提升要具体、确切得多。一切都可以被更准确地衡量,也就意味着切实地价值增量。

过去一年,AI 对商业营销的加成已经缔造了快手带来了商业生态的繁荣。平台商业化收入同比增长超 20% 至 724 亿,合作客户数也同比增长 50% 以上。就连「广告」这个概念本身也在改变,曾经分野明确的「节目」和「广告」,界限正在变得越来越模糊。越来越多商业内容,因为与用户需求的紧密贴合,本身就变成了一种内容。

尤其是在短剧、小说、小游戏这些内容领域……内容的创作、生产、投放、营销、消费,已经形成了完整链路,深刻融入了平台。2024 年 Q4,快手内容消费行业获得迅猛增长,其中短剧的商业化消耗同比增长超 300%。截至目前,短剧的单日消耗峰值已突破 3000 万,小游戏的日消耗峰值突破 1200 万。

而这些新垂类背后,都能看到 AI 技术的影子。无论是对用户偏好的分析预测、内容素材的生成,还是发布策略的制定,都已经离不开 AI 大模型的支撑。

未来,AI 将持续带动内容形式和垂类创新,让内容变得更具互动性,也开拓更多新的工具品类。比如针对电商、本地生活类产品,可以通过 AI 智能客服实现即时互动、深度转化私信。或在品牌营销领域,可以用 AIGC 生成玩法融入到品牌宣发里,让受众参与进来,实现自己的个性定制。

这种革新,对广告主、用户,以及大模型技术本身,是一次「多赢」。商业项目得到曝光,用户收获价值,大模型则得到了效用的验证。这种循环模式,还在延伸到更多领域。通过这种垂类的反馈优化,反而能帮助 AI 大模型技术突破 C 端应用的鸿沟,形成正向的创新反馈闭环。

可以说,通过全面融入 AI,快手将有机会带动商业引擎进入一个全新维度,为平台乃至整个数字商业经济注入更多新活力。

浏览量: 15

文章分页

上一页 1 … 28 29 30 … 84 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间