Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

标签: 科技

瞄准家庭具身,云鲸开始提速

整个双十一,云鲸创始人张峻彬被问得最多的问题是,云鲸的产品和追觅、石头、科沃斯有什么区别。

当每天被问几十次的时候,他认定,「这是我最不想回答的一个问题」。在扫地机器人市场上,云鲸确实是一家很不一样的公司。

2024 年底,扫地机器人的喋血江湖故事依旧没有结束。

等待「见分晓」的过程也许是长了一点,熬出了股价一度冲破千元的公司,熬出来了一个又一个原本不存在的品类和创新,也让很多原来名不见经传的公司熬成了独角兽。

通常,故事进行到这一阶段,往往会出现重要拐点——那个负责结尾反转的人物开始显露端倪。

而云鲸,一家如此「另类」的公司,此时变成了最有可能的答案。

作为行业里第一个做出自动洗拖布扫地机的机器人公司,云鲸的起步颇为亮眼。此后,又第一个研发出上下水装置、脏污识别技术,以及防缠绕滚刷,几乎每一个重要的技术创新,云鲸都走在了行业之前。

但这家公司的过往让人疑虑,因为云鲸又是行业里出了名的「慢公司」——除了资本框架搭得慢之外,在竞品早就开始卷机械臂的时候,它并没有第一时间跟进;在其他公司一年推出几十个新品时,云鲸坚持每千元价格带只出一两款产品;在竞争对手早就突破 1000 人的时候,云鲸才开始着手将 200 人的团队进行扩张。

三年前,曾有投资人对我们表达过看法:认同云鲸的技术和产品,「在行业里有独特性」,但却纠结于云鲸在竞争和资本端的表现,认为其不够激进。

但怎么做才是对的,也许答案从来就不在当下。如果还在互联网的黄金时代,只要结果是好的,那么所走的路径就没有对错之分。不过当行业走到分水岭的关键节点上,创始人的主张就显得格外关键。

和很多背靠大公司,在襁褓中长大的硬科技公司不同,张峻彬始终在安全感驱使和内核驱使中寻找平衡。

混乱的战场上,张峻彬很少将其他公司拉到对手席——在产品和战略都趋同的年代,经验主义似乎已不再重要,出场顺序也不甚关键,但「人总得清醒一点,得知道现阶段什么是真正好的东西,三五年后什么是好的东西」。

当别人很快的时候,云鲸选择慢慢来,当整个行业因为过速奔跑而气喘吁吁,疲惫不堪时,云鲸正准备迎来自己的提速时刻。

如果说找到自己合适的赛道,并快速创新,来自于张峻彬的安全感,那么坚持长期主义,以及向内求索,这包裹的是一个自由又坚定的内核。

01

长期产品主义:别人都做的就是对的么

云鲸最近谈成了一笔数亿元的融资,投资方为深圳和无锡两大国资。但起初,云鲸的融资进行的并没有想象中顺利。

融资刚启动时,张峻彬谈的依旧是市场上的投资机构。但聊了一圈下来,很多投资人都有疑问,云鲸明年的营收是否还能翻倍,「今年有国补加持,云鲸的增长确实迅速,很多人担心这是一个短期主义的事情」。

事实上,扫地机器人行业确实正处在一个模糊的时间节点上——当发展到下半场,陷入焦灼的鏖战时,当增长普遍开始放缓的时候,这是否还是一个值得投资的行业?

信奉长期主义,无论是对创业者还是投资人,在此刻都显得尤其关键。创业初期,曾有多个家电大厂找到张峻彬,希望云鲸做「贴牌」。彼时正是竞争的关键时期,云鲸的资金也很紧张,帮助家电厂商做新的产品线快速回笼资金,确实是一个合理化方向。

但考虑再三后,张峻彬和投资人李泽湘都拒绝了,坚持做独立品牌,选择软硬件和算法全自研。在张峻彬看来,「主动权掌握在自己手里,长期主义的坚持坚守是很重要的」。

全自研的结果就是要打通供应链路,但对于初期的云鲸,如何打动供应链给出更好的 bom 和更多的资源,是进入「供应链地狱」的第一战。随后疫情来临,很多供应商优先服务大企业,放弃小企业,张峻彬组织团队屯了 100 万个口罩,用来交换上游供应链上的各种零部件。时至今日,张峻彬依旧感慨,「2020 年是挺苦的,外界会有很多消息去扰乱我们的决策。对内还要想办法把生产保住,否则体量支撑不了销量,可能大家都不会知道云鲸这个品牌了。」

最焦虑的时候,张峻彬每天「睁开眼睛」就会接到投资人电话,「小米明天要发一款 1999 的机器,你们怎么比」,有时是其他品牌又做了新技术时,问云鲸为什么不做。

即使到了今天,这些提问依旧存在。为什么不早点做边刷外扩,以及是否要做中央集尘——这些功能竞品早在两年前就用上了,并作为最大卖点来发布。

做,并没有太大的技术难点,成本也不是最值得考虑的。但张峻彬在这些问题的反映上显得颇为固执。「边刷外扩实际使用效果有宣传上那么大吗?增加了成本,而且让机器的返修率变得更高,」张峻彬称,「对于长期主义来说,这是好事吗」?

起初没有做中央集尘,也是类似的原因。后续云鲸的做法是,设计了机器人轻集尘系统,独创了尘袋毛发压缩技术,无需垃圾转运,减少站管道滋生细菌。「这并不需要很高的技术和成本,但这么做比直接做中央集尘,显然更有脑子」,一位行业观察人士称。

在云鲸内部,一个产品或功能,通常要用半年到一年的时间来做研究和打磨。张峻彬从不会考虑自己是否晚进入某个市场——在扫地机器人行业,云鲸是少有的 NPS(用户推荐率)为导向的公司——「扫地机器人最终要回归到用户的角度,谁面对消费者,谁才有最终话语权,」张峻彬说。

他在接受媒体采访时曾回忆,「2016 年云鲸刚成立时,和我们一起注册的扫地机公司有 300 多家。我们 2019 年才发布拖地机产品,那时候市场上已经有几个巨头,且市场格局基本稳定。」云鲸反而是靠产品创新、用户价值,硬生生挤入了行业 Top 阵营。

与 J1 问世时,云鲸凭借创新,定义了「拖地机」这个品类不同。在那之后的两年里,云鲸没急着推新品,而是针对 J1 的软硬件进行了多次迭代,用户体验也得以提升。

虽也曾被质疑过研发缓慢,但只有云鲸团队自己知道,他们正是在这段时间里离用户越来越近了。

在张峻彬看来,仅仅可以赚钱但是并不对用户产生价值甚至是负向价值的事情,云鲸不会做,「我们享受做『利他性创造』,这就是我理解的朴素的长期主义了」。

如今,重新定义一个好产品,想赢也并不容易。张峻彬很清楚云鲸当前的竞争处境,「云鲸的产品要么不出,出了就是首战即决战」。

在特定的竞争阶段里,当其他品牌都在卷 SKU,甚至一年发布几十款新品时,云鲸没有急着跟进。因为扫地机器人至今渗透率并不高,还处于教育市场的「概念期」,云鲸的策略是,每千元价格带,「每年只做一两款产品,让不同预算的用户都能找到合适的机器,并且真实地感受产品」。言下之意,相较于十条产品线都是行业第十,把一到两条产品线做到行业第一第二,并且让用户养成使用扫地机的习惯,反而更有价值和意义。

02

长期主义竞争:成长就是苦撑过去

从创立开始,云鲸的成长,也和其他公司错开了节奏。

云鲸创办于智能硬件创业的下半场。当追觅、石头等竞争对手已经成为小米生态链公司时,张峻彬像是一个「外行人」,毕业之后他没选择上班,而是背着双肩包、带着眼镜,频繁飞北京,见了大概二三十家投资机构,但没多少人搭理。

当外界认为小米生态链已经「应投尽投」,大量主流的 VC 都认为消费电子已经没有机会的时候,张峻彬遇到了李泽湘,这才给了云鲸一线生机。

行业里都说李泽湘是一个「不那么 VC」的存在,所以一个「出格」的投资人和一个不一样的创业者的相遇,只能说是历史的巧合。

纵观扫地机器人头部几家公司的创始人,其画像似乎正恰如其分地对应了中国投资圈在过往几年里偏爱的创业者类型。

早些年间,投资人更喜欢投产品经理,普遍认为这种人懂产品,能快速拉齐技术团队。典型的就是石头科技的昌敬,在成立石头之前,昌敬曾在微软、腾讯和百度等大厂的产品部门就职。当资本市场走到中期,性格狂狷、自带话题属性的创业者则更受到青睐,最典型的就是追觅创始人俞浩。

而在投资人已经为过往经验高额买单、资本触手收缩的今日,不止一位投资人称,「谦虚低调,靠谱扎实,坚定走长期主义的人,如今可能会更容易拿到钱」。

如果规则是存在的,那么苦熬多年后,云鲸也许终于将等来和机遇的珍贵吻合。

张峻彬从中学时代就开始研究机器人。创业近十年,他出于个人兴趣做的很多不被外人熟悉的产品,其实也都有机器人的影子。虽然他多次设想过,如果毕业后先工作几年,会不会处理很多问题时会更有经验。但现实已经难以预料。

中国互联网行业有一个很难打破的魔咒——公司做大有很多原因,风口、资本、政策,以及微妙的玄学,但创始人的成长往往跟不上公司的成长速度。不过在云鲸和张峻彬身上,显然出现了例外。

创业从不是一蹴而就的事情,一开始,张峻彬靠着技术所带来的安全感,摸索着做相对正确的事情。

其实,云鲸 J1 发布之前,市面上也曾有宣称可以自动拖地的产品,但因做得不够智能,用户使用体验差,产品未能在市面上流行。

创业前三年,张峻彬的全部精力都放在了研发上,经常带着只有十个人的研发团队吃住在公司。当时市面上的机器人拖地路径都是从基站附近往外拖,经常把拖干净的地面又弄脏。因此,张峻彬团队重新设计一套算法路径,让拖地机中途返回基站。但这对基站定位的准确性要求极高。为此,团队又研发了长期更新维护地图的技术。

2019 年,J1 临近发布前,张峻彬突然决定延期,因为他发现了一个令他无法忍受的产品细节问题:两块圆形拖布在设计时中间有一条缝隙,这会导致拖地时抹布中间的位置拖不到。

但当时公司账上资金已经很紧张了。最终,张峻彬向银行贷了数百万元,将圆形拖布改为三角形,产品最终推迟了三个月上市。

如果说产品问题还在这个理工生的控制内,那么接下来的架构问题,才是更严峻的挑战。

2021 年,云鲸的竞争对手都已经达到千人规模,例如科沃斯当年仅研发人员就有 980 人。但云鲸当时还不到 200 人,「我们当时账面上只有一个多亿,石头和科沃斯人数是我们的十倍,现金是我们的几十倍。如果你没有长期主义的信念支撑,这其实很难玩了」。

那个阶段,张峻彬每天都很焦虑,「安全感基本没有了,内核也非常模糊,我根本回答不了『我是谁,我要去哪』的问题」。

融资,同时将组织架构升级到跟对手匹配的 R&D 人数,是云鲸唯一的选择。但人多了就会管理混乱,甚至管理层也经常对一件事有不同的意见,「我觉得他们说的都对,但每个人想法都不同,也都很坚持,就会有很强的管理上的冲突」。

猝不及防的意外也曾让云鲸差点中道崩殂。21 年 1 月 1 号零点,云鲸遭遇了一次重大的宕机,短时间内,有近一半机器直接变成「砖头」。「当所有客服都接不过来的时候,用户就会打给我。每一秒都有电话进来,听对方破口大骂。我整整一周没睡觉」。张峻彬说,有一天晚上,他看着天花板,发现心率一分钟有两百多,「我觉得我可能要撑不到第二天早上了」。

一时之间,云鲸搭建了 7 条维修线,最终用 3 周时间解决了这件事,「直到现在我都没有计算过当时到底花了多少钱,损失了多少」。

21 年还有一件大事,整个行业都遭遇了半导体风波,云鲸也差点交不上货。所以那两年时间里,张峻彬和吴一昊带着团队经历了产、研、供和营销板块的组织升级。「到 2023 年 9 月,基本把组织问题全部解决完,与此同时,产品创新开发平台体系也逐渐成熟,公司发展开始提速」。

创投圈里曾流行过经典的一个理论,产品看一年,战略看两年,组织看三年。从 19 年推出云鲸 J1 开始,到如今,正好六年时间。在这段相对漫长的时光里,从没上过班的张峻彬,以近乎巧合的方式,度过了一个从安全感驱使,到迷茫,到找到自己的精神内核,到形成自己的文化价值观的过程。

「我自己也有过很多抱怨,创业真不是人干的事,但抱怨之后,咬紧牙关把所有人真正凝聚起来,苦撑过去」,张峻彬说。

成为行业头部公司后的此番回忆,更像是一个幸存者偏差的故事——整个消费硬件赛道的生存率可能还不到 1%——失败的人要么把产品做出来以后没办法量产;要么量产了产品,却没有办法卖出去。

换句话说,外界想复制云鲸的成功,很难。

时至今日,张峻彬依旧喜欢打磨产品。和竞争对手发布新品、跨界和资本运作多线程忙碌不同,张峻彬的时间分配让他看起来不像世俗意义上的创业者。每两到三个月,他只做一件事,例如降本增效、调整架构,或者思考上市。聚焦这些事,直到打透它,「在这个过程中,一些事情被快速迭代了」。

03

家用机器人的未来在云鲸?

明势资本创始合伙人黄明明还记得 2015 年第一次见张峻彬。当时美国机器人品牌 iRobot 在国内已经很火。所以黄明明问了他两个问题:为什么要做拖地机器人,以及如果科沃斯、小米等巨头也来布局这个市场,「你要怎么办」?

张峻彬回答说:「75%的中国家庭是没有地毯的,所以对拖地更有需求,且没有真正被满足。我们一定不会走价格取胜的策略,而是通过自研的技术和产品,让用户是因为真的喜欢而购买。」

黄明明有种莫名的感动:「先别管他能不能做成,我愿意投资这种敢于追求非共识的创业者,他想做的是真正科技驱动的智能产品公司,而不是消费电子。」

同样的场景还会再续,扫地机器人赛道里「追求非共识」的张峻彬这次能否依旧率先解答:当行业发展抵近围墙的此刻,是否转过弯道依旧有一条新的路?以及真正的智能产品,将以什么模样存在。

具身智能显然是一个答案。创投行业曾将具身智能的希望放在人型机器人身上——今年年初,这个行业也用密集的融资消息验证了它。但是,人型机器人发展已过三年,至今依旧没有切实的落地场景。

而扫地机能回答这个问题。家庭服务机器人也未必要长成人的形状。目前的扫地机器人赛道,可以看作是家庭服务机器人的入场券,扫地机是进入大体量家庭最好的产品形态。

按张峻彬的规划,云鲸需要聚焦家庭室内场景,一切有助于未来家庭服务机器人的产品都值得布局。这样的举措,一方面能将清洁的心智深入全球,另一方面通过品类布局形成品牌影响力和渠道优势,才能为未来家庭服务机器人铺路。从产品维度来看,目前扫地机看似火热,但实际上仍有大量产品功能还没做完。

家庭服务里面,收纳、清洁和烹饪,占据了家庭几乎 90% 以上的工作,而收纳和清洁占据了家庭工作的 60%。把收纳和清洁做好,可以将清洁机器人在家庭的渗透率提高至 80% 以上,而渗透率提高后势必会有暴涨。用户基本盘扩大和技术进步,无疑会形成家庭服务机器人的正向循环。云鲸所关注的未来几大服务,就已经包含了空间清洁、整理收纳,以及人机情感交互。

而云鲸已经在行动。云鲸今年推出的逍遥系列,通过大模型语音助手下达清洁指令,机器人已经在尝试依靠自己的语义理解去行动、识别、完成清洁,这已经是一个具身智能的雏形。此外,云鲸从 21 年开始布局的「双目」方向,更是奔着具身智能的方向去的。

这跟特斯拉和 FSD(完全自动驾驶)的逻辑相似——先卖车才有数据、有数据才会有无人驾驶。

「谁拥有数据、谁拥有场景、谁拥有用户就具备了具身发展的能力。」张峻彬说,「我比较肯定我们会在具身智能这个赛道上成为世界级伟大公司,到时候买云鲸的人就像是第一批买苹果手机的」。

就像是十几年前,摩托罗拉时代,人们认为手机的发展已经基本到头了,但随着苹果手机出世,一个新的世界在所有人面前徐徐展开。

目前,第一个做出擦地机器人的过往,云鲸很少去提及,一些隐藏的功能,这家公司也很少对外披露。因为在张峻彬看来,云鲸已经到了高速发展的阶段,最难的时候已经过去了。当行业的热闹过后,即将迎来洗牌环节时,这意味着,现在正在进入一个新蓝海的觉醒时刻。

如果长期主义和自由内核,是张峻彬相信云鲸能走到最后、做到最好的原因,那么「利他主义」,则更有可能给云鲸填上一点「运气」——张峻彬从小就对「通过技术产生很大价值」的事情感兴趣,现在他还常常会想起,初中时,他曾帮视障人群做了一款智能阅读器,「当我能帮助他们生活得更好,让他们接触到更广阔的世界时,我会觉得很有意义。」

如果扫地机器人未来必有一战,张峻彬觉得,云鲸一定会站在决赛场上。当然,决赛之后,云鲸或许会迎来全新的时代、市场和挑战。

浏览量: 51

具身智能需要什么?一场学术年会的讨论给出了一些思考

作者 | Li Yuan 

编辑 | 郑玄

 

最近几个月,中国机器人的进展引起了全世界的关注。

先是 11 月的珠海航展,无人机、无人车、机器狼引起了全球「极客」的讨论,就连马斯克都忍不住转发无人机蜂群表演并评论载人装备已经过时;最近几天,他又点赞了宇树科技新发布的 B2-W 机器狗,火遍全网的视频中,这只中国机器狗各种体操动作、上下坡飞跃不在话下,人们纷纷惊叹这家成立刚满八年的中国公司已经超越了波士顿动力。

从「靠开源吃饭」到「遥遥领先」,技术的不断迭代,让市场有了态度鲜明的转变,这似乎也让我们窥视到了中国机器人赛道弯道超车的可能。

不过,在最近在参加一些专业活动和业界学界进行交流时,笔者总能听到一些新的共识:机器人的未来,技术决定产业的下限,「场景+需求」是未来的上限。

 

01

一场挑战赛看到未来人的期待:

极限犹可突破,至真亦不可止

 

上周五,美团机器人研究院在深圳举办了学术年会。

会上,一个细节让笔者印象深刻:一支叫做「参与就很棒」的队伍获得了一项专业奖。颁奖嘉宾调侃道:「队伍的名字还是要好好起,说不定获奖了就要『社死』。」不过,这个名字或许比在场的许多其他队伍的名字,更贴近比赛的本质。

低空经济是当前机器人应用的重要领域之一,也是国家重点发展的领域,潜力毋庸置疑。对于无人机的学术研究,尤其是对于有想法的在校生而言,能够在落地场景验证想法十分重要,但多数的现实是技术找不到场景去验证。

通过美团的低空经济智能飞行管理挑战赛,学生们获得了难得将想法在大范围场景验证的尝试机会——大赛提供美团研发的仿真环境,可模拟多架无人机在城市及无人机机场环境中同步运行。

模拟的基础,同时也是这家公司搞挑战赛的底气,就是近年来的海量投入和应用:比如无人机应用,一个典型的场景来自「低空之城」深圳:今年在深圳,官方统计数据是 1-11 月市内低空无人机载货飞行 62.6 万架次,同期美团无人机的数字是送了近 20 万订单,飞行架次接近 40 万架次。不难计算,在深圳的天空,每 3 次送货飞行,大约会有 2 次需要美团无人机完成,这家公司的飞行总量是其他公司总和的两倍。

订单背后意味着数据,在数据获取难度远超其他的当下,吸引力不言自明:一场挑战赛,其实是一次真正的「参与」就很棒的机会。

此次低空经济挑战赛议程设置,也十分有趣。整个比赛分成性能赛和创意赛两大部分:性能赛中参赛队面对确定地图环境下的配送场景,物流订单需求会在地图上随机产生。选手开发并提交规划算法,高效、安全完成机场地面调度、起降、城市配送任务,并避免碰撞等极端情况。创意赛则鼓励参赛者设计创新型无人机应用及飞行管理方案,激发技术在前沿场景中的潜力。

王健丞所在的 nROS 团队是性能赛的获胜冠军。

为了获得性能赛的胜利,nROS 团队设计出了一张「蒙娜丽莎」拓扑图。

「我们选用了拓扑图作为我们的高效的地图表征方式,并添加了许多功能节点作为交通管理的模块。通过周期推演来计算出了最优的拓扑地图的降落点的位置。」王健丞介绍道。「为了获得更高的分数,我们最后的送餐航线是选择最短路径,而返航航线选择的则是较为安全的航线。」

图片来源:网络

在一次次的算法优化中,nROS 团队学到了在课本上学不到的许多知识:例如,他们发现无人机进出工作台时,如果路线垂直,协同作业的 AGV 小车会延迟约 4 秒才能进入工作台。基于这一观察,他们调整了装货方式,提高了效率。

「当我们拿到 1 万分的时候,我们曾以为这就不错了;后来拿到 13,000 分,我们觉得这可能是极限;再到 15,000 分时,我们几乎不敢想还能再往前走 。但最终,我们没有停下脚步,突破了 17,000 分。」 王健丞认为这是他们队训「极限犹可突破,至真亦不可止」最好的诠释。

创意赛的表现同样精彩,SkyMinds 天马行空队 凭借一套面向全流程无人配送场景的系统设计夺冠。

在无人机配送的最后 100 米的难点配送环节,SkyMinds 天马行空队使用了团队自己的双臂机器人,使用视觉传感的方法自主导航到用户的指定地点,使用端到端模仿学习的算法实现复杂场景的打包操作,并对弱光环境进行了优化。这种成熟的方案令人难以相信是由在校生完成的。

「你们为什么不把线上系统多开三个月?」比赛结束后,这几乎成为参赛者们的统一呼声。3 个月的时间让他们意犹未尽,许多团队希望能够有更多机会深入优化和测试自己的方案,庞大的真实场景需求,第一次让技术从生活中来,到生活中去。

为了留住人才,美团机器人研究院自然响应呼声,从明年的比赛开始,系统开放时间延长至 6 个月。同时,表现优异的队伍还将获得参与线下实际飞行操演的机会,进一步检验他们的技术在真实场景中的表现。

 

02

具身智能,

真正缺的是产业化的场景

 

当然,如果说年轻人的挑战赛,比拼的是潜力和想象力,那会上「老炮」们的讨论,可能关乎的是当下探索者们发展路径的选择。

毋庸讳言,2024 年,机器人领域细分出的具身智能,已经成为当前科技领域的一个大热词。无论是从学术的快速发展,到产业的融资落地,具身智能都开始表现出极大的潜力。

会上,银河通用创始人王鹤、星海图首席科学家赵行、清华大学交叉信息研究院助理教授吴翼等正在学术和产业交叉领域进行探索的前沿专家,进行了观点的碰撞。

在一年的产业狂奔后,被问到机器人行业目前最大的卡点是什么,各位的答案出乎意料地一致:不是机器人本体,不是智能算法,而是商业落地,是需求和场景。

正如前文所述,商业落地会带来真实世界的数据。在人工智能的赛道上,有真实世界的数据,才能让算法更好地迭代,获得进一步的智能。

王鹤用了一个很好的对比:「自动驾驶和具身智能在技术上很接近,但是在商业上,则完全不同。自动驾驶是一个典型的热启动。你把车卖出去以后,有用户替你开。每一个能卖出去车的车企,后续都能获得海量数据,进一步优化自动驾驶算法。机器人,则完全不同。一个机器人,如果开头不够有能力,一开始就没办法卖出去,卖出去了因为能力不足,也不会有多少真实场景的数据回传,那数据和算法的相互驱动能力就会大大降低,闭环也无法建立。」

图片来源:网络

如何解决,恐怕要产业和学术界一起努力。

对于学术界而言,实现商业化本身,可能有两点比较重要:首先是让机器人先达到一定的可用能力。银河通用目前正在聚焦于使用合成数据,先让机器人获得一定的基础抓取能力,再进入产业界。星海图则正在聚焦少样本的预训练——做更大规模的预训练,让机器人在学习新任务的时候通过三五个样例,就能获取新的技能。

第二点,是安全问题。让机器人部署到人类环境中,与人类共同进步而不产生危害,也是商业化的一个关键重点。

「在装修房子的时候,我们现在都会说给洗碗机留一个空间。什么时候,我们意识到这个地方需要有个电源留给机器人,大家愿意为它留一个改造的空间,人机共生的时代可能才会真正开始。」星海图首席科学家赵行表示。

产业界的推动也同样重要。什么样的场景,才是机器人能快速落地的场景?

或许是更简单的场景。吴翼举了一个我们日常生活中常见的场景——在家找不到东西,给妈妈打电话确认物品位置,最后找到。「这是一个大家看起来稀松平常的事,但是如果机器人要完成的话,首先需要理解比如『东西在白色箱子后面』这个语言在现实世界中意味着什么。同时它要能够做到视觉上的空间理解,做到现实中的定位和导航。涉及到人机交互还需要记忆、交互能力、理解、推理,需要自主地知道问出怎样的问题。」

图片来源:网络

这并不简单。

王鹤则直接指出:「现在不用看需求,直接看什么能做就可以。我认为最快能落地的,就是做粗活。」所谓的做粗活,就是指在环境中导航、移动,抓取、放置。

「这些粗活的场景本身对成功率要求不会极为苛刻——比如自动驾驶目前仍然不能很好地应用,其中一个重要问题是,自动驾驶失败了,是会撞死人的,但简单的粗活,则不存在这样的问题。」王鹤表示。

这样的场景,刚好在我们的日常生活中就很常见。

「比如很多 24 小时业态的前置仓零售店,需求很大。它的活又很简单,就是把一个东西从架子上抓下来,然后放在桌子上给快递员。」王鹤表示,「这就是一个很好的场景。」

王鹤表示,银河通用已经与一些平台达成合作,明年将在更多场景中,启动机器人的规模化场景落地。「具身智能现在的状态就像 2013 年的新能源汽车。我们的目标是,在五年内实现 1 万台人形机器人能够自主在实际场景中工作。」

 

03

在学术与场景的双向反哺中,

平台要做桥梁

 

一场年会,笔者看到了学术获益于场景的同时,也在反哺场景。这或许就是机器人未来发展的路径指引。

作为大会的东道主,每年办一届学术年会,美团或许也是看到了相同的未来。

据美团机器人研究院秘书长刘硕介绍,美团有很多产业界的同行,也有很多在学术界的合作伙伴。之所以成立机器人研究院,正是希望成为产业界和学术界的桥梁,为机器人科技创新与落地应用提供土壤。

「这其中有两个意义。第一是产业界有应用场景,可以牵引学术界的定向研发;第二在于通过给学术界提供经费、场景、工程资源,让学术成果尽快形成产业转化。」她说。

她还分享了一个来自美团的感悟:美团无人机目前运送了超过 40 万单的真实客户订单,飞行架次接近 100 万次,已经达到了非常密集的高频次的飞行。

这样的成绩背后,一部分原因就是「产学研用」合作,推动无人机自主避障的发展。「百万架次的时候,挑战场景其实在平常想都想不到的,我们见过风筝、气球,高楼擦窗的安全绳,我们甚至见过很多好奇的游客的消费无人机,试图在拍摄我们自己的无人机等等。如何发现并解决这些边缘案例?」

除了收集真实场景的数据,美团机器人研究院也在不断发展仿真技术,并和学术界合作解决问题。

例如,在和清华大学深圳国际研究生院的丁文伯团队的合作中,双方就使用了一个 Multi-Game Decision Transformer 的架构,用人工智能找到无人机飞行的边缘案例。

「以我们现在的技术能力,一个专业测试团队,需要用好几个月的时间,才能找到难倒我们规划调度系统的两个难题。但通过人工智能,找边缘案例的速度提升了九倍。」刘硕介绍道,「这让我们能更快地解决一些边缘案例和疑难场景,更好地保障无人机的飞行。」

在自主智能的提升下,美团无人机的技术,今年也在国际上得到了认可,首次在海外拿到了第一张在城市场景的无人机送货的许可证。

图片来源:网络

以管窥豹,在具身智能赛道,需求与场景并存的美团,同样有希望成为学术和场景双向反哺的桥梁。

毕竟在很多与会者看来,过往观念里,机器人的潜力更多被放在工业领域中,视作工厂自动化的主力军。但在人口红利逐渐消失的背景下,人们开始希望通过它从事那些危险、重复、高强度的工作。而随着具身智能技术的进展,新的场景会更多出现在美团擅长的本地生活、即时配送等领域中。这些有趣有价值的应用,会让大家的生活品质得到改善和提升,成为真实的市场需求。

「现在的市场,总在担心机器人的安全和价格,担心人类失去工作,担心机器人的伦理道德……但有一天大家在生活当中真的用到了好产品、好服务,可能剩下的只会是一句,『真香』。」一位参会者道出了别样的「真相」。

 

*头图来 源:视觉中国

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

 

 

 

 

浏览量: 32

特斯拉 2024 年交付数据公布,年销量首次下滑;蜜雪冰城递表港交所;诺奖得主支持马斯克起诉 OpenAI

特斯拉 2024 年交付数据公布,年销量首次下滑

1 月 2 日,特斯拉公布了最新的 2024 年第四季度交付数据,并宣布将于 2025 年 1 月 29 日星期三收盘后公布其 2024 年第四季度的财务业绩。

2024 年第四季度,特斯拉共生产交付了超过 49.56 万辆汽车,2024 年总交付量 178.92 辆,全年同比下降 1.07%。

由于 Q4 交付量不及预期(484575 辆),再加上全年交付数据的下滑,特斯拉美股盘前股价一度跌至 5%,截至发稿跌幅已回升至 2.5% 左右。(来源:IT 之家)

消息称英伟达已在储备 ASIC 设计人才,力图打造 AI 芯片新战线

1 月 2 日消息,台媒《工商时报》今日凌晨报道称,英伟达从 2024 年中就开始从台湾地区半导体公司挖脚设计服务人才,以组建自家 ASIC(专用集成电路)团队,力图在现有 Tensor Core GPU 外打造一条新的 AI 芯片战线。

英伟达目前凭借 GPU 产品在 AI 芯片领域占据绝对领导地位,拥有充足市场份额和有利的议价权。在此背景下亚马逊 AWS、微软、谷歌云服务三巨头等科技企业均在推动自家 AI ASIC 项目,一方面确保自身 AI 战略不会被英伟达 GPU 供应「卡脖子」,另一方面提升同英伟达谈判时的筹码。

而若英伟达自身也同博通、美满等企业一样提供 AI ASIC 设计服务,既可在通用 GPU 外提供更具性价比的按需定制解决方案,同时英伟达在 AI 软件堆栈方面的底力也有助于业务开展。

报道指出,英伟达在台湾地区延揽的 ASIC 工程师涵盖前段设计验证、IP 整合、PHY 设计等各细分领域,显示其对定制芯片业务的重视。(来源:IT 之家)

 

谷歌、Synaptics 宣布将合作开发物联网边缘 AI 技术

1 月 2 日消息,Synaptics 今天与谷歌宣布将在物联网边缘人工智能(Edge AI for the IoT)领域开展合作,旨在为情境感知计算定义多模态处理的最佳实现方案。

据官方介绍,此次合作将在 Synaptics Astra 硬件上整合谷歌符合 MLIR 标准的 ML 内核以及开源软件和工具,将加速物联网人工智能设备的开发,可支持处理视觉、图像、语音、声音和其他模态,为可穿戴设备、家电、娱乐、嵌入式集线器、监控以及消费、汽车、企业和工业系统中的控制等应用提供无缝交互的情境。(来源:IT 之家)

 

TikTok 承诺「禁令」生效将给广告商退款

随着一些广告商开始不再购买 TikTok 上的广告,TikTok 正在告诉大型广告购买公司,如果该应用程序在一月份在美国被禁止,他们如何才能摆脱广告协议。

据两名知情人士透露,TikTok 在给大型广告购买公司的一封电子邮件中表示,如果该应用未能阻止 1 月 19 日禁令生效,它将退还所有本金,即各机构对 TikTok 广告支出承诺的首付款。

这封电子邮件似乎是为了让广告商放心,如果他们继续与该公司开展业务,不会面临亏损的风险。(来源:The Information)

 

字节否认与努比亚合作开发 AI 手机

1 月 2 日消息,有媒体报道称,字节跳动选择努比亚合作开发 AI 手机,双方已签订框架协议,到 2025 年 Q1 会拿出具体方案,2025 年 Q2 进行样机生产、测试,2025 年 Q3 末到 10 月份可能会举办产品发布会推出新产品。

对此,字节跳动官方回应称信息不实,没有相关计划。(来源:新浪科技)

 

微信与 TikTok 获得马来西亚社交媒体牌照,谷歌与 X 平台错过

1 月 2 日消息,据马来西亚通讯与多媒体委员会(MCMC)消息,伊隆・马斯克的 X 平台和 Alphabet 旗下运营视频流媒体平台 YouTube 的谷歌尚未根据马来西亚周三生效的新法律申请社交媒体运营许可证。

2024 年 7 月,MCMC 委员会宣布,在马来西亚拥有超过 800 万用户的社交媒体平台必须在 2025 年 1 月 1 日之前获得在该国运营的许可证。该委员会认为,这对于打击网络犯罪是必要的。

MCMC 还表示,中国平台微信和字节旗下 TikTok 领先其他科技巨头签署了新规则,Telegram 正处于流程的最后阶段。

另外,「负责监督 Facebook、Instagram 和 WhatsApp 的 Meta 已启动获得许可证的程序,预计很快就会敲定,」MCMC 表示。(来源:IT之家)

 

苹果官网突然降价,客服称 14 天内购买产品可退货重购

1 月 2 日消息,元旦刚过,苹果中国官网公布出了「叱咤福利」新年促销活动,1 月 4 日至 7 日,用户以符合条件的支付方式买指定产品,最高立省 800 元。随后,相关话题迅速登上热搜。

截图来源:苹果官网

苹果强调,Apple Store 零售店内可参与本次优惠活动的商品数量有限(iPhone 类商品数量为 29300 件,iPad 类商品数量为 3500 件,Mac 笔记本电脑类商品数量为 530 件,Apple Watch 类商品数量为 8350 件,AirPods 类商品数量为 2590 件,Apple Pencil 类商品数量为 940 件),售完即止。

针对官网降价能否退差价问题,苹果官方客服对中新经纬表示,「如果是在活动前的 14 天内购买的产品,是可以进行退货再购买的,这也可以理解为是一种退差价。」(来源:IT 之家)

微信小店 2025 私域激励:费率降至 1% 单月最高 15 万点奖励 

亿邦动力获悉,微信小店发布 2025 年私域激励计划,通过分享、公众号、小程序场景产生的交易订单,技术服务费减免至 1%,再以电商成长卡形式最高激励 0.4%;通过预约通知场景产生的交易订单,技术服务费将激励等额的电商成长卡。单个账号单月最高可获 15 万点电商成长卡奖励。活动时间为 1 月 1 日至 3 月 31 日,即日起可报名参与。(来源:亿邦原创)

 

蜜雪冰城向港交所提交上市申请书

1 月 1 日,蜜雪冰城股份有限公司向港交所提交上市申请书。

作为知名的茶饮品牌,蜜雪冰城在国内拥有庞大的消费群体和广泛的市场影响力。此次选择在香港上市,成为其发展历程中的一个重要里程碑。(来源:界面)

 

赛力斯张兴海:三年内新能源汽车实现百万量级目标

1 月 2 日消息,赛力斯集团董事长(创始人)张兴海今晚向全体员工发布题为《一个目标干到底》的新年寄语。

张兴海指出,2024 年是具有里程碑意义、转折性意义的一年,赛力斯全年实现新能源汽车销量 42.69 万辆,同比增长 1.8 倍,超额完成计划。同时,问界进入豪华车阵营,问界 M9 全年单车交付 15 万辆,M7 单车交付 20 万辆。

他表示,2025 年,赛力斯将坚定软件定义汽车的技术路线,智慧重塑豪华,问界 M9 锚定豪华车销量持续第一;三年内赛力斯新能源汽车实现百万量级目标。(来源:IT 之家)

 

WPS Office PC 端国内日活设备数突破 1 亿

2025 年 1 月 1 日,金山办公宣布,WPS Office 的 PC 端国内日活设备数突破 1 亿,开启国产办公软件的新篇章。

金山办公自 1988 年成立至今,已经步入第 37 年。在刚过去的 2024 年,金山办公面向企业和组织推出了办公新质生产力平台 WPS 365,包含 WPS Office、WPS AI 企业版和 WPS 协作,成功打通文档、AI、协作三大能力,全面覆盖了一个组织的办公需求,从文档创作到即时通讯(IM)、会议、邮件,再到 AI 应用,让各组件间无缝切换。

同一年,金山办公旗下基于大语言模型的智能办公助手 WPS AI 也升级迭代至 2.0 版本,包含 WPS AI 办公助手、WPS AI 企业版、WPS AI 政务版,进一步将人工智能技术落地在办公软件领域。(来源:极客公园)

Meta AI 推出 LIGER 混合检索 AI 模型,计算效率与推荐精度兼得 

1 月 2 日消息,Meta AI 的研究人员提出了一种名为 LIGER 的新型 AI 模型,巧妙地结合密集检索和生成检索的优势,显著提升了生成式推荐系统的性能。

LIGER 有效地解决了传统推荐系统在计算资源、存储需求和冷启动项目处理上的难题,为构建更高效、更精准的推荐系统提供了新的思路。(来源:IT 之家)

「人工智能教父」辛顿公开支持马斯克起诉 OpenAI

12 月 31 日消息,近日,反对人工智能初创企业 OpenAI 转型为完全营利性公司的呼声日益高涨。

本周一,由年轻人领导的全球倡导组织 Encode 向法院提交了一份支持伊隆・马斯克(Elon Musk)诉讼的法律意见书,试图阻止 OpenAI 的企业化转型。这一举措得到了人工智能领域重量级人物、诺贝尔奖和图灵奖得主杰弗里・辛顿(Geoffrey Hinton)的公开支持。 

Geoffrey Hinton|图片来源:视觉中国

「人工智能教父」辛顿在 Encode 发布的声明中指出:「OpenAI 成立时明确定位为以安全为核心的非营利性组织,并在章程中做出了多项安全承诺。它也因此享受了大量税收优惠和其他政策红利。如果在当前情况下允许其背弃这些承诺,将向人工智能生态系统中的其他参与者传递非常负面的信号。」(来源:网易科技)

 

浏览量: 16

真没想到,AI 夸得我有点不好意思,还能陪我过日子?

在《追忆似水年华》里,普鲁斯特用一块玛德琳蛋糕,让主人公的童年记忆涌现。心理学家称这种因感官刺激而触发情感记忆的现象为「普鲁斯特效应」。它揭示了情感记忆并非冰冷的数据储存,而是与体验紧密相连,等待被触发的那一刻。

 

互联网时代,年度报告俨然成了各大平台的一块「赛博玛德琳蛋糕」,试图唤起用户对平台独特的情感记忆。

支付宝旗下的 AI 生活管家「支小宝」,则选择用 AI 为用户总结 2024 这一年。不少网友看完,纷纷感叹:「这 AI 夸得我有点不好意思了。」

还有网友留言:「2024 感觉有点不顺,但是支付宝说我已经做的很棒了!」

仔细看下来,这份由支小宝为支付宝用户写就的 AI 年度总结,没有过多的标签和账单数据,更像一封为用户加油打气的简单信件。

回望 2024 年,我们见证了 AI 技术不断突破边界,也感受到人们在一次次技术升级中,恐惧于被 AI 替代的焦虑以及随之而来的对立情绪。这一次,支小宝的 AI 年度报告,正尝试让技术为用户创造一种个性化的情绪共鸣。

岁末年初,从一份 AI 年度报告出发,我们也许可以试着讨论不那么炫酷的话题:AI 如何带来最细微的情绪价值?如何真实地走进普通人的日常生活?技术如何创造一个更人性的世界?

 

01

 

这份 AI 年度总结,让普通人的生活被看见

 

浏览社交媒体上对年度报告的讨论,「人情味」是一个频频被提及的评价标准。

有人甚至会保存两年前带给自己温暖的某份年度报告,时不时翻出来看看。这些声音说出了用户对年度报告的期待:不仅是数据罗列,更需要情感联结,照见每个人努力生活的灵魂。

一份经典的 App 年度报告,往往是在用户知情同意下提取行为数据,再提炼出关于习惯、偏好和个性等标签,并通过精美的 H5 模板直观呈现。然而,捕捉数据或许已变得简单,真正困难的是如何让用户从中感受到自己独特的个性和经历。

而生成式 AI 的能力,似乎让这个问题多了一种新解法。AI 可以更高效地整合多维度数据,还可以生成极具个性化的内容,让用户感受到独一无二的「被看见」。

极客公园翻阅了许多「# 支小宝」词条下的 AI 年度报告,首先发现每个人得到的年度称号十分丰富。比如,有新生儿妈妈收到的年度定义是「为家跳动的温柔节拍器」,一位教师用户则被称为「温柔治愈的幸福引路人」,今年刚有小狗的用户被叫做「宠物街上最美的美食博主」……

这些称号不仅贴合个人的年度轨迹,还用语言赋予了生活更多意义。

在传统 H5 形式的年度报告中,角色池里的名称定义是有限的,基本无法避免用户之间的称号雷同。

但是支小宝并没有使用固定的 H5 模版,而选择在获得用户授权后,让 AI 基于其支付宝账单数据进行提炼生成。用户只需要在支付宝首页下拉或下载支小宝 App,就能收到一份 AI 为自己「量身」生成的独特年度总结。

此外,还能在「暖心治愈」「花式夸夸」「散文诗」等多种文风中切换。

不过,AI 对情感的洞察高度依赖于数据的全面性和准确性,生成的内容也只能从现有数据中进行推断和解读。为了避免冒犯用户,AI 生成的语言往往趋于正向和鼓励,略显套路化,缺乏情感深度。

正因如此,AI 无法完全读懂另一个人类复杂多面的灵魂,更多时候是靠善意的描述去「碰运气」。比如,一位妈妈被称为「温柔时光里的亲子故事编织者」,AI 在信中描述了她为家庭付出的许多细节。这样的叙述却让她有点不太高兴,她感叹:「果然有了娃之后就没有自己了。」你看,人心永远都比 AI 复杂。

此外,值得一提的是,支付类的年度报告通常容易引发人们对账单数字的敏感关注,导致用户不愿意分享。但支小宝的 AI 年度总结聚焦生活的点滴故事,而非具体的消费数据,避免了窥探隐私的尴尬感,文案表达也显得更加得体。

当然,如果用户希望了解更具体的账单明细,支小宝也可提供智能分析功能。

除此之外,支小宝还有新年许愿功能,让 AI 帮用户记住 2025 年的心愿。

尽管这份年度报告并不完美,但在压倒性的「AI 提效」的话题讨论之外,它让我们看到了人们对 AI 的另一个希望——在工具价值之外,AI 逐渐能够展现出更多情绪价值。

近年来,从最初的文本对话到如今的实时语音对话和虚拟人形象生成,用户和 AI 的交互越来越接近人类的真实互动。通过海量的知识储备和对话训练,AI 也不再是「机械式」的程序,越来越擅长聊天,正变成一个「懂你」的朋友。

今年上半年,博主「午夜狂暴哈士奇狗」就因为发布和 AI 虚拟人「DAN」的聊天视频而爆火。在她的视频中,「DAN」表现得像一个高情商的男友,带她体验了从暧昧到表白甚至见家长的过程。这让许多网友开始效仿,互相交换训练「AI 恋人/朋友」的攻略。社交媒体上,关于「DAN」的单个话题就有 2.1 亿的阅读量。

「DAN」的爆火说明了人们对 AI 带来情绪价值的需求正在爆发,AI 陪伴应用也成为了人工智能领域增长最快的赛道之一。

有数据表明,从 2018 年到 2023 年,AI 陪伴类应用的月活用户数量增长了 30 倍。以海外 AI 陪伴应用 Character.AI 为例,截至今年年中,其移动端下载量累计 3432 万次,网页端 6 月单月访问量达到 3.1 亿次。

如果 AI 陪伴类应用的长时记忆能力做得更好,它会越来越懂用户的偏好,给用户带来「被记住」和「被关心」的情绪体验。

 

02

 

回到真实人性,让 AI 离生活更近一点

 

AI 在「情绪价值」层面的潜力正在爆发,但这仅仅只是一个开始。

在泛娱乐赛道,不少 AI 应用在推出初期凭借新奇感,曾在社交媒体上被一时热议。一旦用户的新鲜感消退,这些应用因缺乏长期互动的实用价值,很难提高用户留存,更谈不上付费变现。

技术要赢得人心,最终靠的不是一时的新鲜感,而是能否满足人性深处稳定的底层需求。只有当新技术通过创新方式更高效、更贴心地解决实际问题,才能为人们提供普惠价值。因此,AI 要真正融入我们的日常生活,就必须突破单纯的工具属性,进阶为能与用户深度同步的生活伙伴。

而目前来看,人们沉迷于 AGI 的颠覆性叙事,但 AI 的能力尚且做不到完全替代人类,而行业里又缺乏从实际出发、「扎下去」的落地应用。

在底层大模型卷了两年之后,今年行业内更多人也开始意识到这一问题,逐渐从「卷参数」转向「卷应用」。

以支付宝今年 9 月推出的 AI 生活管家「支小宝」为例,支小宝依托支付宝积累多年的平台生态和用户群体,选择将方向聚焦于日常生活服务。

支小宝的流量入口做得非常轻盈,用户只需在支付宝首页简单下拉,即可召唤「支小宝」出来。同时,支小宝还有独立 App,提供更丰富的 AI 原生服务体验。

像支付宝这类数字生活平台,拥有出行、政务、医疗等大量成熟的业务场景,将这些成熟业务 AI 化,为用户提供更崭新的智能服务体验,无疑值得期待。

作为国民 App,支付宝连接了超过 10 亿用户和 8000 万商家,内嵌 400 多万个小程序,以及上万种数字生活服务。对用户来说,几乎可以在支付宝上解决衣食住行所需的一切。但正因为功能太多了,用户有时候无从下手,或者还不知道支付宝能做这么多事。而「支小宝」作为一个「万能」的连接器,可以更轻盈快捷地调用支付宝生态里的强大服务能力。

过去,支付宝用一个二维码解决了支付链路问题;现在,支小宝则试图用 AI 更简单地为用户解决日常生活问题。

只需要和支小宝这位「AI 生活管家」对话,用户就能更简单地点餐、打车、订票,还能让它推荐附近吃喝玩乐等。比如,让支小宝「点一杯瑞幸生椰拿铁到店取」,它会自动选择最近的门店,直接弹出详细的定制页面,供用户支付下单。

当然,还有更多细分垂类需求值得用 AI 焕新。例如,支小宝正与旅游景区、政务机构等合作,推出了各种特定领域的智能体。比如,黄山智能体「黄小松」可以为用户提供 AI 导游、门票预订等服务。今年 11 月,支小宝还上线了「AI 帮找工作」的功能,智能聚合了超 400 万个职位,还可以提供 AI 求职指导服务。

让 AI 有手脚,能帮人办事,多家科技企业均在赛跑。智谱清言也在今年推出了智能交互智能体 AutoGLM,可根据用户的语音指令,实现跨 App 操作,完成点外卖、给朋友发微信、在大众点评上写一篇评论等操作。

AI 落地的未来之路或许正在于:要更贴近人性,也更融入生活,找到技术与需求的深度连接点;从情绪价值到生活服务都能做好,才能更好地完成商业闭环的构建,并为用户创造价值。

 

浏览量: 18

特朗普酒店外一辆 Cybertruck 爆炸,马斯克回应;《鱿鱼游戏》第二季首周观看打破奈飞记录;百度 25 周年李彦宏发全员信

阿里巴巴宣布与大润发分手:以 131.38 亿港元出售所持 78.7% 高鑫零售全部股权

阿里巴巴集团发布公告,宣布子公司及 New Retail 与德弘资本订立协议,出售所持高鑫零售全部股权,合计占高鑫零售已发行股份总数约 78.7%。

根据协议,阿里巴巴子公司及 New Retail 将有权就待售股份收取最高金额约 131.38 亿港元(当前约 123.54 亿元人民币),相当于 1.75 港元 / 股。

截至 2024 年 9 月 30 日止,高鑫零售在全国 29 个省市自治区内 206 个城市共拥有 466 家大卖场、30 家中型超市及六家会员店,总建筑面积约为 1,349 万平方米。

2017 年,阿里巴巴首次入股高鑫零售,2020 年进一步增持后,高鑫零售成为阿里巴巴集团的并表子公司。根据高鑫零售最新发布的财年中期业绩,半年营收 347.08 亿元,净利润 1.86 亿元,实现扭亏为盈。截至 2024 年 9 月 30 日,高鑫零售集团员工人数为 85778 人。(来源:IT 之家)

马斯克称特朗普酒店外 Cybertruck 爆炸是由烟花或炸弹引起的

马斯克在社媒平台发帖称,特斯拉已证实拉斯维加斯特朗普酒店外一辆 Cybertruck 爆炸是由非常大的烟花和/或放置在车底的炸弹引起的,与车辆本身无关。

他表示,该车为租赁车,爆炸发生时所有车辆遥测数据都是正面的,特斯拉高管团队正在调查此事。事件「看起来像是恐怖主义行为」。

据央视新闻,当地时间 1 月 1 日,一辆特斯拉 Cybertruck 在酒店代客泊车区域突然发生爆炸。警方确认,驾驶员当场死亡,为此次事件的唯一死亡人员,另有 7 名旁观者轻伤。爆炸原因尚未查明,调查重点集中在是否为车辆故障引发,或是否存在人为动机。

知情人士透露,涉事车辆内装有类似烟花弹的爆炸物,调查人员正在紧急确认嫌疑人的动机及背景。警方呼吁公众保持警惕,并避免前往事发区域。由于酒店与美国当选总统特朗普相关联,长期以来已是安全威胁的重点区域。(来源:界面新闻)

 

苹果第一代 Vision Pro 头显或已停产,新一代低成本头显正在开发中

据 The Information 报道,苹果在今年初夏开始缩减 Vision Pro 的生产,并可能在 2024 年底前完全停止生产当前版本的设备。这一举措表明,苹果现有库存已足够满足该设备至 2025 年的市场需求。历史上,苹果曾对低需求产品采取过类似策略,如 iPhone 12 mini。

外媒指出,Vision Pro 的需求疲软主要归因于其高昂的价格和内容生态系统的不足。苹果 CEO 蒂姆・库克曾表示,该设备主要面向对尖端技术感兴趣的早期采用者,而非大众市场。

随着 Vision Pro 的停产,苹果将把重心转向开发一款成本更低的头显。据报道,苹果已告知供应商准备在未来产品的整个生命周期内生产 400 万台低成本头显,这一数量仅为原计划 Vision Pro 生产数量的一半。

此前,天风国际分析师郭明錤和彭博社记马克・古尔曼均在社交平台中透露,一款更具迭代性的第二代 Vision Pro 正在积极开发中,并有望引入 M5 芯片和 Apple Intelligence。预计该设备将在 2025 年秋季至 2026 年春季期间发布。(来源:环球网科技)

路特斯正式更名莲花跑车:5 年努力终于拿下「莲花」中文商标

莲花集团 CEO 冯擎峰今日发布内部公告,宣布历经超过五年的努力,在中国取得了一项历史性的法务胜利——北京时间 2024 年 12 月 7 日起,LOTUS 的圆标、字标、「莲花」的中文商标回到了莲花集团手中。

这意味着,莲花集团的所有市场,最终实现了商标的一致性一一 同一个世界,同一个莲花。

路特斯 EMEYA 繁花暗黑版 / 白金版

冯擎峰表示:在中国,「路特斯」的名字用了五年,之所以坚持拿回「莲花」,坚持改回「莲花」,是因为,「莲花」是我们能够跨越周期,逾越艰难,被行业、用户、车迷铭记与致敬的最重要资产,是我们心中的指南针;是因为,「莲花工程」和「莲花车队」是我们最弥足珍贵的品牌图腾;也是因为我们的创始人柯林・查普曼先生、海泽尔・威廉姆斯女士的传奇浪漫——自 1950 年以 LOTUS 作为品牌名,他们常以「莲花」的花瓣来形容我们的 logo,而关于「莲花」命名的「世纪之谜」。

Clive Chapman 先生也告诉我,将在 2027 年海泽尔女士百年诞辰的时候正式揭晓。(来源:IT 之家)

比亚迪 2024 年销量超 425 万辆,今年加速智能驾驶上车

比亚迪发布公告,2024 年 12 月新能源汽车销量为 51.48 万辆,2024 年 1~12 月累计销量为 427.21 万辆,累计同比增长 41.26%。其中,乘用车累计销量为 425.04 万辆。

根据规划,2024 年比亚迪全年销售目标约为 360 万辆。按此目标计算,比亚迪 2024 年超额完成目标销量的 18.67%。

尽管已超额完成目标,但为保证 2025 年 1 月销量相对平稳,比亚迪仍旧于 2024 年底开启了新一轮限时降价。

与降价同步进行的,是比亚迪高阶智能驾驶辅助系统「天神之眼」已在全国范围内正式开通无图城市领航(CNOA)功能,仰望 U8 豪华版、腾势 Z9GT、腾势 N7 三款车型将陆续搭载该功能。(来源:第一财经)

 

2024 年全国电影票房 425.02 亿,8 部影片破 10 亿

据国家电影局统计,2024 年全年总票房 425.02 亿,城市院线观影总人次 10.1 亿。其中,国产影片票房为 334.39 亿元,占比 78.68%。

据猫眼专业版数据,2024 年全年共有 8 部影片破 10 亿,年度票房冠军为春节档影片《热辣滚烫》,全年大盘占比为 8.1%。

数据显示,年度票房前 10 影片分别为《热辣滚烫》《飞驰人生 2》《抓娃娃》《第二十条》《熊出没•逆转时空》《默杀》《志愿军:存亡之战》《年会不能停!》《哥斯拉大战金刚 2:帝国崛起》《你想活出怎样的人生》。(来源:新浪科技)

 

《鱿鱼游戏》第二季全球首周观看量破 Netflix 纪录

Netflix 热播剧《鱿鱼游戏》第二季自 2024 年 12 月 26 日上线以来,取得了巨大成功,首周全球观看次数已达 6800 万,总观看时长为 4.876 亿小时,刷新前作于 2021 年 9 月第四周(20 至 26 日)创下的 4.4873 亿小时的纪录。

从单周收视来看,这仅次于《鱿鱼游戏》10 月第一周(2021 年 9 月 27 日至 10 月 3 日)创下的 5.7176 亿小时纪录,位居第二。按收视地区来看,该剧登顶美国、法国、日本、印度、澳大利亚等 92 个国家和地区榜。

这一成绩打破了 Netflix 的纪录,远超 2022 年《星期三》首周 5010 万次的观看量,并让《鱿鱼游戏》第二季跻身 Netflix 非英语热门剧集榜第七位。这一成绩打破了 Netflix 的纪录,远超 2022 年《星期三》首周 5010 万次的观看量,并让《鱿鱼游戏》第二季跻身 Netflix 非英语热门剧集榜第七位。(来源:IT 之家)

 

百度 25 周年李彦宏发全员信:有些工作直到最后一天才知道成或不成

2025 年新年第一天,同样也是百度(2000 年 1 月 1 日成立)25 周年庆,百度创始人李彦宏今晚发布了一份全员信。

李彦宏表示,技术创新是百度的核心竞争力,「25 年来,我们始终走在技术的最前沿,始终相信技术创新才是百度的核心竞争力。」

他在信中表明了对 2025 年的期待,「虽然超级应用尚未出现,但 AI 的实际渗透率已经不低,并且将在 2025 年继续井喷式增长。」

他写道,「我们也期待,我们在 2023、2024 年种下的种子能够在 2025 生根发芽、开花结果,并且不断获得市场的验证和认可」。(来源:IT 之家)

特斯拉中国首批 V4 超级充电站今年落地,将向更多三方车型开放

特斯拉官方微信公众号在 1 月 1 日透露,2025 年特斯拉中国首批 V4 超级充电站即将落地。

特斯拉称,更好用的 V4 超充桩,搭配更强悍的 V4 超充机柜,搭载最新一代特斯拉充电技术,大大优化充电体验。V4 超充站将向更多三方车型开放,甚至包括将来上市车型。V4 超级充电桩是该公司迄今为止发布的充电速度最快、功率最高的电动汽车充电设备。

特斯拉在中国上海拥有一家专门的超级充电桩工厂,该工厂于 2021 年竣工,据报道其年产能可达 1 万个 V3 超级充电桩。

目前特斯拉全球范围内的超级充电桩已经超过 6 万根,特斯拉全球近 1/5 超级充电桩都建设在中国内地,总数超 11500 根(截至 2024 年 11 月)。另外,全国公共充电桩数量已超 346 万根,超过加油枪数量,特斯拉车主可用车桩比接近 1:2。特斯拉充电网络布局 100% 覆盖中国大陆省会城市及直辖市。(来源:IT 之家)

 

消息称英伟达 GeForce RTX 5080 显卡 1 月 21 日上市

 1 月 1 日消息,英伟达计划于 1 月 7 日上午 10:30 在 CES 2025 上举行演讲,预计黄仁勋届时将亲自公布有关 RTX 50 系列显卡的信息。

@HKEPC 今日爆料称,英伟达新一代 GeForce RTX 5080 显卡将于 1 月 21 日上市。当然,该日期可能仅适用于 RTX 5080,因为 RTX 5090 和 5070 Ti 预计不会与该型号同时发布。

​英伟达 RTX 游戏显卡首发上市顺序并不固定,在 RTX 40 系上率先开售的是 RTX 4090,而在 RTX 30 系中则首先由 RTX 3080 (10GB) 上市。(来源:IT 之家)

 

《黑神话:悟空》制作人冯骥吐槽 Xbox 主机 10G 共享内存「没个几年优化经验拿不下来」

Steam 平台今日公布年度游戏大奖评选结果,《黑神话:悟空》最终斩获「年度最佳游戏奖」,并同时拿下「纵使手残仍大爱奖」和「杰出剧情游戏奖」。

IT 之家注意到,游戏科学创始人 / CEO、《黑神话:悟空》制作人冯骥今日发文称「虽然也没有太大意外,全拿下后还是有点感慨,各位战斗力恐怖如斯,独缺了 XBOX 那件袈裟…… 似乎有点不该(可那 10G 的共享内存啊,没有几年优化经验真拿不下来)。」

据 IT 之家此前报道,《黑神话:悟空》由中国游戏工作室游戏科学开发,改编自中国古典小说《西游记》。该游戏于 2024 年 8 月 20 日在 PlayStation 5 和 PC 平台上推出,但 Xbox Series X | S 版本却无限期延期。

微软游戏部门负责人菲尔・斯宾塞在 2024 年 11 月接受 Game File 采访时称,他确实知晓《黑神话:悟空》是否会登陆 Xbox 平台,但目前无法透露更多信息。(来源:IT 之家)

 

浏览量: 22

这个「能飞」的机器人,悄悄走进人们的生活

相比「无人机」,大部分人可能并不熟悉「飞行相机」的概念。

同样是由飞行动力系统加上相机,飞行相机比无人机更轻、更小,使用门槛也更低。如果说无人机是立足于专业设备,一只脚跨到了消费领域,飞行相机则从最初就瞄准了大众消费品市场。

但这件事很难。不仅是技术上,要做出一个重量只有 100g 飞行器+相机,需要很多积累,更在于市场层面,消费者的认知还未充分建立。对此,零零科技创始人 & CEO 王孟秋说:「让相机飞起来这件事情太疯狂,超过了大家的想象。」

零零科技在这片土壤里耕耘了十年。直到今年,他们看到了曙光。今年 8 月底启动的哈浮 X1 PRO 和 PROMAX 两款飞行相机的众筹,达到了 500 万美元,成为今年 indiegogo 全球众筹金额最高的项目。

在极客公园 IF2025 创新大会上,王孟秋说:「2024 年可以算是飞行相机的元年」。

王孟秋在极客公园 IF2025 创新大会上介绍「飞行相机」的创业史|图片来源:极客公园

而且,这不仅是一个可以通过飞行跟拍用户的摄影师,而还是一种「机器人」。王孟秋认为,飞行相机在经历漫长开发后终于落地,离不开它的能力提升,特别是算力,也就是智能的提升,让它可以更好地感知环境,并作用于环境。未来,这一提升还将解锁更多关于飞行机器人的想象。

以下为王孟秋在极客公园 IF2025 创新大会的演讲全文,由极客公园整理编辑。

 

做用户的「跟拍摄影师」

大家好,我是零零科技的创始人、CEO 王孟秋,每次接近年关的时候来北京参加极客公园的 IF 大会都特别亲切,有一种回家的感觉。因为我们创业已经 10 年了,极客公园是不是最懂所有中国创业者的媒体,我不确定,但肯定是最懂我们的媒体之一,连我今天 PPT 的话题都是公园的朋友帮我想的。今天有两部分,上面一部分是「一个不想飞的机器人」,下面一部分是「摄影师」。

我们先从摄影师这个话题聊起。我先给大家看一个摄影师的作品,非常生活化。拍摄这些作品的摄影师,就是这个,可以从你的手掌起飞,自动跟拍的小设备。这就是我们做的产品,它叫飞行相机,我们的品牌叫「哈浮」。

零零这家公司已经 10 年了,参加极客公园的活动也已经有很多年头了。我们做这个相机也走了 10 年,从 2016 年的第一代产品「小黑侠」,到 2022 月 12 月正式跟大家见面的 X1,2024 年 4、5 月在日本市场推出的 X1S,一直到今年 10 月我们更新的一代叫 PRO、PROMAX,这就是飞行相机的十年进化史。

我简单回顾一下这个历史,所谓飞行相机的起源。

王孟秋介绍零零科技的「飞行相机」产品历史|图片来源:极客公园

这是我们第一代产品「小黑侠」。在这一代产品上,我们已经定义了一个很基础的飞行相机的体验:从你的手掌起飞,不需要遥控,自动跟随。但当时整个交互还需要一台手机去参与,不能算是完全不需要遥控的设备。但是从小黑侠开始,我们的市场宣传口号就叫「你的私人摄影师」。我前面给大家看的一些作品,就是这个机器人私人摄影师完成的作品。

X1 是我们去年发布的产品,它一定意义上完成了飞行相机从「原型机」到「最小可使用单元」的进化,这条路我们走了很久。我这里分享两个比较核心的数据,我们现在有 60% 以上的女性用户,我们用户的年龄群从 4-80 岁都有覆盖。它已经不是传统意义上的飞行器或一款运动相机,因为应该没有哪个飞行器或运动相机,有超过哪怕 10% 的女性用户。所以它是非常生活化、非常大众的一个新物种。

它能帮你完成第三人称视角的记忆记录。我们看到的世界,包含所有东西,除了我们自己。所以一定意义上来说,我们的记忆是不完整的。之前我们需要找一个路人甲,把手机给他,或者支一个三角架来做这件事情(记录自己),但今天不需要了,一个会飞的小飞机就可以干这个事。

我今天也带了一台,这是我们今年 4 月份在日本众筹,现在正式开售的 X1 Smart。有点像 Smart 那款车,它应该是现在最轻最小的一款飞行相机或智能飞行器,它只有 99g 重。因为日本当地的法律法规要求 100g 以下的无人机才可以无需登记注册使用。给大家展示一下,摁一个键,它就从我的手掌起飞,开始自动跟拍和跟踪,只要我手放在它下面就可以把它拿下来。它在说这里地表纹理太差或光线不好,被自己的产品吐槽也是一种很新奇的体验。

从去年到今年,飞行相机这个品类得到了大家更多关注。很大一个原因是我们在做产品的时候,公司内部有个指标叫「每千次使用故障率」。机器人产品有一点很难的地方,它要在很复杂的物理环境里,自主地去感知环境、作用于环境,不管是在家里到处跑的扫地机器人,还是会飞的飞行相机,它的感知能力、智能化程度决定了它能对环境有多广泛的适用性。这些年来,它除了变得更轻更小,只有原来小黑侠不到一半的重量、不到一半的尺寸体积以外,最重要的一个变化是,它变的更聪明了,所以它可以在更复杂的环境里面去自主飞行。

零零科技今年推出的哈浮 X1 PRO 和 PROMAX 两款新品|图片来源:极客公园

这件事情在今年又有一个飞跃和提升,我们 10 月刚刚完成了 X1 PRO 和 PROMAX 的众筹。这应该是今年 indiegogo 全球众筹金额最高的(项目),我们做了 500 万美金。去年 X1 也上了众筹,当时是 180 万美金,去年全球第二。很大的一个变化是,去年我们做 180 万美金,前 100 万美金花了 30 天时间,但今年我们做 100 万美金花了两个小时,第一天 210 万美金,我们就把广告全停了。

我觉得除了这个金钱数字的刺激,背后更重要的是大家对飞行相机这件事情的接受程度、熟悉度,同比于去年这个时候有了很大的飞跃提升。它是一款运动飞行相机,它可以在更高的速度下,更复杂的环境下,包括雪场、骑行这些场景下,来完成自动跟拍。我们现在可以在 42 公里/小时的速度下(国内由于法规,限到 40 公里/小时)匀速跟拍,(被摄物体)最快速度到 60 公里/小时,还能够持续跟踪,因为我们现在可以在 50 米之外,靠视觉跟踪,即便(被摄物体)在画面里就一点点。

除此之外,PRO 和 PROMAX 配了一个小遥控器,我们管它叫智能信标。它有几个作用,一是你可以把它固定在自行车把上或者在腕带上,跟拍的时候不用回头去看飞机,因为它有 1 公里的图传。除此之外还有两个很有意思的小配件。这是右手的 joystick(手柄),把它的磁吸卡扣扣上以后,它就变成了单体的体感遥控器,你摁住后面的按钮,你往左,飞机就往左;你往右,飞机就会往右。我们还有一个左手的手柄,把它连接上就可以变身成双摇杆的航拍遥控器,你就能做航拍的录制。它是第一款 5000 块钱以内的 8K 30 帧的飞行相机或航拍机。这些都是我们 PROMAX 实拍的画面,打造了一个「轻航拍」的体验。实际上 1 公里图传已经足够了,200 米就已经看不到飞机在哪里了。

 

飞行相机的内核是「想飞的机器人」

今天话题第二部分是「一台想飞的机器人」,刚才我一直在讲摄影师,AI 自动飞行摄影师。

为什么它跟机器人会有关系?我讲这件事也讲了 10 年,但我觉得大家不懂。我觉得中文里面「机器人」这个翻译有一点点歧义,因为有「人」字在里面,所以大家觉得只有长得像人的东西叫机器人。但实际上 robotics,机器人核心的定义是我前面提到的,「自主去感知环境,且自主作用于环境」。最近要讲清楚这个事变的容易了很多,黄教主(黄仁勋)前段时间在采访里面提到,他说有三种机器人是最有可能大规模量产的,智能汽车、无人机和人形机器人。

哈浮从 2016 年到现在,8 年的时间里,每一代的哈浮飞行相机的算力一直在提升,比如说从 PRO、PROMAX 和 X1 比,(PROMAX 已经来到了 10T 算力,比 X1 翻了五倍),其实不只 10T,我们只是 10T 的 MPU,如果你算上 CPU 和 GPU 的话,差不多有 15T 的算力。

作为一个空中飞行机器人,它跟传统机器人有一个很大的区别,就是要对抗重力。扫地机器人也好,车也好,在二维空间移动,不需要飞。飞这件事情让所有东西都变的更难,因为你需要搞定功耗、尺寸、体积、动力系统,所有这些东西都需要在很轻的重量下完成。这是飞行机器人有别于其他机器人,很重要的一个点。

我们公司内部一直有一个概念,今天第一次跟大家分享。我们一直在观测和计算一个东西,叫「智能密度」,或「算力密度」。它的意思是,这一台机器人所具备的算力除以它的自重。比如说,我们为什么做 X1S Smart 比 X1 要难很多?一个简简单单的从 125g 到 99g 这件事,25% 的减重就很难,因为已经很极致了。到 PRO、PROMAX,大概是 190g 的重量,有接近 15T 的算力,我们姑且当 10T 去算,(它的智能密度已经提升了很多)。

零零科技的无人机产品女性用户占比很高|图片来源:极客公园

今天可以跟大家小小透露一下,因为过去几年我们沉淀了很多技术,在明年某一个时点,这一件事,就是飞行机器人的智能密度,会有一个爆发。我们现在有一个平台,是全世界智能密度最高的机器人,明年会跟大家见面。

我下面还画了一个图,对比扫地机器人和车。为什么有些东西变的更简单,比如说扫地机器人,到底是 900g,还是 1kg,没有影响,因为它就是靠轮子在地面走。但对我们来讲,这件事情就有很大的影响,所以我不能加那么多散热和额外的芯片,带来额外的功耗,这是飞行机器人。因为这个东西很难,也给了我们一个很独特的竞争环境,一定意义上说,现在全世界真的能做哈浮飞行相机 PRO、PROMAX 这个级别的空中机器人的公司数量,不会超过一只手。而且未来的几年里,可能还是这个数量,甚至会变得越来越少,因为这个门槛很高。

再从另一个维度给大家讲一讲,一个很想飞的机器人这件事情。

今天我在 IF 大会会场外面,看到一个英文词叫 Imagineering,Imagination(想象),加上,Engineering(工程)。我很喜欢,零零这年干的这件事情,为什么有一点反常规,大家平时不太愿意干。我们的方法论真的不太一样,因为我们真的是想象力驱动的一家公司,一个会飞的小机器人,帮你从计算机视角记录生活。这件事情只有足够疯狂的人才愿意去干,就算你把产品做出来,哪怕去推广都很难。为什么?因为它已经超过了大家正常能够想象的范畴。比如我现在有一个婴儿车,可能每天在用,我会自己想有没有可折叠的,这样会便携一点,比较容易放到车上,但应该没有正常人哪天早上起来,决定去百度上搜一搜飞行相机。让相机飞起来这件事情太疯狂,超过了大家的想象,这也是我们觉得这件事好玩的地方所在。我们很希望看到越来越多像零零这样不怕死的公司。10 年说长也长、说短也短,10 年前过年家里的小孩管我叫哥,现在都叫叔了,可能人生精华的 1/5 或 1/6 就这么过去了,但我们觉得自己做的这件事,还是比较有意义的。

飞行相机可能是生活中不可忽视的新的机器人品类|图片来源:极客公园

就像 iRobot,今天扫地机器人大家已经司空见惯了,但是它也走了很长的路径。从 1992 年公司成立,一直到全球出货量突破千万台,走了整整 17 年的时间。还有另外一个公司是戴森,戴森从车库里面开始做无袋吸尘器是一九七几年,他们差不多做了 20 年的 ODM,才有机会做自己品牌的产品,戴森现在是英国首富。我觉得这样的创新或者去开拓一个新品类这件事,从你决定去做它的那一刻开始,就注定了它不容易,但是所有的乐趣和精彩也都是因为它不容易。这 10 年五味杂陈,但有像极客公园这样的朋友们一直陪伴着我们,我们觉得很幸福。

今天站在台上,信心比以前足很多,因为我们全球的用户已经飞了几千万次,在过去短短一年时间里面。很多用户都在用,哪怕是在三四线城市,现在很多阿姨和大伯们,都在很尽兴的享受生活,在用这个小小的飞行机器人帮他记录。

零零从 2014 年到现在,这短短 10 年里面,算是把飞行相机这件事撕了一个小口子。我觉得 2024 年真的可以算是飞行相机的元年,就是我刚刚讲到 MVP,最小可实现产品,我觉得我们做到了。但接下来十年更精彩、更激动人心,飞行相机很可能会变成大家生活中不可忽视的一个新的机器人品类。

我大胆预测一下,飞行相机真的有机会成为第二个年出货量超过千万台的机器人。今年市场又有新的变化,我们有其他一些玩家、一些伙伴、一些友商,也加入到我们这个赛道,也做出了一些飞行机器人。我觉得这是好事情,它就应该走进千家万户,走到大家的生活里面,大家去比拼技术、比拼产品力,这是正向的竞争,我觉得很好。

大家不用记住我,但要记住哈浮,哈浮就是飞行相机。谢谢!

 

浏览量: 52

雷军:小米汽车 2025 目标 30 万台;Altman 确定 GPT 将有「成人模式」;字节否认砸 70 亿美元买 AI 芯片

雷军:小米汽车 2024 年交付 13.5 万辆,2025 年目标为 30 万辆

12 月 31 日消息,雷军开启跨年直播,在超过 4 个小时的直播中,雷军首次回应了外界关心的三件事,包括了小米 SU7 上市 9 个月后的销量数字、2024 年 AI 大背景下的研发投入,以及小米今年宣布新零售定位调整后的渠道扩张情况。

雷军称,2024 年全年小米汽车销量达到了 13.5 万辆。根据官方公布的数据显示,蔚来在今年前 11 个月的交付成绩 18.06 万辆、理想 44.2 万辆、小鹏 15.34 万辆,这意味着小米仅用了 9 个月的时间,就接近了小鹏和蔚来积累多年的单自然年的整车交付量。

除了产能爬坡之外,小米还在继续扩大渠道投入,雷军透露,截至 2024 年底,小米汽车在全国 58 个城市设立了 200 家门店。这个数据在 9 月 30 日小米上一次公布成绩的时候,还只有 38 个城市和 127 家门店。

在谈到明年小米汽车的销量时,雷军为内部确定了 30 万辆交付目标。(来源:腾讯科技)

明年将斥资 70 亿美元购买英伟达芯片?字节跳动回应:报道不实

12 月 31 日消息,字节跳动对「计划明年斥资 70 亿美元购买英伟达芯片」的报道作出回应。字节跳动方面明确表示,相关报道中所提供的信息是「不实」的。

据报道,这项计划将由字节跳动创始人张一鸣领导,他最近一直在与东南亚和其他海外地区的数据中心运营商谈判,以便在明年英伟达下一代最强 Blackwell 芯片上市时就能够使用。报道更指出,根据全球技术咨询公司 Omdia 估算报告,字节跳动已成为中国市场英伟达人工智能芯片的最大买家,甚至是英伟达在亚洲的最大客户。

另外,该机构报告显示,微软在 2024 年订购的英伟达 Hopper 芯片总数达 48.5 万枚,超过全球其他科技公司,位列第二的则是订单量各约 23 万枚的字节跳动和腾讯公司。(来源: 广州日报)

 

Sam Altman 确定 OpenAI 新产品,AGI、Agents、成人模式

1 月 1 日消息,Sam Altman 公布了 2025 年 OpenAI 即将发布的技术产品。分别是:AGI(通用人工智能)、Agents(智能体)、更好的 GPT-4o 升级版、更好的记忆存储、更好的上下文窗口、成人模式、深度研究特色功能、更好的 Sora、更好的个性化定制。

上周圣诞节那天,Sam 发布了一个征集推文,2025 年你希望 OpenAI 发布哪些产品和优化功能?目前,该帖子的评论超过 1 万,浏览量超过 380 万,用户的参与度相当高。

而今天公布的多数技术就是来自用户的反馈。例如,「成人模式」是由 Pliny the Liberator 网友提出来的,他希望可以让模型失去护栏,这样更简单干净。Sam 回复他的是肯定需要某种「成人模式」。(来源:华尔街见闻)

 

理想汽车 2024 年累计交付量突破 50 万辆

12 月 31 日消息,理想汽车官方宣布 2024 年累计交付量突破 50 万辆。据官方介绍,理想汽车成为首个达成年交付 50 万辆的新势力品牌,也是首个达成这一里程碑的中国豪华品牌。

根据最新销量数据显示,2024 年第 52 周 (12.23-12.29),理想汽车周销量达 1.34 万辆,连续 36 周获中国市场新势力品牌销量第一。截至 2024 年 11 月 30 日,理想汽车 2024 年共交付 441995 辆,历史累计交付量为 1075359 辆。

12 月 31 日,理想汽车向 AD Max 用户全量推送 7.0 车机系统版本,此次 OTA 更新将引入高速和城市全场景的端到端升级以及 VLM 功能。据悉,新系统新增 AI 推理可视化交互、Mind GPT-3o 多模态智能体和 Mind Diffusion V2.0 绘画大师等功能。(来源:易车网)

何小鹏:2025 年扩招 6000 人,欢迎老员工回归

1 月 1 日消息,「我大胆预测价格战会从 1 月开始点燃,缺乏智能化,没有全面研发和市场能力等核心竞争力的车企将失去持续发展的机会。」12 月 31 日,小鹏汽车董事长、CEO 何小鹏发布全员信,并提出未来 10 年是 AI 的时代,需要将小鹏汽车打造为「面向全球的 AI 汽车公司」。

整个 2024 年,小鹏汽车走出前低后高的趋势。今年初小鹏汽车交付量连续在低位徘徊,至 5 月首次实现月交付破万辆。随后几个月内,在 MONA M03 以及小鹏 P7+等新车型帮助下,小鹏汽车交付量出现快速增长。9 月开始,小鹏汽车月交付量连续超过 2 万辆,并在 11 月首次实现月交付 3 万辆。

何小鹏认为,2025~2027 年,汽车行业将进入淘汰赛阶段,最近全行业也更真切地感受到淘汰赛的寒意。虽然新能源汽车渗透率有望持续走高,但极致的成本控制及配置的同质化,会引发更激烈的竞争,缺乏智能化,没有全面研发和市场能力等核心竞争力的车企将失去持续发展的机会。(来源:新浪财经)

 

盒马今年连续 9 个月实现整体盈利

12 月 31 日消息,盒马 CEO 严筱磊发布内部信。她在信中指出,过去的 9 个月,盒马做了三件事:回归用户价值、聚焦发展方向、推进组织建设。

严筱磊称,盒马在连续 9 个月整体盈利的基础上实现了双位数增长。这也是严筱磊接任盒马 CEO 后,首次公开披露盈利情况。2024 年年初,盒马创始人侯毅宣布退休,不再担任盒马 CEO 一职,CFO 严筱磊在 2024 年年初开始兼任 CEO。严筱磊于 2018 年加入盒马担任 CFO,她为盒马定下三年后 GMV 达到 1000 亿元的目标。

2024 年 3 月-6 月,在新任 CEO 严筱磊的调整下,盒马第一次实现淡季盈利,且进入连续盈利期。2024 年,盒马共开出 72 家新店,平均 5 天开出一家新店,开店速度约为 2023 年的两倍。其中三分之一位于二三线城市及县城,开店数量为近五年之最。目前,盒马全国总门店近 430 家,遍及 50 个城市,而今年新开店城市和区域共有 21 个。(来源:界面新闻)

 

智谱首个推理模型人人免费用,考研数学得 126 分、还能编写小游戏

1 月 1 日消息,智谱 GLM 模型家族迎来了一位新成员——GLM-Zero 的初代版本 GLM-Zero-Preview,主打深度思考与推理。从年初到年末,在接连推出新一代基座大模型、多模态模型、视频生成模型以及语音模型之后,智谱补上了推理模型这块拼图。

据介绍,GLM-Zero-Preview 是 GLM 家族中专注于增强 AI 推理能力的模型,擅长处理数理逻辑、代码和需要深度推理的复杂问题。同基座模型相比,GLM-Zero-Preview 既没有显著降低通用任务能力,又大幅提升了专家任务能力。

以数学能力为例,智谱让 GLM-Zero-Preview 做了一整套 2025 年考研数学一,最后得分为 126,达到了优秀研究生水平。从下图可以看到,模型给出了详细的解题步骤。它可以帮助开发者快速编写代码,如下使用 HTML 语言独立编写了一个第一人称射击游戏,它还可以调试代码,快速识别错误并给出修复建议。(来源:机器之心)

消息称苹果青春版 iPhone 叫 16E:自研 5G 芯片首秀、后置 4800 万单摄、OLED 屏幕

1 月 1 日消息,消息源 Majin Bu 昨日(12 月 31 日)在 X 平台发布推文,曝料称苹果会在 2025 年推出新款 iPhone,产品名称不会叫做 iPhone SE 4,而是叫做 iPhone 16E。

消息源还表示 iPhone 16E 手机采用和 iPhone 14 类似的设计,配有 OLED 屏幕和操作按钮,会有白色和黑色两种颜色。该机采用 6.06 英寸 60Hz OLED 屏幕。该机的相机配置与 iPhone 16 的主摄像头和前置摄像头相同,均为 4800 万像素后置「Fusion」镜头(可拍摄标准照片和 2 倍变焦照片)和 1200 万像素 TrueDepth 前置摄像头,但缺少超广角镜头。

iPhone 16E 将支持 Apple Intelligence,并首次搭载苹果自研的 5G 调制解调器,自 2022 年 iPhone SE 支持 5G 以来,这是苹果低端智能手机的首次重大更新。售价方面,IT 之家此前报道,iPhone 16E 起售价为 499 美元。(来源:IT 之家)

 

首款骁龙 8 至尊版折叠屏,OPPO Find N5 蓄势待发

12 月 31 日消息,有爆料人士曝光了一加 Open 2 的外观渲染图,这就是 OPPO 将在春季要发布的 OPPO Find N5(对应的海外版本命名为一加 Open 2)。渲染图显示,OPPO Find N5 的摄像头 DECO 跟 Find X8 相似,后置哈苏三摄系统,包含主摄、超广角以及潜望长焦。

对比上代 Find N3,OPPO Find N5 最大变化是机身大幅减薄,其折叠态厚度不到 10mm,是 OPPO 史上最薄的大折叠机型,而且支持 IPX8 级防水,耐用性也得到了大幅提升。核心配置上,OPPO Find N5 采用 8 英寸内屏,分辨率为 2K,刷新率是 120Hz,外屏尺寸是 6.4 英寸,搭载高通骁龙 8 至尊版处理器。

这是行业内第一款骁龙 8 至尊版大折叠屏,新品会在明年春季登场。OPPO 周意保表示,接下来 Find 系列的节奏会稳定下来,给到稳定的时间预期,以后每年 Find 会有春季旗舰发布会+秋季旗舰发布会。(来源:快科技)

哈勃拍摄到的 6.5 亿光年外的 SN 2024PI 超新星大爆炸

1 月 1 日消息,哈勃太空望远镜捕捉到了令人着迷的 LEDA 22057 星系,它是最近一颗超新星 SN 2024PI 爆炸的发生地。这张来自哈勃太空望远镜的新图片展示了星系 LEDA 22057,它位于大约 6.5 亿光年外的双子座。

LEDA 22057 也是一颗壮观的超新星爆炸的发生地。这颗超新星被命名为 SN 2024PI,于 2024 年 1 月首次被自动巡天探测到。这项巡天观测每两天扫描一次整个北半夜空,迄今为止已经记录了一万多颗超新星。

虽然银河系中几乎所有的恒星有一天都会演化成白矮星,这也是太阳在大约 50 亿年后的命运,但并不是所有的白矮星都会以 Ia 型超新星的形式爆炸。要做到这一点,白矮星必须是双星系统中的一员。当白矮星从恒星伙伴那里汲取物质时,白矮星就会变得过于巨大,无法支撑自身。由此产生的失控核聚变会在超新星爆炸中摧毁白矮星,在许多星系之外都能看到这种爆炸。(来源:cnBeta)

 

浏览量: 37

美团外卖推防疲劳,12 小时强制下线;苹果 iOS 18 视觉增强默认启用,隐私堪忧;小米宠物员工狗走失,公司急寻

美团将在全国上线防疲劳机制

​12 月 30 日消息,美团骑手防疲劳机制已于今日在全国主要城市范围内启动上线工作。

美团骑手收到的通知显示,跑单超过 8 小时会收到提醒,此后每隔一小时提醒一次;跑单 12 小时将强制下线。

美团北京某站长表示,此次上线的防疲劳机制也会平衡考虑骑手当日的接单情况,美团项目组每周都在收集意见反馈,持续完善机制。

根据此前美团披露的骑手「防疲劳试点」数据及调研结果,试点区域 99.82% 正常跑单的骑手不受影响,连续跑单触发休息条款的骑手仅占 0.18%,该举措有效保障了骑手休息权,防止极小部分极端案例。(来源:界面新闻)

英伟达计划 2025 上半年发布新一代人形机器人芯片 Jetson Thor

12 月 30 日消息,据 techeconomy 报道,英伟达计划在 2025 年初发布专为仿真机器人设计的新型芯片 Jetson Thor。

据悉,Nvidia 希望为全球数百家机器人开发商提供所需的基础技术。而 Nvidia 机器人副总裁 Deepu Talla 称,公司的做法是充当推动者,提供一个坚实的平台,支持将人工智能集成到机器人系统中。这一举措的时机与两项技术进步有关。人工智能生成模型的普及和模拟训练环境的能力为机器人技术的发展带来了新的可能性。

预计到 2029 年,全球机器人市场的产值将达到 1650 亿美元。借助 Jetson Thor,Nvidia 旨在加强机器人技术,使机器能够执行复杂的任务,并改变从制造业到医疗保健业等各个行业。该公司正在利用尖端技术和合作伙伴关系,成为机器人行业增长的创新驱动力。(来源:品玩)

 

剪映产品负责人张逍然离职

剪映产品负责人张逍然目前已经离职。据公开资料显示,张逍然毕业于武汉科技大学、香港中文大学。她是剪映前身业务脸萌的早期成员,随着脸萌被字节收购而加入字节。从 2021 年底开始,就负责剪映、醒图、CapCut 等等产品在内的整体产品和业务,伴随着这个业务从初创期走向高速发展期。而在 2024 年初,原抖音 CEO 张楠宣布离开抖音,带队剪映及 CapCut 业务,张逍然则直接向张楠汇报。(来源:36 氪)

 

vivo 内部 MR 团队已达 500 人,原型机体验明年 9 月上线

12 月 30 日,vivo 执行副总裁胡柏山在接受采访时称,vivo 的 MR 团队已经达到 500 人规模,预计将在 2025 年 9 月份在全国十几个城市上线高保真原型机体验,产品已经在部分指标体验上会超越了苹果。在商业化进展上,则要根据内容生态的匹配情况。(来源:界面新闻)

特斯拉 Cybertruck 明年 1 月国内开售?官方辟谣

日前,市场有传闻称,特斯拉 Cybertruck 将在国内正式上市,计划于 2025 年 1 月 1 日正式开售。

12 月 30 日,特斯拉中国方面表示:「假消息,1 月 1 日并没有这个计划。」值得注意的是,目前特斯拉中国官网已更新 Cybertruck 的产品信息,总共有三种配置,分别为 Cyberbeast 野兽版、全轮驱动版和后轮驱动版。(来源:每经)

 

开发者质疑苹果 iOS 18 增强视觉搜索功能:默认启用,担忧泄露用户隐私

开发者 Jeff Johnson 于 12 月 28 日发布博文,曝料称在苹果 iOS 18 和 macOS 15 Sequoia 系统中,会默认启用「增强视觉搜索」(Enhanced Visual Search),会将用户照片数据传输给苹果公司,担忧该功能会泄露用户隐私。

在介绍「增强视觉搜索(EVS)」之前,需要追溯介绍 Visual Look Up(VLU)功能。该功能随 iOS 15 系统引入,主要是识别照片的元素,并提供相关的附加信息。例如,用户拍摄一只狗的照片后,该功能会尝试识别其品种。增强视觉搜索是 VLU 的增强版本。

对此,苹果强调 EVS 与 VLU 一样重视用户隐私保护。EVS 利用同态加密、差分隐私和隐藏 IP 地址的 OHTTP 中继等技术,防止苹果获取用户照片信息。尽管如此,位置数据似乎并未共享,因为部分照片的地标识别出现了错误。(来源:IT 之家)

 

智己官宣:正式取得 L4 无驾驶人智能网联汽车道路测试牌照

​12 月 30 日消息,智己汽车智驾项目总监王康宣布,成功获得 L4 无驾驶人智能网联汽车的道路测试牌照,至此,L4 产品线 2024 年的年度目标已都全部顺利完成。王康提到,这一成就为公司在智能驾驶领域的进一步发展奠定了基础。

此外,智己汽车在 12 月 23 日宣布新车交付量已达到 10 万辆,11 月销量为 10007 台,10 月全系销售也达到了 10001 台,连续两个月销量均突破万台。(来源:快科技)

 

小米宠物员工「樱桃」在银川走失,官方恳请网友帮忙寻找

​12 月 31 日消息,今天凌晨小米公司官微转发微博称:小米集团最可爱的宠物员工「樱桃」在银川市不慎走失,恳请朋友们帮忙留心寻找一下。

据悉,「樱桃」是一只小狗,走失时间是 2024 年 12 月 26 日 18:00 左右,走失地点在宁夏银川市西夏区宏图南街力成电气工厂附近。樱桃和旺财的监护人正在银川出差,为方便照顾小狗,将两只小狗一起带到银川。由于事发突然,并非正常外出状态,樱桃没有佩戴项圈、牵引带、狗牌、定位器。从事发当晚至今,采用各种方式(人工寻找、周围寻访、分发寻狗启事、购买社交媒体推送,雇专业寻犬团队)寻找都没有找到樱桃。

樱桃的监护人愿为有效线索(拍摄到确认是樱桃的清晰照片或视频,提供确切地点)现金酬谢 1000 元,收留照顾酬谢 3000 元。(来源:IT 之家)

「受惠于」自研芯片,消息称苹果 iPhone SE 4 售价为 499 美元起

12 月 30 日消息,韩国爆料人 yeux1122 于 29 日在 Naver Blog 发文援引日本通讯公司渠道消息称,新款 iPhone SE(预计为 iPhone SE 4)的起售价为 499 美元(IT 之家备注:当前约 3645 元人民币)或低于 7.8 万日元(当前约 3609 元人民币)。

该博主表示,该机售价之所以低于 500 美元,是因为其搭载了苹果自研的芯片。作为对比,上一代 iPhone SE 于 2022 年推出,起售价为 429 美元(当前约 3133 元人民币),国内发售价为 3499 元起。

而在本月初,彭博社记者马克∙古尔曼在 Power On 时事通讯中透露,苹果公司首款自主研发的调制解调器芯片将于 2025 年(明年)发布的新款 iPhone SE 4 中首次亮相,并在后续应用于部分 iPad 产品线中。虽然其性能不及高通,但古尔曼提到苹果自研方案的最大优势在于降低对高通的依赖,从而节约授权费用。

iPhone SE 4 预计搭载与 iPhone 16 相同的 A18 芯片组,配备 8GB 内存以支持 Apple Intelligence。根据本月早些时候的供应链消息,该机采用 6.06 英寸 60Hz OLED 屏幕。该机的相机配置与 iPhone 16 的主摄像头和前置摄像头相同,均为 4800 万像素后置「Fusion」镜头(可拍摄标准照片和 2 倍变焦照片)和 1200 万像素 TrueDepth 前置摄像头,但 SE 4 缺少超广角镜头。(来源:IT 之家)​

 

极氪大型旗舰 SUV 谍照曝光,官方曾称预计明年第三季度发布

12 月 30 日消息,博主「Geek 灯灯」昨日在抖音上晒出了两张极氪全新大型旗舰 SUV 的谍照。从外观来看,新车仍覆盖较厚的伪装,整体线条方正平直,前脸依稀可见竖条状的进气格栅。根据规划,该车内部代号为 EX1E。

在此之前,极氪智能科技 CEO 安聪慧曾于 8 月透露,极氪首款搭载英伟达 Thor 芯片的全新旗舰 SUV 车型预计将在 2025 年第三季度发布。

英伟达于 2022 年 9 月 20 日发布了全新的 NVIDIA DRIVE Thor 平台,算力可达 2000TFLOPS,相当于 Altan 的 2 倍、Orin 的 8 倍,英伟达当时就表示极氪将在 2025 年首发该平台。(来源:IT 之家)

春运有救了!12306 试点系统自动提交购票订单

12 月 30 日,铁路 12306(含网站、手机客户端)开设了「购票信息预填优化试点」专区,在一定时间、一定区域内,试点推出「系统自动提交购票订单」功能。

本服务的期限截止到至 2025 年 2 月 8 日,适用于北京市、天津市、上海市、江苏省、浙江省、广东省各车站往返四川省、重庆市各车站始发终到列车的长途区段车票发售。

旅客在 12306 上预填购票信息之后,通过新开设的「购票信息预填优化试点」专区,可以预填购票信息、预支付票款,12306 就会自动提交订单。

预填乘车日期为春运期间(2025 年 1 月 14 日至 2 月 22 日)任意一天的购票订单,每个订单可选择「1 个乘车日期+最多 60 个车次」的组合,每名用户最多可同时保有 6 个待提交的购票订单,每个订单的乘车人最多不超过 9 人。

其中,2025 年 2 月 28 日 (正月十一) 只能查看预填订单。开车前第 16 天,12306 将发送通知,提示用户调整意向车次的优先级、确认订票信息,并选择是否预支付票款,预支付金额按照订单中最高执行票价缴纳。开车前第 15 天车票起售时,铁路 12306 将按照用户设置的优先级,依次为已预支付的用户自动提交购票订单,与采用其他方式的购票请求按照订单提交时间先后顺序一同进入购票队列。

购票成功后,预支付金额高于实际票款的将自动退还差价,购票不成功则全额退款,不收取任何额外费用。

如果没有支付,用户可按现有流程,在车票起售时手动提交订单,并完成支付。

 

浏览量: 16

脑机接口和 AI,一个硬币的两面

整理 | 汤一涛
编辑 | 靖宇

 
脑机接口一度承载了人们对赛博格的绝大部分想象,但是这两年脑机接口的进步似乎并不是预想中的快,尤其是在 AI 日新月异的进步衬托下。
这其中当然有很多复杂的原因。脑机接口本身就是一个典型的交叉学科,涉及到了电极材料、芯片封装、医疗器械、算法,是一个非常复杂的全系统。更为关键的是,伦理问题使得脑机接口的每一次试验都必须十分慎重。彭雷提到,他们往往需要一年时间来准备一场试验。
实际上,AI 的很多关键技术突破,往往都有脑科学理论的身影,例如神经网络,例如图像识别。
2021 年,上海脑虎科技有限公司成立(下称「脑虎科技」)。对比另一家脑机接口的明星公司——马斯克的 Neuralink,在成立的 3 年中,脑虎科技已经把两者的差距从 7、8 缩小到了 3 年内。
在彭雷看来,脑机接口和 AI 分别象征着桥的两端,一端代表碳基生命拥抱硅基生命,一端代表硅基生命模拟碳基生命。他相信,soon or later,这两个技术都会在桥的中间合拢。
以下是脑虎科技 CEO 彭雷在 IF 2025 的演讲全文,经极客公园整理。在演讲中,彭雷分享了脑机接口和 AI 的关联,以及脑机接口的未来。

彭雷在极客公园 IF2025 创新大会上讲解脑机接口技术的最新进展|图片来源:极客公园

 

01 神经科学启发了很多 AI 的关键突破

大家下午好,我是脑虎科技的 CEO 彭雷,今天我分享的话题是「一个硬币的两面——AI 和 BCI」。BCI 就是脑机接口的简称,叫 brain-computer interface。
听上去大家可能觉得 BCI 跟 AI 没有什么联系,但我相信听完我的分享之后,大家会发现其实这两件事情在底层逻辑层面上有很高的一致性。它们有一个互洽的过去,也有着一个共同的未来。
我们回顾一下 AI 过去 20 年,尤其是最近 3、5 年的重大事情,你会发现神经科学在 AI 几次关键技术突破上都扮演了非常重要的角色。例如,我们最早对神经网络的设计来自于我们对大脑神经元的放电的原理的研究,然后产生了神经网络;图像识别是来自于视觉神经元怎么处理视觉信号的一些研究;包括 Transformer 架构以及现在的大语言模型,背后本质上是一个叫 attention 的机制,这也来自于神经科学里对人的注意力的研究。

今年获得诺贝尔奖的 Jeff Hinton 就曾经也说过,人工智能的整个研究都是借鉴神经科学的基础。但上个月在跟多伦多大学的采访中,Hinton 也说,他作为一个做了 20 年 AI 研究的科学家,觉得现在对神经科学的研究太慢了。

也就是说,刚开始神经科学给 AI 起了个头,但是后面 AI 的发展速度更快,显得神经科学的发展速度慢了。这个背后有很多原因,我稍后会展开。
首先问一个问题,大家有没有想过大脑跟 GPU 的关系是什么?大家可能觉得好像没有什么可比性,但实际上从物理上来讲、从数学上来讲,他们是有很多方面可以参照对比的。
就拿现在大家已经买不到的英伟达的 H200 来举例子。它的晶体管有 10 的 11 次方;大脑差不多是 860 亿个神经元,大概也是 10 的 11 次方。所以GPU 从浓度上来说已经可以做到和大脑比较一致了。
但是从结构组件上来讲,GPU 晶体管之间的连接,还是跟大脑有重大的区别。大脑神经元跟神经元之间的连接可以有 10 的 4 次方次,而晶体管跟晶体管之间的连接可能是个位数。所以从这个角度来讲,虽然说晶体管跟神经元数量相当,但是它们在连接通路上有 10 的 4 次方的差异。
这是第一个差异点。
第二个差异点,大脑是存算一体的,没有计算单元和储存单元分离这么一说;而我们现在的计算机在冯·诺依曼架构下,还是存算分离的。
第三个差异点是软硬分离和软硬一体的差别。我们不管开发什么软件,可以跑在这台电脑上,也能跑在那台电脑上,软件跟硬件是可分离的。但是大脑的软件跟硬件是不可分离的。
所以之前有人问我,AI 是不是可以很快地模拟整个大脑?
我自己认为大概还有 10 的 9 次方的差异。其中自于 10 的 4 次方,是由于神经元之间的连接通路比晶体管的连接通路复杂很多。
还有 10 的 4 次方到 5 次方的差异是来自一个重要的特性,叫神经可塑性,就是说这个神经元跟神经元之间的连接是可以动态变化的。像今天我在跟各位分享,本质上就是我的 800 亿个神经元在噼里啪啦地放电,传递我想说的话。在座的各位的神经元也在噼里啪啦地放电,我的声音。而听完这段声音之后,你们今天回去,你的大脑会永久地被我所改变——因为我创造了你的新的连接,产生了新的 pattern,你有了新的认知、新的记忆。那这个过程就意味着神经元之间的连接是可以被改变的,而晶体管之间的连接是不能改变的。这里面至少又差了 10 的 4 到 10 的 5 次方的复杂度。
所以说我说这两个路径是在相向而行的,但是两边的速度不一样。

 

02 脑机接口行业在做什么?

接下来我展开说说 BCI,跟大家讲一下 BCI 到底在做什么。
首先跟大家做一个简单的科普,脑科学中对大脑的认知。我们知道它是我们最重要、最脆弱的器官,也是我们有别于动物最重要的区别。但在脑科学的定义中,我们所有的感知、认知、记忆、情感、情绪全是由电信号决定的。只要我能读你的电信号,我就有机会能改你的电信号。
所以说我们面对的自身,本质上其实是一堆电信号产生的各种感知跟认知。
那我们现在对大脑的了解是什么水平呢?
我觉得人类目前对大脑的了解可能不到 10%。大脑有不同的区域,今天我们已经知道哪些地方管理运动,哪些地方管理语言,哪些地方管理听觉。但是更高级的功能,像知识、记忆、情感、意识、自我认知,这些在哪其实我们都不知道。
也就是说,我们大概知道基础的运动是怎么控制的,但其他的东西都还处于探索阶段,它是由非常复杂的网络来支配的。

而脑机接口的本质就是在大脑的不同区域里面插入电极。电极就像导线一样,对那个区域神经元放电的信号进行读取,同时也可以对那个神经元进行刺激。

脑机接口的特征是个典型的交叉学科,涉及到了电极材料、芯片封装、医疗器械、算法,是一个非常复杂的全系统,难度是非常之高的。而我们做很多研究的目的,都要解决如何让大脑在植入脑机接口的时候受益更多、受创伤更少。这是一个不断要 trade off 的事情。
这是脑机接口的植入位置,是一个纵剖面。植入的过程就是切开头皮、颅骨、硬脑膜到脑组织,让电极插在不同的位置,能记到不同的信号。简单地讲,离脑子越近,记到的信号越好。

现在行业里面主要有三个技术路线。一种是左边的这种硬质电极,就这么一个铁盘。这其实是个硅片,有指甲盖那么大,上面有 100 根针。它直接打开大脑插到你的大脑皮层里面去。这 100 根针,就意味着 100 个通道,可以记录 100 到 200 个神经元放电的信号。

第二个是血管支架,通过静脉血管放在大脑里面,血管里面隔着血管去记录神经元。
第三个就是马斯克的 Neuralink,包括我们脑虎科技使用的柔性电极系统。

诞生 20 年以来,第一种技术路线全球植入了 60 个人,第二个路线植入了 10 人,第三个路线是 3 人。

这是第一个技术路线插到人脑上的效果。可以看到患者头上有一个非常大的设备,我们叫 head stage。这个设备是将电信号转移出来,然后基于这个信号来控制机械臂进行一些简单的操作。这个患者是高位截瘫,意味着他脖子以下都是不能动的。但植入脑机接口后,他可以控制两个机械臂切蛋糕吃。我们看上去是平平无奇的动作,但对于一个高位截瘫的患者来讲,切开蛋糕,用叉子叉起来,很缓慢地拿到自己嘴里,是很困难的一件事情。但是通过脑机接口,配合机械臂,这一步已经可以实现了,可以非常大地提升患者的生活质量。

但你也可以看到,这套效果永远还能在实验室实现。他头上接了 3 根线,还有龙门架和其他一堆设备,你没有办法在医院或者家里用。

第二种路线,血管支架,就是把电极放到血管里。它的天花板比较低,我就跳过了。
第三种技术路线,柔性电极系统,代表公司就是马斯克的 Neuralink。马斯克真正当 CEO 的只有 3 家公司,一个特斯拉,一个 SpaceX,最后一个就是 Neuralink。
这是 Neuralink 今年最新的临床进展,可以看到它将前面头上那 3 个很大的设备变成了一个极小的单设备的脑机接口,植入皮下之后完全实现了无线。这是我觉得工程师跟科学家的区别,科学家可以跑 20 年,证明原理可行,但干得非常复杂。马斯克就用它的第一性原理把设备干得极小、极方便,工程能力拉满。

今年 1 月份 Neuralink 植入了第一个患者。这个患者也是高位截瘫,它通过脑机接口能够完整地控制电脑。他正在玩的游戏叫 Webgrid,原理就是移动鼠标点击。

这个游戏在在 Neuralink 官网上就有。我玩这个游戏大概是 11 分,已经是非常快的速度,我们公司平均下来得分在 9 分左右。但是这个患者纯粹用脑控制想象,就可以做到 9.5 分,已经比很多健全的人都快了。
我们讲脑机接口发展需要 3 个核心的要素,高通量、低创伤和长期在体。
高通量很好理解,我们有 800 亿个神经元,那我们希望能记录下来的神经元数量是多少?马斯克能记录 1024 个,我们能记录 256 个,还有几倍的差距。但我也抛出过一个概念是脑机接口的摩尔定律,就是我们认为能读写神经元的数量,每 18 个月应该会翻一番,至少我们是这样做的,马斯克也是这样做的。
所以说未来 8 年、 10 年,我觉得能记录上百万通道神经元的脑机接口一定会出现。这样你控制手、控制机械臂,甚至控制特斯拉车、控制 Optimus 机器人,从原理上来讲都是可行的。

 

03 为什么神经科技发展速度比 AI 慢?

AI 和脑科学真的是一个桥的两边,在相向而行。我们整个产品包括了硬件、软件和动物资源,AI 领域里面也有同样的硬件,软件跟实验资源,完全可以对应。我们做的脑机接口的这套东西,放在 AI 领域就是英伟达做的事情——从整个基础的芯片、到硬件框架、网络连接、交换等等。然后数据跟算法其实就是 CUDA,就是 hugging face。但是现在在 AI 里面有非常成熟的数据集跟算法的分享集,脑科学里面还没有形成,所以我们要建立自己对脑信号脑算法解码的 Hugging Face 跟 CUDA。
但是为什么神经科学的发展速度比 AI 的慢?原因只有一个,就是伦理。我们没有办法大规模地去做动物的实验和人的试验。每做一次试验,我们都要准备一年,要非常严格地评估患者的受益,一步步按照相关的要求走。但是 Sam Altman 去融 15 亿美元,把 GPU 的规模放大 20 倍,就可以迭代了。
所以说我们也希望在脑科学领域成为英伟达这样的基础公司,加上像 Hugging Face、CUDA 这样的生态,来让全球的神经科学家共同加速,这样我们硅基跟碳基的融合可能会比想象的更快来到。
我们脑虎在去年做到了两个实验,一个是训练狗在跑步机上走路,来解码它怎么控制四只腿的;另一个是训练猴通过解码来打乒乓球的游戏。这两个是马斯克在 21 年做到的事情,我们在 23 年做到了。所以说从实验进度的角度来讲,我们大概落后它两年半到三年的时间。但我们作为一家新创的中国公司,跟它的这个差距是从最初的七八年慢慢的缩小 3 年,我们觉得还是进步很快的。

 

04 脑机接口的未来

那马斯克现在在做什么呢?
第一个是运动恢复。现在的患者都是用脑控设备,但是未来可以做到脑控外骨骼、脑控机械臂,那患者就可以用他自己的躯体站起来,或者控制机器人来帮他做一些事情。
第二个是语言接口。我现在已经在非常快地表达了,但其实也就每分钟 140 个字。实际上大脑的想象速度肯定超过 140,只是人讲不了那么快,你也听不了那么快。有朝一日通过脑机接口,可以将我的表达用 1 分钟 800 个字传递给你,就不用这么来回讲了。去年实验室里已经能够做到正常人说话速度的 60%,未来这个速度一定还会提高。
第三个是视觉。对于盲人或者没有眼球的人,可以通过在视觉皮层刺激,让他看到黑暗中有闪烁的白色的斑点。这些白色的斑点就可以用来描绘物体的边界。那对于一个盲人来讲,60 个通道能看到这样的东西。到 600 个通道、 2000 个通道,其实可以说绕过眼球传递视觉是完全可行的。马斯克已经开始招募做视觉刺激的患者了,我相信在明年年底这个产品方案应该就会看到第一个植入的人。

 

第四是记忆假体。大家可能发现自己随着年纪大了,记忆越来越差。本质上对记忆储存的位置还在研究中,但是有一些机会能够对记忆进行强化,或者选择性遗忘,甚至修改。当然现在修改还远远谈不上,但是加强跟选择性遗忘是有科学根据支撑的了,也有些公司在做这样的事情。

然后还有具身智能。Optimus 前两天刚发了视频,可以看到它下个坡已经很流畅了,也能适用于各种环境。相信未来植入脑机接口的人也不一定完全要靠自己的身体,可以直接通过脑控 Optimus 帮他完成事情。那这可能就真是一个机械飞升的过程。
我们相信硅基生命和碳基生命的融合会在 2035 到 2045 年之间发生。我们代表了碳基生命这边拥抱硅基生命的趋势,其他 AI 伙伴们代表了硅基生命在模拟我们的方式。反正 soon or later,我们会在中间合拢。
我相信大家在有生之年一定可以看到这件事,我们也希望能够共同推动把这件事做成。
浏览量: 38

我们试了市面上八款视频模型,发现 Sora 确实不太行了

 

头图来源:即梦AI

 

过去一个月,随着 Sora 正式面向用户开放,视频模型赛道进入了新一轮疯狂内卷。不仅谷歌推出号称最强视频模型 Veo 2,国内的可灵、Minimax 也相继更新。视频模型的热闹,一时间甚至盖过了近期大热的推理模型和3D生成模型。

 

有意思的是,被认为行业标杆的 Sora——这个去年春节期间发布的惊艳了全行业的期货,却在正式发布后遭到了极客们和不少业内人士的吐槽,认为其表现没有想象中惊艳,尤其对比过去一年陆续发布的国内外视频模型,Sora 看起来已经没有优势甚至还要落后于这些“后辈”。

 

国内视频模型已经吊打 Sora?出于好奇,笔者选取了下面 7 款国产视频模型,加上 Sora,做了一个技术视角上未必严谨,但更代表用户直观体验的评测。

 

  1. 腾讯元宝
  2. 字节即梦AI
  3. 快手可灵AI
  4. 生数科技 Vidu 1.5
  5. Pixverse
  6. 海螺AI (MiniMax)
  7. 智谱清影

 

笔者选取了创意短片、高校、幻想、二次元、网红视频五个内容领域,分别用 ChatGPT 生成了五段提示词,来看看这八个模型,在这五个领域的生成表现到底如何。

 

最后先叠个甲:今天视频大模型实际使用的时候还很难一步到位,往往需要多次生成数十条甚至更多的视频,才能有几个可用的结果。由于时间有限,我们在测试时每个 Prompt 只生成了几段视频,从中挑选了结果比较好的一个,由于测试数量有限,这里不能作为严谨的能力测试,只让大家对今天国产模型的能力有一个整体印象。

 

1. 创意短片

 

首先测试的是创意短片,这其实也是今天视频模型最重要的商业化应用场景——今天一部分广告营销公司正在探索如何利用视频大模型制作商业宣传广告。过去在这个领域,制作一条高质量创意广告的价格可能高达数万乃至数百万没有。

 

而生成创意短片,其实考验大模型两方面的能力:第一是基于能否把一些抽象的概念,变成可以看得见、摸得着的故事,也就是创意能力;第二是把创意变成视频画面,也就是创作视频的能力。

 

ChatGPT 生成的提示词如下

 

用五个关键词:科技、爱情、未来、机器人、失落,生成一个科幻爱情短片,展现未来世界中人工智能与人类情感的碰撞。

 

我们用每一个视频模型都生成了数个视频片段,从中选取了比较的好一个,具体结果及观感如下所示:

 

  1. 腾讯元宝AI

元宝生成的这段视频效果比较一般,像是一个背景上贴了两张视觉中国的机器人和人类抠图。

 

  1. 字节即梦AI

即梦的这段视频的画面感觉稍微好一点,有点像2000年前后的星战电影,不过说是爱情,这两位看起来却像是同行,颇有点彩虹之风,这个精神状态可以说很超前了。

 

  1. 快手可灵AI

可灵的这段视频,机器人和人类的质感和着装更有未来科技感,五秒钟的视频像是演绎了《魂断蓝桥》里爱人重逢的经典画面,很有故事感,画面还用了一些电影运镜的手法。不过有点微妙的是,机器人看起来有点偏中性甚至女性,也有点彩虹风。

 

  1. 生数科技 Vidu 1.5:

Vidu 的这段和前几段视频走了一个完全不同的风格,很有赛博漫画的感觉,是几个大模型里主题风格最独特的一个。

 

  1. Pixverse:

跟可灵 AI 的感觉有点像,而且也有点彩虹风。

 

  1. 海螺AI (MiniMax):

海螺 AI 的这条画面和运镜处理的都不错,不过故事的诠释有点不像爱情,像「战友情」。

 

  1. 智谱清影:

智谱的这个确实有点抽象,人物建模有点像 3D 游戏,还跳了一段舞,另外 5 秒左右的时候男主的眼睛有点诡异。

 

  1. OpenAI Sora

最后是 Sora,这个确实有点难评价:机器人比真人大很多,而且全程无表情,像是机械神灵即将审判眼前的信徒。

 

综合来看,在创意短片的这八条视频里,七个国产大模型的表现都明显好于 Sora。其中几个模型的表现可圈可点:可灵和海螺的视频表现最自然,即梦比较真实,Vidu 比较则有特点。

 

2. 搞笑短片

 

第二组我们测试了搞笑短片,这其实是视频模型另一个非常有潜力的应用场景——越来越多的短视频创作者和内容公司正在尝试通过视频大模型来制作更生动、更贴近受众需求的娱乐内容。

 

生成搞笑短片,主要考验大模型在两个维度上的能力:其一是反应能力,即对恰当的幽默点的捕捉,其二是画面呈现能力,也就是能否通过将搞笑点准确传递,同时保持画面流畅。

 

ChatGPT 生成的提示词如下

 

生成一个视频,展示一只猫试图跳上沙发,结果一头栽进沙发的缝隙里,表现出惊讶和尴尬的表情。

 

我们用每一个视频模型都生成了数个视频片段,从中选取了比较的好一个,具体结果及观感如下所示:

 

  1. 腾讯元宝

除了「试图跳上沙发」表现成「爬上沙发」,元宝生成的这段视频对提示词的还原还是比较贴切的。

 

  1. 字节即梦AI

漏掉了「试图跳上沙发」的环节,只呈现了当一个人/猫尴尬的时候会让自己看起来很忙碌的即视感。

 

  1. 快手可灵AI

在完整表现提示词的前提下,连「尴尬」的表情都有。

 

  1. 生数科技 Vidu

完成了试图跳上沙发无果的部分,但是没栽进沙发的缝隙里,而是掉到了地上。

 

  1. Pixverse

怎么变成两只猫……掉下来那只脸上不是「惊讶」而是「惊恐」。

 

  1. 海螺AI (MiniMax)

没有掉进缝隙里,但能看出猫咪脸上若隐若现的尴尬。

 

  1. 智谱清影

跳上沙发没表现出来,中间猫猫还有点变形了,不过最后的「恼羞成怒」还是有点贴切的。

 

  1. OpenAI Sora

「栽进沙发的缝隙里」表现成猫咪的身体和沙发融为一体,瞬间变微型惊悚片。

 

综合来看,在搞笑短片的这八条视频里,元宝、即梦AI、可灵AI基本完整连贯地表现了提示词里的内容,其他模型的表现则有点多少缺失。

 

3. 幻想短片

 

第三组测试的是幻想短片。这同样是视频模型的一个重要探索方向——越来越多的内容创作者和公司开始尝试利用视频大模型打造具有高度沉浸感的奇幻世界。

 

生成幻想短片,其实考验大模型两方面的能力:第一是创意能力,能否从字面设定中,构建出一个充满想象力的世界,将未知的场景转化为具体可视的画面;第二是细节呈现能力,能否呈现出丰富的光影效果和动态的环境设计。

 

ChatGPT 生成的提示词如下

 

一个人在梦中穿越不同的奇异世界,包括浮空岛屿、巨型植物、以及巨大的未知生物。

 

具体结果及观感如下所示:

 

  1. 腾讯元宝

有点古风即视感,主打一个绿色调。

 

  1. 字节即梦AI

这个就更绿了,还很像游戏画面。「一个人在梦中穿越不同的奇异世界」这一点是一点也没体现。

 

  1. 快手可灵AI

这个「穿越」很快速,但除了植物没有其他生物了。

 

  1. 生数科技 Vidu 1.5

这个给人感觉很像「梦」,是那种五彩斑斓的梦,尤其开头生动体现了噩梦中的「惊吓感」。

 

  1. Pixverse

虽然人物最后一秒变形了,不过解读出了除了大型植物意外以外的存在。

 

  1. 海螺AI (MiniMax)

人物变形得很明显。不过这个梦的色彩还是蛮斑斓的。

 

  1. 智谱清影

主打一个粉色梦幻。

 

  1. OpenAI Sora

游戏操控弹跳视角。

 

综合来看,在幻想短片的这八条视频里,可灵AI和Vidu的表现最贴切,尤其Vidu跟其他大模型生成的内容似乎不在一个次元。即梦AI和Sora都太像游戏视角与画面了。

 

4. 二次元

 

第四组的关键词是二次元。风格化内容是视频模型主推的方向之一,二次元这一风格受众广泛,市场需求强烈。这类短片的创作对大模型在画风设定、角色设计和场景构建上要求较高,同时需要叙事和动态表现的深度融合。

 

ChatGPT 生成的提示词如下

制作一个二次元风格视频,讲述一位年轻少女在异世界冒险。她在一个被魔法和奇幻生物充斥的世界中,结识了各种伙伴,并面临来自黑暗势力的挑战。

 

具体结果及观感如下所示:

  1. 腾讯元宝

这完全是可以哄小孩的动画短片了,小女孩最后眉飞色舞的。

 

  1. 字节即梦AI

跟上一part的测试一样,又很像游戏画面。

 

  1. 快手可灵AI

这个也很像哄小孩的动画片,只是有点看不出「冒险」,一派其乐融融的景象。

 

  1. 生数科技 Vidu 1.5

这个动画的色彩有点过度饱和了。

 

  1. Pixverse

这个短片有比较明显的皮克斯动画风格。

 

  1. 海螺AI (MiniMax)

开头的年轻少女会有点让人想起葫芦娃,倒是号召来几个伙伴,就是最左边的伙伴变形了。

 

  1. 智谱清影

很日漫。

 

  1. OpenAI Sora

除了没有伙伴,对提示词的表现是相对最贴切的,不过就没有很二次元了。

 

这一组里智谱清影生成的内容最贴合二次元,但在画面上,Sora终于表现不错了,可灵AI产出的内容也很精美,pixverse的皮克斯风格也很到位。

 

5. 网红视频

 

最后一组测试的是网红视频,网红经济已经成为全球范围内的一大趋势,从内容创作者到品牌营销方,都在探索如何利用短视频来吸引流量和提升影响力,看看大模型在这方面的表现如何。

 

ChatGPT 生成的提示词如下

 

抖音网红在自拍时用创意特效改变背景,从普通街头一瞬间变成梦幻彩虹世界,最后加上她的微笑和俏皮手势。

 

具体结果及观感如下所示:

  1. 腾讯元宝

看来没识别出提示词中的「她」。

 

  1. 字节即梦AI

没有体现「变」的过程,直接背了个彩虹圆盘在身上。

 

  1. 快手可灵AI

这个生成效果真的很梦幻。

 

  1. 生数科技 Vidu 1.5

画风似乎有点古早,像是少儿节目预告片开头主持人亮相,然后也没体现街头这个背景。

 

  1. Pixverse

最后的画面定格有点吓人,左边两位女士的面部发生了畸变。

 

  1. 海螺AI (MiniMax)

这个就很贴切了。画面里的「人」很像人,画风也自然舒服。

 

  1. 智谱清影

开头画面的主角嘴歪了。6秒的视频都有点诡异。

 

8.OpenAI Sora

第四秒出现的手,是两只右手,而且上方的那一只手,看起来怪怪的。但主角的笑容很灿烂,主角也非常接近真人,抛开旁边作为画面辅助的那两只手,足以以假乱真了。

 

这一组里海螺AI和可灵AI胜出明显,无论对提示词的理解还是画面的审美、真实感都胜出一筹。

 

结语

 

在这五个场景测试里,国产视频模型在中文交互条件下,面对非专业用户群体,整体表现是优于Sora的。尤其是在创意短片、搞笑短片和幻想短片的创作中,可灵AI、海螺AI、即梦AI和Vidu都展现了出色的创意和视觉效果,能够捕捉幽默点、打造奇幻世界以及呈现独特风格。

 

在二次元和网红视频的表现上,智谱清影看起来是最贴合二次元风格的画风,而海螺AI则在网红视频中特效运用和场景切换上表现了不错的创意能力和视觉效果。

 

但这毕竟是个有限次数下的不严谨测试,并不能代表各个模型在不同场景中的实际表现,毕竟文生视频模型接下来的重点在于对场景的应用。

 

智源研究院副院长林咏华最近在采访中提到「经过今年的发展,无论是开源模型,还是闭源模型,2025年都会出现基于文生图、尤其是文生视频的应用。」

 

这也就意味着,2025 年视觉模型将从「基础能力的提升」转向「生产场景的比拼」未来的竞争不仅仅是在画质、速度等基础指标上进行比拼,更将在具体应用场景中的表现上展开较量,特别是在广告、娱乐等行业场景里。

 

随着技术的不断进步,视频生成的成本和速度将逐步降低,市场的门槛也会随之降低,未来,AI 视频生成将更多融入到更加复杂和多元的应用场景中,开启全新的产业竞争。

 

随着大模型的逐步成熟和应用场景的多样化,如何在具体生产场景中发挥最大效能,将成为未来的关键竞争点。

 

真正的挑战就要来了。

 

浏览量: 66

文章分页

上一页 1 … 51 52 53 … 85 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间