Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

特朗普:部署国民警卫队加强华盛顿治安

  中新社华盛顿8月11日电 (记者 陈孟统)美国总统特朗普11日在白宫召开记者会宣布,他将在华盛顿部署国民警卫队,以加强美国首都的治安。

浏览量: 3

哥伦比亚总统选举参选人遭枪击两个多月后去世

  中新社北京8月12日电 波哥大消息:当地时间11日,哥伦比亚参议员、该国总统选举参选人米格尔·乌里韦遭枪击两个多月后,于首都波哥大一家医院因伤重去世,殁年39岁。

浏览量: 3

雷军:小米YU7改名,被误会是丐版;传淘宝闪购周末峰值超美团;低价 MacBook 或年底亮相,599 美元

雷军征求小米 YU7 标准版改名意见:很多人误以为是入门或丐版,配置绝不输于竞品 Pro 和 Max 版

8 月 11 日消息,小米创办人、董事长兼 CEO 雷军在微博向网友征求小米 YU7 标准版是否改名的意见,称标准版很多人误以为是入门版或者丐版,但实际上非常强大,续航高达 835 公里,700 Tops 算力的 Thor 芯片和激光雷达等等,配置绝不输于竞品 Pro 版和 Max 版。

目前,该投票已有 2404 名用户参与,有 1794 票投给了「低调一些,继续叫标准版」、610 票投给了「对齐竞品,直接叫 Pro 或 Max 版」。

据此前报道,小米 YU7 于 6 月 26 日晚上市发布、7 月 6 日交付首批车主,提供 YU7 标准版、YU7 Pro、YU7 Max 三种车型配置,售价 25.35 万-32.99 万元。该车开售 3 分钟大定突破 20 万台,1 小时大定突破 28.9 万台,仅 18 小时锁单量便突破 24 万台。(来源:IT 之家)

OpenAI 申请 GPT-5 中国商标遇挫,相关申请均被驳回

8 月 11 日消息,OpenAI 上周正式发布新一代人工智能模型 GPT-5,该模型已在中国提交商标申请,国际分类涵盖科学仪器、网站服务,目前所有相关申请均已被驳回。

具体来看,OpenAI 公司已通过两家关联公司在中国提交了商标申请,其中:

欧爱公司申请注册两枚「OPENAI GPT-5」商标,国际分类为网站服务、科学仪器,目前均处于等待驳回复审阶段;

欧爱运营有限责任公司申请注册两枚「GPT-5」商标,国际分类同样为网站服务、科学仪器,商标状态也均为驳回复审中。

据悉,「GPT」全称为「生成式预训练转换器」,已被全球多国商标机构认定为通用技术术语,缺乏显著性。美国专利商标局(USPTO)曾两次驳回 OpenAI 对「GPT」的注册申请,理由是「阻止竞争对手正确描述其产品」。

发现,欧爱运营有限责任公司还在 2023 年申请多枚「CHATGPT」「GPT-4」「GPT-6」「GPT-7」商标,国际分类为科学仪器、网站服务,当前商标状态均为「驳回复审中」。(来源: IT 之家)

 

事关稳定币,蚂蚁集团辟谣

8 月 11 日消息,蚂蚁集团今日在其官微发文:关注到网络上有消息宣称「蚂蚁集团与中国人民银行、中国稀土集团共建全球首个稀土人民币稳定币」,并以此诱导投资者关注相关板块,蚂蚁集团从未与相关机构有此类计划,请公众注意甄别,谨防上当受骗。

(来源: TechWeb)

 

微软 GitHub CEO 托马斯・多姆克离职,将再次创业

8 月 12 日消息,微软 GitHub CEO Thomas Dohmke(托马斯・多姆克)晚间发文,宣布将卸任 GitHub CEO 一职,去开启他的下一段冒险。

托马斯表示,GitHub 正在蓬勃发展,未来前景光明。

托马斯在发给 GitHub 员工的内部帖子中表示,十多年前,他的初创公司被微软收购后,他和他的家人从德国搬到了美国。从开发移动开发者工具,到与 Nat Friedman 一起运营 GitHub 的收购,再到成为 GitHub 的 CEO 并引领公司进入 Copilot 和 AI 时代,「这真是一段难忘的旅程」。

然而,经过这么长时间,托马斯表示他的初创公司根源开始拉扯他,因此决定离开 GitHub,再次成为创始人。GitHub 及其领导团队将继续作为微软 CoreAI 组织的一部分执行其使命,更多细节将很快公布。(来源:IT 之家 )

美团上线「点外卖看鹿晗演唱会」活动,鹿晗工作室:平台活动非官方授权

8 月 11 日消息,近日,美团 App 内出现点外卖看鹿晗演唱会相关活动信息。对此,2025 鹿晗 Season4 亚洲巡演活动官方微博 @ 这就是 Season4 发文并配图表示:

如下某平台活动及话题,均非我方及鹿晗先生官方授权合作,已侵犯鹿晗先生的人格权及我方对该演唱会的独家合法权益。对此我方已完成取证,并保留依法追诉的权利。

随后,鹿晗工作室官方微博也转发了该消息并提醒网友:「请认准官方渠道,勿轻信此类未经授权的营销信息,保护好自身隐私及财产安全,谨防权益受损。」

值得一提的是,笔者在美团平台搜索发现,相关页面也出现了用户获得鹿晗演唱会门票信息。另外,有媒体就此事向美团方面求证,截至发稿,官方暂未回应,客服表示「相关问题会详细记录反馈给相关部门。」(来源:快科技)

 

消息称淘宝闪购上周末峰值首次超过美团

8 月 12 日消息,据晚点 LatePost 昨日晚间报道,在 8 月 7 日立秋这天,淘宝闪购的日订单量在当天 20 点就创下了新纪录,但这一天的日订单量,美团仍比淘宝闪购多出了约 2000 万单。

8 月 7 日 – 9 日,在「秋天的第一杯奶茶」「88 会员日」「大会员体系」「超级星期 6」各种促销活动以及居民楼办公楼商场车站随处可见的橙色广告的共同推动下,淘宝闪购的日订单量连续在这三天都超过了 1 亿单。据该媒体了解,8 月 8 日和 8 月 9 日,这两天淘宝闪购的日订单量份额首次超过了美团。

报道称,双方统计日订单量的口径并不统一:

  • 美团的口径是完成履约的订单,即当天配送到消费者手中的订单;
  • 淘宝闪购的口径是完成交易的订单,即当天消费者支付的订单,这其中也会包括预约第二天配送的订单,8 月 7 日那天淘宝闪购的预约单占比接近 10%。

而那些奶茶店最后倒掉的饮料,或者消费者付款后迟迟收不到货然后退款的订单,在美团和淘宝闪购都属于无效订单,不被统计在总单量。

根据淘宝闪购及饿了么官方发布的数据,8 月 7 日立秋当天,有 30 多万餐饮小店在淘宝闪购平台上成交突破峰值,饿了么骑手数量达到去年的 3.5 倍,平均收入是去年的 1.4 倍。(来源:IT 之家)

 

马斯克的最强 AI 模型 Grok 4 现已免费开放,非订阅用户每天可限量使用

8 月 11 日消息,马斯克上午宣布,Grok 4 现在对所有用户免费开放。免费用户每天可完成少量查询,超过限制则需要订阅。

根据 xAI 官方 X 账号的介绍,只需使用「自动」模式,Grok 就会将复杂的查询路由到 Grok 4。若用户偏好「掌控一切」,则可以切换到「专家」模式。在限定的时间内,xAI 将提供「慷慨的」使用额度。

据 IT 之家此前报道,马斯克曾宣称 Grok 4 是全球最强 AI 模型,在处理学术问题上的表现已经达到博士级别。

从官方公布的跑分数据来看,Grok 4 模型具备非常亮眼的成绩,在实时速度、推理能力和高级视觉等方面,将和 OpenAI、Anthropic 顶尖模型同台较量。(来源:IT 之家)

 

「全球首个孕育机器人」预计一年内面世,定价不超 10 万元

8 月 11 日消息,据潇湘晨报 8 月 10 日报道,国内某机器人公司创始人张其峰正在研发全球首个孕育机器人和传统的试管,这套系统模拟了子宫环境,还装进仿人类的机器人体内,让「机器人妈妈」从怀孕到分娩,全流程复刻人类体验。

报道称,目前该技术就是孕育箱的技术,只是将其与机器人的肚子相结合,预计「样机」一年内推出,定价不超过 10 万元。

张其峰是广州卡伊瓦机器人科技有限公司的创始人、董事长兼 CEO。该公司成立于 2015 年,推出了餐饮服务机器人系列、迎宾讲解机器人系列等多款产品。(来源:IT 之家)

长城全新坦克 500 Hi4-T / Hi4-Z 智享版汽车预售发布:带激光雷达、Coffee Pilot Ultra 驾驶辅助系统,36 万元起

8 月 11 日消息,长城全新坦克 500 Hi4-T / Hi4-Z 智享版汽车今日预售发布,新车配备激光雷达、搭载 Coffee Pilot Ultra 驾驶辅助系统,预售价 36 万元起。

  • 全新坦克 500 Hi4-T 智享版:36.00 万元
  • 全新坦克 500 Hi4-Z 智享版:38.88 万元

据介绍,全新坦克 500 Hi4-T / Hi4-Z 对车辆外观进行调整,配备激光雷达。外观方面,新车身轮廓与在售车型保持一致,采用举折中网 + 琉璃珀车标,配备斗拱大灯 + 宫阙之眸尾灯,辅以承天腰线设计;内饰方面,全新坦克 500 配备山水画卷中控台 + 丹陛石副仪表板、Coffee AI Sound、5.4L 智能冷暖双用冰箱、50W 双无线充电,并改用怀挡式换挡设计。

新车搭载长城汽车第三代智能辅助驾驶系统 Coffee Pilot Ultra,拥有 27 个辅助驾驶传感器(激光雷达 + 摄像头双冗余方案),包含 1 个激光雷达、3 个毫米波雷达、12 个超声波雷达、11 个高清摄像头。新车拥有全融合泊车系统,支持自定义泊车、记忆泊车、遥控泊车、倒车循迹等功能,同时还拥有 Coffee Night Vision 远红外夜视系统。(来源:IT 之家)

 

低成本 MacBook 或将于 2025 年底上市,售价 599 美元

据《电子时报》报道,预计新款 MacBook 的至少部分零部件将于 2025 年第三季度末投入量产。该报道援引供应链内部未透露姓名的消息人士的话,进一步称新款 MacBook 的售价将在 599 美元至 699 美元之间。

这样一来,新款 MacBook 的价格将与台式机 Mac mini 持平,并且比目前 13 英寸 MacBook Air 的起售价(999 美元) 低 300 至 400 美元。

据报道,新款 MacBook 的显示屏尺寸将略小,为 12.9 英寸。据 MacRumors 首次报道,生产计划意味着它将在 2025 年末或 2026 年初发布。这也与郭明錤之前的报道相符。

郭明錤没有透露更精确的发布时间表,也没有具体价格。但他表示,这款设备将配备约 13 英寸的屏幕,并有银色、蓝色、粉色和黄色四种颜色可供选择。(来源:cnBeta.COM )

法国最大核电站因水母入侵导致暂停运营

8 月 12 日消息,法国电力集团于当地时间 8 月 11 日宣布,位于法国北部的格拉沃利讷核电站因设备系统附近出现大量水母而停机,整座核电站暂停运营。

法国电力集团发表声明说,大量水母聚集导致水泵站过滤设备触发保护机制,4 台反应堆机组于 10 日晚至 11 日清晨相继停机。这座核电站其余两台机组因接受维护,先前已关机停运。

格拉沃利讷核电站位于法国北部省,临海而建,是法国最大核电站,共配备 6 座反应堆,总装机容量 5.4 吉瓦。

这次事件未对核电站、人员或环境造成安全影响。工作人员正进行紧急诊断和维修,以确保核电站安全重启。

据央视新闻援引法国媒体报道,全球变暖导致海温上升,有利于水母繁殖。格拉沃利讷核电站发言人说,水母入侵导致反应堆停机「相当罕见」,但历史上也发生过类似事件。(来源:IT 之家)

 

浏览量: 4

昆仑万维发布新模型 SkyReels-A3,开启五天技术发布周

 

作者|Li Yuan

编辑| 郑玄

 

笔者最近的 guilty pleasure,是沉迷于刷《甄嬛传》的二创和解析视频。

刷着刷着,就发现了一个有趣的现象:现在用《甄嬛传》的原声直接给产品打广告,已经成了一门新显学。前一秒祺贵人还在说「臣妾要告发熹贵妃私通」,后一秒可能就在用同样的声线推荐某款咖啡。而且,和早年的 AI 视频不一样,现在祺贵人的嘴型都已经可以对准地相当自然了。

不过,虽然在一两句台词上已经以假乱真了,只要超出一两句的范畴,「娘娘带货」基本上还是翻车的。

现有技术生成的视频,一旦拉长时间,各种问题就暴露无遗:人物的动作和手部常常僵硬扭曲,与商品或环境的交互极不自然;画面质量会随着时间推移出现视觉伪影甚至「崩坏」;镜头语言更是死板单一,无法满足专业场景需求。

用这种技术生成一两句带货视频插在一个长视频里,是猎奇的亮点,但真要让「安陵容」完整地唱一支 MV,或者让「皇后娘娘」做一场半小时的直播带货,观众很快就会因为这些挥之不去的瑕疵而感到疲劳,就算是《甄嬛传》这样的顶级 IP 也拉不住。

不过,AI 的进展,当然是很快的。你永远可以相信 AI 的发展速度。

8 月 11 日,昆仑万维就正式发布其在 AI 视频生成领域的最新力作—— SkyReels-A3 模型,似乎就是为了精准解决上述所有问题而来。

据悉,昆仑万维 Skywork AI 技术发布周正式启动,8 月 11 日至 8 月 15 日,每天将发布一款新模型,连续五天发布覆盖多模态 AI 核心场景的前沿模型。

基于 DiT(Diffusion Transformer)视频扩散模型,只需要输入参考图像/视频,文本 prompt 和音频, SkyReels-A3 模型就能生成长达一分钟的可以用文本控制的数字人视频。

SkyReels-A3 模型专门对手部动作交互、运镜控制和美感表达进行了增强,瞄准的是包括口播导购 带货、MV/演讲等 情景。

当前 SkyReels-A3 模型已上线,欢迎登录 SkyReels 官网体验,登录后在左侧导航栏中选择 Talking Avatar 工具。

 

 

这意味着,娘娘们也能带货了?

 

01

直播介绍商品可用,

和物体交互十分自然

 

在 SkyReels-A3 模型生成的视频中,笔者注意到一个很大的特点是,生成的数字人可以和物体进行自然的交互。

比如在这个桌游带货的场景中:

这段 SkyReels-A3 生成的桌游介绍视频中,桌游盒子保持了很好的前后一致性,主播和桌游的交互也很自然。桌游本身封面如下图:

虽然看着容易,但其实在测试中,其他模型的生成效果,很可能是这样的:

SkyReels-A3 之所以能让数字人自然拿起桌游,主要是对广告主播等业务场景,进行了手和商品的交互优化。

SkyReels-A3 直接针对手部动作的自然度和清晰度,构造了针对线上直播等场景的数据,并采用了不同 seed 和训练过程 ckpts 来生成大量候选。通过 reward model 来挑选 top-1 最好最差的结果,采用直接偏好学习来进一步优化模型的生成结果。

除了带货,同样的能力,也会让模型在其他方面表现更突出。

比如在下面的 mv 场景中,SkyReels-A3 模型生成的数字人歌星很自然地就握起了话筒,真实感一下子就提升了。

除了与话筒的交互,这个视频也能感受到,整个模型的上肢运动十分自然。

目前可以看到的有些数字人模型,虽然已经能够做好嘴形对齐,但是稍微经过一点时间,就会感觉到只有嘴巴在动,很假。而 SkyReels-A3 已经做到了不错的效果。

 

02

有美感、无限长的长视频正在解锁

 

除了能与物体进行自然的交互,要让数字人视频真正摆脱「玩具感」,迈向「生产力」,还必须攻克两大难题:如何让视频在拉长时间后依然保持稳定,以及如何打破固定机位的呆板视角。

而这,也正是为什么现在《甄嬛传》的 AI 二创仍然通常只能在一两句台词的长度内,维持极高的真实感——时间再长,就容易「露馅」。

SkyReels-A3 在此也进行了一些优化。

 

 

图丨 Skyreels-A3 实现音频驱动人物对话视频生成技术框架

传统 AI 视频生成,最大的痛点在于误差累积。模型就像一个记性不太好的学生,一句接一句地往下说,说到后面就忘了前面,导致画面出现肉眼可见的劣化、扭曲,也就是常说的「崩坏」。

而 SkyReels-A3 选择采用了一种聪明的插帧方法。简单来说,它不再是傻傻地根据前一帧猜下一帧,而是能预先锚定一个未来的、清晰的「关键帧」,再高质量地补全中间的视频片段。这种机制确保了即使视频长达一分钟,人物的面部和画面也能保持高度的一致性。

这带来了什么直接的好处?简单来说,就是彻底打开了视频时长的枷锁。 从技术上讲,这种架构甚至支持无限长的视频生成,虽然在实际产品部署中可能会限制单次上传的音频文件大小,但 生成一段单镜头、分钟级别的视频已经毫无压力。

如果说长时稳定解决了「能不能看」的问题,那么丰富的镜头语言则决定了视频「好不好看」。

以往的数字人视频多是「大头贴」式的固定视角,非常乏味。SkyReels-A3 则内置了一个基于 ControlNet 的镜头控制模块 ,直接赋予了创作者「导演」的权力。根据其技术文档,模型预设了推镜 (push in)、拉镜 (push out)、左摇 (pan left)、右摇 (pan right) 等 8 种常见的专业运镜,且每种运镜的强度都可以从 0 到 100 连续调节。

从左到右的运镜在直播带货的场景下,显得更自然。

手持镜头效果则可以模拟 vlog 的效果。

虽然生成完全的长视频,数字人技术目前仍然不能完全以假乱真。但笔者在看完在 SkyReels-A3 时长和运镜上取得的突破后,已经看到了未来的潜力。

一个稳定、可控、具备镜头感的长视频数字人,已经足以叩开许多过去难以想象的应用场景的大门。短期内,上半身自然的长视频数字人,似乎可以被用在 mv 等场景中。未来,则更不可限量。

 

03

昆仑万维技术周重磅推出,

SkyReels-A3 首日亮相

 

昆仑万维此次还公布了 SkyReels-A3 的技术指标。使用了基准 A-Bench 上(涵盖日常对话,唱歌和口播等不同场景),测评了多个维度:Sync-C 和 Sync-D 用于精确测量生成视频中唇部动作与音频的同步程度。IQA 和 ASE 则是通过专门训练的 MLLM 来评估视频画面的质量和艺术性。ID similarity 则是通过 cosine 相似度,计算生成视频和参考图/视频的人脸相似度。

 

 

可以看到, SkyReels-A3 在衡量唇部同步精准度的 Sync-C 指标,画面的艺术性和人脸相似度上,都达到了行业先进的水平。

实际上,SkyReels-A3 这样一个在多个维度上都带来惊喜的模型,仅仅是昆仑万维本周技术发布会的「开胃菜」。它背后所展现的,是昆仑万维作为中国 AI 领域第一梯队的深厚积累与全栈能力。

回望过去,昆仑万维的 AI 战略始终呈现出「开源贡献」与「产品落地」双线并进的鲜明特色,这使其不仅成为勤勉的「基础设施建设者」,更是锐意进取的「顶尖产品经理」。

一方面,作为「基础设施建设者」,昆仑万维以持续的顶尖开源模型,为行业「修路搭桥」,彰显其技术硬实力。

过去数月,昆仑万维密集开源了多个在行业内取得 SOTA(State-of-the-Art)成就的大模型:

早在 2025 年 2 月,其开源的中国首个面向 AI 短剧创作的视频生成模型 SkyReels-V1,便已在 Hugging Face 总排行榜上连续多日稳居前十。今年 4 月,更是发布了全球首个使用扩散强迫框架的无限时长电影生成模型 SkyReels-V2,不断突破技术边界。

除此之外,在多模态领域,其不仅推出了成功将强文本推理能力迁移至视觉模态的思维链推理模型「Skywork-R1V」系列,还发布了集图片生成、理解和编辑于一体的化模型「Skywork UniPic」,以 1.5B 的轻量级规模性能逼近同类大参数模型。

针对专业领域的挑战,昆仑万维也毫不示弱,其数学代码推理模型「Skywork-OR1」在同等参数规模下实现了业界领先的推理性能。而软件工程自主代码智能体基座模型「Skywork-SWE」也是在开源 32B 模型规模下实现了业界最强的仓库级代码修复能力。不仅如此,昆仑万维还前瞻性地布局了空间智能领域,推出了工业界首个开源的 10B+空间智能大模型「Matrix-Game」。

另一方面,作为「顶尖产品经理」,昆仑万维毫不掩饰其商业雄心,亲自下场打磨直面用户痛点的惊艳产品,将最前沿的技术迅速转化为生产力。

集成了视频大模型与 3D 大模型的 AI 短剧平台 SkyReels,搭载了最新的 SkyReels-A3 模型,让创作者能够「一键成剧」,轻松制作高质量 AI 视频。

当第一天的发布就已经为 AI 数字人视频的种种顽疾提供了如此有说服力的解法,我们不禁对未来充满期待:在接下来的四天里,昆仑万维还会拿出怎样的杀手锏?

这场从 8 月 11 日持续到 15 日的技术发布周,或许正是昆仑万维在向外界宣告——其 AI 全栈能力已然成熟,并且准备好在牌桌上亮出更多底牌。对于整个行业和所有 AI 关注者而言,好戏,才刚刚开始。

*头图来源:昆仑万维

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

浏览量: 3

世界机器人大会:笨拙的今天,与狂奔的明天

作者| Li Yuan

编辑| 郑玄

笔者刚刚从今年的世界机器人大会回来。

「人,实在是太多了。」这是今年世界机器人大会上,几乎每个人见面的第一句开场白。

世界机器人大会人潮年年汹涌,但今年,那种摩肩接踵的压迫感格外强烈。

不过,比人多更震撼的,是你几乎无处不遇的机器人。去年,它们绕场走一圈,还得三五个「保镖」在旁牵绳护送;今年,尤其是开展第一天,你一个转身,就可能与一台两条腿、甚至四条腿的新物种擦肩而过。

今年的机器人,变得前所未有地渴望与世界互动——叠衣服、拉被子、和观众比试拳击、踢球、和观众互动递送物体……同时,这种急切也带来了大量的翻车现场——你几乎能在社交媒体上找到所有顶尖公司的翻车现场,无论是鬼畜的机器人倒地抽搐,还是自信满满地抓取眼前的东西,结果一直在努力地抓着空气。

但是比起前几年机器人展会上,很精心编排的机器人舞蹈,固定交互中慢速的把一个东西抓到另一个地方,你能明显感觉到有活力从里面生长了出来。

相比于其他行业,机器人企业似乎更不避讳翻车现场。这种不精心编排的演示,带着一种经济上行的美感:一种「我知道我会出错,但我依然是未来」的自信。它混乱,却迷人,属于高速增长行业独有的美感。

这也是这次笔者从世界机器人大会回来最深的感触:只要有未来,只要长得足够快,人们愿意等待一个暂时无用的机器人。

01

加速的进化:

为何行业如此振奋?

人们之所以如此宽容,是因为机器人这个行业,尤其是人形机器人这个赛道,仍然在以一个极高的速度,同时进化着它的「两翼」。

两翼的一端,是双足人形机器人的运动能力。

这是笔者来过的第三年世界机器人大会,在 2023 年的世界机器人大会上,宇树机器人的 CEO 王兴兴还在和在场的机器人同行们解释,为什么前一年开始入局做人形机器人的算法, 在接受极客公园采访的时候,提到当时「波士顿动力的软件层面遥遥领先」 。当时整场的人形机器人,能直接行走的屈指可数。

而短短两年,人形机器人的运动能力已经大大升级。

宇树机器人一如既往地展现出了第一流的运动控制能力。现场观看搏击比赛,机器人的力度真的有点令人震撼。

而这种运动能力并没有限于宇树,是多点开花的。

众擎机器人长项在于拟人动作,跳舞的动作像人的可怕。

逐际动力最新发布的全尺寸人形机器 LimX Oli,有 1 米 65 高的全尺寸人形结构和 31 个主动自由度。也在现场完成了轻快步、模特步和正步,包括高动态的舞蹈和功夫表演。

松延动力也展示了一个机器人翻跟头的现场演示。

而在另一端,机器人的灵巧泛化操作能力也在快速进化。

往年,一个机器人能听懂语音指令,然后慢慢抓起一个特定的小球递给你,就已经是顶级演示。今年,多家公司的展示,已经将目标指向了柔性物体的操作——这是从「会抓」到「会用」的关键一步。

柔性物体的难度在于它的不可预测性。一个刚性的瓶子,物理属性恒定;而一件衣服、一个香囊,是无定形的、柔软的,每一次抓取都可能呈现不同形态。要拿稳它,不仅需要「看见」,更要「理解」,还得在毫秒之间预判它的形变,并即时调整力度。刚性物体的抓取,在日常生活中只占一小部分;而柔性物体,才是通向家庭和服务场景的必经之路。

今年,已经有多家公司在这一领域展现出令人惊讶的成果:

比如星海图此次展示的拉被子演示。视频虽然有加速,但是能够把被角收起的情况下机器人自主推理找到被角拉开,且多次随机重复下都能成功,也是很精彩的演示。

自变量的做香囊也是全程柔性物体操作。

以年为单位来看机器人的进步,无疑是巨大的。

更重要的是,这些能力并非由某一家垄断。在这个高速发展的赛道中,新玩家持续涌入,带来更多可能性。比如,长期以服务机器人闻名的擎朗智能,今年也推出了自己的双足机器人,计划在酒店等熟悉场景中进行商业落地。擎朗 CEO 李通在极客公园采访中表示,双足研发的技术壁垒已不再高企,「看到机会就可以做」。

在高速发展的赛道中,大批成立于 2024 年,甚至成立于 2025 年的等实力选手纷纷入局,各自带着独门绝技,在这片丛林中占据自己的山头。

当然,促使这场进化的,还有嗅到商机的源源不断的投资人。他们用真金白银投票,确保这场关于进化的豪赌,有足够的燃料,以当前这令人眩目的速度,继续狂奔下去。

02

略显尴尬的落地:

双足提供情绪价值,操作只能找小场景

「这机器人能落地吗?」

这是展会现场空中飘荡着的最响亮的问题,从投资人到创业者,再到每一个好奇的观众都对这个话题很是关心。

但当笔者逛遍世界机器人大会,一个略显尴尬的落地现状是:在当下,人形机器人在很大程度上仍是「无用」的。

一位资深投资人向我估计,今年全行业的人形/类人型机器人总出货量也许在三万台左右。

而笔者走访各家展台得到的体感甚至更为保守:大多数公司的年出货量目标都只在几百台,能突破一千台的,已是金字塔尖的佼佼者。

宇树 CEO 王兴兴一直表示,研究机器人,最终是希望它来干活的。不过当被问及当下双足机器人的价值,除了情绪价值之外,还有什么?

宇树创始人王兴兴的答案坦诚得惊人。他表示,之所以做双足,是因为它技术上更简单,是一种「Why not?」(为何不呢?)的逻辑。哪些技术先成熟,哪些技术就优先做。

情绪价值没有对标,在双足机器人领域,市场竞争目前似乎也在变得更加激烈,让“无用之用”的接受度更高。

宇树 R1 WRC 表演 |图片来源:宇树科技

如果说两条腿的机器人,目前主要在提供情绪价值;那么,长着两只手的操作型机器人,则面临着另一种更棘手的困境——「有用之难」。

工厂、智慧零售、酒店餐饮……这些宏大的叙事谁都懂,但现实是,技术还远远达不到。

一方面,机器人的「大脑」还不够聪明。目前的模型训练,大多只能完成几个孤立的动作,要让一个机器人在一个真实场景里,成功完成多项任务,暂时还不太容易做到。

另一方面,灵巧操作仍是巨大的瓶颈,需要依靠数据、硬件等多方面技术一起进步。

目前行业比较认同的 VLA 路线,严重依赖于数据。而实际上,数据的高质量的操作数据又极度依赖高精度硬件来采集。而硬件的迭代,本身也需要一定的时间和操作来反哺迭代。

今年,一些公司已经意识到这一核心痛点,开始试图解决这一问题。

比如,2025 年才成立的零次方,据称今年已出货 200 台,能在 2025 年成立后迅速就出货的原因之一,就是其核心技术能力之一就是做高质量数据采集。

笔者也在展台体验了星尘智能的数据采集工具。展台人员介绍,他们采用绳驱传动、极度丝滑的硬件结构,才能采集出更「干净」的数据,进而训练出动作同样丝滑的模型。

在宏大场景迟迟难以马上落地的当下,一些公司的展示策略很是巧妙:他们会上演刷马桶、收拾屋子等看似酷炫的任务演示,但真正销售的,并不是家政机器人,而是面向科研人员的开发平台。这些高难度的演示,就像精心设置的「诱饵」,用来吸引最有购买力的客户,为这场「有用之难」的探索买单。

也仍然有许多公司,选择在真实环境中硬碰硬,实地采集数据,力图找到那个能真正撑起商业化的切入口。

这个场景或许需要有点苛刻——需要一定的泛化操作能力,以至于此前工业机械臂无法覆盖;同时又要避开与人频繁接触、过高速度要求,以及廉价人工过于容易替代的可能。

条件虽然苛刻,但这样的场景并非不存在,例如工厂某些特殊的上下料环节,比如服务业的某一个整理行为。各家各擅其场,都在找自己的细分领域,也都在相信自己可以从一台两台试验机,慢慢涨到十台几十台试点机,慢慢开始逐渐渗透一个场景。

所以说,无论是「无用之用」,还是「有用之难」,为什么行业对这种落地的尴尬似乎并不在意?

答案简单而纯粹——因为虽然距离真正的「有用」还很遥远,但每一家的出货量,都在实实在在地增长。

只要曲线还在上扬,技术还在进步,就有希望。

03

为何等待?

一场可以「寸进」的长跑

在今年的世界机器人大会上,笔者观察到一个迷人的悖论。

几乎每一位机器人公司的 CEO,在描绘未来两三年的宏伟蓝图时都充满了不容置疑的乐观,但话锋一转,又都会真诚地补上一句:「请给我们一些包容,成长不会那么快。」

这种略微矛盾的姿态,也精准地投射到了公众的认知里。

在网络舆论场,人们对人形机器人的观感几乎是撕裂的:要么是顶礼膜拜,视其为下一个时代的序章;要么是嗤之以鼻,断言它不过是昂贵的遥控玩具。

行业内部也远未达成共识。有人坚信,VLA(视觉-语言-行为模型)就是技术的「奇点」,通往通用智能的康庄大道已然铺开,剩下的只是时间和算力的问题;也有人认为,技术仍在混沌中爆炸性发展,行业还在等待一个能定义范式的、天才式的突破。

机器狗戏水 | 图片来源:现场拍摄

那么,在这种遍布着矛盾、分歧与误解的喧嚣中,行业那股不可动摇的信心,究竟从何而来?

答案或许只有一个,那就是相比其他前沿科技,机器人产业有着一项无可比拟的特权:「寸进,亦是胜利。」

自动驾驶的宿命,是「L5 或一无所有」,在抵达那个完美终点前,每一步商业化都如履薄冰。而机器人不同,模型能力每向前推进一毫米,就可能撬开一个细分到极致的新场景——哪怕这个场景,仅仅是支撑一家企业多卖出几百台机器人,获得活下去的燃料,奔赴下一场更艰难的战役。

或许资本,也是看清了这场增量游戏的本质,才愿意不断加注。他们愿意忍受更长的周期,去赌一个可以被「分期兑现」的未来。

但耐心是有额度的,他们究竟能赌多久?

在一场英伟达举办的论坛中,宇树王兴兴和银河通用王鹤同场对谈,对行业未来做出预测。

宇树的王兴兴给出的答案是每年至少翻一倍;而王鹤的预测,则是每年翻十倍。

从一倍到十倍,这道巨大的裂谷,就是对行业未来不确定性最诚实的度量。

它意味着,没有人真正知道终点线有多远,也没有人知道通往终点的正确路径。

他们唯一确信的,只有一件事:

在一个高速成长的行业中,速度是唯一的通行证。

*头图来源:视觉中国

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

浏览量: 3

马斯克:可能失去特斯拉控制权;何小鹏:听雷军劝,全新 P7 做 24 小时耐力测试;传华为将发 AI 推理突破成果

 

马斯克自曝或失去对特斯拉的控制

近日,马斯克公开称自己对公司的控制权并不稳固,甚至「可能被赶下台」。这场风波的起因是马斯克对自己持股比例的公开忧虑。据悉,近日马斯克在社交平台 X 上发帖回应,认为自己目前约 12.8% 的持股比例,并不足以确保其在公司的主导地位。

他担心在未来公司生产「数百万台机器人」后,自己可能会被激进的股东「赶下台」。

近日,一篇帖子提到马斯克的持股比例为 21.2%,并暗示其中大部分股份已被用作贷款抵押。

对此,马斯克澄清:「仅供参考,我目前没有任何以特斯拉股票为抵押的个人贷款。」

他同时指出,其股票期权的税率接近 45%,这意味着他获得的投票控制权净增长仅在 4% 左右。

马斯克表示,他希望拥有大约 25% 的公司股份,才能获得足够的影响力来引导公司的发展方向。(来源:新浪财经)

消息称华为即将发布 AI 推理领域突破性成果

据报道,华为将于 8 月 12 日在 2025 金融 AI 推理应用落地与发展论坛上,发布 AI 推理领域的突破性技术成果。据透露,这项成果或能降低中国 AI 推理对 HBM(高带宽内存)技术的依赖,提升国内 AI 大模型推理性能,完善中国 AI 推理生态的关键部分。(来源:科创板日报)

 

英特尔首席执行官陈立武周一将访问白宫

据媒体援引知情人士报道,英特尔首席执行官陈立武将于周一访问白宫。该报道称,预计陈立武将与特朗普进行广泛的谈话,同时希望解释他的个人和职业生涯背景,并补充说,他可能会提出英特尔和美国政府可以合作的方式。报道还说,陈立武希望通过表明他对美国的承诺,并保证将保持英特尔制造能力的重要性,以争取特朗普的认可。(来源:36 氪)

研究显示,美国计算机专业应届生失业率,超生物、艺术史专业两倍

根据纽约联邦储备银行的最新研究,计算机科学专业的应届毕业生失业率高达 6.1% 至 7.5%,这一数字是生物学和艺术史专业毕业生失业率的两倍多。《纽约时报》的深度报道更是揭示了这一现象背后的残酷现实。

一方面,人工智能编程技术的广泛应用正在逐步淘汰初级岗位,使得大量计算机专业毕业生失去了入门的机会。另一方面,亚马逊、Meta 和微软等科技巨头纷纷裁员,进一步加剧了就业市场的竞争。学生们陷入了所谓的「AI 厄运循环」:他们利用 AI 技术批量投递简历,而企业则使用 AI 自动筛选简历并快速拒绝,有时甚至在几分钟内就做出决定。(来源:IT 之家)

 

听从雷军建议,全新小鹏 P7 纯电轿车将进行 24 小时耐力测试

8 月 10 日消息,小鹏汽车董事长何小鹏发文称:「之前雷总和我围绕真正高性能的纯电车型,专门讨论过是否应该做 24 小时耐力测试的事情,这是一件非常难、强度非常大的测试,雷总建议可能的话都应该去做一下测试。」

小米 YU7 Max 测试车今年 6 月曾进行一场纯电车 24 小时耐力挑战,就是用纯电车连续超高速跑 24 小时(含充电时间),看看可以跑多少公里。其最终成绩为 3944km,扣除充电时间,平均时速 210+km/h;充电 30 次,每次 10-12 分钟,这次测试获中汽中心认证。

雷军透露,这项测试有四大难点:1、持续保持 210km/h+ 超高速行驶;2、单次续航要长;3、充电要快;4、散热要好,要扛得住 24 小时连续几十次快充快放。

全新小鹏 P7 于 8 月 6 日迎来中国首秀并开启预售(没有公布预售价),将于本月晚些时候正式上市。新车全系标配全域 800V 高压架构平台、5C 超充 AI 电池,10 分钟补能 525km,最长续航高达 820km,每百公里能耗 12kWh,拥有 3 秒级零百加速性能、230km/h 最高时速。(来源:腾讯科技)

 

王兴兴:机器人模型、架构不统一,相当于 ChatGPT 诞生前的 1-3 年

在 2025 世界机器人大会上,宇树科技 CEO 王兴兴发表了对机器人行业现状与未来发展的演讲。王兴兴认为,目前机器人行业对数据关注太多,对模型关注太少。现在最大的问题其实是模型问题,当前的机器人模型架构不够好不够统一,即使有很多比较好的数据训练,但是也无法使用。

他指出,尽管机器人行业今年以来发展速度惊人,但智能机器人当下及未来最关键的挑战仍是「具身智能机器人大模型」。

而目前模型的发展仍然比较缓慢、架构不统一,尚未出现重大突破。假如类比AI大语言模型的发展,其还处于「ChatGPT诞生前的 1-3 年」。

王兴兴还表示,希望宇树公司的机器人做成可以综合干活的通用型人形机器人,包括工厂、表演、家庭等各种场景,而不仅仅是单一场景。

据他介绍,目前宇树公司绝大多数员工,包括他本人,都在为训练机器人在各个场景干活而服务。

此外,王兴兴还提到,未来 2-5 年智能机器人技术的重心,是统一、端到端智能机器人大模型,更低成本、更高寿命的硬件,超大批量的制造,以及低成本、大规模算力。(来源:快科技)

苹果或推出全新 AI 语音控制功能:试图改变 iPhone 操控方式,为机器人产品打基础

8 月 10 日消息,彭博社记者马克・古尔曼今晚发布了最新的 Power On 时事通信,他表示苹果正测试一项全新的 Siri 功能,旨在让 iPhone 用户仅凭语音即可完成精准操作。如果一切顺利,它可能会改变游戏规则。

据介绍,这一功能将依托改进的 App Intents 技术,可实现跨应用的深度控制,包括查找、编辑并发送特定照片,或者在社交媒体上发表评论,浏览购物应用并将商品加入购物车,甚至无需触摸屏幕即可登录某个 App 或服务。

据称,该功能原计划与新一代 Siri 一同推出,但因内部测试与兼容性问题推迟至明年春季,并将配合 Siri 基础架构全面升级同步上线。

古尔曼认为,该技术不仅是 Siri 的 AI 升级要点,更是苹果构建「语音优先」交互生态的重要一步。未来,苹果计划将这种语音技术应用于正在研发的智能家居设备,包括计划于明年发布的智能显示屏和后续的桌面机器人。(IT 之家)

 

央视朱广权提前体验 vivo Vision 头显,双指空中捏合「轻松上头」

8 月 11 日消息,vivo 去年底曾宣布将推出一款混合现实(MR)头显设备,新品名为 vivo Vision。

在今年 4 月的 vivo X200 Ultra 手机发布会上,vivo 宣布 Vision 混合现实头显将在今年下半年发布。

根据博主 @ 向往草原的牛马啊 8 月 9 日晒出的图片,央视主持人朱广权提前体验到了这款 vivo Vision 头显。

该头显的设计风格跟苹果 Vision Pro 相似,前面板集成了很多摄像头,支持双指捏合操作,外挂的一根线是用于连接外置电池。(来源:@ 向往草原的牛马啊)

34 年历史终结:美国运营商 AOL 宣布 9 月 30 日正式取消拨号上网服务

8 月 11 日消息,美国在线(AOL,现隶属于雅虎旗下)宣布将于 2025 年 9 月 30 日正式停止其基于公共交换电话网络(PSTN)的拨号上网服务,结束其长达 34 年的运营历史。

尽管宽带早已在美国普及,但在部分偏远地区,宽带接入仍未覆盖或价格昂贵。数据显示,截至 2021 年,拨号上网服务仍有「数千」用户。

美国联邦通信委员会(FCC)最新报告显示,美国农村地区有 23.3% 的居民、土著部落地区有 27.7% 的居民缺乏固定陆地 25/3 Mbps 宽带覆盖,而城市地区这一比例仅为 1.5%。这也是 AOL 在推出拨号上网 34 年后,仍保有部分用户的原因之一。

根据公告,AOL 将在停止拨号上网服务的同时,终止相关软件,包括 AOL Dialer 和 AOL Shield 浏览器。(来源:网易)

 

浏览量: 3

小红书为什么要做“漫展”?

2025 年夏天,小红书第一次以线下漫展的方式进入了游戏与二次元产业的舞台中央。

8 月 8 日开幕的 REDLAND,是小红书首次线下大型漫展。与大部分漫展选在会展中心不同,首届 REDLAND 将场地选在了上海复兴岛——一个曾经的船厂遗址,小红书把它打造成为了「全球首个痛岛」。

REDLAND 拥有整整 80000 平方米的户外空间,涵盖三大沉浸式展区与 50 多个游戏与动漫 IP。更特别的是,它以「开放世界冒险岛」的方式构建了一套高度拟游化的观展机制:从角色设定、任务系统,到徽章收集与沉浸式互动体验,小红书显然不满足于复刻传统漫展模式,而是在探索打造一座沉浸式的「2.5 次元主题乐园」。

如果你对小红书的印象还停留在「自拍、种草、美妆护肤和旅游攻略」,那么你可能会对它举办一场大型漫展感到惊讶。但 REDLAND 的出现,恰恰说明了这个平台正在经历一次更深层的社区兴趣结构重组。

事实上,在 REDLAND 举办之前,小红书平台的内容生态已经发生剧烈变化。过去一年,平台上二次元内容同比增长 175%,游戏内容增长 168%,成为小红书继时尚、美食之后的第三、第四大垂类。今年 7 月,小红书平台也正式完成品牌升级,从「你的生活指南」转变为「你的生活兴趣社区」。

在这一背景下,REDLAND 更像是小红书社区升级后的「一场线下考试」。在二次元与游戏内容成为平台新引擎的当下,这场展会既是一次对用户文化的响应,也是小红书试图建立线下 IP 影响力的开始。’

REDLAND 嘴硬博物馆丨来自:极客公园

REDLAND:不只是漫展,还是「箱庭世界」

在正式逛展前,REDLAN 的主创团队先与受邀媒体进行了简短的交流。项目团队对于展会整体设定的介绍迅速勾起了我的兴趣——它听起来与传统的漫展、游戏展有明显的区别。

REDLAND 采用了非常规的展览结构,将整个复兴岛划分为三大展区:

  • “翻身时空港”(船台):以米哈游的御三家(《原神》《绝区零》《崩坏:星穹铁道》)、腾讯的《王者荣耀》、网易的《蛋仔派对》等热门 IP 为核心,搭建上也与船厂遗迹相融合;
  • “重生试炼场”(老仓库):《和平精英》的「天降帅锅」展、《苏丹的游戏》的撅卡体验,以及育碧、小众独立游戏试玩集中于此;
  • “发呆小森林”(复兴岛公园):主要展示《剑网三》《永劫无间》《逆水寒》等古风 IP,隐藏有宝可梦彩蛋任务和多个自建社团展台。

重生试炼场的独立游戏试玩丨来自:极客公园

不同于传统漫展或游戏展常见的「标准展位+舞台演出」结构,REDLAN 的整体动线、互动机制乃至世界观设定,都更像是一场线下 RPG 游戏。

为参观者,我在入口处领取了「新手装备包」,其中包含防晒喷雾、补水饮料等户外必需品,一枚初始徽章和一张角色身份卡。徽章像是经验条,参与展位互动集齐三个后可兑换金徽章;角色身份则分为五类(穿梭者、探索者、鉴赏家、体验者、决胜者),我拿到的是「决胜者」身份。很明显小红书希望用选游戏职业的方式增强观众的代入感,不过直到结束我也没弄明白这个身份有什么作用。

进入展区后,玩家们需要沿着「翻身时空港-重生试炼场-发呆小森林」这条动线移动,沿途可以选择自己感兴趣的展位去体验,带有一定的开放世界结构。但与其说是沙盒式逛展,我更愿意形容 REDLAND 像一个「线下箱庭游戏」:区域不大但内容精巧,动线虽固定却有一定节奏。

REDLAND 的展区地图丨来自:小红书

展位的玩法设计上,REDLAND 整体也更强调互动性。几乎所有参展 IP 都设置了与玩家的互动机制,而且这些机制大多参考原作游戏的经典玩法。例如,《原神》展台是游戏里经典的打靶小游戏,《苏丹的游戏》则模仿游戏里经典玩法——抽卡然后做任务撅卡,《柯南》则是复刻了动画里的电梯杀人案,需要玩家在现场找线索推理……

《苏丹的游戏》REDLAND体验丨来自:极客公园

在搭建风格上,REDLAND 同样体现出不同于传统漫展的思路。一方面,每个 IP 展位更像是一个沉浸式主题空间,观众仿佛步入一个小型的迪士尼或环球影城。例如「发呆小森林」中的《剑网三》《逆水寒》,借助公园原生态环境还原了古风世界观,给玩家们带来不错的沉浸感。

发呆小森林唯美国风展区丨来自:极客公园

另一方面,REDLAND 也有强烈的统一性。比如整个展区到处都有补给站、徽章点、NPC、任务板等有着 REDLAND 世界观元素的区域,甚至各个 IP 展位大多也以像素 RPG 风格进行再创作,使整个展区在风格上更趋一致。相较之下,传统漫展更多体现为参展商自有逻辑主导,展馆之间主题可能不同,但展位之间风格参差,而 REDLAND 则有更统一的叙事语境和空间秩序。

REDLAND 互动体验丨来自:极客公园

当然,作为首届活动,REDLAND 仍有不少待改进之处:8 月的户外高温对观众与 Coser 来说都颇具挑战,部分展位互动较浅,动线与任务引导还可优化。但整体观感上,它确实在一定程度上实现了为用户「搭建一个现实版二次元世界」的目标——这是一场融合了「真人游戏」与「沉浸主题乐园」概念的线下试验。

REDLAND 背后,小红书如何理解「新二次元」?

逛完展后,我自己的感受是:REDLAND 背后连接的是小红书对新一代二次元文化的一种系统理解。

前文提到,二次元和游戏已成为小红书第三和第四大的内容垂类。其快速增长背后,我认为有三个关键要素:女性向二游如《恋与深空》的迅速崛起;主机游戏和独立游戏玩家在小红书找到兼具「用户-用户」「用户-创作者」属性的社区交流场域;以及最重要的,对 2.5 次元人群需求的深入响应。

与传统 ACG 社区侧重 OGV 与 UGC 内容不同,小红书并未试图复制原有模式,而是在 UGC 生态中发掘出「2.5 次元人群」的表达路径:他们不再只是观看者,而是将 IP 融入日常生活——为角色庆生、cos 角色出行、痛服拍照、快闪团建等,形成了一种介于虚拟与现实之间的生活方式。

过去一年小红书兴趣热点笔记增长情况丨来自:DT 商业观察

这些表达方式本就存在于二次元的线下文化中,但在此前,国内并没有一个线上社区能完整承接这类用户的日常表达。而小红书的打卡机制、内容发布形态与兴趣社群组织能力,天然适配这一类「沉浸型表达」,并伴随泡泡玛特、乙游、漫展等二次元周边文化的兴起而快速放大,最终延伸到主机游戏、男性向二游等更广泛的 ACGN 圈层。

逛漫展/游戏展是这类热爱线下和周边的 2.5 次元群体非常重要的文化生活方式,但传统漫展越来越难以满足这些用户,尤其是抛开收集吧唧(徽章)、coser 集邮、线下打卡等社交货币层面的需求,当同人内容、IP 资讯转向线上传播下,线下展会要提供真正的差异化价值,必须突破「打卡/集邮」的表层机制,构建更具内容密度与社交能量的空间。

在这方面,主题乐园是一个可借鉴的方向。比如日本环球影城中的动漫 IP 体验区、VR ZONE 等虚拟现实乐园,均在提供「沉浸体验」上获得二次元群体的青睐。REDLAND 项目组也提到:「我们想给非现充用户一个痛的空间,就像迪士尼是给现充造的童话,而 REDLAND,是为游戏与二次元用户搭建的开放世界。」

这也解释了为什么 REDLAND 并未采用传统「漫展招商」逻辑,而是从场景出发倒推展位策划:厂商需结合地貌设计展台,每个展位必须设计互动机制,平台原创展位与主线任务共同强化「整岛游乐场」的沉浸体验。

在国内 ACGN 线下内容渐趋固化的当下,这种具备「社群意识+互动机制」的平台型实验,无疑具备探索价值。当然,这也对资源调度、策展能力提出了更高要求:高质量沉浸展往往投入巨大,如何平衡二次元群体的文化诉求、互动设计的体验感、以及漫展运营的现实产出,这或许是小红书在持续推进大型漫展项目时必须长期思考的问题。

REDLAND 入口丨来自:极客公园

结尾

最后一个问题是:小红书能否成为二次元和漫展的新变量?

就目前来看,小红书并未将 REDLAND 定位为商业化重资产项目,更多是在完成一场「兴趣文化的空间实验」——洞察了快速增长的 ACGN 社区需求,进而尝试将二次元世界和小红书社区文化结合并搬到线下,打通线上线下的内容链路。

从平台的角度看,这次实验释放了几个明确信号:小红书正在形成自身的内容美学与空间表达方式;它愿意为用户的兴趣建构一个「可感知的、可游玩的」物理空间;它希望用这样一场岛屿级的策展行为,来捕捉用户的情绪价值与文化认同。

REDLAND 不是传统漫展的对标物,也不是谁的挑战者。它更像是这个时代内容社区探索「虚实融合」的一次尝试。

它的完成度还不够高,但它的想象力足够新。

而这,或许已经足够。

浏览量: 3

GPT-5 发布后遭用户吐槽,GPT-4o 重新上线;苹果创五年多来最大单周涨幅;暑期档电影总票房破 80 亿元:《南京照相馆》超 20 亿|极客早知道

GPT-5 发布后遭用户吐槽,OpenAI 将 GPT-4o 重新上线

8 月 9 日,据报道,OpenAI 于 8 月 8 日发布的 GPT-5 模型系列并迅速向所有用户推送。尽管官方称 GPT-5 在推理能力、任务执行和多模态理解方面有重大突破,但部分资深用户怀念 GPT-4o 的互动体验,认为 GPT-5 缺乏创意与温度,且基于 GPT-4o 的工作流程在新模型上效果大打折扣。此外,免费用户还抱怨更快触碰到使用次数上限,被迫考虑升级至付费版本。

面对用户不满,OpenAI 首席执行官 Sam Altman 在 Reddit 上举办 AMA 活动并亲自回应用户关切。他承诺为 ChatGPT Plus 用户带回 GPT-4o,并根据使用情况决定支持时长;同时,正在研究让用户同时使用 GPT-4o 和 4.1 的选项;此外,将为 Plus 用户在全面推送完成前将 GPT-5 的使用上限翻倍,并提高透明度,让用户更容易知道每个回答由哪个模型生成。

8 月 9 日,OpenAI 发文宣布 GPT-4o 已重新上线,供 Plus 和 Team 用户使用。若需多平台使用,用户可在 ChatGPT 网页版设置中启用「显示旧版模型」来访问 GPT-4o。(来源:网易科技)

苹果创五年多来最大单周涨幅,库克白宫之行降低关税担忧

8 月 9 日,据报道,苹果股价周五上涨 4%,收于每股 229.35 美元,创下自 2020 年 7 月以来的最大单周涨幅。本周的股价变动为苹果增加了超过 4000 亿美元的市值,目前其市值已达 3.4 万亿美元。

此前,该公司首席执行官蒂姆・库克于周三与特朗普总统一同出现在白宫。库克与特朗普在白宫共同宣布,苹果计划在未来四年内向美国企业和美国产零部件投资 1000 亿美元。

苹果计划购买更多美国芯片的举措令特朗普感到满意。他在公开会议上表示,由于该公司在美国进行生产,将有资格豁免未来可能使进口芯片价格翻倍的关税。(来源:新浪科技)

 

马斯克炮轰 OpenAI 和微软关系,纳德拉回帖称期待 Grok 5 到来

8 月 9 日消息,科技媒体 Windows Central 发布博文,称特斯拉 CEO 伊隆・马斯克猛烈抨击微软与 OpenAI 的数十亿美元合作,称其背叛了 OpenAI 非营利初心,沦为微软的「事实子公司」。

马斯克在诉讼中强调,OpenAI 原本承诺为全人类利益发展通用人工智能(AGI),如今却在微软主导下追求利润最大化。这一转变被马斯克视为「根本性背叛」,并为此提起两起法律诉讼,其中第二起更指控 OpenAI 涉及「racketeering」(敲诈勒索活动)。

尽管马斯克言辞激烈,微软和 OpenAI 高层反应冷淡。微软首席执行官萨提亚・纳德拉在回应马斯克称「OpenAI 正在蚕食微软」时,回应「期待 Grok5 的到来!」(来源:IT之家)

 

Gemini 不断发出自我厌恶的评论,Google 正在努力解决

今年 6 月,一位 X 用户分享了一段会话截图,其中显示 Google Gemini 说了一句「我不干了,我显然没能力解决这个问题。代码有问题,测试有问题,而且我是个傻瓜,」聊天机器人说道。「我犯了太多错误,已经不值得信任了。」

7 月份,一位使用 Gemini 的 Reddit 用户表示,该机器人「陷入了循环」,然后分享了类似的自嘲信息。

一名 X 用户将这两条帖子自己的账号上,引发了 Google DeepMind 集团项目经理 Logan Kilpatrick 的回应。

「这是一个恼人的无限循环错误,我们正在努力修复!Gemini 今天的情况还不算太糟,」Kilpatrick 写道。(来源:cnBeta)

2025 暑期档电影总票房破 80 亿元:《南京照相馆》超 20 亿

8 月 9 日,根据灯塔专业版数据,2025 年暑期档(6 月-8 月)总票房(含预售)突破 80 亿元。今年暑期档至今总出票量为 2.13 亿张,场次高达 2904.12 万,平均票价为 37.6 元。

其中,抗战题材影片《南京照相馆》总票房已破 20 亿(今早已突破 21 亿),在《南京照相馆》之后,《长安的荔枝》以 6.57 亿的档期票房位居第二;7 月 2 日上映的《侏罗纪世界:重生》,档期票房为 5.59 亿,排名第三。(来源:IT之家)

 

宇树王兴兴:曾坚决反对人形机器人,机器人 ChatGPT 时刻在两三年内

8 月 9 日,宇树 CEO 王兴兴在世界机器人大会上透露,自己曾经最坚决反对人形机器人,宇树直到 2022 年都完全没有做人形机器人。但以 ChatGPT 为代表的 AI 技术进步显著以及马斯克等对于尖端技术关注度高,当时宇树有客户直接找到宇树、愿意给钱下订单,直接导致宇树开始做人形机器人。

同时,王兴兴还表示,快的话,可能未来的一两年或者两到三年,就会迎来机器人的 ChatGPT 时刻,「最慢的话我估计 3 到 5 年也是很大概率能实现这个概念,大家可以关注一下。」(来源:第一财经)

 

Cursor 限时免费提供 GPT-5 支持,并推出全新 CLI 工具

8 月 8 日,根据 Cursor 官方声明及网络信息,Cursor 针对其付费计划用户提供了一定额度的 GPT-5 免费使用权限。X 平台上,@rohanpaul_ai 在 7 月 28 日的帖子中提到,Cursor 正考虑与 OpenAI 深化合作,部分得益于 GPT-5 在编码任务中的卓越表现。帖子指出,GPT-5 在软件工程、代理式规划和多步骤工作流等领域的性能尤为突出,甚至超越了 Anthropic 的 Claude Sonnet4 模型。

此次限时免费活动旨在让更多开发者体验 GPT-5 的强大功能。Cursor 的付费计划用户将获得 GPT-5 的免费使用额度,具体时间窗口尚未明确,但活动已在开发者社区引发广泛讨论。(来源:aibase)

 

多地新规:骑手遵守交规不闯红灯每月可多挣千元

8 月 8 日,据媒体报道,美团在东莞、天津、上海、长沙启动新一轮「不闯红灯安全激励活动」。该活动在各地交警及相关部门指导下展开,骑手在配送过程中遵守交通规则、不闯红灯,每单即可额外获得 1 至 1.5 元奖励,每月可多挣千元。

据介绍,早在今年 5 月,美团便在济南、泉州、惠州、包头等城市开展骑手交通安全治理试点,为保持零闯红灯记录的骑手发放「等灯等灯奖」。活动期间,骑手一周增收达到 400 多元,试点城市超过 2 万名骑手获得奖励,专送骑手闯红灯行为环比减少 26%。同时,在全国 100 余个城市,美团还将「安全分」纳入骑手考核,达到一定安全分等级的骑手将获得对应月度奖金和权益。(来源:新浪科技)

大疆全新运动相机 DJI Osmo Nano 曝光:强调尺寸取消前置副屏、有望 10 月前发布

8 月 9 日,据 Igor Bogdanov 发文,公布了大疆旗下一款全新运动相机 DJI Osmo Nano 的谍照,显示该机将采用类似 DJI Action 2 的机身设计,预计将在 10 月前发布。

外观方面,该机采用单镜头设计,无前置副屏,机身体积相对小于 Osmo Action 5 Pro 等产品,预计将配备类似 Action 2 的可拆卸显示屏模块以实现取景与操作功能。消息源透露,该运动相机将对标影石 Insta360 Go Ultra,不过该机的具体参数暂不知悉。(来源:IT之家)

 

任天堂 Switch 2 新配件专利曝光,有望还原钓鱼全过程

8 月 9 日,科技媒体 Engadget  发布博文,报道称任天堂获批一项新的专利,探索为未来 Switch 游戏掌机添加 Playdate 风格的手摇曲柄(Hand Crank)配件。

根据专利描述,该配件无需额外电源或复杂结构,类似腕带安装方式,通过磁吸方式连接至 Joy-Con 手柄侧边。这一配件能追踪用户的旋转操作,将物理转动转化为游戏输入信号,为玩家提供更直观的操控体验。

该曲柄的核心技术依赖于 Joy-Con 2 手柄内置的鼠标传感器,在用户转动手柄上的曲柄后,传感器可精确捕捉其旋转速度与方向,控制游戏角色或机制。虽然专利未明确指出具体应用场景,但分析认为,钓鱼小游戏是最直接的适配对象。(来源:IT之家)

主导开发《暗黑破坏神》的罗德·弗格森离开暴雪和微软

8 月 9 日,Rod Fergusson 再次离开微软,他宣布将在暴雪工作五年后离开,此前他曾为《暗黑破坏神》系列游戏效力。目前尚不清楚他离开暴雪的原因,但他参与了该系列主要游戏的发行,包括《暗黑破坏神 II:重制版》、《暗黑破坏神:不朽》手游,以及最新的主线游戏《暗黑破坏神 IV》。

弗格森因其在《战争机器》系列中的出色表现而闻名,此前数十年他曾在 Epic Games 和微软任职。今天早些时候,他通过社交媒体宣布了最新的离职消息,并表示:「是时候离开暴雪/微软了,握紧手中的剑,看看接下来会发生什么。」

「这些团队已经为成功做好了准备,未来将推出一系列令人兴奋的作品,」他补充道,并透露了暴雪暗黑破坏神开发团队未来可能推出的作品。

暴雪总裁乔安娜·法里斯也在社交媒体上发文感谢他在暴雪的贡献,并表示:「引领像《暗黑破坏神》这样的系列需要非凡的天赋、远见和团队协作。」(来源:cnBeta)

浏览量: 3

李想称知道哪个品牌在黑理想;比亚迪:App 将继续使用「比亚迪」原名;世界机器人大会开幕 | 极客早知道

 

李想称知道哪个品牌在黑理想:拿我玩梗可以,但不要恶意诋毁理想车主

8 月 8 日消息,理想汽车 CEO 李想昨日在抖音发布视频,针对近期理想汽车遭遇的黑公关事件发表看法,明确表示公司知晓背后操控的品牌及专业水军机构,同时强调不会因此「黑化」,将坚守原则应对。

 

李想在视频中回顾,理想汽车多款车型发布时均遭遇过类似舆情风波:「当年 L9 发布的时候,就有一波宣传说理想汽车倒闭了;到 Mega 上市的时候大家也都知道相关情况;然后 i8 发布时,又是大量的舆情事件。」他直言,「每一次背后都有一个不同的品牌在操控,这一次我们也知道哪个品牌在操控,但其实背后也都是专业的水军机构。」

尽管这些专业水军机构会「把各种痕迹藏得很深」,但李想坚定表示:「我们不想把自己黑化,去变成跟他们一样的人。如果我们变成跟他们一样的人,他们就彻底赢了。」(来源:IT 之家)

比亚迪:经过内部慎重研讨,App 将继续使用「比亚迪」原名

8 月 8 日消息,历时 21 天,比亚迪 App 合并后发起的全新名称投票已经于 7 月 31 日截止,其中「成就梦想」以 7648 票当选第一。

然而,比亚迪官方宣布:经过我们内部慎重研讨,比亚迪 App 将继续使用原名称「比亚迪」。

比亚迪表示:投票排名第一的「成就梦想」投稿用户,除获得入围奖励外,还将为其发放原定的「采用奖励」(IT 之家注:10000 积分与 50 梦想值)。

 

(来源:新浪科技)

2025 世界机器人大会在北京亦庄开幕

为期 5 天的 2025 世界机器人大会 8 月 8 日在北京开幕,大会吸引了 200 余家国内外优秀机器人企业参展,其中人形机器人整机企业数量创下全球同类展会之最。

 

大会设置「产业发展」「创新应用」「技术融合」三大篇章,超 400 位国内外顶尖科学家、国际组织代表、院士和企业家将聚焦机器人领域产业趋势、应用实践、创新成果展开交流分享。博览会设置创新馆、应用馆、技术馆 3 大展馆,50 家人形机器人整机企业参展,数量创同类展会之最。

本届大会以「让机器人更智慧,让具身体更智能」为主题,得到 28 家国际机构支持,来自全球近 20 个国家的 1 万余名选手参赛,共有 200 余家企业的 1500 余件产品参展,其中首发新品 100 余款。(来源:央视网)

 

OPPO 为员工打造近 5000 套海景房公寓,单间不到 1500 元

8 月 8 日消息,OPPO Find 系列产品负责人周意保 8 月 6 日发文,表示年底要搬到 OPPO 新的工业园,旁边还建了将近 5000 套海景房公寓。

周意保表示:「现在的大学生真幸福,入职就能直接住到公司自建的海景公寓,上班通勤时间只需要 7 分钟……」

 

从周意保放出的图片可以看到,该公寓配套有生活服务、休闲娱乐、运动健康、亲子教育、餐饮饮品等设施,户型可选最低 25 平米单间~103 平米三室两厅。

从 CUBE 立方设计去年披露的公告获悉,这个「OPPO 滨海湾高级人才房项目」是 OPPO 首个大体量住宅项目,为东莞市滨海湾新区提供人才公寓和完善的生活配套设施,项目总建筑面积约 60 万平方米,建设内容包括 22 栋高层塔楼住宅、2 层地下室以及其他生活配套,可提供约 4100 多套人才住房,可容纳约 1.1 万人。(来源:CnBeta)

蔚来相关人士回应小米、蔚来通过富国银行茅某某向海外转移资金:假消息

8 月 8 日消息,近期网上有传闻称,富国银行茅某某操盘的跨境保理项目表面是为小米、蔚来等中国企业融资,实际利用复杂佣金结构向海外转移资金。

蔚来相关人士就此回应新浪科技表示,蔚来和富国银行及茅某某没有任何合作,也未有任何形式的接触。相关不实言论已经取证,并将追究造谣传谣者法律责任。

IT 之家此前报道,小米公关负责人王化也发文称:「经核实,小米集团在全球范围内没有和富国银行以及『茅 XX』开展过任何合作,也未有任何形式上的接触。相关言论均已取证,并已经启动司法程序追究造谣传谣者法律责任!」

快手上线独立「外卖」入口 外卖商品二季度支付用户数环比增长超 3 倍

快手本地生活在「团购」页面上线独立「外卖」入口。8 月 8 日,记者获悉,今年二季度,快手本地外卖商品支付用户数环比增长超 3 倍。

点击进入「外卖」后,可以看到「外卖省心购」的字样,其中包含特惠外卖商品,包括汉堡披萨、咖啡奶茶、快餐便当等。据《读佳》报道,「外卖」中的商品主要来自美团,用户购买商品后,可以获得兑换券,券需要在美团 App 内使用。(来源:富途牛牛)

 

董明珠回应格力玫瑰空调争议:可能有一点不那么美,但它创造了世界首台,你敢吗?

8 月 8 日消息,据新浪财经报道,格力电器董事长董明珠今日在 2025 第十九届中国品牌节上回应了玫瑰空调的争议。

董明珠表示,玫瑰空调售价 3.2 万元,是世界首台采用仿生玫瑰外观造型的空调,配备 3D 立体油墨丝印技术。

 

「玫瑰空调可能有一点不那么美,但它创造了世界首台,你敢吗?」,董明珠反问。

董明珠今日在中国品牌节介绍了格力的产品和价值观。董明珠还向台下观众喊话:不用格力的洗衣机和冰箱,那就是你犯的错误。「我那冰箱可以节能,同时,蔬菜水果摆在里面二十天,依然像从地里刚刚摘出来一样的新鲜,营养都保留了起来」。(来源:IT 之家)

全球 500 余台人形机器人共赴「冰丝带」,首届世界人形机器人运动会 8 月 14 日开幕

8 月 8 日消息,「2025 世界人形机器人运动会发布会」今天举行,确认 2025 世界人形机器人运动会将于 8 月 14 日晚在国家速滑馆「冰丝带」开幕。

 

据央视报道,2025 世界人形机器人运动会是全球首个为人形机器人组织的综合性竞技赛事,共有来自全球五个大洲、16 个国家的 280 支参赛队伍参赛。赛事为期三天,从 8 月 15 日持续至 17 日。

2025 世界人形机器人运动会由北京市人民政府、中央广播电视总台等单位联合主办,总台北京总站联合承办,这是全球首个以人形机器人为参赛主体的综合性运动会。

全球 280 支队伍届时将带着 127 个品牌的 500 余台人形机器人,围绕 26 个赛项展开角逐,包含竞技赛、表演赛、场景赛 3 类 22 个主体赛项和羽毛球、篮球、乒乓球、自由搏击、群体舞蹈 5 个外围赛项。(来源:CnBeta)

微信宣布加强治理财经领域「自媒体」违规行为:视违规程度采取限流、禁言、封号等措施

8 月 8 日消息,微信今晚发布关于加强治理财经领域「自媒体」违规行为的公告。

微信表示,平台致力于打造绿色、安全的网络环境,平台倡导专业证券公司、证券投资咨询机构,具备专业资质的财经和证券类「自媒体」账号发布信息丰富、权威真实的内容,而不具备专业资质为他人提供荐股服务、编造和传播虚假信息,诱导用户进行投资及实施诈骗、歪曲解读国家经济政策等行为,违反了国家相关法律法规及平台规则,平台将进一步深入治理。

微信提醒用户在观看内容时,可留意账号页外显展示是否有对应专业资质、职业资格、专业背景等认证材料名称,注意甄别信息。

 

微信还表示,根据《关于加强「自媒体」管理的通知》《关于开展「清朗・整治『自媒体』发布不实信息」专项行动的通知》要求,平台将进一步防范和治理歪曲解读宏观经济政策、扰乱经济社会秩序等违规行为。特别是对于编造和传播虚假信息,诱导用户投资或实施诈骗,无资质违规荐股等内容,平台将视违规程度对账号采取限制流量、固定粉丝增长、暂停营利权限、禁言、封号等梯度性处置措施。(来源:IT 之家)

 

消息称华为有望国内首发 eSIM 手机:新款三折叠、Mate 80 系列

8 月 8 日消息,据《科创板日报》今日报道,有消息称,华为推出支持 eSIM 的新款三折叠手机,有望成为国内首款商用 eSIM 的智能手机。该媒体从产业界人士了解到,华为确实有相关计划。而后续发布的华为 Mate 80 系列,可能也将有一款机型支持 eSIM。

此外,OPPO 相关负责人向《科创板日报》记者表示,今年年底预计会有首批支持 eSIM 的手机上市。

多名业内人士对该媒体表示,对于智能终端厂商而言,eSIM 是比较明确的发展趋势。但政策监管和运营商的态度,将影响 eSIM 技术在手机终端的落地速度。

有产业链人士对该媒体表示,如果华为顺利在 9 月推出支持 eSIM 的三折叠旗舰手机,那么将在国内从苹果手中抢下 eSIM 首发。

综合 IT 之家此前报道,博主 @ 智慧皮卡丘 今年 7 月在微博透露,华为新机将采用全新通讯架构,结合后续评论内容预计为 Mate 80 系列。

 

(来源:IT 之家)

 

未受微软裁员 9000 人影响,小岛秀夫游戏《OD》仍在开发中

科技媒体 WccfTech 昨日(8 月 7 日)发布博文,报道称小岛工作室和 Xbox 合作开发的恐怖游戏《OD》仍在开发中,并未受到微软全球裁员 9000 人计划影响。

IT 之家此前报道,微软宣布在全球范围内,裁员超过 9000 人,导致多个游戏项目被取消,其中包括 ZeniMax Online 的新 MMO 游戏、Perfect Dark 重启版、Rare 的 Everwild 以及 Avalanche Studios 的 Contraband 等等。

一位微软发言人今日确认,小岛秀夫与 Xbox 合作的恐怖游戏《OD》仍在开发中。OD 在 2023 年游戏大奖上首次公布,当时引起了广泛关注,成为当年最引人注目的游戏之一。自那以后,关于 OD 的消息不多,小岛秀夫仅简要提及了这款游戏,并表示其目标是创造玩家未见过的体验。

 

(来源:CnBeta)

 

浏览量: 3

维他动力Vbot:当遥控器被丢掉,才是机器狗「有生命感」的第一步?

 

头图来源:维他动力

 

 

8 月 8 日下午,北京亦庄的世界机器人大会A区一角,人潮涌动间隙,可以看到一只溜达的「小短腿」。

 

它一会儿跟在展区人员身后走来走去,一会儿又挤进人群对着镜头歪头卖萌——这是在WAIC后,维他动力(Vbot)又一次把自家「大头」放到真实人流里「溜达」。

 

如果机器人终究要走进家里的客厅,它应该长什么样?该用什么姿态和你的孩子打招呼?又凭什么让家里人相信,它是一个可以放心的家庭成员?

 

这家成立刚满半年的公司,带着 3 亿元融资、60 多位从 AI、汽车、动画乃至飞机内饰领域跨界而来的工程师与设计师,试图回答以上问题。他们给出的答案,就是这只昵称为「大头」的智能伴随机器人Vbot。

 

联合创始人赵哲伦说,他们在试图用「工程科学的思维控制精度,用艺术的思维创造灵魂」 ,为机器人注入「生命力」。

 

他们想让四足机器人摆脱遥控器,同时回答一个问题:机器人到底能怎样进入真实的家庭生活?

 

「赛博遛狗」|图片来源:维他动力

 

跳出「工具论」,重新定义机器人的「存在感」

 

「大头」不是人们印象中那种带着工业气息、充满机械感的机器狗,也不是过于拟人以至于有些怪异的仿生体,而是一款外观圆润、充满亲和力的四足机器人,定位是「智能伴随机器人」 。

 

「我们认为它在正式交付之后会是你的小跟班、小跟拍、小跟护。」 赵哲伦这样描述产品的核心体验:它可以跟随家庭的每一个成员出行,帮着拿包;利用AI能力,成为比家人更懂抓拍时机的摄影师;甚至可以在你无暇他顾时,照看老人和孩子 。

「大头」表演了一段跳舞|视频来源:极客公园

 

这听起来像是一个不错的家庭伙伴,但一个问题是:为什么是现在?为什么是四足形态?毕竟,在过去十多年里,至少有三代四足机器人问世,但它们似乎从未真正走出实验室,进入大众的视野 。

 

维他动力创始人余轶南(前地平线智能驾驶总裁,自 2015 年起主导地平线智能驾驶和智能座舱技术研发与落地)的看法是,「过去的产品为什么不work?核心就是几点:第一是价值交付,第二是成本,第三点是非常重要的,面向消费者的售后维护。」 他提到,过去的机器人成本高达几十万,且在安全性、可靠性上难以保证,本质上是技术发展还未到那个阶段 。

 

而今天,情况发生了质的改变。维他动力联合创始人赵哲伦(前理想汽车智能驾驶产品总监,负责理想 ONE 与 L 系列车型智能驾驶产品的定义与交付)将其归功于一个「盟友」——智能汽车产业。「整个智能驾驶,它确实是很好地开拓了整个机器人发展的前提。」

 

他解释道,智能汽车的快速发展,使得无论是算力芯片、控制器还是电机,其成本在中国被大幅优化,并且品质极高,这为当今的机器人制造提供了绝佳的基础 。

 

有了「造得起」的前提,下一个问题便是「如何设计」。

 

维他动力从一开始就希望跳出传统机器人设计的窠臼。赵哲伦分享了他们最初的产品定义思考:在一个矩阵的两轴上,一条是机器人与人的关系,从工业、冷峻到友善,再到可能过于「低幼化」的玩具感;另一条则是它的行动能力,从桌面级、室内轮式,到能够户外行走但无法上下台阶,再到真正的全地形能力 。

 

「我们最早的时候其实希望这个机器人尽可能小,但我发现要想基础地完成跟人一样走,人能到哪它能到哪,全地形能力,腿的长度至少得是现在这个长度。」

 

最终,他们将Vbot定义在「友善」与「全地形能力」的交点上:它要有足够强的运动能力,但外观上又不能带有攻击性,而是友善、可爱,同时又不失质感,不会让人觉得是个玩具 。

 

为此,团队引入了「迪特-拉姆斯式简约设计」,遵循「Less, but Better」的核心理念 。他们的首席工业设计师曾有十几年在美国设计商务舱内饰的经验,为Vbot带来审美上的质感 。赵哲伦总结了四个设计原则:

 

  1. 黄金比例:无论是大小腿的比例,还是身体与头部的对比,都经过精心计算 。
  2. 圆润倒角:整个机身几乎看不到锐角,创造了与人更和谐的关系 。
  3. 高级质感:样机的腿部甚至用到了与Apple Watch同款的材料,以提升整体品质感 。
  4. 锐利切割:在需要的地方采用锋利的切割线条,增加设计感,但触感依然保持圆润 。

「大头」在自己下楼梯|图片来源:维他动力

 

最终呈现的Vbot,在WRC现场的一众四足机器人中,确实显得有点不一样的「萌」。

 

拆解「大头」:一只四足机器人的大脑、算力与「心脏」

 

如果说设计哲学赋予了Vbot亲和的「皮囊」,那么其内在的技术架构则是它拥有「灵魂」的基石。维他动力从一开始就意识到,要打造一个真正自主的机器人,必须摒弃传统的路径。

 

这其中核心之一在于对「算力」的理解和应用。余轶南指出,今天的智能汽车,特别是高阶智驾,往往需要在车身布满多达12个摄像头来覆盖长焦和广角,以感知周围环境 。虽然总算力很高,但分配到每个摄像头上的算力其实非常有限 。

 

Vbot则走了一条更精简、更高效的路。「人其实通过两个眼睛、两个摄像头就能覆盖他基本移动的需求。」 余轶南解释道。

 

Vbot采用了拟人的可运动双目摄像头设计,就像人可以通过转动头部来扩大视野一样,这对摄像头可以灵活转动,使其水平视场角从固定的150度大幅提升至约230度,垂直视场角也从80度扩展到125度 。

 

这种设计的精妙之处在于,它不仅降低了对传感器数量的依赖和硬件成本,更带来了一个高效的结果:单位像素可用算力(TOPS/MPixel)远超主流智能汽车,约是其3到8倍 。

 

更高的「算力密度」意味着Vbot有能力在端侧运行更大规模、更复杂的AI模型,这是其实现高级智能的关键前提。

 

为了应对真实世界中复杂的异形障碍物和暗光环境,Vbot还额外配备了一个机器人专用的360°激光雷达,确保在全场景下都具备可靠的避障能力 。

 

强大的感知能力需要一个同样强大的「大脑」来处理。Vbot采用了双系统设计:

智能本体域负责感知—决策—规划—动作,运行于与地瓜机器人联合的S100P芯片(最高128TOPS)——这是机器人的「运动中枢」;

智能交互域负责显示、语音、光效与通信,运行与头部X5芯片,实现高效低功耗的人机交互——这是机器人的「社交中枢」。

 

这种高度集成的中央计算架构 带来了另一个优势:节省空间。赵哲伦说:「过去拆开一个四足机器人,肚子里要放好多块板子……今天由于我们高度集成,身体里有更大的空间可以来放电池包。」

 

这直接关系到机器人的「续航」这一核心痛点。传统同级别的四足机器人电池容量普遍在400Wh左右,续航仅一到两个小时。而Vbot凭借优化的内部结构,电量达到了600Wh以上,较行业上限提升了38% 。

 

不仅如此,维他动力还在与电池巨头亿纬锂能(EVE Energy)合作,联合开发更高密度的动力电池,有望将电量进一步提升,实现超过6小时的户外续航,完全满足单日出行的需求 。

 

然而,Vbot不仅要「看得见」、「动得久」,更要「听得懂」、「会思考」。为此,团队为它设计了一套全新的Agent架构 。

 

余轶南将它与我们熟悉的PC和手机交互做了对比:我们与电脑的交互距离很近,可以用键盘鼠标;与手机的交互距离更近,可以直接触控 。但与机器人的交互,距离往往在几米开外,掏出手机来控制,体验其实非常不便 。

 

Vbot的Agent架构,就是想想要抛开遥控器和预设的图形界面 。赵哲伦解释道,有无遥控器的核心区别在于,对环境的感知由谁来承担。「在有遥控器的情况下,是控制者来承担对环境的感知」。而没有遥控器,这件事就需要机器人本身去实现。

 

机器人的Agent架构|图片来源:维他动力

 

它的核心是视觉—语言—行动(V-L-A)模型 ,统一了「看懂—听懂—做对—解释清楚」的全链路 。用户输入指令后,Agent大脑会利用思维链(CoT)和反思(Reflection)等机制,像产品经理一样理解意图、拆解任务,然后调度各种工具来完成 。

 

这些工具不仅包括机器人自身的感知和技能,还包括可扩展的物理世界工具(如通过多功能背板连接机械臂或运动相机)和互联网服务 。

 

「它可以通过各种各样的连接工具实现机器人跟世界的互动。」余轶南举例说,Vbot可以拖着人玩滑板,也可以装上一个特制设备,在网球场里自动捡网球 。这种可扩展的「任务工具链」,为用户提供了丰富的应用生态 。

 

注入「生命力」:用艺术的思维来创造灵魂

 

「我们是要打造有生命力的机器人。」赵哲伦在发布会上强调,「工程科学的思维可以控制精度……但我们认为必须得用艺术的思维来创造灵魂。」

 

这句话点明了维他动力不一样的追求:让机器人拥有「生命感」。他们认为,过去很多机器人交互方式存在局限,要么被预设的图形界面限制,要么只依赖语音而容易产生误解 。

 

团队从「LOVOT之父」林要那本为《温暖的科技》的书中获得启发。书中提到,人与人之间的信息传递,55%依赖肢体语言,38%是语气,而纯粹的语言内容只占7% 。这让他们意识到,要让交互变得自然、温暖,就必须让机器人拥有丰富的表达能力。

 

「机器人应该怎么样来去表达自己的情绪?不管是开心也好还是害怕也好。」Vbot给出的答案是:全模态交互 。它不仅有屏幕上的表情,更有肢体、扬声器和指示灯的协同表达 。

 

为了让这些表达生动可信,维他动力做了一件在机器人行业相对少见的事——聘请动画师。赵哲伦介绍,他们将迪士尼动画的十二法则,如节奏感(Timing)、夸张(Exaggeration)和吸引力(Appeal),融入到机器人的动作设计中 。

 

例如,通过控制动作的速度变化(加速度),来表达惊讶或喜悦的情绪;通过夸张的躲避动作,来告诉用户它「害怕」前方的沟壑,无法通行;通过一些小动作展现其鲜明的个性,比如在思考时做出歪头的姿态 。这些设计让Vbot不再是一个执行命令的机器,而是一个能够传递情绪、有「性格」的伙伴。

 

除了情感表达,Vbot也拥有「长期记忆」。赵哲伦向极客公园谈到,他们的记忆系统分为三部分:空间、关系和信息。

  • 空间记忆:机器人需要记住家庭或办公室的环境布局,能听懂「去爸爸的房间」这样的指令。
  • 关系记忆:通过声纹和人脸识别,它能分清家庭成员,知道谁是谁。
  • 信息记忆:这是更深层次的交互记忆,让机器人能够理解并记住用户的偏好和习惯。

 

这种对「生命感」的追求,背后是一定的技术支撑和清晰的商业规划。维他动力成立仅半年,已先后完成种子轮和天使轮融资,累计融资规模达3亿元人民币,天使轮由达晨创投领投,联想创投、渶策资本等跟投 ,资金也将聚焦于首款智能伴随机器人的规模化量产 。

 

为此,他们组建了一个覆盖电池、电机、算法、数据基建等全栈软硬件的60多人研发团队 ,并与京东(新零售)、火山引擎(大模型算力)、地瓜机器人(端侧算力)、禾赛科技(传感器)和亿纬锂能(电池)等行业巨头达成了深度合作 。

 

一条清晰的路线图已经铺开:9月启动制造工厂,10月到12月开启早鸟内测,年底正式上市,并在明年1月的CES展会上开启海外众测 。他们也有一个更长久甚至宏大的目标:5年内,让机器人大规模进入家庭和办公场所;10到20年,成为全球前三的智能机器人公司 。

 

当被问及为何不做更「酷」的人形机器人时,赵哲伦向极客公园坦言,人形机器人的技术挑战依然巨大,且他们认为第一款家用产品「个子不能比孩子高」,以保证亲和力和安全性。

 

从智能汽车产业汲取养分,到用「算力密度」重塑硬件架构,再到以「生命感」定义交互体验,维他动力正在走一条此前未被走通的路。他们丢掉了遥控器,因为这迫使机器人必须真正地理解世界。

 

维他动力创始人|余轶南

 

余轶南说,「智能手机跟非智能手机最大的区别是没有物理按键,无人驾驶跟辅助驾驶最大的区别是没有方向盘。」 而Vbot正在做的,就是拿掉机器人的「遥控器」,推动其向一个更自主、更智能的方向发展。

 

浏览量: 3

文章分页

上一页 1 … 87 88 89 … 1,941 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间