Skip to content
  • 51蛙吖蛙元宇宙社交空间官网
51蛙吖蛙 – 元宇宙社交

51蛙吖蛙 – 元宇宙社交

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

标签: 科技

AI 上新|这款 AI 浏览器,让我惊喜,又有点「后怕」

作者| Moonshot

编辑| 靖宇

 

你是否也曾为在浏览器上打开十几个标签页、却依然找不到答案而烦扰?

你是否经历过,只是想搞懂一个概念,却在搜索、跳转、视频、文章里中耗去大半小时,最后仍不明所以?

在 AI 工具爆炸的 2025 年,我们被各种新玩意包围:AI 写作、AI 搜索、AI 总结、AI 启动器……好像 每一个软件都想借 AI,重塑一遍你和电脑的关系 。

而上网冲浪最重要的那块冲浪板——浏览器,一直以来都没有被 AI「重新定义」。大多数所谓的「AI 浏览器」,不过是在搜索框里集成了 ChatGPT、Gemini,或是装个 AI 插件。

浏览器,这个现代人最常用的工具,却也是最没有「升级感」的工具。

直到「Dia」出现。

Dia 的核心理念是: 「AI 即是浏览器」 ,它不是浏览网页的工具,也不是 AI 外挂和插件,它是少数真正从底层重新定义「浏览器」的产品。

如果你还在复制粘贴网页去 ChatGPT,总结、翻译、提问一条条来,那你真的该认识一下 Dia 了。

在用了一段时间 Dia 后,它不仅重塑了我对 AI 时代浏览器的理解, 还创造了我新的上网习惯,也让我产生了某种恐惧 。

栏目作者召集

极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!

现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例: AI 上新|这个应用,让苏格拉底和尼采手把手教我「哲学」 ) 向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。

同时, 优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。

AGI 太久,只争朝夕,让一部分人先 AI 起来吧! 投稿、进群请扫描下方二维码添加极客小助手微信

 

01

AI 就是浏览器本身

 

第一次打开 Dia,你可能会被它的界面迷惑:没有传统浏览器的标签页、书签栏、插件区,取而代之的一个对话框,和下方「聊天」、「写作」、「编程」三个功能卡。

打开浏览器,即用大模型,有问题,对话框里直接聊,堪称「大模型」版 Boss 直聘。

这也是 Dia 不同于传统浏览器之处:它把浏览器的核心功能,从浏览网页变成了「解决需求」。

我们通常打开浏览器,是需要解决某个具体的问题,比如你想知道「剪映和 Final Cut 的功能差异,它们分别适合哪些类型的视频剪辑者?」

在传统浏览器中,你需要打开搜索引擎,把复杂的需求简化成「剪映和 Final Cut 的功能差异」。再在浩如烟海的网页里,人工比对功能列表、翻社区评论、看评测文章和视频,最终自己提炼出结论。

而在 Dia 中,你可以输入自己完整且具体的想法,「我是一个剪辑小白,我想学着剪辑自己的 Vlog 发到某书/某音上,请帮我比较一下……」。

Dia 会用 AI 帮你:

  • 自动查找多个来源(官网、知乎、Reddit、媒体评测)
  • 自动阅读网页内容并生成简明摘要
  • 用结构化方式输出表格或段落总结
  • 最后提出具体建议:如果你是新手短视频博主,更推荐剪映;如果是团队协作或需要插件生态,Final Cut 更合适……

这不是简单的搜索增强,Dia 完整地替你做完了「检索 – 筛选 – 得出结论」的全过程。

而且 Dia 不是那种千篇一律的 AI 聊天机器人。你可以开启「个性化模式」,自定义 Dia 的语气、写作风格,甚至让它模仿某些知名人物的表达方式。Dia 甚至可以根据你设定的职业和兴趣,给出更贴合你需求的答案。

由此一例延伸,你还可以直接和 Dia 说「帮我总结下这篇论文」、「把这段网页内容翻译下」、「帮我写个邮件模板」,甚至「用保罗·格雷厄姆的风格给我讲讲这个概念」。

当然,这些功能任何大模型都能实现,但 Dia 的不同之处在于,它不仅是「我问,它答」,而是「我说目标,它执行流程」。

Dia 背后的交互理念是:「 人类提出任务,AI 自动跑网页 」。

这也就重塑了「浏览器」这一产品目的。其他浏览器目的是:更好地浏览网页,而 Dia 的目的则是:利用网页,完成你的需求。

 

02

无数的网页,无缝的 AI

 

Dia 的核心杀手锏,是它对人与网页交互方式的彻底重构:网页不仅能看,更能直接对话、理解、处理。

传统浏览器中,你要想让大模型帮你处理网页信息,往往得经历这样一套流程:「复制网页内容 → 打开 ChatGPT → 粘贴 → 输入 Prompt → 处理结果再粘贴回来。」哪怕你用上了各种插件或侧边助手,依然逃不出「来回切换 + 手动处理」的困境。

而 Dia 把这整个链条,浓缩成了一次点击。

你只需点击网页右上角的「Chat」按钮,就能在当前页面直接唤起 AI 侧边栏,像聊天一样说出你的需求。

Dia 会自动读取并理解你当前页面的全部上下文,包括正文、图表、表格、视频音频、PDF、甚至图片上的文字信息。你甚至不需要告诉它「我需要你看这段」。

在实际体验中,Dia 展现出强大的内容感知与任务执行能力。

比如我打开一封活动方发来的 3000 字英文邮件,内容涉及会议安排、座位号、取票方式、注意事项、法律须知……

我根本没精力一段段翻看,所以我在「Chat」中输入:「请总结邮件重点。」Dia 立刻理解邮件结构,剥离出关键字段,把我最需要的「座位和兑换码」信息提炼出来。我不用复制粘贴,再跳转去 ChatGPT,它就在我眼前完成了整个信息处理。

更惊艳的,是 Dia 对复杂内容和具体指令的理解力 。

比如我正在浏览一段 20 分钟的 YouTube 足球训练视频,你不需要从头看到尾,只需在侧边栏下指令:「视频里推荐的单人训练方案是什么?是否推荐新人采用?」

Dia 会自动「看」完视频内容,再对应到我具体要求「单人训练」,生成相应答案,甚至会在答案里标出时间点,点击即可直接跳到对应片段。

我完全不需要全片观看再记个笔记,就已经得到了翔实可用的答案。

我甚至可以打开多个视频页面,比如几支热门的足球训练教程,一支都不点播放,直接唤出 Dia:「请结合这些视频,给我制定一个适合在家练习的训练计划。」

Dia 就会把所有视频作为输入源,进行并行分析,生成一个结构清晰、语气自然、结合你需求的定制训练方案。

 

所以与其说 Dia 集成了大模型,不如说它让网页本身成为了 AI 的输入接口 。

Dia 能识别每一个网页的结构逻辑,我看到的文本、图表、图片、视频、嵌入文档通通可以当作可读对象。

无论我面对的是冗长邮件、冗杂文档、复杂视频、PDF 报告、论坛高楼的评论区,我只需要说出我需要什么,Dia 就能「理解、处理、生成」。

而且,Dia 还可以把对话内容一键生成图片,待我后续查用,这种「所见即所得、所聊即输出、句句有回应」的体验,让我网上冲浪的体验变得无比丝滑和顺畅。

 

03

面向未来设计

 

除了两大核心功能外,Dia 还有许多可圈可点的设计。

比如界面设计,打开 Dia,你会感受到一种安静和专注,就像一张未经打扰的白纸。

它的界面干净得近乎「禅意」:只有一个对话框,几个功能卡,一个「Chat」按钮。从设计上就仿佛告诉你:重点不是网页,而是任务。

Dia 上没有传统浏览器那些满屏的书签页、插件栏、广告条和通知弹窗,在初始设定时,它就内嵌了屏蔽广告的选项。

让你从浏览到操作,都能感受到一种「极简式专注」。

Dia 强调隐私的「屏蔽功能」

AI 也嵌入到了网页浏览的每个字节里。

比如我可以随意框选一句话,右键「Ask Dia」,Dia 会把这段话和整个网页一起抓取进 AI,它既有上下文,也有重点句。

所以我能让它「用海明威的文风/刘慈欣的文风/雅思写作 7 分的水平重写这段话」,也可以问「这段话在全文结构上的意义是什么?」

Dia 还支持用户预设命令,我就创建了一个「/read」命令。在阅读长文时,我只需要输入「/read」,Dia 就会按照我的 prompt 去处理网页,并按要求反馈结果。

其实就是把 prompt「快捷键化」

当然,Dia 并非完美,甚至让我感受到了隐患。

虽然中文识别与处理能力非常强,但 Dia 界面不支持中文,AI 输入输出中文都需要手动设置。

其次,最令人困扰地还是网络问题,Dia 目前只支持美区 IP 的账号登录,以及在调用模型时,也要保持美区 IP,哪怕经由网络设置后,依然会随机出现连不上模型、被迫弹出账户等问题。

 

上面是登录问题,下面是调用模型时的失败

以及,我吹毛求疵地希望,Dia 能走得再远一点,不只是「理解网页」,而是能「操作网页」,能独立完成「自然语言 – 执行」的回路。

就像我希望,我能对它说:「我想看电影《F1》的预告片。」Dia 就能立刻打开 YouTube 或 Bilibili,搜索对应片段,自动播放,甚至为我挑选中文字幕版本。

又或者我说:「帮我订明天中午去上海的高铁票。」Dia 就能自动跳转到 12306,识别出发地、填好时间、筛选出中午时段的车次,然后停在确认页上,等我点下支付。

就像我们曾对手机上的语音助手充满幻想,希望它能调用 App、订外卖、设闹钟、发微信。

我对 AI 时代的浏览器,也有类似的期许:它不仅该帮我理解网页,更该帮我调用网页、操作网页、完成任务。

这时的浏览器,已经不再是传统意义上的「信息入口」,而是一个真正能动手做事的 AI Agent 。

结果我还是要复制粘贴、打开 YouTube、筛选视频

如果说此前介绍过的 Raycast 重构了我 Mac 的操作习惯 ,那 Dia 也重塑了我的上网体验。

用 Dia 一段时间后,我发现上网不再是漫无目的地冲浪,而是一个更加专注的过程。

过去的浏览体验,常常我是被信息推着走。一开始只想查个数据,最后却在无数个标签页之间兜兜转转,看了一堆没用的东西。

而现在,当我带着任务时,我专注在任务上,而非纷繁复杂的信息和网页里,我直接和 Dia 对话,让它给我答案;

当我在看内容时,我专注在内容上,我不用停下来查词、跳页、记录,我请求 Dia 助我理解。

Dia 不只是浏览器,而是一个面向 AI 时代的信息界面。它把浏览器从「打开页面」的工具,变成「完成任务」的平台。

而这,恰恰也是我最隐隐担忧的地方。

我确实变得更专注了,但与此同时,也失去了一部分耐心 。当任务被不断压缩成目标 + 输出,我开始习惯于一句「总结一下」代替完整阅读。

我不再耐心体会镜头的剪辑节奏、句子的遣词造句、结构的层层铺垫,而是本能地请求 AI 快速提取结论, 我变得更加依赖于 AI 带来的「快餐」 。

就像这篇文章,如果我不是作者,而是读者,在 Dia 中打开它的第一反应,很可能只是敲下快捷命令:「/read」。

而这,是整个 AI 时代都面临的难题,或许也间接证明了:

Dia 做对了。

*头图来源: Wired

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

浏览量: 7

特斯拉 Robotaxi 迎来首撞;谷歌 AI 制药即将进行首次人体试验;香港目标今年内发出稳定币牌照

特斯拉 Robotaxi 迎来首撞:轻微擦碰停放车辆

据视频博主克里斯(网名 DirtyTesla)分享,上周他在一次特斯拉 Robotaxi 的试驾过程中,经历了特斯拉 Robotaxi 项目「首撞」。

此次事故并非在高速行驶或变道过程中发生,而是在车辆静止状态下,特斯拉的全 FSD 意外地将 Robotaxi 驶向了一辆停放的汽车,轻轻碰撞了对方的车门。

根据克里斯的描述,事故发生时,他正在使用 Robotaxi 前往一家披萨店。然而,车辆在尝试进入该店停车场时遇到了问题。在多次尝试失败后,车辆最终放弃了进入停车场的计划,停在了停车场入口旁。克里斯在下车后立即开始拍摄视频。视频显示,特斯拉车辆在没有任何明显原因的情况下,突然转动方向盘,径直向一辆仅几英寸距离的丰田凯美瑞驶去。

此前,马斯克曾声称 Robotaxi 将不会在前排座位安排人员,并为此招聘了远程操作员。然而,乘客很快发现,虽然车内确实有安全操作员,但他们被安排在副驾座位上,而不是主驾。马斯克表示,这种安排是因为特斯拉对安全「格外谨慎」,而此次事故似乎也证明了这种谨慎的必要性。(来源:IT 之家)

淘宝美团外卖大战,上周末外卖市场规模扩大一倍

据《晚点》报道,上周六淘宝天猫的市场团队拿出比肩双 11 的预算和阵仗,迎接百日闪购增长计划的第一个冲单日。

当天下午,全国美团一线经营人员突然接到通知,当天要放开限制,全力补贴、极尽所能跟进淘宝闪购的补贴战,冲高单量。

这轮较量的结果是:7 月 5 日美团宣布所有外卖订单(包括餐饮和零售订单)突破 1.2 亿,其中餐饮订单超 1 亿。淘宝闪购则在两天后宣布,5 号当天的闪购订单量超过 8000 万单。

整个外卖市场总量年初日均大约 1 亿单。随着京东开始做外卖、淘宝闪购入场,市场规模在这一轮遭遇战前被逐渐补贴到每天 1.5 亿单左右,并在上周六当日冲到 2.2 亿单。(来源:晚点 LatePost)

香港目标今年内发出稳定币牌照

7 月 7 日,香港特区政府财经事务及库务局局长许正宇表示,目标今年内可发出稳定币牌照。香港《稳定币条例》将于 8 月生效。

许正宇亦表明,批出的稳定币牌照数目会是个位数,盼于条例生效后能够收到申请,目标今年内可发出牌照。至于有金融机构取得牌照后,是否能够发行与人民币挂钩的稳定币,他说若牵涉其他司法权区的货币,则要与相关机构讨论。

谈及稳定币的应用情景时,许正宇说:「我们希望(稳定币)着重处理在实体经济中的难点和痛点,例如跨境支付,尤其是牵涉到『本币』风险较高,又或当地金融体系不是那么完备,而进行跨境支付时,则有一定的挑战。但若有以法定货币作为基础的稳定币,作为一个有效的支付工具,可便利跨境交易及减省当中的交易成本。」(来源:21 世纪经济报道)

特斯拉全球最大超充站在加州落成

据外媒 Insideevs 报道,特斯拉在加州洛斯特希尔斯建成了一座名为 Project Oasis 的超级充电站,配备了太阳能电池板、Megapack 储能装置,目前已启用 84 个充电车位,是全球最大的特斯拉充电站之一。

该充电站完全依赖太阳能供电,未接入传统电网。特斯拉表示,等到今年底 168 个充电桩全部上线后,这里将成为全球最大、最具代表性的「零化石燃料 + 脱离电网」充电示范站。

现场所有车棚顶部都装有太阳能板,停车区旁还建有一座大型太阳能电场,总发电能力达 11 兆瓦。发电所得被储存在 10 个 Megapack 中,每个容量 3.9 兆瓦时,足以支持每天数百辆电动车完成充电,实现全程由太阳能驱动的零排放出行。(来源:IT 之家)

谷歌 AI 制药即将进行首次人体试验

近日,DeepMind 旗下的药物研发公司 Isomorphic Labs 正准备开始在人体上测试其人工智能设计的药物。

Isomorphic Labs 于 2021 年从 DeepMind 分拆出来,一直处于将 AI 融入药物研发的前沿。该公司利用先进的机器学习算法分析海量生物数据,识别潜在的药物靶点,并设计出能够有效治疗多种疾病的新型化合物。

对于制药公司而言,研发一款新药往往需要数百万美元的投入,药物试验的成功概率则只有 10%。公司总裁 Murdoch 认为,Isomorphic 的技术有望大幅提高这一成功率。去年,Isomorphic 与诺华和礼来两家制药公司签署了重要研究合作协议。(来源:财联社)

具身智能再现大额融资,星动纪元A轮融资近5亿元

7 月 7 日,清华系具身智能企业北京星动纪元科技有限公司宣布完成近 5 亿元 A 轮融资,本轮融资将用于人形机器人软硬技术的研发与量产落地。

星动纪元成立于 2023 年 8 月,是清华大学唯一持股的具身智能企业。星动纪元的技术路线是软硬一体,目前的产品是轮式人形机器人星动 Q5 和面向工业领域的全尺寸双足机器人星动 SRAR 1,以及五指灵巧手 XHAND1。

在模型侧,星动纪元是希望让机器人像人一样「看懂世界,自主行动」。公司提出融合理解与生成的具身大模型模型 ERA-42,将视觉、理解、预测、行动等功能统一到一个端到端的模型中,可实现一个模型控制全身灵巧操作。

在零部件方面,星动纪元的核心零部件,包括关节模组、灵巧手、电机、减速器、控制器等,均为自研。

商业化方面,截至 6 月,今年已累计交付超 200 台产品,另有上百个订单在量产交付中。在全球市值 TOP 10 的科技巨头中,9 家为星动纪元客户,目前所有订单中,50% 以上来自海外客户(来源:科创板日报)

罗马仕退款排至 17 万位,网友:梦回 ofo 小黄车退款潮

7 月 7 日,近期深陷产品质量风波的罗马仕再度引发广泛关注。有网友发现,罗马仕服务号上出现「退款进度」查询入口,不少购买了召回型号及批次产品的消费者纷纷查看退款进展,小红书网友 @Lucky 反馈自己已排到 17 万位,退款之路漫漫。

在电商平台方面,目前淘宝和拼多多上的罗马仕官方旗舰店已关闭。京东平台仅余京东自营店和罗马仕数码配件旗舰店,抖音平台目前能搜索到罗马仕官方旗舰店和罗马仕旗舰店,但相关店铺所售商品也仅以数据线、充电器等配件为主,曾经的明星产品充电宝不见踪影。

面对罗马仕当下的困境,不少网友联想到 2017 年 ofo 的退款困境。当时,据海口日报报道,海口市民阿正在 ofo 退款队列中已排到第 14460679 位。(来源:凤凰网科技)

极越CEO复更微博,此前传闻称极越正在重组

近日,极越 CEO 夏一平微博重新更新,7 月 6 日,他接连转发两条动态,一条为前极越车主对极越的祝福,另一条则为极越官方发布的「关于用户关心的问题说明(第十六次)」。

「关于用户关心的问题说明(第十六次)」发布于今年 6 月,主要内容涉及极越售后维保、智能辅助驾驶 OTA 等方面。

此前,原极越汽车公关负责人徐继业曾在朋友圈发文称:「有兄弟透露极越大概率不会破产了,集度董事会已经同意重组,集度目前正与 3-4 家重组方沟通中。」(来源:新浪科技)

曝 iPhone 17 Pro 放弃钛金属,将回归全铝机身

近日,iPhone 17 Pro 模具在社交平台上被曝光,和之前爆料的渲染图一致,iPhone 17 Pro 采用横向矩阵相机 DECO,闪光灯和 LIDAR 激光雷达扫描仪位于矩阵相机右侧。

值得一提的是,iPhone 17 Pro 全面放弃钛金属,采用全铝合金机身,中框和后盖为一体化设计,不过苹果 Logo 区域为玻璃材质,用来支持无线充电。

据爆料,iPhone 17 Pro 的苹果 Logo 靠下放置,为了适配这个 Logo,配件商制造的 MagSafe 手机壳在磁吸环底部开了小孔,这样看起来更加和谐。

怒喵科技创始人李楠指出:iPhone 17 Pro 系列放弃沿用很久的三明治结构,回归全铝合金 Unibody,苹果使用钛合金也不是不行,但是重量会吃亏。(来源:快科技)

新款问界 M7 谍照曝光

近日,一组新款问界 M7 的谍照在网络流传。通过谍照可以看到车辆外观相较于新款有很大变化,整体造型更贴近问界 M8 的设计语言。据相关消息称,新款问界 M7 或将在 9 月份正式上市,有可能会在 7 月或者 8 月批次进行工信部申报。

车辆整体造型更加圆润饱满,两侧大灯组造型与问界 M9 和 M8 相似,采用矩形船桨的造型。前脸的造型更加高大,通过谍照看很像小号的问界 M8。据爆料,预计新车的整体尺寸也有所增加,车长会由现款的 5020mm 增加至 5100mm,轴距从 2820mm 提升至 3050mm。车尾部分,透过谍照缝隙可以看到预计车辆将会采用贯穿式尾灯,车尾两侧翼子板具有不错的肌肉感,整体造型相比现款更加饱满。

有消息称,新款问界 M7 的纯电续航里程可能将突破 300km,综合续航里程也有可能达到 1500km。(来源:汽车之家)

《F1:狂飙飞车》成苹果迄今最高票房电影

赛车题材电影《F1:狂飙飞车》上映十天,全球票房已破 2.93 亿美元(约合 21 亿元人民币),超越马丁・斯科塞斯执导的《花月杀手》和雷德利・斯科特执导的《拿破仑》,成为苹果迄今为止票房最高的电影。

作为一部苹果原创(Apple Original)作品,这部电影在票房上打破了多项纪录,同时收获了极为积极的影评。该片在首映日就取得 2500 万美元票房成绩,其中还包括了价值 280 万美元的提前预映场票房。当时,分析师曾预计这部电影的首周末票房会在 3500 万至 6000 万美元之间,但实际首周末票房达 1.4 亿美元。

值得一提的是,这部电影的制作预算达 2 亿美元,但苹果并不完全依赖院线来收回成本,相反他们更看重这部电影在其流媒体平台上的影响力。(来源:IT 之家)

浏览量: 7

灵宝机器人完成近亿元融资,工厂派投资人盯上「人形机器人」

作者|Li Yuan

编辑| 郑玄

 

当多数人形机器人公司还在争夺展台 C 位时,灵宝 CASBOT 默默收获了一张来自工厂的支票。

6 月 26 日,灵宝 CASBOT 宣布获得近亿元天使+轮融资。本轮由蓝思科技领投,天津佳益及老股东国投创合、河南资产跟投。

与行业内多数人形机器人所获得的融资不同,这次签支票的手,明确来自需要解决产线痛点的「工厂派」,而非评估技术故事的风投会议室。这也是领投方蓝思科技在智元机器人后第二次投资人形机器人。

人形机器人是否是噱头?能否有朝一日大规模落地?

当 VC 还在计算估值模型时,似乎产线已经给出了更诚实的投票。

在 2025 年机器人爆火之后,许多双足人形机器人聚焦展演、教育场景落地。而此次获投的灵宝 CASBOT 本身,也代表了一条相对特殊的路径:不过多关注聚光灯下的展演,锚定工厂车间与矿山井下等刚需场景。

当工厂派投资人开始下场押注具身智能,一个更尖锐的问题浮出水面:为何工业场景仍是少数玩家的蓝海战场?

极客公园对话了灵宝 CASBOT 的联合创始人&COO 张淼,试图探寻具身智能在工业场景目前的生存真相。

 

01

被技术高墙与 ROI 标尺圈出的蓝海

 

机器人在工业场景里是真需求吗?

「工业场景的需求是真需求。」灵宝 CASBOT 的联合创始人&COO 张淼给出了肯定的回答。

算上之前投资灵宝 CASBOT 的联想公司的消费电子工厂和此次投资灵宝 CASBOT 的蓝思科技,灵宝机器人已经接触过了多家消费电子工厂。

「3C 产品品类切换频繁,但单品类的生产体量又不大,这就要求产线足够『柔性』,不能是固定的、一次性的重投入。」张淼解释道。

一个典型的痛点,出现在质检环节。目前,这条产线的「主角」仍是质检工人。工厂并非没有想过替代方案:

要么使用专用质检设备,高昂的成本和「专机专用」的属性,使其在品类频繁更换时沦为「鸡肋」;要么是传统的固定机械臂,虽然成本更低,却无法胜任需要手眼脑协同、且具备一定泛化抓取和操作能力的复杂任务。

拥有通用操作能力的具身机器人,如果能够承担工厂的部分操作任务,将对工厂实现柔性生产,节约成本有很强的意义。

同样的需求也发生在矿山场景。这里的需求更为刚性,驱动力也超越了单纯的成本考量。

根据国家矿山安全局的指引,2026 年底前实现「危重岗位机器换人」是摆在许多央国企面前的硬性指标,这构成了不容置疑的「政策刚需」。

井下作业环境极端恶劣——深入地下百米乃至千米,常年面对 30-40°C 的高温高湿,空气中还可能弥漫着有毒气体,机器换人是对人类生命的根本关怀。

然而,虽然是真需求,机器人换人却仍然是绝对的蓝海市场,而原因就是技术和 ROI 的两道高墙。

第一道墙就是技术。

理论上,如今的大模型已能理解人类的复杂指令,并进行一定的泛化操作。

但在物理世界,「灵巧手」的能力瓶颈限制了绝大部分替代可能。「比如给 3C 产品撕掉一层精细的背贴,或是理顺一把纷乱的线束,这些人类习以为常的动作,对于机器人来说,仍是巨大的挑战。」张淼举例。

主要的难点之一在于灵巧手。目前的灵巧手本身还达不到人类的能操作的精细度,需要等待触觉传感、算法、模型和手的构型的一同进步。

当前的技术边界大致如此:类似「插拔内存条、拧螺丝」这类相对规整的装配任务,机器人「或许」可以勉强完成。

而矿井环境则在操作之上,又叠加了「本安防爆、抗尘耐用」等一系列严苛的工程化要求,则机器人本身必须经过本安、抗爆、防尘等一系列特种改造,提出了另外的技术要求。

第二道墙,则是「ROI 标尺」。即便需求再真实,工业客户的每一笔采购仍然遵循严格的商业回报逻辑。

工业客户从不为情怀买单。张淼坦言,许多客户的需求非常明确:「12 到 18 个月内,必须收回机器人采购的成本。」这条清晰的商业红线,考验的不仅是机器人的售价和效率,更考验着机器人公司对工业流程的理解和成本控制能力。

而如何与客户共同定义场景、核算并达成这笔「经济账」,恰恰是工业场景的另一重隐形门槛。这或许是技术储备夯实同时又具备丰富工业场景交付经验的灵宝 CASBOT 团队,一个独特的竞争优势。用他们的话说,「我们更会和工业制造企业打交道,讲好这本技术与商业结合的账。」

 

02

真人数采与成本重构:灵宝二代的量产解法

 

面对工业客户「12-18 个月必须回本」的冰冷标尺,任何无法被清晰量化的技术情怀都显得苍白。灵宝给出的解法是,在 2025 年 6 月 16 日发布的第二代机器人 CASBOT 02 上,进行了一场彻底的、由商业化需求反推的「成本与智能重构」。

其中,最核心的改变,便是对机身进行了「骨架与外壳分离」的模块化、解耦化设计。

张淼在表示,将复杂的整机结构「解耦」为独立的骨架和外壳模块,不仅整机成本和重量显著降低,更关键的是,它极大地提升了「装机效率」,为即将到来的小规模量产交付铺平了道路。

此外,借助本轮领投方蓝思科技在供应链上的深厚积累,其成本还有进一步优化的空间。

目前,CASBOT 02 在京东官方售价为 32.88 万元,精准卡位于行业主流价格带的中段——向下与 20 万级别的简配机型拉开能力差距,向上则避开了 50 万以上的进口或纯科研型号,让其具备了进入大部分 B 端及一些 C 端爱好者采购清单的现实可能性。

此外,虽然针对工业场景更多,灵宝 CASBOT 02 也针对目前需求很大的展览文旅场景做了一定的优化,增加了灵动模式——机器人在不工作的时候,也会做出一些类人的思考和举动,增加和用户互动的趣味性。

除了本体的优化之外,灵宝团队也在算法上做了升级。

团队发现,单纯的 VLA 模型在面对工业精细化操作时存在性能瓶颈。为此,他们在 VLA 模型之上,创新性地加入了「离线-在线两步微调」方法,特别是在线阶段引入强化学习,让机器人能在与真实环境的交互反馈中不断优化策略。

同时,其核心优势的灵巧手算法也进行了迭代升级。

与行业内的机器人相比,灵宝的机器人背后的软件算法有几个与众不同的地方。

其一是,是名为「分层端到端」的实用架构。

将负责核心任务、可在本地独立运行的「端侧具身模型」,与负责开放式交互、部署在云端的「云侧大模型」分离开。这保证了机器人在网络不佳的工厂能稳定作业,在需要交流的商场又能「连上云」对答如流。

其二则在于数据。

在具身智能的赛道上,数据是模型的血液。目前行业内许多公司使用「真机遥操作」的数据采集模式。灵宝 CASBOT 联合创始人&COO 张淼表示,这种路径有其自身的问题:为了保证数据质量,操作员会下意识地把一个不到 1 秒的动作,放慢到好几秒来完成。

而用这种失真的慢数据去训练模型,产出的机器人效率只有人类的 30%,这也是为什么很多演示视频需要加速播放。这不适配工厂场景。

灵宝的解法是让「人类自己当教练」——他们与中国科学院自动化研究所联合研发了一套「真人域」数据采集系统(带有密集触觉传感器的手套和视觉眼镜),由工程师真人佩戴,以最自然高效的方式完成任务,从源头保证了数据的高质量与「原汁原味」。

在完成了智能与成本的双重进化后,灵宝清晰的量产交付计划也浮出水面,其商业路径并非单押双足。

灵宝机器人今年也参加了人形机器人马拉松比赛,虽然并未进入前三,但是是场上唯一零失误、零摔倒的机器人。张淼表示,公司对双足的规划,更像是「能够满足多地形通过」即可。

而未来,公司布局了全尺寸双足、轮式机器人、以及可独立销售的灵巧手三条产品线。

「我们今年的目标,是在三条产品线上分别完成小规模的量产交付,每条线的量级大约在 100 台套左右。」张淼最后强调,「我们的量产,唯一的目标就是为了真实的订单交付。没有客户买单,盲目量产没有意义。」

*头图来源:灵宝机器人

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

浏览量: 7

传TikTok要为美国市场单开新App,全球将出现三个「抖音」?

 

头图来源:视觉中国

 

TikTok要在美国推出新App了?

 

7月6日,外媒The Information爆料称,TikTok 计划推出一款全新的美国版App——内部代号「M2」,预计9月5日上线。

 

TikTok推出这一新App的背后,应该是出于应对美国法案的拆分要求。

 

美国政府一直对TikTok施加「不卖就禁」的压力,要求其处理在美业务。但TikTok不可能出售整个全球业务,单独出售美国业务并成立独立运营的美国版TikTok,似乎是一个较为可行的解决方案,但最终还是要看美国与中国方面的谈判究竟如何落地。

 

前段时间就不断有消息传出,称TikTok可能会将其美国业务出售给一个美国财团。特朗普也公开表示过,可能会单独出售美国市场的TikTok,并独立成立一个新的平台。

 

如果上述计划最终落实,那么未来的全球市场上或将出现三个版本的「抖音」——全球版的TikTok、美国的新版TikTok和中国的抖音。这一拆分不仅能够符合美国监管要求,还可能在不同市场中带来差异化的运营模式和用户体验。

 

1 推出新App,为出售美国业务做好准备?

 

据《The Information》报道,TikTok 正在为其美国用户开发一个全新的应用程序,以配合美国业务出售的计划。

 

报道称,TikTok已制定计划,将在 9 月 5 日向美国应用商店推出新 TikTok 应用程序,该应用程序内部被称为「M2」(现有的 TikTok 应用程序内部被称为「M」)。

 

根据计划,TikTok 用户最终需要下载新的「M2」版本才能继续使用该服务,现有版本将运行至明年 3 月。

 

图片来源:视觉中国

 

就在上周五,美国总统特朗普表示「已基本达成协议」计划让一家本土公司收购TikTok的美国业务,并称打算在下周一或者周二(也就是本周)与中国重启谈判。

 

报道称根据该协议,包括甲骨文在内的非中国投资者组成的财团将收购 TikTok 的美国业务,而其母公司字节跳动预计将保留少数股权。然而,这一交易仍然需要中国方面的最终批准。

 

更早些时候,特朗普就曾表示已经为TikTok的美国业务找到了买家。当时的报道里,有知情人士透露,潜在买家是由甲骨文、黑石集团和风险创投公司Andreessen Horowitz组成的财团。

 

据市场情报公司Sensor Tower的估算,TikTok在美国的月活跃用户数约为1.15亿,略低于Instagram的1.31亿,领先于Snapchat、Pinterest和Reddit,后三者的美国月活跃移动用户数分别为9600万、7400万和3200万。

 

据独立投资研究机构 CFRA Research 的估计,TikTok 在美国的业务估值介于 400 亿到 500 亿美元之间——估值基于与竞争对手应用相比的 TikTok 美国用户群和收入的估计;而彭博行业研究的分析师则认为其估值约为 300 亿至 350 亿美元——该部门曾表示这一估值“由于是被迫出售而有所折价”。

 

若考虑到算法等核心技术,TikTok 的估值可能更高,甚至达到 2000 亿美元。其母公司字节跳动的估值则在去年去年12月被软银集团旗下的愿景基金调整提高至4000亿美元以上。

 

TikTok此次的做法——要求用户下载独立的新应用在业内并不常见,这么做可能面临一定的用户流失风险。但推出新版本的 TikTok 应用可能有助于解决部分关于数据安全的争议,符合美国对该应用的合规要求。

 

TikTok 在美命运走向何方

 

自2019年美国政府开始对 TikTok 进行国家安全审查以来,TikTok 已多次尝试解决数据安全问题,并在多个层面展开了抗争,但字节跳动面临的压力并没有因此缓解,而是愈发严峻。

 

2019 年 11 月,美国政府对 TikTok 母公司字节跳动收购 Musical.ly 进行了国家安全审查,关注点在于用户数据的处理和存储。

 

此后的几个月里,美国参议院多次举行听证会,推动立法禁止TikTok。到了2020年8月,时任总统特朗普签署了行政命令,要求TikTok在90天内剥离美国业务,并采取一系列限制措施。尽管这些禁令并未立刻生效,但美国外国投资委员会(CFIUS)紧接着对TikTok展开了更为严格的审查。

 

2021 年 6 月,拜登政府虽然撤销了特朗普时期的禁令,但实际上相关的施压和限制力度更为加强。

 

TikTok 过往尝试了多种努力试图解决问题。包括建立「透明度和问责中心」;成立内容顾问委员会;成立专门的美国数据安全公司(USDS),负责管理美国用户的数据; 实施名为「Clover」的数据隔离工程和「Texas」的数据安全工程,这两项计划的年度运营成本均达到了大约 10 亿美元;聘请具有美国背景的高管;与甲骨文(Oracle)达成协议,甲骨文将成为 TikTok 在美国的「可信技术提供商」,根据协议,甲骨文有权对 TikTok 美国的源代码进行安全检查。

 

过往的努力以及后来TikTok 为阻止提案所做的一系列努力以及抗争,随着美国国会通过这项法案,均以失败告终。

 

美国会听证会上 TikTok首席执行官周受资被反复盘问国籍|图片来源:视觉中国

 

2024年4月,美国国会通过立法,禁止或强制母公司字节跳动出售 TikTok——该法案后经总统拜登签署成为法律。

 

该法案要求字节跳动在 2025 年 1 月之前完成美国业务的出售。

 

在2024年12月,美国联邦上诉法院驳回TikTok的上诉,维持了要求字节跳动剥离TikTok美国业务的禁令,TikTok面临在2025年1月19日在美关停的风险。

 

在禁令生效前一天,TikTok 在美国正式停止服务,但随即在十余个小时后恢复了服务。在特朗普重返白宫之后,禁令生效日期连续推迟了三次。

 

1月20日,特朗普重返白宫,随即把期限延至4月5日,之后又延至6月19日,而在上个月,特朗普又将该期限延长至9月17日,届时新版 TikTok 应用预计将推出,并从应用商店下架现有版本。用户将被引导下载新应用,但目前尚不清楚这一提示将通过何种方式传达。

 

这项交易或将使TikTok在美国符合《保护美国免受外国对手控制应用程序法案》的要求,但是否符合美国法律仍存疑,报道称考虑到字节跳动是否愿意将算法等核心技术与美国买家共存疑享,一些私募股权公司对这一交易仍持谨慎态度。

 

无论 TikTok 最终能否延续在美「生命」,美国对于其数据安全的疑虑,及其与中国的关系,已经把这场博弈升华为全球化背景下国家与企业之间复杂的角力。

 

与此同时,TikTok 的坚持象征着对权力与压力的抵抗,也可能对未来科技行业的国际互动产生深远影响。一个问题是,新App的推出会是TikTok 在美国命运的转折点吗?

 

 

 

浏览量: 7

李斌:蔚来千亿亏损都在明处,财报很干净;小米 YU7 正式交付首批车主;华为盘古团队回应「抄袭」|极客早知道

 

小米 YU7 正式交付首批车主,雷军跟车主合影

7 月 6 日消息,今天下午小米 YU7 正式交付首批车主,小米创办人、董事长兼 CEO 雷军为车主交付车辆,并合影、为车主开车门。

 

据官方信息,此次交付覆盖全国 58 个城市(注:官微暂未公布具体城市名单)。

上午 10:00 至 7 日晚上 24:00,小米 YU7 还开启了限时改配。锁单用户 (非准现车) 都可参与改配,如改配成功,将重新安排生产并重新计算预计交付时间。此次改配仅限 YU7 标准版 / Pro / Max 之间进行版本修改,或对 YU7 订单配置进行修改。

小米创办人、董事长兼 CEO 雷军在微博上披露了当前的改配情况:更多人改配到 Max 版,很多人改配颜色到影青色、珍珠白、流金粉。

小米 YU7 于 6 月 26 日晚正式发布,提供 YU7、YU7 Pro、YU7 Max 三种配置,售价 25.35 万-32.99 万元。该车开售 3 分钟大定突破 20 万台,1 小时大定突破 28.9 万台,仅 18 小时锁单量便突破 24 万台。(来源:CnBeta)

 

罗马仕、安克超 120 万台充电宝召回后续调查:电池生产过程中混入金属异物

7 月 6 日消息,近期,充电宝召回事件成为社会关注焦点,罗马仕、安克创新等品牌相继召回多款产品,召回产品超过 120 万台,民航局也发布紧急通知,禁止旅客携带无 CCC 认证标识以及被召回型号的充电宝乘坐境内航班。

据央视新闻报道,根据目前调查的情况分析,这次两家企业实施召回的原因基本相同。市场监管总局质量发展局召回处一级调研员赵健透露,召回原因为电池在生产过程中混入金属异物,多次充放电,使用后存在产品过热甚至燃烧的安全隐患。

记者走访业内专家了解到,锂电池品质对于充电宝安全来说至关重要,在生产中混入金属异物可能有多种原因。

中国化学与物理电源行业协会移动电源分会秘书长许辉勇称,原材料的整个生产、运输、存储的过程中,有可能本身掺杂了金属物。在整个电芯(锂电池)的生产过程中,设备长时间老化磨损,可能会带来这些金属杂质,车间的洁净度不够,可能也会导致一些金属的杂质在生产过程中混入。

据专家介绍,金属异物是充电宝锂电池生产的核心管控指标,在生产过程中必须严格监控。

许辉勇还透露,电芯(锂电池)内部正负极当中有一个隔离膜,一般混入金属颗粒杂质之后,有可能会刺穿隔离膜,从而导致正负极的内部短路,最终触发整个电池热失控起火。(来源:IT 之家)

 

华为:HarmonyOS 游戏即将亮相 2025 ChinaJoy

7 月 6 日消息,华为终端官微今日发文宣布,HarmonyOS 游戏即将亮相 2025 ChinaJoy 展览会,其展区位于上海新国际博览中心 N3 馆 01 号(具体游戏阵容暂未公布)。

据了解,以「聚・你所爱」为主题的 2025 年第二十二届 ChinaJoy,将于 8 月 1 日至 4 日如期举办。目前展会各项筹备工作正有序加速推进。累计 743 家企业报名参展,其中外资企业 237 家,来自美国、加拿大、英国、德国、日本、韩国等 37 个国家和地区,外资占比达 31.8%。

 

本届 ChinaJoy 联合官方指定票务平台——大麦、票星球、支付宝蓝花火、携程、B 站会员购及官方微信小程序「CJ 魔方」,分三轮开启门票售卖(来源:CnBeta)

 

OpenAI 招聘主管点名批评 Meta:挖角手段让人闻到一股「绝望的味道」

7 月 6 日消息,OpenAI 招聘主管 Joaquin Quiñonero Candela 日前在 X 上点名 Meta,批评其挖角方式过于激进。他透露,Meta 向 OpenAI 员工开出高薪职位,但这些 offer 只有短短几小时的有效期,员工几乎没有时间与主管沟通。他直言这种行为「不道德」,并称「让人闻到一股绝望的味道」。

Candela 写道:「我理解讲求效率,但不能拿截止时间当武器。」不过他随后淡化了「不道德」的措辞,表示不想显得道德高人一等。

 

Meta CEO 扎克伯格的挖角目标不止 OpenAI,还盯上了由 OpenAI 联合创始人苏茨克维创办的新创公司 Safe Superintelligence(SSI)。据 CNBC 援引知情人士消息,SSI 曾是 Meta 的潜在收购对象之一。今年 4 月,SSI 估值高达 320 亿美元(注:现汇率约合 2293.76 亿元人民币)。(来源:CnBeta)

 

华为盘古团队回应开源模型抄袭:严格遵循开源许可证的要求

近日,网络上有声音质疑华为盘古大模型涉嫌抄袭阿里巴巴通义千问模型。7 月 5 日,华为盘古 Pro MoE 技术开发团队发表声明称,盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。

开发团队称,盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。「我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。我们始终坚持开放创新,尊重第三方知识产权,同时提倡包容、公平、开放、团结和可持续的开源理念。」(来源:贝壳财经)

 

累计亏损超千亿元,蔚来李斌最新回应:钱都亏在明处,财报非常干净

据蔚来创始人、董事长、CEO 李斌 7 月 6 日上午在微博的直播,李斌和吴晓波以及近百位企业家参观访问了合肥蔚来先进制造新桥二工厂。

在参访过程中,李斌表示蔚来一直以来的底色是技术创新,累计研发投入达到 600 亿元。

他谈到,蔚来是全球唯一的在三地上市的汽车公司,蔚来财报里把研发投入计成当期费用钱都亏在明处,资产负债表非常干净。

 

李斌近期多次提及蔚来将于今年第四季度实现盈利的目标。

在 2025 上海车展期间,李斌表示,「2025 年是蔚来的产品和技术收获大年,技术量产上车、销量提振可以提高毛利率,再加上管理层面坚定推进降本增效,所以蔚来经营表现会逐个季度得到改善,我们很笃定第四季度会实现盈利。」(来源:极目新闻)

 

TikTok 为美国开发新版应用 9 月上线,有重大变化?

据科技网站 The Information 报道,知情人士称,TikTok 正在为美国用户开发一个新版应用。报道称,TikTok 已制定计划,将于 9 月 5 日在美国应用商店上线新版应用。TikTok 用户最终必须下载新版应用,才能继续使用该服务。现有应用预计可使用至明年 3 月,但这一时间表仍可能发生变化。

 

上月,美国总统特朗普将字节跳动出售 TikTok 美国业务的截止期限延长到了今年 9 月 17 日。

The Information 还指出,TikTok 新版应用将解决美国的安全顾虑。一个由非中国科技公司组成的财团预计将收购 TikTok 美国业务。参与此次交易的公司包括美国公司甲骨文,不过 TikTok 母公司字节跳动将保留少数股权。

截至发稿,TikTok 尚未回应置评请求。(来源:CnBeta)

 

Netflix 发布《赛博朋克:边缘行者 2》先导预告片,CDPR 联合扳机社打造

7 月 6 日消息,昨日 CDPROJEKT RED 在 Anime Expo 2025 上宣布《赛博朋克:边缘行者 2》正式开启制作,与 TRIGGER 扳机社共同打造,并将登陆 Netflix。

今日,Netflix 发布了一段一分钟的《赛博朋克:边缘行者 2》先导预告,其中包括大量《赛博朋克:边缘行者》第一季的画面。

 

大卫已逝,但夜之城永不停歇。

《赛博朋克:边缘行者 2》将带来一个全新的独立 10 集故事,延续《赛博朋克 2077》的世界观——一段关于救赎与复仇的残酷传奇。在这座因暴力而闪耀的城市里,一个问题始终萦绕:当世界被浮华蒙蔽双眼,你究竟要付出何等代价,才能让自己的故事被人铭记?

据 CDPR 介绍,本季由导演五十岚海(《赛博朋克:边缘行者》《SSSS. 古立特》)倾力打造,以大胆的影视化风格呈现,他也是《边缘行者》第一季第六集《烈火之女》(Girl on Fire)的导演。

《赛博朋克:边缘行者 2》主角设计由菅野一期(《普罗米亚》《赛博朋克:边缘行者》)操刀;剧本团队包括回归的大冢雅彦(《天元突破红莲螺岩》《普罗米亚》)与雨果奖得主 Bartosz Sztybor。(来源:IT 之家)

 

王化:「传小米与徕卡即将终止合作」是胡说

7 月 6 日消息,今日有传闻称,小米与徕卡的合作关系即将结束。

对此,小米公关总经理王化回应称:「上次是 2023 年 6 月 1 日,番茄发了个微博说小米 14 就是最后一代了。我转发了文案搭配的是「这就胡说了」,这次居然进阶了,来了个据报道,还有作者…… 我的回复也需要进阶,请大家笑纳:这还是胡说。」

 

这并非小米与徕卡合作首次遭遇谣言。早在 2023 年 6 月,就有传闻称小米 14 系列将是双方合作的最后一款机型,当时王化便以「这就胡说了」直接辟谣。(来源:IT 之家)

 

MIT 团队推出首台芯片级 3D 打印机:比硬币还小,以纯光固化树脂技术实现手持打印

7 月 6 日消息,麻省理工学院(MIT)与得克萨斯大学奥斯汀分校联合开发出了全球首款芯片级 3D 打印机原型。相关成果已发表于《自然》子刊,团队下一步将开发可单步全息固化的光子芯片系统。

 

据介绍,原型芯片搭载 160 纳米厚光学天线(普通纸张约 10 万纳米厚),整体尺寸甚至小于 25 美分硬币,可通过毫米级光子芯片发射可重构光束,使树脂在可见光波长照射下快速固化成型。

这款概念验证设备由单枚光子芯片构成,无任何活动部件。芯片表面集成微米级光学天线阵列,通过操控光束射入特制树脂槽。

据介绍,这种树脂经过特殊优化设计,可在特定可见光波长下迅速固化。研究人员成功打印出包括「M-I-T」字母在内的任意二维图案,全程仅需几秒时间。后续,科研人员希望使树脂槽底部的光子芯片发射三维全息可见光,从而一步完成物体整体固化。这种便携设备有望应用于医疗定制(如手术器械部件)与工程现场快速原型制作。(来源:CnBeta)

 

 

针对台积电亚利桑那工厂的人力资源诉讼已扩大到 17 名原告

针对台积电亚利桑那厂的一系列诉讼最初于去年提起,现已扩大到 17 名原告,他们指控该公司存在一系列歧视性和不安全的做法,原告均为美国公民,他们指控台积电在亚利桑那州工厂工作期间对他们存在歧视。这些指控包括在招聘过程中偏向中文能力、对非台湾员工的惯常偏见以及不安全的工作条件。

 

针对台积电的诉讼最初于 11 月由 12 名原告提起,并于 6 月再次提起,新增 15 名原告。这些原告均为台积电亚利桑那州工厂的前任或现任员工,他们在诉状中指控该公司存在多项违反安全规定和歧视的行为。

原告声称,台积电倾向于在亚利桑那州工厂聘用台湾或中国大陆的应聘者,因为他们认为「台积电台湾公司的人力资源团队向美国人力资源部门发送了美国台湾/中国大陆应聘者的简历,这些应聘者通常已经具备在美国工作的能力,并且已经经过审查并认为适合聘用。」

据他们称,台积电歧视美国员工的一个主要方式是语言。诉讼称,不仅「根据台湾总部的指示,台积电招聘会的邀请函必须使用中文,以便只吸引符合台积电偏好种族和国籍的学生」,而且为了排除非东亚裔人士,台积电的关键会议也使用中文进行。

台积电亚利桑那州的员工经常被派往台湾接受培训,之后才能开始工作。诉讼称,这些员工「经常被台湾同事排斥,因为台湾同事在他们面前只说国语」。此外,投诉人还声称,这些员工「受到管理层的贬低,工作环境充满敌意」,并且「经常被排除在业务讨论之外,因为谈话通常用国语进行,商业文件也通常用中文书写」。

投诉人称,台积电对国语的偏好也体现在美国的招聘信息中。北美、亚利桑那州和华盛顿州的职位空缺通常会在招聘启事中补充说明,『国语/中文』是必需的、优先的或『加分项』。

(来源:CnBeta)

 

浏览量: 5

3C 充电宝销量暴涨,商家库存告急;传美团餐饮日订单破亿;激光灭蚊器曝光,每秒杀 30 只蚊子,3569 元起

小米 YU7 今日起开启交付,全国 58 城用户将喜提新车

小米汽车官微昨日发文宣布,小米 YU7 明天将正式开启全国交付,覆盖全国 58 个城市(官微暂未公布具体城市名单)。

6 日上午 10:00 至 7 日晚上 24:00,小米 YU7 还将开启限时改配。锁单用户 (非准现车) 都可参与改配,如改配成功,将重新安排生产并重新计算预计交付时间。此次改配仅限 YU7 标准版 / Pro / Max 之间进行版本修改,或对 YU7 订单配置进行修改。(来源:IT 之家)

降价奏效,苹果 iPhone 二季度在国内销量实现两年来首次增长

近日,研究机构 Counterpoint Research 的一份报告显示,预计 2025 年第二季度中国智能手机销量同比略有上升,华为和苹果引领增长。

得益于 iPhone 16 系列促销活动,尤其是 iPhone 16 Pro 和 iPhone 16 Pro Max,苹果 5 月份实现销量增长。

也正是靠着降价这一步棋,今年第二季度,苹果 iPhone 在中国的销量实现两年来首次增长,不过反观竞争对手华为(增速 12%),增速仍要远超他们的 8%。(来源:快科技)

 

英伟达 GeForce 宣布参展 BW2025,RTX 5080/5070 公版显卡限量发售

英伟达昨日发布公告,宣布 7 月 11 日-7 月 13 日「GeForce 神秘登陆 Bilibili World 2025」。

英伟达表示,届时将开放 RTX5080/5070 公版显卡售卖。自 7 月 5 日起,用户可登录 B 站 App 在线预约(打开 bilibili 右下角「我的」,点击推荐服务「BW 乐园」,按页面指示完成预约)。

除此之外,英伟达还将举行多场游戏试玩会,包括暂未发售的《明末:渊虚之羽》(7 月 13 日),届时将有超过 30 名 UP 主陆续空降展台,与玩家展开现场直播、合影互动、水友赛等活动。(来源:IT 之家)

 

Meta 继续为 AI 业务「招兵买马」,计划收购声音克隆企业 PlayAI 部分资产

彭博社六月末报道称,Meta 正与 AI 声音克隆企业 PlayAI 展开深入谈判,计划收购这家小型初创公司的技术和部分员工。不过根据知情人士的消息,这笔交易尚未最终确定,仍可能发生变化。

PlayAI 技术和人员资产的加入将进一步丰富 Meta 在 AI 领域的储备,尤其是在 AI 助手和智能眼镜等软硬件的语音功能方面,提升与 OpenAI、谷歌在这一方面的竞争力。

与 PlayAI 的谈判是 Meta 的 AI「买买买、挖挖挖」行动的最新篇章之一:就在上个月该企业以 143 亿美元(现汇率约合 1024.91 亿元人民币)收获 Scale AI 近半数股权同时带走其创始人收获 S;近来又有消息传出 Meta 斥巨资从 OpenAI 挖角多位研究人员。(来源:IT 之家)

美团即时零售日订单已突破 1.2 亿,餐饮订单占比过亿

据美团内网公布信息显示,截至昨日 22 时 54 分,美团即时零售当日订单已经突破了 1.2 亿单,其中,餐饮订单已超过 1 亿单。

值得注意的是,就在当晚 20 时 45 分,美团内网曾显示即时零售日订单突破了 1 亿。这也意味着,在 2 个小时的时间内,美团已产生了超过 2000 万笔订单。考虑到周末夜宵时段仍然是外卖高峰期,这一数据目前仍在增长中。

7 月 5 日是暑期消费旺季正式开启后的第一个周末,也是外卖消费的传统促销季。公开报道显示,去年夏天美团的订单峰值超过了 9000 万单。(来源:雷锋网)

 

英特尔前 CEO 帕特·基辛格承认他低估了 AI 的影响

今日,日经亚洲的一篇报道称,英特尔前首席执行官帕特·基辛格承认,在他任职期间,公司在人工智能方面的做法乏善可陈。

他说,「我和英特尔的几乎所有人都低估了人工智能的影响。纵观今天的人工智能芯片,不难发现芯片在人工智能计算方面的性能不断提升,但这些芯片的功率效率却三代都没有改变。」

英特尔对人工智能的犹豫在基辛格最初认为「推理」就是一切的时候就更加明显了,当时 NVIDIA 和其他公司正忙于模型训练。当时英特尔的前首席执行官声称,公司已准备好抓住推理需求的机遇,甚至将 CUDA 称为「护城河」。尽管如此,我们从未在人工智能领域看到英特尔有任何产品能够与 NVIDIA 竞争,除了他们的 Xeon 服务器 CPU 这种统治市场数十年的产品。(来源:cnBeta)

 

3C 认证充电宝销量猛增,部分商家库存告急

7 月 5 日消息,据央视财经报道,近期,「充电宝召回」事件引发广泛关注,3C 认证已成为消费者衡量充电宝品质的关键指标,国内部分机场也加强了对充电宝 3C 标识的查验力度。

记者探访发现,线下市场和电商平台带有 3C 标识的充电宝产品销量都出现增长。记者在几大电商平台发现,在售的充电宝产品均已带有 3C 认证标识,无 3C 认证的充电宝已经被禁止上架销售,部分商家库存告急。(来源:IT 之家)

 

谷歌 DeepMind、普林斯顿大学推出新 AI 模型,可精准预测人类行为

7 月 5 日消息,据外媒 iXBT 4 日报道,德国 Helmholtz AI 研究计划、谷歌 DeepMind、普林斯顿大学等机构的研究团队近日联合发布了一项重要成果:一款名为 Centaur 的通用型 AI 模型,首次实现了在大规模认知任务中预测人类行为的能力。

Centaur 基于 700 亿参数的 Llama 3.1 语言模型,并通过名为 Psych-101 的数据集进行了专门训练。该数据集汇集了来自 6 万名参与者、覆盖 160 个实验的超过 1000 万个决策,涵盖了感知、记忆、逻辑推理、道德判断及不确定性决策等领域。凭借这一训练方式,Centaur 能够在未接触过的新情境下做出精准预测。

目前,Psych-101 数据集和 Centaur 模型已全部开放,未来还计划拓展应用至儿童心理学、精神病学等更多领域。(来源:IT 之家)

领克 900 2.0T 探索版汽车启运:2.0T 发动机、全球首搭 NVIDIA Thor 芯片

领克汽车官方公众号昨日发文宣布,领克 900 2.0T 探索版汽车正式启运,将陆续抵店。

据介绍,领克 900 2.0T 探索版汽车搭载 2.0T 发动机(VEP4)+ 3DHT Pro(P1+P2)+ P4*2「1+3」动力构型,支持 4.3s 零百加速,综合续航 1443km。

该车采用 GVMC 域控制底盘配合矢量机动技术,实现 ±10° 后轮转向,转弯半径小于 5 米,支持蟹行模式,可避开周边障碍。

该车还支持寰宇一体卫星通信,可一键直连天通卫星,支持 24H 无盲区守护、紧急情况时自主发起卫星救援、5~10 米定位精度、360° 无死角安全支持、中国全域覆盖等特点。(来源:IT 之家)

 

Photonmatrix 便携式激光驱蚊器海外众筹:每秒可消灭 30 只蚊子,黑暗中也能工作

科技媒体 Tom’s Hardware 7 月 4 日发布博文,报道称在 Photonmatrix 便携式激光驱蚊设备正在 IndieGogo 平台众筹,起售价为 498 美元(现汇率约合 3569 元人民币),每秒最多可以消灭 30 只蚊子,且在黑暗中也能工作。

Photonmatrix 的一大特点是能够在黑暗中工作,有效范围可达 6 米(19.7 英尺),并且可以使用充电宝供电,最长可持续 16 小时。

这款设备分为基础版和专业版,基础版的有效范围是 3 米(9.8 英尺),售价为 498 美元而专业版则翻倍至 6 米(19.7 英尺),专业版的价格也因此高出 200 美元,达到 698 美元,不过早鸟价可以便宜 40 美元。

众筹目标是 2 万美元(现汇率约合 14.3 万元人民币),目前已超过这一目标的 1300%。尽管资金水平充足,但这款产品目前仍处于原型开发阶段,距离商业生产还有不少挑战。(来源:IT 之家)

温网使用 AI 判罚引选手不满,组委会回应「系统比人工更可靠」

据英国《卫报》4 日报道,温布尔登组委会为使用 AI 司线系统辩护,回应英国一哥杰克・德雷珀对其「并不百分百准确」的质疑。

德雷珀在第二轮不敌 36 岁的前温网亚军马林・西里奇后表示,人工司线被取消令人惋惜。当地时间周四的比赛中,现年 23 岁的德雷珀对采用 AI 技术的鹰眼系统表现出不满。在第四盘的一次争议判罚中,对手发球被判界内,他当场摊手质疑。

德雷珀在赛后表示:「老实说,我不认为这项技术真的完全准确。今天有几个球,系统显示在场地上留下了印记,但从粉末痕迹来看根本不可能。我想它终究不是完美的,这种偏差可能只有几毫米。」

赛事总监杰米・贝克表示:「现在 ATP 巡回赛强制采用实时判线技术,其他两项大满贯也已用上四五年了。」其认为,这也意味着相关技术越来越成熟,认证流程也更加专业。「从准确性到稳定性,如今整套系统的表现可以说达到了网球历史上的最佳水平。」(来源:IT 之家)

浏览量: 7

首销破三万台,「卖爆」的小米眼镜给行业带来了什么?

小米 AI 眼镜毫不意外地「卖爆」了。

根据小米官方账号的设备激活数据显示,截止 2025 年 7 月 2 日,小米 AI 眼镜的实际用户激活数量已突破三万台。这个数字,区别于模糊的出货量或销量,它直接反映了已经拿到产品并开始使用的真实用户规模,是硬件销售中最重要的活跃用户指标之一。

这一成绩标志着,在经历了一众创业公司的前赴后继和市场摸索后,中国的 AI 眼镜赛道,终于迎来了一位重量级玩家的入场,并且通过强势的品牌效能,正在将 AI 眼镜这一概念普及给更多普通数码用户。

 

小米 AI 眼镜外观 | 图片来源:极客公园

 

这股强劲的势头,在中国 AI 眼镜行业引发了剧烈的涟漪。如果说此前的智能眼镜是少数极客和先行者的「浅滩游戏」,那么小米的入局,则是将整个行业带入了充满变数与机遇的「深水区」。

01

为何是小米?

 

小米的成功并非偶然,它的背后,是整个行业在过去一年多时间里的探索、试错与期待。

中国 AI 眼镜市场中,最典型的负面案例,是曾被寄予厚望的闪极。

作为一家在数码配件领域以设计和「反性价比」著称的新锐品牌,闪极曾抢占先机,试图打造国产版的 Ray-Ban Meta。闪极拍拍镜描绘的功能蓝图——AI、拍摄、记忆、回溯,以及 999 元的「共创价」,一度让市场为之振奋。

然而,理想与现实之间横亘着巨大的工程化鸿沟。从 2024 年 5 月预售到 2025 年 1 月才陆续发货,长达 7 个月的等待消磨了用户的首批热情。而真正到手的产品,更是暴露出一系列问题:有用户反映「新品到货双侧镜腿就不对称,而且镜腿掉漆」,更有甚者,在一个月内连续两次遭遇无法开机、充不进电的致命缺陷。

 

定价 999 元 的闪极眼镜产品在上市之后存在诸多品控问题 | 图片来源:小红书

 

作为一款拍照眼镜,其核心的拍摄功能也备受诟病,画质被用户形容为「千禧年的复古画风」,存在严重的彩噪、色偏和模糊问题。发布会上承诺的视频回溯、蓝牙通话等功能也未能如期上线。

一位阿里通义大模型团队的高管曾透露,闪极团队对 AI 的理解还停留在「接入个 API 就行了」的层面,严重低估了从模型到眼镜应用的整合难度。

硬件选型上的失误更让产品雪上加霜。闪极为拍拍镜搭载了紫光展锐 2020 年发布的智能手表芯片 W517,试图用一颗为手表设计的芯片,去支撑一款需要更长续航、更轻重量、并接入多种大模型的智能眼镜,其调教难度可想而知。

闪极的困境,是整个 AI 眼镜硬件行业从 0 到 1 所面对巨大挑战的缩影——它暴露了创业公司在供应链整合、品控、软件调优和工程化能力上的短板。

在这样的背景下,小米作为一家成熟的、年出货上亿台设备的硬件巨头,其优势被无限放大。强大的供应链议价能力、深厚的硬件工程经验、成熟的质量控制体系以及完善的软件开发团队,共同构成了小米 AI 眼镜成功的基石。

它不需要像创业公司那样在黑暗中摸索,而是在一条已经被验证的道路上,用硬件公司最擅长的方式,做出一款完成度更高、体验更稳定的产品。

02

产品的取舍与再中定义

 

小米 AI 眼镜虽被定调为「面向下一个时代的个人智能设备」,但其产品本身并不「未来」,甚至被不少 XR 媒体评价为「乏善可陈」。

小米 AI 眼镜重约 40g,采用了经典的 D 型方框设计,官方宣称「专为亚洲脸型优化」,佩戴时不易产生明显的压迫感。尽管有评测认为其镜框和镜腿相较于设计更为时尚的 Ray-Ban Meta 略显粗大呆板,但小米通过提供经典黑、半透明玳瑁棕、鹦鹉绿等多种配色,以及支持全渠道配镜服务,最大限度地满足了日常佩戴的时尚属性需求。

 

小米 AI 眼镜外观 | 图片来源:极客公园

 

其硬件设计部分的最大的设计亮点,无疑是「电致变色」版本的推出。用户通过双指划动镜腿,即可在 0.2 秒内实现镜片颜色的多档调节。尽管该功能有时需要多次调试才能成功,且需额外支付 700 至 1000 元的溢价(怒喵科技创始人李楠曾评价「这个技术如果真的想普及,不能这么收割消费者」),但它依然凭借炫酷的科技感吸引了大量订单,目前在多个电商平台均已显示「到货通知」。

第一人称视角(POV)拍摄是当前 AI 眼镜最核心的应用场景。小米选择以更高的分辨率作为突破口,其横屏视频在清晰度和画幅上超越了 Ray-Ban Meta 的竖屏格式,同时也更贴合主流平台的观看习惯。

然而,这种对画质的追求似乎牺牲了部分的稳定性。在运动场景中,小米眼镜的画面拖影相较于防抖性能卓越的 Ray-Ban Meta 更为明显。在交互层面,两者都提供了快捷的操控方式,但细节上的差异体现了不同的打磨思路。小米通过实体按键实现了迅捷的 0.8 秒快拍,但在语音控制上,却缺少了结束录制的指令,必须依赖手动操作。

相比之下,Ray-Ban Meta 的语音交互则更为完整,支持全程语音启停,提供了更沉浸的「解放双手」体验。

此外,作为产品体验的灵魂,AI 的实现路径也直接决定了用户体验的内核。小米与 Meta 选择了两条截然不同的技术路线。

Meta 选择将 AI 模型内置于设备端侧,实现了几乎零延迟的飞快响应。然而,对中国用户来讲,网络限制使其核心的多模态 Meta AI 功能在中国大陆地区无法使用。

目前,小米在 AI 眼镜上选择了一条更务实的「云端」路线,将其 AI 能力完全绑定于手机上的小爱同学。

这种做法的优势在于能够调用强大的云端算力,从而实现会议纪要转写、多语言同声传译等复杂且高度本土化的实用功能。但其代价是,每一次交互都依赖于手机的蓝牙连接,带来了大约两秒的延迟。

03

百镜大战与巨头的野心

 

小米的入局,不仅是推出了一款产品,更是向整个行业发出了一个明确的信号:AI 眼镜的时代,真正开始了。

Ray-Ban Meta 的成功为所有后来者提供了范本和目标。其销量突破 200 万台,合作方依视路陆逊梯卡更是计划到 2026 年底将年产能提升至千万台。这一成功,源于 Meta 的技术与雷朋经典设计的完美结合,以及依视路陆逊梯卡遍布全球的强大线下渠道。

Meta 与依视路的合作证明了,只要解决了设计、佩戴和核心功能问题,消费者愿意为 AI 眼镜买单。

Meta 的野心不止于此。它计划推出更多基于 Oakley 等旗下品牌的联名款,并逐步将 Ray-Ban Meta 打造为一个开放平台,允许第三方开发者为其开发应用。

 

Meta Oakley 眼镜外观 | 图片来源:Meta

 

扎克伯格在内部会议上呼吁:「我们基本开创了这个品类,竞争对手尚未真正进场,但他们终将到来……眼下正是我们全速推进的绝佳时机。」

但在国内,小米面对的是一个蓄势待发、但用户接受程度相对更低的战场。除了前述的闪极,雷鸟创新推出的 V3 AI 眼镜主打 4K 拍摄和 39g 的超轻重量;Rokid Glasses 则凭借其显示功能,数次在社交媒体上「出圈」,在前期同样承担了不少教育市场的成本。

除了产品本身,一场围绕设计与渠道的合纵连横早已展开,博士眼镜、宝岛眼镜等传统眼镜巨头,纷纷与雷鸟、华为、魅族等科技品牌达成合作,试图抢占线下入口。

此外,作为事实上的普及者,小米 AI 眼镜仍然在很多地方起到了教育市场的作用:许多消费者在体验小米 AI 眼镜时都会问:「为什么不能直接在镜片上显示字幕?」

这背后,是 AI 眼镜行业在当前技术阶段产生分水岭的缩影:真正的 AR 眼镜,需要在轻薄的镜片上实现高亮度的信息显示,并由一颗低功耗芯片进行实时运算,即使是目前已经采用自研芯片的小米 AI 眼镜,也没有在当前的试水阶段采用这种设计。

Counterpoint Research 的副总裁 Neil Shah 指出,AR 眼镜最难的部分是占系统总功耗 60% 的显示模组和 30% 的运算芯片。今年六月底,罗永浩在投身 AR 领域、烧掉大量资金后也在极客公园举办的 AGI Playground 大会上坦言,十年内 AR 眼镜都不太可能实现理想的商业化。

因此,无论是小米还是 Meta,都务实地选择了「眼镜+相机+音频+AI」这一形态,作为通往终极 AR 眼镜的过渡阶段。这既是技术上的妥协,也是商业上的明智选择。

但凭借小米的品牌势能,AI 眼镜的概念迅速从科技圈渗透到大众消费市场。三万台的激活量,意味着有三万个活跃的种子用户正在通过社交分享、口碑传播,让更多人了解并对这一新品类产生兴趣。

一款来自巨头、且能够大规模出货的产品,为上游供应商提供了明确的需求和方向。无论是镜片电致变色技术、微型摄像头模组,还是特种转轴和低功耗芯片,都有了可以为之奋斗和迭代的量产目标。一个稳定、健康的产业链生态,正围绕着这些头部产品加速形成。

小米的成功入局,无疑会刺激更多科技和互联网大厂加速推出自己的产品。可以预见,接下来,来自百度、字节跳动等公司的竞品也将陆续登场。2025 年下半年的 AI 智能眼镜市场,将从创业公司零星点火的阶段,正式进入巨头们正面厮杀的激烈竞争格局。

04

通往「下一个 iPhone」的漫长征途

 

小米 AI 眼镜的表现,决定着它能否在中国市场抢占先机,至少从目前的首销销量来讲,小米 AI 眼镜作为大厂中入局最早、最受期待的选手之一,已经抢占了重要的先机。

 

小米 AI 眼镜外观 | 图片来源:极客公园

 

但它远非这场竞赛的终点:从长远看,AI 眼镜的终极目标,的确仍然是成为继智能手机之后的下一代个人计算平台。这条路道阻且长,需要攻克显示、功耗、交互、生态等无数技术难关。但小米 AI 眼镜的火爆销售证明,大门已经被推开,市场已经准备好迎接变革。

在这场没有人愿意错过的、通往「下一个 iPhone」的竞赛中,沿着 Meta 的路线,小米已经率先看见了第一个弯道。

浏览量: 6

YU7 纸巾盒 169 元被骂太贵,雷军:成本很高;19.58 万,小鹏 G7 预定破万;充电宝冲击,罗马仕停工停产 | 极客早知道

员工曝罗马仕已通知全面停工停产,工资只发到 6 月份

受充电宝召回事件影响,罗马仕经营陷入困境。7 月 3 日,多名罗马仕员工向界面新闻记者证实,自 7 月 1 号开始,罗马仕内部已经陆续通知员工全面停工停产,正式公告还没出,员工工资只发到 6 月份。

7 月 2 日,罗马仕公司发生工商变更,雷社杏卸任法定代表人、董事、经理,由雷杏容接任,此次变更不足三个月。

针对法定代表人变更等事宜,罗马仕方面曾回应媒体称,目前公司正在安排整改,先梳理内部,公司全部精力都聚焦产业链自检,为新品做准备。(来源:界面新闻)

超越苹果:英伟达周四盘中一度突破 3.92 万亿美元,创史上最高市值纪录

7 月 4 日,据路透社报道,周四盘中交易,英伟达市值一度达到 3.92 万亿美元,短暂超过了苹果的创纪录收盘市值,成为史上最具价值的企业。

周四早盘交易,英伟达股价一度上涨 2.4% 至 160.98 美元,市值达到 3.92 万亿美元,超越了苹果在 2024 年 12 月 26 日创下的 3.915 万亿美元的收盘市值纪录。

然而,截至周四收盘,英伟达股价涨幅回落至 1.3%,最终报收于 159.34 美元,市值为 3.89 万亿美元,距离苹果的纪录还有一步之遥。

微软股价周四收盘上涨 1.58%,市值为 3.7 万亿美元,排在第二。苹果股价上涨 0.52%,市值为 3.19 万亿美元,排在第三。(来源:IT 之家)

 

首款车尚未开售,索尼、本田合作电动汽车项目年亏损已超 3.6 亿美元

7 月 3 日消息,据彭博社 6 月 30 日报道,索尼、本田合作推出的电动车项目年度营业亏损扩大逾一倍,达到约 3.62 亿美元(注:现汇率约合 25.93 亿元人民币),而双方合作的首款车型 Afeela 的上市发布还要等一段时间。

索尼本田移动公司在周一发布的财报中披露,截至今年 3 月的财年亏损为 520 亿日元(现汇率约合 25.91 亿元人民币),较上一财年的 205 亿日元大幅增加。(来源:IT 之家)

 

特斯拉 6 月国内销量环比上涨 59%, 创二季度单月最高国内销量

7 月 3 日消息,2025 年 6 月特斯拉国内销量 6.1 万辆,环比上涨 59%,同比上涨 3.7%,创下二季度单月最高国内销量。据乘联会最新数据显示,特斯拉上海超级工厂第二季度交付量为 19.1 万辆,较一季度环比增长 10.98%。

乘联分会数据显示,6 月全国新能源乘用车厂商批发销量 126 万辆,同比增长 29%,环比增长 3%。其中,特斯拉中国 6 月新能源乘用车批发销量 71599 辆,排名第 4。

虽然国内迎喜报,但特斯拉二季度全球交付量创造史上最大跌幅,共交付 384122 辆,同比下降 13.5%,且低于分析师预期的 38.7 万辆。(来源:财联社)

小米 YU7「车规级」纸巾盒被骂卖太贵,雷军回应

小米 YU7 上周发布上市,起售价为 25.35 万元,在发布会当晚仅用 3 分钟就突破了 20 万台大定量,数据极为夸张,刷新了行业认知。

小米 YU7 是围绕小米人车家战略的产品,车上预留了多个 IoT 硬件适配口以及配件放置位,其中,光磁吸点位就多达 16 个,甚至在中控屏幕后面的仪表台上,都专门为纸巾盒做了一个磁吸点。

该点位配套的「车载磁吸纸巾盒」目前已经在小米汽车 App 商城上架,售价 169 元。

不过,大众普遍认为这个纸巾盒定价过于昂贵,并在网上开始热议起来,昨晚雷军在返场直播中回应了这个问题。他表示,这个纸巾盒在设计的时候,材质、制作工艺比较复杂,刚开始过不了车规的测试。后来又改材质和胶,弄得成本巨高无比。大家可能不知道,它放的那个位置,我们在吐鲁番的时候是 90℃,一般胶的盒子肯定给你晒化了。

最后,雷军还是觉得定价过于高昂,表示会逼内部进一步去降低成本。(来源:数字尾巴)

 

西门子称美国已取消对中国芯片设计软件的出口限制

7 月 3 日消息,德国西门子股份公司收到美国政府的通知称,美国已取消对中国芯片设计软件的出口限制。根据公司声明,这家德国供应商已恢复中国客户对其软件和技术的全面访问。

西门子公司就此回应称,近期获美国商务部工业与安全局(BIS)通知,该局于 5 月 23 日致函西门子所提出的对中国客户出口电子设计自动化(EDA)软件及技术的管制限制现已不再适用。据此,在遵守适用出口管制法律法规的前提下,西门子已恢复对出口管制分类编号(ECCNs)为 3D991 和 3E991 的软件与技术的完整访问权限,并已恢复对中国客户的销售和技术支持服务。

「175 余年来,西门子始终致力于为包含中美两国在内的全球客户提供支持。当今全球贸易环境快速变化,我们深知这些变化可能会为客户带来不便,并对客户给予的耐心和理解表示感谢。」该公司称。(来源:澎湃新闻)

 

制造问题搞不定,苹果可折叠 iPad 折戟:需求也不足

7 月 3 日消息,继 iPhone 之后,苹果可折叠产品系列的下一步无疑是 iPad,但遗憾的是,最新消息称苹果遇到了一系列问题,迫使其不得不为可折叠平板的开发进程踩刹车。

报道称,苹果公司也一直在探索在推出 iPhone 的同时推出可折叠 iPad,不过该公司已决定暂时停止这款最大的可折叠设备的研发。

业内专家将这一决定归因于制造困难、生产成本的增加,尤其是与柔性显示技术相关的成本增加,以及消费者对较大型可折叠设备的需求相对较小。(来源:快科技)

 

小红书辟谣被阿里收购:系谣言

7 月 3 日信息,今日在社交媒体上,有消息称,「内部消息称,小红书马上要被阿里收购了。」对此,新浪科技向阿里巴巴和小红书双方进行求证,小红书方面表示,「以上信息为谣言。」阿里方面截止发稿未回应。

早在 2019 年,就出现了针对阿里将收购小红书,且阿里系 HRG 已经进驻该公司的相关传言。对此,小红书高管曾公开表示,「是造谣,已发函至谣言的源头,将追责到底。」

公开信息显示,从 2013 年创立至今,小红书一共获得 7 轮融资,其历轮投资者包括腾讯、阿里巴巴、天图投资、真格基金和中信资本等,累计融资额超 9 亿美元。

近日,据外媒披露,金沙江创投一份标注为今年 3 月的内部文件显示,小红书估值已跃升至 260 亿美元,较 2023 年底的 170 亿美元增长超 50%,并超过其 2021 年创下的 200 亿美元历史峰值。(来源:新浪科技)

全球首款 L3 级算力 AI 汽车!小鹏 G7 上市,售价 19.58 万元起

7 月 3 日消息,今日晚间,小鹏汽车举行小鹏 G7 上市发布会,号称是全球首款 L3 级算力的超级 AI 汽车。

新车分为 602 长续航 Max 版、702 超长续航 Max 版、702 超长续航 Ultra 版三个版本车型,售价分别为 19.58 万元、20.58 万元、22.58 万元。小鹏 G7 此前已启动预售,预售价为 23.58 万元。

据介绍,小鹏 G7Max 版标配两颗 Orin-X 芯片,Ultra 版配备三颗图灵 AI 芯片,算力相当于 9 颗 Orin-X 芯片,有效算力大于 2200TOPS,是行业其他旗舰 3 倍以上。(来源:红星新闻)

 

LiblibAI 正式推出 Lovart 国内版本「星流 Agent」

7 月 3 日,LiblibAI 正式推出 Lovart 国内版本「星流 Agent」,定位为一款面向中文创作者的智能设计拍档。产品延续 Lovart 海外版本的核心能力,支持自然语言生成整套设计物料,包含主图、海报、社媒封面、视频动画及 3D 模型等。系统已接入十余个主流大模型,支持图像、视频、声音、3D 的一站式生成与导出。目前星流 Agent 已在 PC 端及移动端同步上线。(来源:36氪)

 

iPhone 17 Pro 新 MagSafe 设计曝光:圆形底部开口,适应背板苹果 LOGO 下移调整

7 月 3 日消息,科技媒体 majinbuofficial 昨日发布博文,报道称苹果公司在调整 iPhone 17 Pro 机型背面的苹果 LOGO 位置之外,还因此调整了 MagSafe 系统磁圈布局。

据此前报道,苹果今年推出的 iPhone 17 Pro 机型由于横向矩阵设计,因此苹果会调整后盖 LOGO 位置,向下移至靠近底部中心的位置,这也带来了磁圈布局调整。

MagSafe 系统自 iPhone 12 起就依赖精确的磁铁阵列来实现对齐和配件兼容。随着 iPhone 17 Pro 上苹果标志的下移,磁铁阵列也相应地移向底部中心。(来源:IT 之家)

Grok 4 意外提前曝光,马斯克宣布「重写人类知识库」

7 月 3 日消息,马斯克旗下 xAI 的「重磅炸弹」Grok 4 提前泄露,有开发者在 xAI 控制台的源代码中意外发现了两个全新模型 Grok 4 和 Grok 4 Code。与此同时,xAI 刚刚完成了一轮 100 亿美元(约 716 亿人民币)的巨额融资。

Grok 4 被定位为「最新、最强大的旗舰模型」,官方宣称它在自然语言、数学和推理方面提供无与伦比的性能,堪称万能的完美之选。但马斯克的野心远不止于此,他提出了一个听起来就很「马斯克」的宏大目标:利用 Grok 4 的推理能力重写整个人类知识库,补充缺失的内容,纠正错误的知识,然后基于这个「纯净版」知识库重新训练 AI。

对此,Cohere 联合创始人 Nick Frosst 就担心 Grok 4 会不会变成「马斯克观点的放大器」。也有网友表示自己会通过收藏纸质书籍来保存人类知识的原貌,对抗 AI 的「修正」。(来源:量子位)

浏览量: 6

小米YU7爆单29万辆后,19.58万的小鹏G7能否杀出血路?

在 MONA M03 成为爆款之后,小鹏能持续在 KTV 蹦迪吗?

7月3日,一款被称为「AI智能家庭SUV」的小鹏G7正式上市了。新车共推出三个版本,售价在19.58万元到22.58万元之间。这次新增了602长续航Max,最终售价比预售价直降4万元。

此前的6月11日,小鹏G7亮相并开始预售。作为2025年小鹏首款全新车型,G7预售两大版本:Max版 / Ultra版,预售价仅需23.58万元起。

就在小鹏G7上市前一周,小米YU7上市后爆单,1小时拿下28.9万辆订单。两款车发布时间这么近,定位也有些类似地方,小鹏G7会不会被小米「碾压」?小鹏能否延续此前的高速增长攻势吗?

2200 TOPS 的 AI汽车

当车企进入一个细分市场时,除了要明确产品定位,还要看玩家有谁?G7所在的20 万到30万细分市场,已经是一个竞争充分的红海市场,其中特斯拉Model Y是那个「学霸」。

「围攻」特斯拉,是过去几年中国新能源市场的常见戏码。去年,乐道 L60、智己 LS6、极氪 7X等,就上演了「六大门派」围攻Model Y的戏码。但最终效果有限,特斯拉依然是细分市场的冠军。

特斯拉Model Y作为一个绕不开的角色,不管是发布会PPT,还是用户选车时,小鹏要如何与Model Y竞争呢?

它没有硬碰硬,而是亮出了自己的两大「秘密武器」:硬核科技和空间舒适。

我们先来看一下硬核科技,这里不仅是科技平权,更要「硬核」。这次发布会上,小鹏带来了702km CLTC超长续航、全域800V高压SiC碳化硅平台、5C超充AI电池、追光全景抬头显示AR-HUD、天玑系统等。

小鹏汽车自研的图灵AI芯片 | 图片来源:小鹏汽车

其中,最受关注的是小鹏自研的图灵AI芯片。

据了解,小鹏G7的Ultra版本搭载了3颗小鹏自研的「图灵AI芯片」,总算力超过了 2200 TOPS,因此官方给 G7 的标签之一是第一款「具备 L3 级别算力」的 AI 汽车。G7的算力是行业主流旗舰的 3 倍到 28 倍,这让它能运行更复杂、更智能的AI程序。

不过,2200 TOPS的算力,并非全部用在辅助驾驶。具体是这么分配的:在辅助驾驶方面,用两块图灵AI芯片替代双英伟达Orin-X芯片;在座舱方面,小鹏采用图灵AI芯片+高通8295P,有效AI算力比行业旗舰大26倍。

小鹏用3颗自研芯片,释放出2200TOPS的算力,到底能否转化为用户体验呢?还是跟前几年类似又在「堆料」呢?对此,何小鹏表示,他们要做的是大模型的本地化部署。

在软件方面,小鹏采用了VLA-OL+VLM双架构,不依赖云端即可完成复杂场景决策。VLA (Vision-Language-Action) 模型,你可以把它理解成「行动决策大脑」。它不像只会背书的学生,而是像一个经验丰富的老司机。它通过摄像头看到世界,用AI去理解这个世界,然后做出最合理的行动。

而VLM (Vision-Language Model) 模型,则可以叫它「理解世界的大脑」。如果说VLA负责「怎么开」,VLM就负责「看懂了什么」以及「如何与你交流」。

简单来说,VLA掌管车的运动与行动决策,而VLM则负责理解与交流,是整车跟人交互OS的入口。

把家用SUV卷成「移动客厅」

在过去10年的发展过程中,小鹏汽车就经历了一次从「偏科生」到「全能选手」的转变。

几年前,当上百家新公司涌入新能源汽车这个赛道时,竞争异常激烈。当时的小鹏就像一个「偏科生」,它选择将自己最擅长的「智能化」这一科做到极致,希望靠着这个「独门绝技」脱颖而出。这在当时是聪明的策略,也确实让它活了下来。

但是,随着时间推移,大家发现,买车就像我们选择一个朋友或伙伴,不能只看他一方面。如果一辆车虽然很「聪明」,但在空间、舒适度这些日常最常用到的地方却表现平平,很多人可能还是会犹豫。

何小鹏也意识到了这一点,尤其是在经历了一些波折后。他开始明白,一辆好车,不能有明显的「偏科」或「短板」。于是,小鹏汽车开始「发奋图强」,力争成为一个各方面都优秀的「全能选手」。

这次全新的小鹏G7,就是他交出的一张「全能答卷」。它不仅保留了硬核科技这个「奇兵」,更在大家最关心的空间和舒适度上,下足了功夫。

小鹏G7实现88%超大得房率,整车空间达4.47m³ | 图片来源:小鹏汽车

对于一辆家用车来说,「大」就是硬道理。小鹏G7是怎么做的呢?

它通过缩短车头、拉长车尾的设计,让车子看起来很动感的同时,把内部空间压榨到了极致。后排乘客的腿部空间非常宽敞,远超同级别的车,跷二郎腿都绰绰有余。

它的后备厢有819升,比以「能装」著称的特斯拉Model Y还要大。如果把后排座椅放倒,更能扩展到一个惊人的2277升!这是什么概念?别说日常购物、放婴儿车了,就算是搬家拉个小冰箱,或者周末全家出游带上帐篷、烧烤架,都毫无压力。

除此之外,小鹏G7在空间上还有很多小巧思,全车有39处储物空间。最有趣的是一个电子密码手套箱。就像给你的储物格上了个保险箱,在中控屏幕上输入密码才能打开,放点隐私或贵重物品。

如果说空间是硬指标,那舒适度就是软实力。小鹏G7全车标配了通风、加热、按摩和电动调节功能。座椅坐上去非常柔软,据说比奔驰的座椅还要软50%。

小鹏G7还有一个聪明的「太极AI底盘」, 它能根据路况自动调节悬挂的软硬,过减速带时更柔和,高速转弯时支撑更有力,让开车坐车都更平稳舒适。

同时,小鹏G7全车配备了20个扬声器,最厉害的是,这个音响系统能「听懂」音乐。它会根据你放的歌曲是摇滚、古典还是流行,自动匹配最合适的音效,让你随时随地都能享受到「最佳听音位」的待遇。

00后看不上水桶车,想要有绝活的车

在小鹏G7上市前,汽车圈发生了一件大事:小米汽车YU7来了,而且一来就火得一塌糊涂,订单量像滚雪球一样疯涨。

这下,很多人都为一周后才登场的小鹏G7捏了一把汗。毕竟,凭借雷军的营销能力,小米YU7就像一个自带流量的「超级网红」,吸引了所有人的目光。G7作为后来者,会不会被抢了风头?

对此,小鹏汽车P/G系列产品负责人 Nick表示,小米YU7是一款长板非常长的车。小鹏G7和小米YU7是两个赛道、两个品类:G7主打硬核科技、舒适性,小米YU7的强项在颜值、操控。市场上之前产品更偏向是水桶车的车型,均衡,随着95后、00后的年轻人成为购车主力,他们不再只满足于一辆「没毛病」的车,他们需要的是一款长板非常长的车型。

2025年上半年小鹏汽车的销量,已经超过去年全年 | 图片来源:小鹏汽车

那小鹏G7,能否延续小鹏当前大热的势头?

7月1日,小鹏公布了6月份和整个上半年的成绩单,数据非常亮眼。6月交付新车34,611台,比去年同期暴涨了224%!这已经是小鹏连续8个月,月销量稳定在3万台以上。更厉害的是,今年上半年的销量(19.7万台),已经超过了2024年全年的总和。

截止发稿,小鹏并没有像往常一样,发布销量战报。答案或许已经不那么重要了。因为对于今天的小鹏来说,一时的销量爆款固然可喜,但更重要的是,在成为一家「全球领先的AI汽车公司」的漫长道路上,每一步都走得稳健而有力。

在他们看来,赢得一城一地的得失并非终极目标。他们真正在乎的,是「组织的复利」——打造一个强大的、能不断自我进化的团队和体系。

因为,在中国市场激烈竞争的下半场,组织力才是最需要经受考验的。

浏览量: 12

AI 语音爆发的这半年,一位「局中人」看到的赛道爆发逻辑

 

过去半年,「AI 语音」赛道正密集地获得融资。尤其引人注目的是,这些融资多为大额,并且投向早期团队。

比如,前不久 AI 语音应用 Wispr Flow 靠「默念输入」,完成了 3000 万美元的 A 轮融资,累计融资额已达 5600 万美元;语音模型公司 Cartesia 在 3 月份完成了 6400 万美元的 A 轮融资,累计融资 9100 万美元;AI 语音合成公司 ElevenLabs 更是在 1 月份宣布完成 1.8 亿美元的 C 轮融资,估值超过 30 亿美元。

与此同时,无论是 Meta、OpenAI、Google 等科技巨头,还是 MiniMax 等创业公司,都在密集发布自己的语音模型或语音产品。Siri 也被曝出或将被 ChatGPT 或 Claude 等模型接管,来跟上语音交互的进展。

这些消息无一例外都指向了 AI 语音的火爆。

为什么过去半年多以来,AI 语音领域会如此集中地爆发?

声智副总裁黄赟贺认为,语音对话从一个 App 中的功能模块,迅速进化为 AI 时代入口级别的存在,与大模型的加持有极大关系。

在智能音箱红极一时的年代,大部分我们熟知的智能音箱品牌都搭载了声智的远场声学交互技术,比如小爱同学、天猫精灵、小度音箱等等。而「小爱小爱」的唤醒词,实际上也是来自于声智。

这家公司创办于 2016 年,一直在声学+ AI 交叉领域探索。然而,作为一家在幕后提供 AI 声学技术的公司,在大模型浪潮来临之后,果断选择下场投身开发自己的 C 端产品。毫无疑问,他们看到了这波「大模型+语音」浪潮里新的商业机会,其旗下的 AI 耳机目前出货量已接近 100 万套。

前不久,极客公园与声智副总裁黄赟贺聊了聊AI语音市场的爆发逻辑、语音交互的「卡点」,以及它将如何影响我们的未来。

 

以下内容根据黄赟贺的讲述和声智的论文整理而成:

AI 语音的想象力,已经远在 Siri 之上|图片来源:网络

 

AI 语音为何现在爆发了?

最近两年,越来越多的 AI 语音初创团队获得大额融资,集中爆发。

其中,一个很重要的推动因素是,大模型让声音这项基础能力首次实现了「可编程化」。

「可编程化」这个词,意味着将一种能力或者一个对象,通过清晰的接口和逻辑,变得可以被代码自由地调用、组合、修改和控制。过去,文字是可编程的,图像是可编程的,甚至视频也是可编程的(比如视频编辑软件)。

但声音更多的是一种「输入」或「输出」的介质,其内部的复杂结构和信息,很难被软件直接「编程」和「理解」。

传统的语音识别,更多是把声音转换成文字,然后对文字进行处理。

比如,之前在深圳、成都有很多做声音标注的团队,拿到语音之后,再人工转换成文字,打上不同的标签,比如各种特征、意向的标签。

大模型来了之后,打标签的这项工作可以交给大模型,它比大量的人工团队标得快和准。

以前做 NLP 的背后都是一堆苦逼的运营在那里打标签,让 AI 系统能够识别每个句子的意向。过去,语音的开发,每增加一个功能,都需要从头写代码,费时费力。比如,想让智能音箱支持「点外卖」,得单独开发一套语音识别和语义逻辑,成本高、周期长。

而现在 AI 大模型可以解决了。

更重要的,依靠大模型对多模态数据的深度理解能力,对声学信号的更细致解析,使得声音本身携带的除了文字信息之外的更多信息,开始被 AI 系统直接捕捉、理解和「编程」。

这种可编程化,意味着 AI 可以像处理数据一样处理声音。它可以分析声音的频率、振幅、波形,提取出情绪特征、识别不同的声源、声源距离、甚至预测你的意图。

这时,声音包含的不再仅仅是「你说了什么」,更是「你如何说」、「你在哪里说」、「谁在说」以及「你说了之后希望发生什么」。

由此,声音也成为了真正的交互引擎。

 

真正的语音交互,不是「Voice」而是「Sound」

其实,很多人以为,语音交互就是「Voice」(语音)。但其实 Voice 这个词是一个狭窄概念。真正的语音交互,核心不是「Voice」,而是「Sound」(声音)。Sound 里面包含了 Voice。

具体来说,「Sound」包含了更丰富的元素:语调、音色、节奏、情绪,更重要的是环境音。环境音里面可能包含了环境中的各种非语音信息,比如背景音乐、环境噪音(风声、雨声、车声)、物体发出的声音(开门声、打字声)、以及人类语音中包含的非语义信息(语调、语速、音色、语气词、叹息声、笑声、哭声等)。

比如说,你咳嗽的时候,跟 AI 说话,它可能会识别出咳嗽,然后跟你说多喝水;比如,你在咖啡馆说,「帮我找个安静的地方」,AI 不仅要理解你的指令,还要从背景音中判断出你当前的环境嘈杂,从而推荐附近的图书馆。

当我说「下一代对话交互的入口并非『Voice』,而是『Sound』」时,我指的是 AI 系统将不再仅仅依赖于识别你说的「词」,而是能够全面感知和理解你所处环境的「声学场景」中的所有关键元素。

只有当 AI 能够全面感知并解析「Sound」中包含的这些多维度信息时,它才能真正理解用户的深层需求,提供更精准、更个性化、更富有情感的交互。这才是真正的「语音交互」,它不仅仅是「听懂」字面意思,更是「听懂」你的「言外之意」和「心声」。

 

语音交互的「卡点」,大厂烧钱也没用

尽管大模型带来了语音交互的巨大飞跃,但语音交互当下依然存在一个核心的「卡点」,而这个卡点根植于物理学,具体来说,就是声学。

我们常说「听清、听懂、会说」。「听懂」和「会说」的能力,正在被大模型以前所未有的速度提升。但「听清」这个最基础的环节,却受到物理层面的制约。如果 AI 听不清你的指令,即便它能「听懂」再复杂的语义,能「会说」再动听的话语,那也都是空中楼阁。

比如说当下最热门的具身智能,现在很多机器人都是电驱动的,那么它带来几个大问题,一方面是电路的噪声本身就很大,另一方面是关节噪声,还有就是很多机器人是金属材质,厚厚的,声音在穿透时会大幅衰减。

所以,机器人动起来的时候,噪声很大,尤其在室外,更难听清楚人的指令。要么大声喊,或者拿麦克风喊。因此,现在很多机器人都要靠遥控器来控制。

当下最先进的具身智能机器人仍然依赖于遥控器来操控|图片来源:网络

这方面,其实就需要对声学层面的突破,比如说环境噪声的抑制,比如电路底噪的抑制,还有啸叫的抑制、混响回响的抑制等等。

而这些就是物理学科的逻辑,它需要数据样本,需要 know how 的壁垒,不仅是技术问题,而是时间的问题,需要时间去采集声音、做训练。

这不是烧钱能解决的。

让 AI 准确地「听清」用户的指令,依然是一个世界级的难题。而声学相关的人才很少,所以像谷歌、微软、苹果经常会收购声学技术的初创公司,几乎只要出来一家就会收购他们。

大家都明白,要构建真正的下一代人机交互系统,拥有核心的声学能力是基石。

 

语音交互的下一站,是实现「共情」

现在很多 AI 应用的日活、留存不高,有个很大的原因就是普通人本身是不会提问的,让人向大模型提问,这本身就是一个非常高的交互门槛。

好的提问还需要学识、表达等基础,所以停留在文字层面的问答,本身就是一种门槛限制。

而语音带来的一种可能性是,它正在开启一个全新的阶段——人机交互的「共情模式」。

如果把语音交互比作一个「UI 界面」,那这个界面会长什么样?我们可以做个推演,它的构成要素可能会有:

  • 情绪识别:AI 通过分析语调、音量、语速,判断用户的情感状态。比如,你的声音颤抖,AI 可能推测你在紧张或伤心。

  • 意图理解:不仅听懂你说了什么,还要明白你想做什么。比如,你说「播放音乐」,AI 会根据你的情绪,决定是放摇滚还是古典。

  • 声纹识别:通过独一无二的音声波特征,区分不同用户。比如,家里的智能音箱能自动切换到「孩子模式」模式,只为孩子的声音提供安全的回应。

  • 情绪生成:AI 的回应需要带有情感化的表达。比如,用温暖的语气说「别担心,我来帮你解决」,而不是机械的「好的,正在处理」。

这些要素的背后,是 AI 从「功能导向」到「情感导向」的转变,AI 会与人实现共情。这种交互,能显著提升长时间交互的质量和亲密感。

不仅如此,从狭义的「Voice」拓展到广义的「Sound」,当 AI 能接收到的不仅仅是用户的指令,而是整个物理世界的实时反馈时,我们可以去构建一个「声学世界模型」。

这个「声学世界模型」可以理解声音在物理世界中产生、传播和交互的根本规律,它不仅要「听清」和「听懂」,更要具备「声学常识」和「声学推理」的能力:它能从一声闷响中分辨出是书本落地还是箱子倒塌;能通过回声判断出房间的大小与空旷程度;更能理解「脚步声由远及近」背后所蕴含的物理运动逻辑。

未来,当这样一个声学世界模型与视觉、语言大模型深度融合时,具身智能机器人将不再「失聪」和冰冷。这也是我们正在做的。

 

 

浏览量: 6

文章分页

上一页 1 … 23 24 25 … 100 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间