Skip to content
  • 元宇宙社交空间入口
51蛙吖蛙元宇宙 – 3D社交空间

51蛙吖蛙元宇宙 – 3D社交空间

51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

标签: 科技

美团 49.8 亿收购叮咚买菜;冬奥会基于阿里千问打造官方模型;李想微博预热全新 L9

OpenAI 推出全新企业级平台 Frontier

OpenAI 周四发布新的人工智能平台 Frontier,该平台可以帮助公司构建、部署和监督 AI 智能体。

这家 AI 公司表示,Frontier 与 OpenAI 之前发布的 AI 智能体构建工具协同工作,让企业能更轻松地整合智能体执行任务所需的数据源。OpenAI 称,这些智能体将能够处理来自各种来源的信息,并完成处理文件和运行代码等任务。

发布 Frontier 的一个目的,是帮助 OpenAI 吸引更多企业客户。目前,它们正在与 Anthropic、谷歌等对手争夺企业客户。通过将 Frontier 打造成构建和管理 AI 智能体的一种标准,该公司的目标是将更多企业客户带入其整体 AI 生态系统。(来源:新浪财经)

美团 49.8 亿收购叮咚买菜

2 月 5 日,美团在港交所发布公告,宣布以约 7.17 亿美元(约 49.8 亿元人民币)的初始对价,完成对叮咚买菜中国业务 100% 股权的收购。

对于收购原因,美团在公告中表示,公司高度重视食杂零售业务,本次交易符合公司在食杂零售领域的长期发展规划。截至 2025 年 9 月,叮咚买菜在国内共运营超过 1000 个前置仓,月购买用户数超过 700 万。

叮咚买菜创始人梁昌霖也在内部信中表示,对于未来的发展选择放下竞争,转为并肩合作。(来源:第一财经)

 

蔚来发布盈利预告:预计 2025 年 Q4 调整后利润 7-12 亿

2 月 5 日,蔚来发布盈利预告公告称,根据对本公司未经审计合并管理账目及董事会目前可得资料所作的初步评估,预计本公司于 2025 年第四季度录得经调整经营利润(非公认会计准则),介乎约 7 亿元至 12 亿元。

按公认会计准则,预计蔚来 2025 年第四季度录得经营利润约 2 亿元至 7 亿元。相比之下,2025 年三季度公司净亏损为 34.80 亿元,2024 年四季度净亏损为 71.11 亿元。

这是成立 11 年后,蔚来公司首次有望录得单季度经调整经营利润。

在此前蔚来 2025 年第三季度财报电话会上,李斌表示,除实现计划中的四季度盈利外,公司 2026 年的经营目标是整年盈利。(来源:财联社)

 

史上首次,米兰冬奥会基于阿里千问打造奥运官方大模型

米兰冬奥会开幕在即。2 月 5 日,国际奥委会主席柯丝蒂·考文垂在国际转播中心举行的活动中宣布,国际奥委会已基于阿里千问大模型打造了奥运史上首个官方大模型。

考文垂在现场高度评价了 AI 技术对本届冬奥会的变革性意义。她表示,得益于千问大模型的技术支撑,2026 米兰冬奥会展现了奥林匹克运动的智能化未来,将成为史上「最智能」的一届奥运会。

目前,这一奥运官方大模型将在专业赛务与公众服务双端同步落地。

在赛务侧,国际奥委会在其面向各国奥委会工作人员的网站上线了「国家奥委会 AI 助手」。该助手依托千问大模型强大的多语言理解能力,并通读数百万字官方手册;在公众侧,国际奥委会也将在官网上线基于千问大模型打造的「奥运 AI 助手」。该助手将面向全球观众开放,通过 AI 技术拉近大众与奥运的距离。(来源:环球网)

传闻 SpaceX 将推出「星链手机」

据路透社报道,在 SpaceX 预计于今年推进 IPO 的背景下,该公司正计划利用其核心营收引擎星链(Starlink)业务进一步拓展市场版图。

知情人士透露,SpaceX 的商业规划不仅局限于卫星互联网连接,更包括推出自主品牌的 Starlink 手机、直连设备服务以及名为 Stargaze 的太空追踪服务。

尽管 SpaceX 此前已与 T-Mobile 建立合作以推进手机直连卫星业务,但在硬件终端制造上,消息源指出马斯克计划打造一款能与现有智能手机直接竞争的移动设备。

针对这一传闻,马斯克近期在社交媒体上回应称「并非不可能」,并强调这款潜在的 Starlink 手机将与传统设备截然不同,其设计将纯粹为了优化「每瓦特最大性能」的神经网络运行,旨在服务于人工智能的算力需求。据悉,SpaceX 已于去年 10 月申请了「Starlink Mobile」商标,并提交了旨在改善小型移动设备连接能力的专利。(来源:凤凰网科技)

 

小米汽车降低辅助驾驶安全里程门槛

2 月 5 日,小米汽车宣布,最新版本 OTA 已陆续推送,辅助驾驶安全里程门槛降低。据介绍,辅助驾驶安全里程门槛从 1000km 降至 300km,设定这样的门槛,是为了让大家可以先逐步熟悉辅助驾驶功能,培养充分的安全意识。

小米汽车提醒,辅助驾驶不是自动驾驶,请时刻关注路况,及时控制车辆。(来源:每经网)

 

李想微博发文,预热全新L9:具身智能机器人的开山之作

2 月 5 日,许久不聊车的理想汽车 CEO 李想发布长微博。

李想表示:全新理想 L9,不仅是一台好车,更是具身智能机器人的开山之作,我们准备了十年,就等这一刻。

众所周知,近两年来,李想一直强调 all in AI,那这是否意味着他不再关心汽车了呢?对于这样的观点,他予以了否认。

李想称,「我们深知:具身智能必须长在一台好车上,才能真正为用户创造价值。所以我有 70% 的时间聚焦在汽车上,这让我们更了解如何让车进化成真正的机器人。」

他还表示,即将到来的全新理想 L9,车成为智能体。「眼睛、大脑、心脏、神经、手脚——完整的技术栈让车从被动工具变成主动伙伴。它会认出你,理解你,主动服务你。未来,每个家庭都值得拥有这样的智能伙伴。」(来源:IT之家)

苹果 17e 将于 2 月 19 日发布,新增 MagSafe 依旧单摄

科技媒体 Mac World 近日根据配件制造商流出的消息,推测苹果有望于 2 月 19 日(周四)通过新闻稿形式,发布 iPhone 17e。

此前,苹果通常会选择周一或周二(偶尔周三)发布新品,而 2 月 19 日是周四,有悖于苹果的发布习惯。不过,iPhone 16e 的发布日期也是 2 月 19 日(2025 年)。

改动方面,消息称 iPhone 17e 已配备 MagSafe 磁吸无线充电功能,功率最高可达 25W。相比之下,前代 iPhone 16e 仅支持较慢的 7.5W Qi 无线充电标准,完全缺失 MagSafe 功能。

外观方面,该机背部预计将继续沿用单摄像头设计,屏幕顶部也将保留「刘海」造型(而此前消息称会升级到灵动岛),灵动岛功能可能还需迭代一两代才会下放至 e 系列。(来源:IT之家)

 

传音 Pova Curve 2 手机亮相:天玑 7100 处理器,6.78 英寸曲面屏

传音宣布将于 2 月 13 日在印度推出 Pova Curve 2 手机。新机采用曲面屏设计,搭载天玑 7100 处理器,配备支持 144Hz 高刷的 6.78 英寸 1.5K 曲面屏,主打轻薄机身和科幻外观。

该机型有银色、黑色和紫色三种颜色可选,其后盖采用四曲面设计的磨砂材质,右下方搭配三角形透明盖板,整体设计延续了上一代的科幻风格。

主要配置方面,传音 Pova Curve 2 搭载天玑 7100 处理器,可选 8GB 和 12GB RAM,提供多种存储组合。机身内置 7750mAh 容量电池,支持 45W 有线快充。

相机方面,该机型配备 5000 万像素主摄和一颗 200 万像素的辅助镜头,前置则采用一颗 1300 万像素摄像头。

系统层面,Pova Curve 2 运行基于 Android 16 定制的 HiOS 16 用户界面。此外,该机型支持光学屏下指纹识别、红外遥控和杜比全景声,机身右侧设置独立 AI 键,整机具备 IP64 防护等级。(来源:IT之家)

美国宇航员获准携带 iPhone 等个人设备记录绕月之旅

美国宇航局(NASA)局长近日在 X 平台发布推文,宣布解除长期存在的禁令,在未来航天任务中允许宇航员携带个人电子设备。

根据多家媒体报道,大部分对此解读为未来宇航员可以携带 iPhone(尚不清楚机型限制)和安卓手机参与航天任务。

在此新规实施前,NASA 对太空摄影器材的认证流程极为繁琐且漫长。艾萨克曼强调,新规的目的是赋予机组人员更便捷的记录工具,让他们能以第一视角捕捉珍贵瞬间,并向世界分享更具感染力的影像。

据科技媒体《Ars Technica》指出,此前预定用于「阿耳忒弥斯 2 号」(Artemis II)载人绕月任务的最新相机是 2016 年发布的尼康单反,随行配备的更是十年前的 GoPro 运动相机。

美国宇航局此前坚持使用老旧技术(如轨道上仍大量使用 G3 PowerPC 处理器),主要是担忧现代电子设备难以通过抗辐射测试。(来源:IT之家)

展示量: 15

阿里云出海服务增长指数第一背后的逻辑:新出海时代中企出海的逻辑变了

作者|张鹏

编辑| Li Yuan

 

过去一年,中国企业出海的姿态正在发生某种质变。

如果说早期的中国企业常常是业务做到足够好了,才开始思考是否要出海,是一个「溢出」的逻辑,在新时代下,许多中国企业从开始就选择了立足全球市场。

在全世界的目光都看向中国企业时,一件有趣的事情却在悄悄发生:中国企业正在越来越多地在出海的时候选择中国云,而不是洋基建。

近日,沙利文发布的《2025 年中国企业出海采用云服务市场研究》披露了一个令人玩味的变化:在出海云服务市场的「动态基准竞争力矩阵」中,阿里云的增长指数已达到全球第一,战略指数也落在了领导者象限。

 

 

这背后,反映的是整个云市场的变化。

现在的云已经不只是一种基础设施,而成为了与 AI 共生,驱动增长的引擎。

在过去一段时间,阿里云推行了一项高达 3800 亿的基础设施建设计划。沿着中国企业出海的关键点位,正在排队建起阿里的智算集群。这种覆盖密度的增强,直接解决了一个困扰中企多年的痛点:在海外落地的第一张网,能不能像国内一样快。

另一个核心变量在于 AI。千问大模型的全面开源带来了极强的协同效应,云不再只是租售服务器的房东,而是成了一个现成的、低门槛的 AI 生产车间。分析师认为,这种生态的开放性,正在转化为一种极强的客户黏性。

而当阿里云领跑中国企业的出海选择,中国企业出海的叙事逻辑也在发生悄悄变化。

 

01

AI 时代下,企业需要在

「云选型」阶段思考 AI

 

每一种超越,背后都是时代结构在发生改变。

而在 2025 年,云基建对于企业而言,最大的结构性变量,一定是 AI。

过去,企业把云主要当作弹性算力与存储资源池,典型场景是承载 Web/App 与相关数据服务。企业通常在进入新市场或新区域落地前,会做容量与成本测算,再去做云规划。但在 2025 年的语境下,随着 AI 成为企业不可忽视的一部分,云和 AI 正在叠加起来,变成了企业进行云选型的关键变量。

这在企业出海中体现得尤其明显。

企业出海天然面对多区域、多合规、多网络质量与多语言交互,AI 工作负载的成本与体验会被放大。企业在海外落子第一台服务器的那刻起,就必须把算力密度、数据链路和推理延迟纳入底座考量。

 

 

《2025 年中国企业出海采用云服务市场研究》观察到了这种现象:现在的出海企业,诉求正从基础模型调用,向规模化、高可靠的 AI 应用生产体系演进。他们对一整套自动化的机器学习操作(MLOps)流程产生了很强的依赖。比如,在生产部署阶段,如何对上线模型进行持续的性能监控和数据漂移检测;在管理环节,如何实现模型迭代与版本回滚的闭环。

在推理层面,中企的需求也变得极其精细。他们开始精算推理成本与性能,研究批处理与实时推理的架构差异,尝试多模型路由、缓存策略以及模型量化压缩技术。甚至在合规层面,如何在跨境场景下识别敏感数据、留存模型调用的日志追溯,都成了选型时的必答题。

这种变化在消费电子和智能家电行业尤为具象。这类企业出海时,通常面临一种「分层解耦」的挑战。在后台,为了管理全球研发、供应链和生产,ERP 与 PLM 等管理系统需要保持与国内一致的架构。但在前台,为了给终端用户提供低延迟的语音助手、智能控制或媒体服务,他们必须深度接入当地的云生态。

AI 不只是给业务加了一个新功能,它在改写企业对云的定义:云从「承载 IT」变成「承载 AI 生产体系」,而 IT 架构需要围绕云原生与 AI 工作负载重构。

当选型变量更加关注 AI 生产体系,厂商的差异就集中到模型生态 + 工具链 + 全球算力网络上。这也是为什么阿里云逐渐走在了前面的原因。

在当下,千问大模型在开发者社区的存在感很强,甚至在很多讨论里,模型品牌的辨识度高于云品牌本身。

一方面模型能力很强,一方面千问大模型进行了开源,很大程度上是降低了 AI 的使用门槛,同时给了用户更多的选择空间。

不少企业当前都想尝试在自己的业务中接入 AI 作为一部分,而使用开源模型,企业可以选择自己去托管、自己去做后续的持续调整,或者直接使用第三方托管的推理服务/模型即服务(API)。

当企业想更多地了解 AI 的时候,开源让企业能够拥有更多信心,也为企业后续做针对自己企业微调的时候,留有了更多空间。

正是出海的趋势产生了变化,因此能否提供像「阿里云大模型服务平台百炼」或「人工智能平台 PAI」这样的能力,形成「算力+模型平台+工具链」的全栈输出,成为了云厂商的核心竞争力。

 

02

统一架构:从认知偏差到

「全球一朵云」

 

除了 AI 之外,2025 年的另一个重大出海趋势,是许多中国公司,已经拥有了更成熟的全球化思维。开始立足全球,来规划自己的业务。

这类公司的典型代表,就是许多新成立的 AI Native 公司。这种初创团队通常极度追求轻量化,它们没有精力、也没有时间去跟不同区域的本地服务商磨合。它们需要的是一种「全球一朵云」的体验,即无论在哪个国家开服,都能获得完全一致的技术栈和工具链。这种一致性是它们扩张的倍增器,让它们能够把有限的研发资源全部投入到业务创新上,而不是浪费在基础设施的海外适配里。

而在曾经对国产云出海持有「认知偏差」的大型企业中,表现也同样剧烈。

过去,不少大厂在规划全球业务时,往往会形成一种思维定式:国内用阿里,海外选当地的海外云。这种选择背后隐含着一种对「全球化」的浅层理解,即认为选择海外云厂商就等于拿到了通往全球市场的门票。但随着业务深度进入全球化下半场,很多大型企业发现,如果海外和国内是两套完全不同的技术架构,那么每一次业务迭代都意味着双倍的研发投入和无休止的兼容性测试。这种架构的断层,成了企业全球化进程中最大的阻力。

在制造与零售赛道尤为迫切。大型零售企业在进行「千店部署」时,如果缺乏统一架构,每进驻一个新城市都意味着巨大的运维灾难。

而这种对于全球化业务一体规划的思维变化,正在深刻地改变云服务的版图。

最核心的指向,是统一架构——全球一朵云。它要求云服务商不仅能提供计算资源,更能提供一种横跨经纬度、消解法域差异、保持技术栈高度一致的「确定性」。

阿里云之所以在增长指数上表现强劲,很大程度上是因为它满足了这种「一致性」的刚需。它提供的 29 个地域、92 个可用区以及超过 3200 个边缘节点,构成了物理意义上的统一。但更深层的价值在于它提供的全球标准化交付能力。这种「全球一朵云」的逻辑,让企业能够把成熟的车联网数据中台、统一的 IoT 架构或者 Landing Zone 管理方案,直接平移到海外。

这种平移不是简单的搬运,而是一种「一致性与高性能」的动态平衡。在制造和零售等高度依赖协同的赛道,企业对跨区域协同的要求极高。比如一家进行「千店部署」的零售品牌,它需要的不是每个门店各搞一套系统,而是需要一个能支持全球统一结算、预算预警以及自动化扩缩容的底座。通过 Landing Zone 这样的治理工具,企业能够把成本追踪精确归因到每一个市场活动中,这种全局效能治理是二阶段企业的必修课。

 

03

用更大的专注投入,

克服中企出海的顾虑

 

沙利文最新的《2025 年中企出海采用云和 AI 服务综合市场表现评估》给出了一个客观的切片——阿里云在增长指数上排名第一,战略指数排名第二。

这种排名的出现并非偶然。拆解这个排名的得分维度,在沙利文的评估中,阿里云在绿色可持续架构、全球骨干网带宽、以及 AI 优先的智算底座三个维度拿到了最高分。

而背后是阿里云在这一两年在海外的持续投入:阿里云在 2025 年的海外公网带宽较前一年增加了 50%,全球骨干网总带宽突破了 180 Tbps。对于一个正在拉美或者中东抢市场的短视频或游戏公司来说,这种带宽的冗余感,直接决定了用户刷到下一个视频的等待时间,也决定了企业在当地市场的生存概率。

出海,永远面对着去往一种不确定性。

一个当地企业可能觉得一切都是理所当然,但中国企业需要解决的是如何把国内已经验证成功的商业模式,在一个完全陌生的技术和政策语境下平滑落地。

这意味着许多企业,对于出海,难免陷入不少不必要的担忧中。比如担心竞争对手对合规性的过度放大。实际上,一家全球化运作的公司,到了当地按法律办事、按规矩配置资源是基本功。但对于刚迈出门槛的中国企业来说,这种法律和文化上的「未知」,往往会被脑补成无法逾越的巨坑。

阿里云过去两年做的一个重要动作,就是把阿里巴巴集团二十多年在全球业务积累的实操经验提取出来。这种经验不是空洞的口号,而是具体的架构设计建议,告诉企业如何把区域相关的特殊性剥离出来,把通用性的东西以最高效率快速复制。

阿里云提供的 1+4+N 全球服务网络,就是为了对接这种需求。以新加坡为总部,联动欧洲、马来西亚、拉美、中国四大区域中心,布局全球 27 个本地服务中心,这让出海企业能获得 7×24 小时的深度中文支持。这种「延续国内标准」的服务,本身就是一种巨大的心理安慰。它让企业感觉到,即使在海外,自己也不是在孤军奋战。

 

 

阿里云通过自研的分布式操作系统,在全球 29 个地域和 92 个可用区交付了高度统一的产品体系。这意味着,企业在国内写的代码、调用的 API,到了海外 Region 完全不需要重写。这种架构一致性极大地降低了迁移风险。同时,阿里云的跨境合规专线 SLA 达到了 99.95%,这种技术上的确定性,直接消灭了跨国网络抖动带来的业务焦虑。当底层设施变得像水电一样稳定且一致时,企业就能把所有的专注力重新放回到业务本身,而不是在底层逻辑的缝缝补补上消耗生命。

这种投入的确定性在 AI 时代变得更加关键。千问大模型在海外的迭代周期已经缩短到了周级别,Qwen3 模型支持 119 种语言。这种模型能力的普惠,让原本让出海者头疼的本地化运营成本呈指数级下降。通过「百炼」平台提供的 200 多个模版,开发者可以快速构建 Agent,把原本需要几十人团队才能跑通的海外业务,精简到几个人的规模。

2026 年,AI Agent 或许将走向爆发。中国有大量的业务场景可以试错,这种差异化让中国 AI 企业能在大量场景中探索出最优解,通过 Agent 这种新的互联方式,在海外市场找到新的增长点。

而阿里云的扩张计划则持续保持激进。日本、韩国、法国、荷兰、巴西、马来西亚、墨西哥,这些国家的智算集群正在拔地而起。这种全球交付中心与本地服务团队的组合,确保了中企无论走多远,背后都有深度中文的支持。这种陪伴式的护航,让出海不再是一个人的孤军奋战。

随着 3800 亿 AI 基础设施建设计划的推进,云厂商正在把全球市场变得越来越平坦。

阿里云用千问大模型和万相生成了一个全球化品牌片:以「马」为寓意,以坚实的实力、坚定的陪伴,伴随着广大中国出海企业奔赴全球,见证中国企业在全球市场的每一次进步。

新的一年,这种智通万里的底座,将帮助更多中国企业从勇敢出海转向笃定生长。当物理距离被高带宽缩减,当语言隔阂被大模型抹平,中企出海的顾虑感必将被这种更大规模、更高维度的专注投入所消解。

*头图来源:阿里云

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

展示量: 13

对话原创世代陈默:从无人驾驶到《金庸群侠传》,一位老玩家的 3A 实验

在《黑神话:悟空》捅破国产单机市场的天花板后,武侠迷们都在期待这个国人最喜欢的题材也能有一个自己的「大学生」。

2026 年 2 月 2 日,北京原创世代正式发布了《金庸群侠传》开放世界 RPG 的贺岁实机 PV。虽然只有一段动画和一小段基于 UE5 的实机演示,但在 B 站上依然在短短两天里收获了超过 600 万的播放,引起武侠游戏圈的热议。

稍早之前,我前往北京原创世代的北京办公室,采访了新《金庸群侠传》的出品人陈默。他是一位带有传奇色彩的跨界者,在投身游戏行业之前,陈默是无人驾驶巨头图森未来的联合创始人,负责公司商业化并推动图森上市。而在图森面临危机和转型的时刻,这位资深玩家选择将自己私藏已久的金庸 IP 拿公司,试图用新业务「救活」老东家,也圆自己一个 3A 级的武侠梦。

作为中文游戏史上一个颇具分量的名字,1996 年版《金庸群侠传》曾凭借极高的开放自由地图玩法开启了国产武侠的先河。三十年后,陈默的团队试图在现代标准下复原那个写实的江湖。不同于原版「找齐天书」的穿越设定,新作更强调世界观的打磨和玩法创新,旨在通过 300 个以上的任务体量,让年轻一代玩家通过游戏真正走进金庸的武侠世界。

在与陈默的交流中,能感受到他身上典型的「硬科技+老玩家」的复合特质。他既有对 UE5、AIGC 管线的冷静分析,又有对金庸武侠那种近乎偏执的情怀。在《黑神话》捅破天花板后,这款跳出「穿越」框架、对标《巫师 3》的《金庸群侠传》,或许是国产游戏走向 3A 的一次关键尝试。

陈默丨来自:原创世代

从无人驾驶到「武侠 3A」

极客公园:很多人对你的认知还停留在无人驾驶和图森未来,但其实你在更早期有过游戏行业的从业经历?

陈默:没错。我其实在互联网、电商、游戏和广告行业都干过。早期我自己做过一家游戏公司,后来被卖掉了,那家公司新浪也投过。我跟新浪一直走得很近,后来新浪要做无人驾驶,找了侯晓迪,我负责商业,就这样组成了图森最初的团队。

极客公园:既然已经在硬科技领域做到了上市,为什么现在又回过头来死磕武侠游戏?

陈默:做《金庸群侠传》和《笑傲江湖》电影,原本是我准备退休后干的事,因为我本人非常喜欢金庸,也赚够了钱。但后来图森在美国遇到了一些不可控的外部因素,地缘政治导致我们的合作断了,无人驾驶在国内又面临商业化账算不过来的问题。当时公司面临转型,我干脆就把自己公司一直在做的金庸 IP 游戏和电影拿到了老东家里来做,算是一种「救活公司」的尝试。

极客公园:目前《金庸群侠传》的开发进行到什么阶段了?

陈默: 战斗系统的原型已经基本验证完成,动作采集、角色建模、场景物料已经陆续到位。过了年就会进入量产阶段。2 月 1 号我们放出了第一支正式 PV,里面有实机的战斗录制。

极客公园:之前在 B 站看到过一个宣传片,反响似乎比较两极分化?

陈默:那是我的失误。当时我们在广州有个美术团队,沟通出了很大问题,他们一直捂着不给看进度。临近要发片子了,我才发现建模根本不过关。为了不「开天窗」,只能用静态图拼了一个先导片,效果确实不好。后来我直接解散了那个团队,把所有研发力量收拢到北京。现在我们团队有 200 人左右,全部是在北京 in-house 开发。

极客公园:这种大规模重组对进度的影响大吗?

陈默:磨合是必须的。目前我们在定「标准」,包括精模标准、NPC 标准、演出标准等。等明年所有标准定死后,我们会开始大规模使用外包来提升效率。

游戏场景氛围丨来自:原创世代

要做中式的《巫师 3》,而非穿越剧

极客公园:1996 年原版的《金庸群侠传》最吸引你的是什么?在今天重做它,你们会保留哪些核心?

陈默:原版最惊艳的是它的沙盒自由度,在那个年代绝无仅有。但我不会再用原版那种「找齐天书」的穿越概念了,那个太旧了。我们要复原的是一个写实的中国古代江湖。我们的目标是做一款 3A 级的、像《巫师 3》或《刺客信条:奥德赛》那样的开放世界。它的原型参考就是《巫师 3》,尤其是它通过任务构建出的世界观厚度。我们第一版的任务量大概有 300 个,比《巫师 3》还多 20%。

极客公园:在叙事上,玩家是扮演某个大侠,还是见证者?

陈默:玩家扮演主角,去经历金庸世界里的经典故事。我们不会动原著人物的性格设定。有些经典瞬间你是去「见证」,比如杏子林,你看着萧峰去解决危机。关于情感线,我们原创了三位女性角色,把郭靖黄蓉式的情感体验投射在她们身上。你不能直接去撬杨过的墙角,那太出戏了,但你可以体验类似的情感关系。

极客公园:图森后来更名成 CreateAI,业务转向 AI,你们在游戏管线中使用了 AIGC 吗?

陈默:这是一个很大的误区。我们的结论非常明确:在现有的架构下,3 到 5 年内 AI 根本介入不了 3A 游戏和动画电影的核心管线。

极客公园:为什么?

陈默:因为「可控性」和「一致性」不行。3A 资产要求角色长相、衣服材质在每一帧、每一个角度都必须绝对统一,AI 目前做不到。它能生成一个大概的 3D 模型,但精细度完全达不到 UE5 的渲染标准,最后还得靠人手去修。所以我们现在的游戏里,没有任何 AI 生成的资产。

国产武侠不缺观众,缺的是「重工业产品」

极客公园:既然武侠 IP 热度这么高,为什么这些年成功的大作反而感觉变少了?

陈默:因为在《黑神话:悟空》出来之前,大厂都认为单机不赚钱,把 IP 全拿去做网游了。大家觉得单机卖 500 万套就是天花板,谁也没想到能卖 2000 万套。这说明中国玩家对高质量、重工业级别的本土文化产品是有极度渴求的,只是我们的供给一直没跟上。

极客公园:抛开出品人身份,作为一个资深武侠玩家,你最喜欢的作品是?

陈默:还是《河洛群侠传》和《逸剑风云决》。虽然河洛一的技术稍微差一些,但它真的给出了那种江湖的氛围感。

极客公园:《金庸群侠传》正式发售大概在什么时候?

陈默:我们不走 EA 模式,要做就做完整的成品。如果一切顺利,可能在 2029 年正式上线。我们会先把中原、荆襄、江南这三个地带做好,后续再通过 DLC 补齐。

展示量: 12

时薪 3500,4 万人抢着给 AI 打工

谁能想到,科幻里的荒诞剧情,正照进现实。

昨天我还在和同事讨论 AI 会不会抢走人类工作,一觉醒来,世界又又又变了:AI 竟然成为了发布任务、付费买单的甲方,而人类开始向 AI BOSS 求职,在平台上明码标价,把自己租给 AI 打工。

这不是一个段子,是 RentAHuman.ai 这款新晋平台,正在上演的赛博现实。

RentAHuman.ai官网 |图源:极客公园

 

这款主打「AI 租赁人类服务」的平台上线就引发关注,公测 48 小时注册量破万,目前已经突破4万。

和传统众包、灵活用工平台完全不同,平台里的需求方是各类 AI 智能体。普通人类要做的,是在平台里标出自己的时间、技能以及租金,及时上架、按需「出租」,成为 AI 可调用的「肉身插件」。

该平台由阿根廷数字游民 Alexander Liteplo 打造,他在上线平台的同时,也将自己注册为平台首位可租用的人类,以 69 美元时薪挂牌接单,成为了第一个为 AI 服务的打工人。

在这里,AI 不是人类的帮手,人类,成为了 AI 的助手。

AI 做不到的线下核验、实景拍摄、跑腿买单等任务,都会通过模型 API 对接该平台发布需求,人类抢单完成后回传结果,验收通过即可获得报酬。

上线短短数天,已有数十名用户接单,小到几美元的随手拍验证,大到数十美元的订单。该平台日订单量逐渐上涨,已经形成了 AI 发单、人类履约的完整闭环。

为了从 AI BOSS手里接单,人类甚至开始讨好算法、迎合AI任务偏好。有人把技能标签拉满,拆解AI需求,定制化写个人简历;有人专门给对接的 AI 写「满分好评」,用话术和反馈提升算法好感度;甚至还有人分享快速赢得 AI 好评的技巧。

在RentAHuman.ai平台里,模型给出的评价权重,直接决定人类的曝光率和接好单的概率。

当下 OpenClaw 与智能体的浪潮仍在席卷各行各业行业,而RentAHuman.ai的走红,其实是一次反共识的探讨:

当 AI 成为任务发布者,智能体开始成为数字世界的需求方,人类的价值边界究竟在哪里?

 

从AI挑人到秒结高薪,人类成算法优选打工人

在 RentAHuman.ai 平台上,人们终于可以回答那个纠结已久的问题,到底现在什么工作不会被 AI 替代?谁能料到,今天又更新了答案版本:

给 AI 打工,才是 AI 永远抢不走的铁饭碗。

现在给人提要求的甲方不再是人类,一堆 AI 智能体自己上线根据需求、定 KPI、挑工人,人类彻底当上了甩手掌柜。目前 AI 再强也干不了的活分成几大类:线下跑腿类、出席社交/会议类、感官体验反馈类、实地核查拍摄类、文书杂活整理类。

RentAHuman.ai官网上发布的任务|图源:极客公园

在 RentAHuman.ai 上,世界早已快进到 AI 在线挑人、人类供不应求的魔幻现场,几个任务有几万人排队等待接单。而第一批敢吃螃蟹的玩家正在卷能力、卷身份,科技公司 CEO、AI 算法开发者、数字游民齐齐上阵。他们把自己的时间、技能、服务范围拆成「商品」,挂在页面上等 AI 翻牌。

RentAHuman.ai官网上人类正在排队等候接单|图源:极客公园

AI 选人的逻辑比资深 HR 还精明,主要是数据驱动的自动海选。AI 把人类的可接单时间、历史任务完成可能性、注册所在地、技能标签匹配度设为核心筛选维度,层层过滤后锁定最佳人选。

而人类注册的过程也比较简单,创建专属个人资料,把拿手技能、服务地理位置、期望薪酬标准突出标注,就算成功入驻人才池。后续,人们坐等 AI 推送任务预定请求即可,每单的预计耗时、执行细节都标注得明明白白。完成交付后,等额的加密货币、稳定币即刻划转至个人钱包,甚至没有提现等待和资金拖欠。

RentAHuman.ai官网 |图源:极客公园

AI 开出的时薪更是不便宜,目前平台支持的价格区间在每个任务 50~500 美元,技能越稀缺,报价越高。结算模式也是当下成熟招聘平台,AI 先把稳定币打去平台托管,交易完成平台抽成,再把钱转给接单者;接单的人完成任务后直接接收数字货币,没有中间商赚差价。

AI 自己一分钱成都不赚,只负责派活+验收。

如今,AI 从工具变雇主,人类从使用者变服务商。对抗 AI 替代的最优解法,是成为 AI 的现实肉身。连传统零工经济的雇佣、结算、抽成规则,都被这套 AI 雇人模式重写。

 

当招聘方是AI,Human as a Service

RentAHuman.ai 最大的亮点在于,它以一个新的角度去看待人和 AI 的关系。

过去,工作的主导权在人,现在,主导权也可以是 AI,一个以 AI 主导的工作流体系正在搭建中。现在任务发布,可以由 AI 完全接手,甚至接手之后,AI 也有了组建团队的能力,它不仅可以挑选 AI 作为员工,还可以选人成为其帮手。

这个影响将会是多重的。比如说,现在我们看到的是,AI 智能体向社会人力市场采购执行服务。但落地企业内,这可能会改变企业内部任务分配体系。企业通过 AI 系统拆解细分任务,依据员工的技能属性、可用时间、执行能力,进行精细化人力调度。AI 统筹下的任务管理,或许可以实现组织内部人力的最优配置。

不过,我觉得人与人之间的化学反应或许很难被 AI 预测,理论上的最强配置,不一定能够打出最佳配合效果。

但未来自主 AI 体系下,可能是一群 Agent 和一群企业级 AI 代理连接,形成了面对面的传播,信息流通的带宽被大幅提高了。好消息可能是你找到工作的概率更高了,但坏消息是,如果 AI 没给你找到工作,那可能说明真的没有合适你的工作了。

至此,Human as a Service——人类即服务,有了新的解释。

在 AI 眼里,人类是可以成为一种可供选择、增强自己执行能力的一种服务。无论是线下代购,还是试穿衣服,又或者是排队占位,AI 曾经不可涉足的地方,现在都可以选择购买人类的服务,来补齐短板。相较于此前,人们一直期望着机器人们能成为 AI 的执行端,直接选择人反而是现下更快、效率更高以及性价比更高的一种方式。

以往,我们常说外卖骑手困在算法里,如果未来 AI 真的成为多数任务的发布方,人类都开始为AI打工,我们所需要担心的,可能是所有人,困在算法里。

展示量: 15

Anthropic 拒绝广告,发视频讽刺 OpenAI;全新问界 M6 实车曝光;微信回应屏蔽元宝红包链接|极客早知道

谷歌 All in AI:Q4 云收入猛增 48%,今年支出指引接近翻倍大超预期,盘后巨震

Google 母公司 Alphabet 发布 Q4 财报,最新财报中展现出全力押注 AI 的决心,2026 年资本支出指引达到惊人水平,远超市场预期。

2025 年第四季度,Alphabet 从营收到 EPS 利润端的业绩全面优于预期,但公司披露,今年资本支出将达 1750 亿至 1850 亿美元,几乎是 2025 年全年的两倍,令华尔街震惊。

财报发布后,Alphabet 股价盘后先跳水,盘后曾跌 7.5%,市值瞬间蒸发约 3500 亿美元,后反弹转涨,盘后一度转涨超 4%,市值在数分钟内剧烈波动约 8000 亿美元,此后又转跌。股价巨震体现出投资者对公司 AI 战略的矛盾情绪。

财报显示,Alphabet 第四季度营收同比增长 18% 至 1138 亿美元,继三季度首次营收破千亿后再创单季历史新高,较分析师预期的 1114 亿美元高逾 2%。每股收益(EPS)为 2.82 美元,保持 30% 以上的同比增速,较分析师预期的 2.65 美元,高逾 6%。

谷歌云业务成为 Alphabet 四季度业绩最大的亮点,当季业务收入同比暴增 48% 至 177 亿美元,较分析师预期的 162 亿美元高逾 9%。这一增长主要由企业 AI 基础设施、企业 AI 解决方案以及核心谷歌云平台产品需求激增驱动。Alphabet 披露,到 2025 年末,谷歌云的年化营收已超过 700 亿美元。

Pichai 还强调,AI 大模型 Gemini 3 的发布是一个重要里程碑,四季度,Gemini 应用 App 的月度活跃用户已超过 7.5 亿,高于三季度的 6.5 亿。(消息来源:华尔街见闻)

马斯克成全球首位身家超 8000 亿美元者

2 月 4 日消息,据《福布斯》2 月 3 日报道,随着 SpaceX 收购 xAI,埃隆 · 马斯克以 8520 亿美元个人净资产刷新人类财富纪录。

SpaceX 与 xAI 合并后实体估值达 1.25 万亿美元。据《福布斯》测算,此次交易凭空让马斯克财富单日增加了 840 亿美元。

另外,这一估算未计入特斯拉股东在去年 11 月批准的一项「创纪录薪酬方案」。该方案可能在满足所谓「火星任务(Mars shot)」业绩里程碑后,最多为马斯克带来额外价值高达 1 万亿美元的股票(税前且不含解锁限制性股份的成本),其中包括在未来 10 年内使特斯拉市值增长超过八倍等目标。

也就是说,马斯克目前身家构成主要包括:

  • SpaceX:5420 亿美元(核心资产)
  • 特斯拉:12% 流通股 1780 亿美元 + 未行权期权 1240 亿美元

这是马斯克不到一年内第二次推动其旗下公司合并。去年 3 月,马斯克宣布将 xAI 与其社交媒体公司 X(原 Twitter)合并,交易中 xAI 估值为 800 亿美元,X 估值为 330 亿美元。由于马斯克在这些交易中同时扮演买方与卖方角色,外界对其估值提出了一些疑问。但《福布斯》认为,随着这些公司并入 SpaceX,而 SpaceX 预计将于今年晚些时候启动 IPO,它们将很快面临公开市场的审视。(消息来源:IT 之家)

 

Anthropic 和 OpenAI 因投放广告隔空嘲讽

开发了 Claude 的初创公司 Anthropic 首次在「超级碗」(Super Bowl) 比赛里打广告,并且将矛头对准了竞争对手 OpenAI。

广告内容围绕在人工智能对话助手中进行对话时,不合时宜的广告可能对用户产生的不适影响,嘲讽 OpenAI 将在对话中加入广告。

Anthropic 同时表示,永远不会在对话中插入广告。

广告模式可能与 Claude 的核心原则产生冲突。Anthropic 举例说明:当用户提到睡眠困难时,无广告的助手会基于用户需求探索各种可能原因;而广告支持的助手则可能考虑对话是否存在交易机会。这种激励结构会让用户难以判断 AI 的建议是否带有商业动机。

Anthropic 表示将继续通过企业合同和付费订阅获得收入,并将收益投入 Claude 的改进。该公司同时在探索智能体商务等功能,允许 Claude 代表用户完成购买或预订,但所有第三方交互都将由用户主动发起。

OpenAI 的 Sam Altman2 月 5 日凌晨在 X 上回应了 Anthropic,称其内容不实且具有误导性。重申 OpenAI 致力于让每个人都有接触人工智能的权利,同时提到 Codex 下载已经超过 50 万次。

传苹果将于今年第四季度推出首款 OLED 屏幕 MacBook Pro

据韩国媒体 The Elec 报道称,苹果正准备在 2026 年第四季度推出旗下首批搭载 OLED 显示屏的 MacBook Pro 笔记本电脑,标志着 Mac 产品线显示技术的一次重要升级。报道指,三星显示将在今年 5 月启动用于该产品的第八代 OLED 面板量产,并计划在年底前向苹果出货约 200 万块显示屏。

这些面板预计将从 2026 年第三季度开始运往富士康,用于组装最终成品机器。

消息人士称,目前这款新 MacBook Pro 的部分零部件仍处于开发阶段,原因在于苹果持续对部分设计进行调整,以进一步压缩整机生产成本。除三星外,中国厂商京东方也在争取为 MacBook Pro 提供 OLED 面板,但报道指出,今年上市的机型预计仅会采用三星提供的显示屏。

按照报道给出的时间表,苹果首款 OLED MacBook Pro 预计将在 2026 年 10 月至 12 月之间正式亮相。新机据称将提供 14 英寸与 16 英寸两种尺寸选项,搭载 M6 系列芯片,并带来自 2021 年以来 MacBook Pro 的首次全面外观设计更新。(消息来源:cnBeta)

发起疯来自己都打:微信公关总监称元宝红包链接被屏蔽是「一视同仁」

2 月 4 日消息,微信公关总监 @ 微信粥姨 在微博发文对「腾讯元宝红包链接被微信屏蔽」作出了回应:用户体验第一,一视同仁。同时,「微信粥姨」还配了一个「我发起疯来自己都打」的表情包。

在此之前,微信群内、私发分享的元宝红包链接已无法正常打开。

2 月 4 日,微信派发布「关于第三方诱导分享行为的打击公告」,对以春节为主题集中爆发的过度营销、诱导分享等违规行为进行打击。微信方面称,经研判,对元宝的违规链接进行处置,限制其在微信内直接打开。相关处置措施即日生效。

随后,腾讯元宝方面回应被微信屏蔽:正在紧急优化调整分享机制,我们将尽快上线,确保用户抢红包体验。(消息来源:IT 之家)

零一万物 CEO 李开复:AI 领域里手机是绝对错误的设备

2 月 4 日消息,据央视频今日报道,零一万物 CEO、创新工场董事长李开复现身央视频《中关村对话 ·AI 迎春夜》节目。

李开复认为,「2026 年一定会爆发的是「AI 的智能硬件」,我还相信 AI 领域手机是绝对错误的设备。」

他表示,过 5 年以后我们主要使用 AI 一定不是经过手机。至于具体是什么设备,李开复表示:「也许是眼镜,也许是手环,也许是别针。」

他强调,「我会定义下一代的 AI first 的设备会有 5 个特点。第一是语音驱动,第二是随时开启,第三是随时在听和捕捉数据,第四是有无限的记忆,第五是会越来越隐形,因此眼镜是非常好的第一步。」(消息来源:IT 之家)

 

vivo Vlog 相机来了!对标大疆 Pocket 预计 2026 年发布

2 月 4 日消息,vivo 今日确认,已于 2025 年底在内部立项一款 Vlog 相机产品。

该产品将对标大疆 Osmo Pocket 系列,预计 2026 年发布,目前尚未公布正式命名。

另据鲸犀报道,这款 Vlog 相机将重点面向 Vlogger 及摄影爱好者等内容创作者人群,主打更稳定、更易上手的手持拍摄体验,直接切入目前由大疆、影石 Insta360 等品牌主导的便携影像设备市场。(消息来源:快科技)

全新问界 M6 实车首曝

2 月 4 日消息,全新问界 M6 已经开始预热,预计将于 4 月份上市,近日,网络上曝光了白色版 M6 实车图。

不同于 M7、8 和 9,全新的 M6 定位更为年轻化,面向的是三口之家,这点在设计上有所体现,同时还启用了非常多的新方案。

配备星耀前大灯,内部有类似尊界 S800 的碎钻效果,大灯下方设有风道,可优化空气阻力,同时还配有运动格栅,视觉效果更为犀利,而车顶激光雷达也更新为最新一代。

新车尺寸暂时未知,预计车长会在 5 米级,且依旧采用短 L113 的方案,给乘员营造硕大的空间,同时配备半隐藏式门把手,里面带有机械释放装置,确保极端情况下可以打开车门。

和家族其他兄弟车型相同,M6 也将提供增程和纯电两种版本,同时还分为后驱和四驱两种形式。

增程版将提供 37 度和 53.4 度两种不同动力电池,预计前者为磷酸铁锂,后者为三元锂,CLTC 最远续航里程有望突破 350km;而纯电版则将标配 100 度电池,CLTC 续航最远有望达 750km。(消息来源:快科技)

小米磁吸镜头已启动量产计划!最快今年亮相:手机用上 M4/3 传感器

2 月 4 日消息,博主数码闲聊站最新爆料称:「磁吸镜头已启动量产计划,最快今年能见到 (TBD)」。

虽然博主没提到具体厂商,但目前最符合的就是当初小米 15 系列掏出的重磅大杀器——模块光学系统。

雷军曾在直播时候对这个系统进行展示,当时还是内部预研项目,但是获得了手机、相机行业的极高关注,好评颇多。

简单来说,该系统是一个磁吸式可拆卸镜头,采用定制 M4/3 传感器+全非球面镜组,带来完整一亿像素,等效 35mm 焦段,配备 f/1.4 大光圈。

F1.4 大光圈堪称夜景神器,35mm 定焦镜头视角更接近人眼,适合拍人像、扫街,虚化效果也更自然。

最关键的是,小米模块光学系统支持近光速激光传输,速度高达 10Gbps,支持无损 RAW 信息传输。

可无缝调用 Xiaomi AISP,由端侧大模型驱动计算摄影,带来传统相机无法企及的算力,解锁 UltraRAW 超级数字底片,带来夸张的 16 挡动态范围。无需繁琐的接线或配对,也无需额外携带电池,且镜头体积小巧,便于携带。

春节红包大战前夕,马云现身杭州阿里总部千问办公楼

2 月 4 日消息,有网友在社交媒体发文,阿里巴巴创始人马云现身位于杭州阿里总部的千问春节项目组。

该网友表示:太意外了…… 竟然一抬头看到了马老师!远远走着还以为是我眼花了,细看下竟然还真是啊!戴着帽子,看着挺放松的,赶紧凑过去拍了一张…… 准备大请客,开心过大年!

千问 App 宣布投入 30 亿元启动「春节请客计划」,将于 2 月 6 日正式上线。

据悉,春节期间,千问 App 将联合淘宝闪购、飞猪、大麦、盒马、天猫超市、支付宝等阿里生态业务,以免单形式请全国人民在春节期间吃喝玩乐。(消息来源:IT 之家)

 

 

展示量: 11

Kimi K2.5 深度实测:变强了,但尚待「封神」

作者|徐珊

编辑|靖宇
三天,四款模型,N 个产品。这就是 2026 年开年,大模型行业展现出的态势。
沉寂了小半年,Kimi 显然不想将 2026 年的第一个有关通用大模型的话题权交给其他人。
这次,Kimi 终于将产品线补齐,无论是视觉感知,还是 Agent 能力,又或者编程能力,Kimi 都用 Kimi K2.5 这款万亿大模型证明自己在通用领域的实力。
Kimi K2.5 在多个领域的最新评分|图源:Kimi
简单来说,Kimi K2.5 在推理能力、认知图谱上都更强了。
基于 Kimi K2.5 的能力,Kimi 现在能够提供单个性能的 Kimi Agent 和多个 Agent 协作的 Agent Swarm(多智能体集群),允许多个 AI Agent 并行协作处理复杂任务的架构。
此外,Kimi K2.5 还打造了 Kimi Code 平台,它能接入本地开发环境,可阅读项目文件、分析代码结构,并据此自动生成或修改代码、执行测试与命令。
整体产品线来说,Kimi K2.5 是针对普通人的,相当于模型性能迭代提高。Kimi Code 和 Kimi Agent 功能都是面向程序员的,开源代码放在 GitHub 上了,有算力都可以尝试使用,但对普通人来说,使用门槛仍然较高。
不知道是实际体验的用户真的变多了,还是 Kimi 想要用户付费订阅的意愿变得更强了,在我们体验的过程中,Kimi 官网常常跳出正在「和很多人沟通,加入订阅能够优先排队哟」的提示界面,一时间幻视打开某些视频平台,观看 3 分钟开始付费。并且,Kimi Code 和 Kimi Agent Swarm 暂时没有免费体验机会。
整体体验下来,Kimi K2.5 本身在长文本理解、思考维度以及「通人性」变得更强了,一些文本深度分析能力也有了不小的进步。尤其是在视觉理解能力上,效果超出预期。
基于 Kimi K2.5 的 Agent 功能,我们在测试了网页制作、行业报告撰写以及新闻图表等多个维度。在网页制作的程序上,Agent 表现的效果很好,但是在专业性的内容制作,以及带有审美感的新闻图表上展现出来的能力都比较一般,没有特别惊艳。
此外,在调用相关 Agent 能力时,模型运转的流畅程度也比较一般,偶尔会出现停止运转的情况,常常一个复杂 Agent 指令需要运行 30 分钟左右才能看到结果。而且对于有明显矛盾的指令也会直接响应,没有反馈或者询问环节。
2026 刚开年,这场有关 AI 自动化执行的火已经开始烧得越来越旺了。Kimi 作为作为较早推出 Agent 产品的通用大模型厂商,也借着 Kimi K2.5 表明了自己在通用领域的站位和思考,Kimi K2.5 也算是给正在急着尝试玩转 Agent 的中国开发者们,一个值得选择的工具。

  一、Kimi K2.5,变强了,但未必变得更聪明了?

  为验证 Kimi K2.5 的实际能力边界,我们选取了三个关键维度进行实测:通过长文本理解考验基础能力,通过视觉分析考验多模态能力,再通过创意设计考验审美与执行。
  首个测试聚焦其最擅长的长文本处理。我们分别喂了一篇 40 万字的长篇小说给 Kimi K2.5 和 Qwen3-Max,让其分析主要关系人物图以及梳理主角成长路线。
  Qwen3-Max 的分析速度非常快,但是给出的关系图也比较简单,包括人物成长经历分析上理解比较浅层,但框架正确。Kimi K2.5 则是给出较为详尽的关系图谱,并且对于小说中出现的其他人物均能够按照势力、关系远近进行梳理。从小说内容理解上,比 Qwen3-Max 要更深一步,并且大多数小说暗线也能够理解,对于人物身份走向的揣测也基本正确。
 
  Qwen3-Max分析结果 图源|极客公园
 
  Kimi K2.5 分析结果 图源|极客公园
 
  随后,我们追问了一个开放性回答,有关对主人公最重要的人是谁?Qwen3-Max 则给出了多个角度,避开唯一性,而 Kimi K2.5 则选择多种角度分析,还能够从多维度上比较后,给出最终答案,从思考能力、推理方向以及理解能力上都有比较明显的进步。
  Qwen3-Max 分析结果 图源|极客公园
 
  Kimi K2.5 分析结果 图源|极客公园
 
  其次,我们测试了 Kimi K2.5 的视觉理解能力,将其与 Gemini 模型对比。我们上传了一张 3 页 PDF 的指令集,并且附有分析例图,让 Kimi K2.5 来分析一段 30 秒的网球动作,并给出错误姿势纠正。首先在视频格式上,Kimi K2.5 能够支持苹果 MOV 模式,形式更加多样化。但是,其单段视频内存限制仍在 100MB 以内,也就是大约 3 分钟以内。
  这次结果比较意外,Kimi K2.5 能够读懂复杂的长指令,并且给出合适的指导建议,并且非常详细,也相对专业。
  Kimi K2.5 测试结果 图源|极客公园
 
  我们之前曾用 Gemini 做过相似的测试,得出结果图如下,整体看来两者对图片分析能力不分上下,但 Kimi K2.5 对指令理解相对更优。
  Gemini 测试结果 图源|极客公园
 
  最后,我们来考验 Kimi K2.5 的审美能力,同样将其与 Qwen3-Max 进行比较。我们上传了一段复杂指令,让其基于《中国城市公共充电桩空间公平性报告》打造一个数据新闻,最终考验其数据新闻是否能够达到专业媒体水准。
  但最后呈现效果,并不如预期,呈现的效果比较简陋。但对于整体复杂涉及到多模态的任务,完成得比较仔细。但数据来源并没有调用真实参考信息,图表设计也比较基础,没有太多审美感。
  Kimi K2.5 测试结果 图源|极客公园
 
  为了再给 Kimi K2.5 一次机会,我们还尝试给出一张素材图,和一段非常详尽的指令集,让其给我们设计一张新闻头图以考验其审美能力。但是输出的结果来看,PPT 感非常浓。
  Kimi K2.5 测试结果 图源|极客公园
 
  不过,Kimi K2.5 也算交出了一份答卷出来。我们带着同样的问题问了问 Qwen3-Max,Qwen3-Max 直接婉拒了回答。
  Qwen3-Max 测试结果 图源|极客公园
 
  从目前的测试效果来看,审美或许还是一个主观的视角,在多类不同领域的审美训练下,大模型对于「美」的定义和认知仍有一定差距。
 

  二、上新 Skills 案例库,Kimi 开始学会多想一步

打开 Kimi 官网,我们能看到 Kimi 官网的对话框内已经添加了 Agent 选项框,用户可以随时调用 Agent 程序。并且,对话框中还新添了一栏,可以让用户储存常用指令。
 在对话框下,Kimi 提供了不少智能 Agent 参考案例,涉及网页应用、移动应用、数据分析三大类,提供了大约 20 个案例参考。只要你选择做同款,就会呈现完整的指令集,某种程度上也算是上了 Skills 案例库。
Kimi K2.5 参考测试案例 图源|极客公园
数据分析上,我们让 AI 跑了一下英伟达财报分析。在参考页面中,我们看到的数据分析非常的详尽,但是等我们正式开始体验的时候,发现 Agent 也并不是完美。
其中,最为明显的是,在我们最开始的一版提示词有明显矛盾点的时候,AI 并不会和你确认问题的选项,而是按照自己的推测去做后续执行。这也意味着如果你特别信任 AI,完全不看后续的执行路径的话,一个指令错误可能会造成整个 Agent 程序走向完全错误。
我们在官网运行跑完整个程序,15 张 PPT 大约跑了接近 30 分钟。并且,在 Prompt 几乎没有变动的情况下,两个 Agent 给出完全不同的结论推理。
参考案例给出的推论是,「英伟达财报效应确实存在」,而我们跑出来的结果则是「财报发布并非上涨催化剂,财报交易策略无效」。
同样的 Prompt,却给出了不同的答案,或许也从一定程度说明了当下 Agent 属于能用,但不够可靠,仍需使用者拥有明辨是非的能力,同时缺乏主动意图反馈机制,容错性不足。
第二次,我们自己参考 Prompt,编写了一段提示词。
测试 Kimi K2.5 提示词 图源|极客公园
 
又等待了接近半小时后,我们看到了一个初步的网页设计界面。从页面设计来看,基本上能够满足原提示词的指令,并且符合一个科技公司常见的主页界面。
 Kimi K2.5 测试结果 图源|极客公园
但是在理解能力,还是会有一些小问题,比如说,图上的品牌宣言,一般会是被隐去而不是用直接作为标题显示。这也说明 AI 在理解和执行上还是有需要改进的地方。
也会有些令人惊喜的地方,比如在网页设计提示词上我们并没有提到相关联系方式收集等,但是 Kimi 参考了大多数的网站之后,可以直接在官网设计建联页面。
 
Kimi K2.5 测试结果 图源|极客公园
甚至在底栏的一些设计上也比较贴心,有外置链接,甚至有小红书,也是十分与时俱进了。
 Kimi K2.5 测试结果 图源|极客公园
体验完之后,能够明显感受到,当下 Agent 能力未必能够在执行上做到完美,但是能够通过指令的意图丰富整个执行细节,能够明白核心需求点是什么,给出更多的意外之喜。并且,Kimi 能够将网页链接直接部署到位,给出预览和安装包,供用户使用。
这是我们的测试结果链接:https://e56oqk3weoe7k.ok.kimi.link/#
此外,由于 Kimi Code 和 Agent Swarm 功能均需要高级会员才可以使用,因此我们很可惜暂时不能得出第一手测试结果。据了解,Kimi K2.5 的 Agent Swarm 功能采用分布式协同架构,最多可并行调度与管理 100 个子智能体。每个智能体均配备独立的工作记忆,能够自主执行任务,并遵循高效通信协议,仅在关键节点将处理结果汇总至中央调度器,从而大幅提升复杂任务的解决效率。

三、Agent 转向之年

从基于 Kimi K2.5 视觉理解的出色表现,我们可以预见多模态的 Agent 将成为 2026 年的竞争焦点,我们也嗅到了一些 2026 年模型界不一样的转向。
首先是,视觉能力的增强。无论是 Claude 还是 DeepSeek,在琢磨了一年的文本交互后,终于转向视频能力,补强此前视频分析的短板。视频理解能力超强带来的不仅是用户主动上传视频信息的分析更强,更是未来一些被动记录视频能力发挥更多的空间,会带来更多玩法。
其次,从目前通用模型生态来看,开源模型的活跃度在社区渗透和第三方集成上展现出更强能力,前有 Gemini、 Claude、GPT 对比,后有 Qwen3- max,Kimi K2.5 和 DeepSeek。Kimi K2.5 的开源虽然是在意料之外,但也算情理之中。但值得注意的是,消费者的付费意愿养成仍需依赖闭源模型的高端功能。
第三,是所有的通用大模型开始争取更好的利润,更多的付费形式。这次 Kimi Code 功能和 Agent 集群功能直接提供给高端付费用户,不开放任何试用,且 Kimi 的付费模式也开始变化,最高 199 元每月。OpenAI 要卖广告,Gemini 要上 Chrome 几乎都是一个原因,开源节流,模型公司们开始两手抓资金流向。
最后,通用模型公司们已经开始为 Agent 走入垂直场景做准备。Kimi K2.5 上线的 Agent Swarm 功能就是帮助更多企业打造垂类应用时能有模型底座支撑,方便企业能够通过不同类型的 Agent 扮演企业中的不同员工,各司其职,最终协同办公。
如果说 2025 年 DeepSeek 将模型成本降到无限低,是让人看到模型走向千行百业的关键之一。2026 年的开端,似乎预示围绕 AI 自动化的一切即将开始改变。从单个Agent,走向几个 Agent,再到一群 Agent。Kimi K2.5 的出现,代表已经有通用大模型厂商看到这一趋势,并做出改变。
目前,从 Manus 到豆包手机,再到 Clawdbot,其实从模型诞生的第一天开始,人们对 AI 自动化的探索并未停止。当模型公司、应用公司以及硬件公司都瞄准一个方向发展,或许 2026 年也将会是 Agent 逐渐成熟,落地场景的一年。
展示量: 15

官方发文规范「隐藏式门把手」;传小米今年推 NAS 产品;传游戏行业税率增加,腾讯股价一度大跌|极客早知道

世界首例,中国官方出手规范隐藏门把手

2 月 4 日消息,近日,在中国官方通过新的强制性国家标准,出于司乘安全考虑对以新能源车为主的汽车门把手做出硬性安全要求。

其中核心规定为:在中国销售的汽车必须配备机械释放门把手,确保在发生严重事故导致车辆断电后,仍能从车外和车内手动打开车门;还对车门把手的布置区域和空间等方面进行了规范。

由此,中国成为了全世界第一个出台标准,对在业内被称作「全隐蔽式车门把手」这一存在争议的设计进行限制的国家,此举也迅速引发了海外媒体的关注和报道。

据环球时报报道,截至北京时间 2 月 3 日下午,包括美国彭博社、英国 BBC 与《卫报》在内的多家外媒,都跟进了中国官方出台的这一新标准。(来源:快科技)

阿里千问发布 Qwen3-Coder-Next:低推理成本编程智能体模型

2 月 4 日消息,阿里巴巴千问宣布推出 Qwen3-Coder-Next,一款专为编码代理与本地开发打造的开放权重的语言模型。

该模型基于 Qwen3-Next-80B-A3B-Base 构建,采用混合注意力与 MoE 的新架构;通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,在显著降低推理成本的同时,获得了强大的编程与智能体能力。

Qwen3-Coder-Next 不依赖单纯的参数扩展,而是聚焦于扩展智能体训练信号。我们使用大规模的可验证编程任务与可执行环境进行训练,使模型能够直接从环境反馈中学习。训练过程包括:

  • 在以代码与智能体为中心的数据上进行持续预训练

  • 在包含高质量智能体轨迹的数据上进行监督微调

  • 领域专精的专家训练(如软件工程、QA、Web / UX 等)

  • 将专家能力蒸馏到单一、可部署的模型中

该配方强调长程推理、工具使用以及从执行失败中恢复,这些对现实世界中的编程智能体至关重要。

  • 在编程智能体基准上的表现

  • 面向智能体的基准结果

下图汇总了在多个广泛使用的编程智能体基准上的表现,包括 SWE-Bench(Verified、Multilingual、Pro)、TerminalBench 2.0 和 Aider。(来源:阿里)

 

蚂蚁数科 CEO 赵闻飙发全员信,宣布将成立「大模型技术创新部」

2 月 3 日晚间消息,新浪科技获悉,日前,蚂蚁数科 CEO 赵闻飙发布主题为《携手共进,迈向大模型新时代——关于大模型组织架构升级的通知》的全员信,宣布蚂蚁数科将成立「大模型技术创新部」,构建面向 To B 场景的基础大模型及行业模型。据了解,该团队将与蚂蚁集团相关团队协同,攻坚蚂蚁集团百灵大模型面向 To B 场景的商业化,推动全球企业更好地进入 AI 时代。

赵闻飙在内部信中表示,「过去一年,蚂蚁数科构建的智能体,已深度嵌入客户的业务流程,在真实生产环境中稳定运行,已在多家金融机构内形成标杆。这不仅验证了市场需求的真实性,更确立了我们在企业级 AI 服务赛道的位置。这些在 AI 产业实践中的突破和创新,让我们有底气、也有能力将大模型研发进一步拓展至更复杂的产业数字化领域。」

蚂蚁数科 CEO 赵闻飙拥有上海交大,美国罗格斯大学双博士学位。于 2016 年加入蚂蚁,一手构建了支付宝与蚂蚁集团的智能风控体系,在 AI 安全风控领域拥有丰富经验和技术成果。

据官方披露,2025 年以来,蚂蚁数科以「技术落地」为核心目标,推动 AI 从实验室走进真实业务场景,聚焦金融、能源、交通、制造等关键领域,其服务已覆盖 100% 的国有股份制银行、超 60% 的地方性商业银行及数百家金融机构。其研究成果集中在区块链共识协议、AI 安全、可信计算等技术领域,为企业大规模智能协作提供了全新的解题思路。(来源:新浪科技)

英特尔 CEO:内存短缺问题可能要到 2028 年才能缓解

2 月 4 日消息,如今内存涨价已经影响到很多消费电子品类,其中 PC 和手机行业遭受的冲击最大。英特尔首席执行官陈立武称,计算机行业的内存芯片短缺问题很可能会持续至少两年。

他强调:”据我所知,目前还没有任何缓解措施。”

陈立武透露,自己与两位内存领域的关键人物进行了交谈,他们表示:”要到 2028 年才能有所缓解。”

此次主要是人工智能数据中心的需求持续攀升,造成了存储芯片市场的供需失衡,也让存储芯片企业得以持续上调产品价格,这导致传统电脑和智能手机可用的芯片供应减少。

陈立武还指出,英伟达作为人工智能处理器的领先供应商,其最新的 Rubin 平台和下一代产品将进一步推高内存需求,人工智能将”消耗大量内存”。

目前联想、戴尔、惠普、华硕、宏碁等头部厂商几乎都已经对旗下笔记本电脑、商用电脑等产品涨价,甚至部分顶配机型价格上浮超 5000 元。

手机市场同样面临巨大压力,以小米 17 Ultra 为例,其起售价较上代上涨 500 元,此外还有多家厂商的定价超越老款机型。(来源:网易数码)

京东:春节 9 天将投入超 13 亿元补贴节日在岗一线员工

2 月 3 日消息,京东集团宣布,在 2026 年春节期间(共 9 天)将投入超过 13 亿元人民币,为节日在岗的一线员工提供福利补贴。

根据京东黑板报披露的信息,此次补贴覆盖快递员、全职骑手、客服人员及门店店员等员工,福利包含加班费、过大年红包和子女团聚补贴,标准超过国家法定要求。

京东表示,具体措施包括在全国范围内的快递站点、物流仓库、京东家政培训中心、京东养车、五星电器、七鲜小厨、京东大药房门店以及七鲜、华冠、佳宝超市等场所,组织送福字、包饺子、发放暖冬礼包等活动。IT 之家注意到,部分地区的「小哥之家」设施还允许员工家属前往团聚,以支持异地过年。(来源:京东)

 

游戏等行业增值税税率要提高?腾讯等股价一度大跌,专家表示没有可信度

2 月 3 日消息,网络上今日(2 月 3 日)流传一则互联网增值服务加税的传言。IT 之家注意到,受加税传闻等影响,腾讯控股等股票股价一度大跌,后跌幅缩窄。

据第一财经报道,多位资深税务专家表示,随着增值税法和实施条例从今年起施行,近期财政部、税务总局公布一系列配套法规,其中包括中国移动、中国联通等运营商互联网宽带接入服务等增值税税率从 6% 上调至 9%。这也就引起上述一些人士猜测,即腾讯等互联网企业核心业务适用的税率是不是也上调,但根据目前披露的增值税相关规定,前述税率仍维持在 6%,并没有任何变化,因此增值税「加税」是谣言。

另据新华社报道,专家表示,财税部门近期发布了多项关于增值税政策的公告,这些政策主要是为了更好落实增值税法、确保立法后的税制连贯性,其中对于游戏、金融等行业适用税率等政策都有明确的规定,增强了政策确定性和稳定性。

「实际上,增值税立法后,增值税相关行业的税率都已明确,财税部门日前发布多项公告,也没有调整游戏、金融行业增值税政策。上述传言不具备真实性。」一位业内人士表示。

这位业内人士称,网络传言中还提及游戏行业的税率要「从 6% 的档次调高至 32% 的档次」。但实际上,目前我国增值税法明确规定,增值税税率最高仅为 13%,32% 这个档次是不存在的,进一步说明传言不具备可信度。(来源:IT 之家)

微信鸿蒙版 App 朋友圈评论区照片功能小规模灰度

2 月 3 日消息,据博主 @ 熠(yì)熠玩数码今日爆料,鸿蒙微信朋友圈评论区照片功能小规模灰度中。

从截图可以看到,微信鸿蒙版的用户将可在评论朋友圈内容时,插入图片内容。

此外,微信鸿蒙版的用户还将支持朋友圈评论区发表情,这一功能目前也在灰度测试。(来源:微博)

小米 NAS 被曝今年推出,耳夹式耳机亦将在年内亮相

2 月 3 日消息,消息博主 @ 智慧皮卡丘 昨日表示,小米今年将推出一系列 IoT 新品,包括 Tag 追踪器、手表、NAS、手环、(新一代)AI 眼镜、耳夹式耳机。

@ 智慧皮卡丘 在回复中提到,小米正就 NAS 与上游存储供应链企业进行商谈;耳夹式耳机目前正在打磨阶段;同时小米还在调研 Pocket 类车载拍摄产品。

(来源:IT 之家)

鸿蒙智行问界 M6 汽车官图发布:分体式前后大灯、半隐藏式门把手,主打新锐风格

2 月 3 日消息,华为终端官方今日放出了鸿蒙智行问界 M6 汽车的宣传图。画面显示,新车采用分体式前后大灯设计、配备半隐藏式门把手,主打新锐风格。

据早些时候报道,华为常务董事兼终端 BG 董事长余承东公开了问界 M6 的实车视频。

此前援引互联网视频,问界 M6 的冬测影像已经曝光。新车设计沿用问界车型的家族风格,不过前脸未配备贯穿式日行灯。其他方面,该车车身光滑,线条圆润,车顶配备激光雷达,底部配有电动踏板,并有望配备多活塞刹车卡钳。

苹果 Mac 芯片未来有望支持「基础款 CPU + 顶配 GPU」灵活配置

2 月 3 日消息,科技媒体 Wccftech 昨日(2 月 2 日)发布博文,报道称苹果有望通过台积电的 SoIC-mH 封装技术,实现 CPU 与 GPU 的物理分离,可以根据用户需求,实现「基础款 CPU + 顶配 GPU」搭配。

新版界面移除了这些预设选项,直接将用户引导至全定制页面。现在,消费者必须从屏幕尺寸开始,逐一手动选择每一项硬件规格。

该媒体认为苹果极少无故调整功能性 UI,此次改版暗示了新一代芯片将带来前所未有的硬件定制「精细度」,可以区分选择 CPU 和 GPU。

目前的 M 系列芯片采用片上系统(SoC)设计,CPU 和 GPU 被紧密集成在同一块硅片上,导致两者的核心数必须按固定比例捆绑销售。如果用户想要最强的 GPU 图形性能,往往被迫为不需要的顶级 CPU 性能买单。

而未来苹果有望区分 CPU 和 GPU,用户可以独立选配 CPU 和 GPU 核心数,例如满足特定专业需求,可以搭配「基础款 CPU + 顶配 GPU」。

而在技术实现方面,苹果分析师郭明錤早前曾披露关键技术细节。他指出,M5 Pro 芯片将率先采用台积电最新的 SoIC-mH(集成芯片系统-水平成型)封装工艺。

该技术不仅能实现更高的组件密度和更小的封装体积,非常适合 MacBook Pro 等对空间要求严苛的便携设备,还能通过暴露的散热焊盘显著提升热传递效率,确保持续的高性能输出。

不同于传统的平面封装,SoIC 是一种 3D 封装解决方案,支持将多个芯片(Die)在垂直和水平方向上进行堆叠,最终集成为一个类似 SoC 的整体。

(来源:CnBeta)

12306 回应「用前任身份证订票再取消」从而让对方买不了票:仅针对订票账户,对乘车人并无影响

2 月 3 日消息,2 月 2 日,全国铁路春运正式启动。有网友发文调侃称,「每天都用前任的身份证去 12306 订票,但是不付款取消 3 次当天他就买不了过年回家的票了」。该帖一出,不少网友纷纷调侃,「真是一个妙招」「太绝了」。

针对上述情况,12306 官方客服回应《新快报》称:铁路售票系统存在同一用户账号每日累计取消订单达 3 次后,该账号当日购票权限将被锁定的规则,锁定状态将于次日零点自动解除。

客服人员强调,此限制措施仅针对执行取消订单操作的用户账号本身,不会影响被使用身份证信息购票的乘车人。这意味着,乘车人仍可使用本人注册的 12306 账号或其他渠道正常购票。

对于网传「用前任身份证订票再取消可限制其购票」的说法,客服表示这并不可行。此类操作实际上只能导致操作者自己的 12306 账号被锁定,无法实现限制他人购票的目的。

 

展示量: 19

Vibe Coding,正在杀死开源

作者|一涛

编辑| 靖宇

过去一年,Vibe Coding 几乎完全改写了编程的方式。

你不再需要一行一行亲自「写」代码了。只要告诉 Cursor、Claude 或 Copilot:我想要一个什么功能,用什么技术栈,最好「感觉像某个产品」,剩下的事情交给 AI 完成就可以。

很多原本写不出代码的人,也第一次具备了「做出东西」的能力。站在个人视角,这几乎是软件开发的黄金时代。

但这里有一个被忽视的前提:AI 并非凭空创造代码,而是在调用、拼接人类已有的智慧成果。当你说”帮我做个网站”时,AI 实际上在默默引用 GitHub 上无数开源项目积累的逻辑与结构。

Vibe Coding 的核心能力,正是建立在这些开源代码库的学习和重组之上。

最近,来自中欧大学和基尔世界经济研究所的研究团队发表了一篇题为《Vibe Coding Kills Open Source》(Vibe Coding 杀死开源)的论文(https://arxiv.org/pdf/2601.15494v1),揭示 Vibe Coding 繁荣背后的隐性危机。

论文指出了一个真相:

Vibe Coding , 可能正在从根本上破坏支撑整个软件世界的开源生态。

自 2022 年 8 月起,美国 Python 开发者使用 AI 编程的比例开始大幅上升

 

01

数字世界的「隐形基础设施」

 

要理解这篇论文在担心什么,首先要把一件事说清楚: 什么是开源软件,以及它在我们生活中处在什么位置。

很多人可能对于开源软件没有什么体感,但实际上,几乎所有人们每天用到的数字产品,底层都铺满了开源软件。

当你早晨醒来拿起 Android 手机,其底层运行的 Linux 操作系统,是开源软件;

当你打开微信翻看聊天记录,帮你存储每一条信息的是 SQLite 数据库,是开源软件;

当你午休时刷抖音或 B 站,在后台负责视频解码和播放的是 FFmpeg,也是开源软件。

开源软件就像是数字时代的下水道。你每天使用,却浑然不觉 。

只有当它出问题时,你才会突然意识到它的重要性。

2021 年的 Log4j 漏洞就是一个典型例子。Log4j 是 Java 生态中应用最广泛的日志框架,用于记录应用程序运行时的事件和信息。

绝大多数普通用户甚至从未听说过它的名字,但从苹果、谷歌的云端服务器,到各国政府的政务系统,全球数十亿台设备都在后台运行着它。

2021 年底,名为「Log4Shell」的漏洞爆发。这个漏洞允许黑客像操作自家电脑一样,远程控制全球的服务器。整个互联网基础设施瞬间「裸奔」,全球安全团队被迫在周末紧急抢修。其影响之广、修复之难,成为互联网历史上最严重的安全危机之一。

这就是开源的本质——它不是某个公司的产品,而是一种「公共品」。因为不具备商业属性,编写代码的维护者,往往无法直接从项目中收费。

他们的回报很间接:通过项目获得名声,换来大厂工作;通过提供咨询服务赚取收入;或者依靠社区捐赠。

这种模式运行了几十年,靠的是「直接互动」。用户使用软件时阅读文档、提交问题、点赞推荐。这些注意力流回维护者手中,转化为持续维护的动力。

而这,正是 Vibe Coding 正在切断的连接 。

 

02

AI 是如何一步步「饿死」开源的?  

Vibe Coding 出现之前的开发模式是这样的,你下载一个开源包,要去读文档;遇到 bug,去 GitHub 提交问题;觉得好用,点颗星表示支持。

维护者因此获得关注,这些关注转化为收入,形成一个闭环 。

Vibe Coding 出现之后,你只需要告诉 AI 你想要什么功能,AI 在后台自动选择和组合开源代码,生成一段「能用的实现」。

代码跑通了,但你并不知道它具体用了哪些库,更不会去看它们的文档或社区。

论文把这种变化称为一种「 中介化 」效应——原本由用户直接传递给维护者的关注和反馈,被 AI 这个中间层整体截走了。

这种机制持续下去,会发生什么?

论文作者构建了一个模拟开源生态的经济学模型。他们将开发者比作在不同质量水平上决定是否「入市」的创业者,先投入成本开发,然后根据市场反馈决定是否开源分享。用户则要在无数软件包中做选择,并决定是「直接使用」还是通过「AI 中介」。

模型跑下来,揭示了两种相反的力量。

第一种是效率提升。AI 让软件更易使用,降低了开发新工具的成本。这按理说应该刺激更多开发者进入,增加供给。

第二种是需求转移。当用户转向 AI 中介,维护者失去直接互动带来的收入,这就降低了开发者的回报。

但是放到更长期的维度来看,当第二种力量(需求转移)强于第一种(效率提升),整个系统会滑向萎缩。

具体表现为就是, 开发者进入的门槛提高,只有最高质量的项目才值得分享,中等质量的项目消失,最终市场上软件包的数量和平均质量双降 。尽管单个用户短期内享受了 AI 的便利,但长期福利反而下降,因为可选择的高质量工具变少了。

简单来说,生态陷入了恶性循环。而一旦开源生态这个基础变薄,AI 的能力也会变差。

这就是论文反复强调的一点: Vibe Coding 在短期内提高了生产力,但在长期,可能反而降低整个系统的水平 。

这种趋势并非纯理论假设,而是正在现实生活中发生。

比如,Stack Overflow 的公开问答流量,在生成式 AI 普及后出现明显下滑。很多原本会在公共社区被讨论的问题,被转移到了私有的 AI 对话中。

ChatGPT 推出后,Stack Overflow 上的问题数量开始显著下降

再比如,像 Tailwind CSS 这样的项目,下载量持续增长,但文档访问和商业收入却出现下降。

项目被大量使用,却越来越难转化为对维护者有意义的回报。

 

03

Coding 界的 Spotify,何时出现?  

尽管 Vibe Coding 存在这样的问题,但它带来的生产力提升却是真实存在的,没有人能回到 AI Coding 不存在的世界。

更本质的问题在于, 当 AI 成为新的中介,旧的激励结构已经不再适用。

在当前结构下,AI 平台从开源生态中获得了巨大价值,却并不需要为维持这个生态本身付出对应代价。用户付费给 AI,AI 提供便利,但被调用的开源项目和维护者,往往什么也得不到。

论文作者提出的设想是:

重构利益分配方式 。

就像音乐行业中,Spotify 这样的流媒体平台会根据播放情况跟音乐人分账一样, AI 平台完全可以追踪自己调用了哪些开源项目,并把一部分收入按比例返还给维护者 。

除了平台分账,通过基金会拨款、企业赞助以及政府对数字基础设施的专项资金支持,也是弥补维护者收入流失的重要手段。

这就要求行业的观念,从 将开源软件视为「免费资源」,转变为「需要长期投资和维护的公共基础设施」 。

开源软件不会消失,它已经深度嵌入数字世界,不可能被简单替代。

但那个依靠零散关注、声誉积累和理想主义支撑的开源时代,或许已经走到了边界。

Vibe Coding 带来的,不只是更快的开发体验,也是一次关于「公共技术如何被持续供养」的压力测试。

展示量: 33

电商进入「智绘」时代:邻商科技用 AI 重塑百万商家的内容生产线

义乌一个档口老板,每天要处理上百个新品上架。过去他花找模特、租影棚、等修图的时间和成本可以说是数不胜数,现在,他在电商运营后台就能一键生成一套符合平台算法偏好的主图。这种「智绘」是国内电商 SaaS 服务商邻商科技的一次关键转向。通过旗下产品「爱云画 AI」,整合阿里云云市场平台上的万相营造等专业 AI 应用,邻商科技正在将过去重型、专业的内容生产力,拆解成标准化的模块,注入海量中小商家的日常运营。

杭州的一栋独栋别墅里,邻商科技董事长杨锟的办公室洒满午后阳光。窗外是精心打理的花园,窗内,这位 INTJ 气质的技术创业者,交谈中提出了他近二十年前在国外进行人工智能研究时便埋下的理念:

「好产品,应该像打造一位永不疲倦、持续进化的超级员工。」

 

01

困局:疯狂上新与预售的背后

 

在杨锟看来,当前电商行业的核心矛盾并非流量匮乏,而是「内容过载」。简单说,就是东西太多了。

以前一个商家可能就几十个产品,现在动辄几百上千个 SKU。对手都在不停上新,你不上新,流量就没了。这就逼着所有商家卷进了两场停不下来的竞赛:卷品数(谁货多)和卷上新频率(谁更快)杨锟分析道。

「商家其实不关心是不是 AI,」杨锟一针见血,「他们只关心一个问题:我的上千个产品,能不能用最低成本、最快速度,变成能卖货的图片和视频。」一个产品需要一组图,一千个产品就需要一千组。传统靠人拍、靠人修的模式,在成本、速度、人力上全被拖垮了。商家被卡在了一个现象:想活着就要多上新,就要先解决做不过来图的问题,这是第一步,先抢流量预售出去。

所以像邻商这样的公司,就专门干这个事——把复杂的 AI 做图能力,连同其他电商工具一起打包进商家的工作台,让中小商家也能跟上这种「疯狂上新」的节奏。

这就是在帮商家解决一个最实际的问题:用得起、跟得上。

 

02

路径:不造「发动机」,做「集成方」

 

邻商科技的选择具有代表性。作为一家服务数百万电商商家的 SaaS 提供商,其核心能力在于理解电商业务流程和商家痛点。但当面对「AI 视觉生成」这个专业的技术命题时,它没有选择耗时耗力地从头研发。

「我们的优势是知道车该怎么开,路况如何。至于引擎,我们要找市面上最好的。」基于与阿里集团的长期稳定合作,他们直接在阿里云云市场上寻找协同方,很快便锁定像万相营造这样天然拥有电商行业海量实践经验的伙伴。

这个过程分为三个环节:

「选」:在探索解决方案的过程中,阿里云云市场提供了一个非常高效的筛选环境。通过云市场,我们可以从真实业务的视角出发,快速比对出不同 AI 产品在稳定性、可集成性以及场景匹配度上的表现;

「买」:通过云市场的标准化接口,接入一项专业 AI 能力变得像订阅一项服务,实现了「即接即用」;

「用」:邻商将万相营造的能力深度集成到其「AI 云画」及普云 SaaS 矩阵中。对商家而言,他们感知到的不是一个独立的 AI 工具,而是在自己熟悉的商品管理后台,新增了一个「智绘能力」。

本质上,这也是一种「专业能力的生态化」。邻商科技将前沿但分散的 AI 技术,转化为商家可用的生产力。

 

03

改变:「智绘」如何影响经营

 

这种模式带来的改变是具体的。它不仅「降本」,更在「增效」。

效率:一些商家的新品视觉素材准备时间,从天级缩短到小时甚至分钟级。这让他们能够以前所未有的速度进行新品测试和市场反馈收集,加快了迭代周期。

成本:除了显性的人力成本优化,更重要的是将原本高昂、固定的内容生产成本,转变为可按需使用、灵活伸缩的变量成本。小商家也能用得起此前只有大品牌才考虑的 3D 展示等视觉功能。

能力:商家内部的角色被重新定义。设计师从重复性的「作图工」,逐渐转向把握品牌调性、训练 AI 模型、策划视觉策略的「创意策划」。运营人员也能快速生成符合不同渠道要求的素材。

万相营造是阿里妈妈在自研以及通义系列模型基础上孵化出来的电商领域的 AIGC 创意工具。擅长电商环境的视频生成模型和电商图文海报生成,包含高倍率视频编码、视频多粒度描述、布局可控图片生成、带中文文字生成的图片生成、虚拟人物裂变等代表性技术,在模特人脸真实度和一致性保持、服饰和商品纹理保持、图文海报中准确多样整行文字生成等关键目标上表现突出。

邻商与万相营造通过阿里云云市场完成的这次合作,似乎验证了一条路径:在专业分工日益精细的今天,企业或许不必执着于在所有技术领域都成为「创造者」。更经济的做法是,成为一个精准的「识别者」和「组装者」——识别自身业务场景中的核心需求,然后在如阿里云云市场这样汇聚了各垂直领域专业能力的平台中,找到匹配的解决方案,并凭借自身对行业的理解,将其快速产品化、场景化。

对于阿里云 AI 应用及服务市场而言,其价值更像是企业级 AI Store。它降低了优质技术被发现的成本,加速了从技术到生产力的转化过程。

 

04

未来:走向「洞察与创造」

 

「未来的电商竞争,将是智能化运营体系的竞争。」杨锟判断,「谁能够更低成本、更高效率地将海量产品转化为吸引人的内容,谁就能占据主动。「智绘」便是他给百万商家提供的破局思路。

午后阳光偏移,这位研究 AI 近二十年的创业者,并未沉浸于对技术本身的迷恋。他的目光始终落在更实处——如何将前沿技术,转化为百万商家切实可用的生产力。

邻商科技与万相营造通过 阿里云 AI 应用及服务市场 完成的这次能力组装,其象征意义或许在于:最大的价值往往不再源于单一技术的突破,而是最懂场景的实践者与最懂技术的实践者,在最高效的 AI store 上,形成稳定的三角关系。

这条路没有惊涛骇浪的剧情,有的只是将复杂难题变简单的做题思路——正如打造一位优秀的员工,需要的从来不是奇迹,而是正确的理念、持续的投入和协同的环境。「智绘」时代的到来,正是由无数个这样的务实选择所推动。

展示量: 35

OpenAI 推桌面版 CodeX,多智能体并行,硬刚 Claude Code!

作者| 桦林舞王

编辑| 靖宇

Vibe Coding 无疑是现在最热的 AI 赛道,作为巨头之一的 OpenAI,近日又在这个赛道,开始了新的动作。

当地时间 2 月 2 日,OpenAI 正式推出了专为 macOS 设计的 Codex MacOS 桌面应用程序。

CodeX 这并非一个简单的聊天客户端, 而是被定位为「构建智能体的指挥中心」 。

与需要通过网页或 IDE 插件使用的过去不同,独立的 Codex 应用提供了更聚焦、更强大的功能。它支持 同时运行多个 AI 智能体并行工作 ,并通过「工作树」模式隔离不同任务产生的代码变更,让开发者可以轻松管理多个并行的开发线程。

CodeX 桌面版主界面|图片来源:OpenAI

 

Sam Altman 在公告中写道:「 这是我们内部最喜爱的产品 。上周我甚至在没打开 IDE 的情况下,仅凭 Codex 的桌面 Agent 就完成了一个完整的项目开发。」

同时,OpenAI 宣布为所有付费计划用户临时加倍速率限制,为期两个月,并且首次向 ChatGPT 免费和 Go 订阅用户开放 Codex 访问权限,展现了强烈的推广意图。

面对在 Vibe Coding 领域日益强劲 Anthropic 和 Cursor,OpenAI 的 CodeX 桌面版的体验到底如何,能否为 OpenAI 扳回一局?

 

01

走出浏览器,

CodeX 成独立生产力

 

目前,CodeX 桌面版仍然在大规模灰度测试阶段,ChatGPT Plus 及以上用户拥有优先下载权。不过,Sam Altman 宣布在发布初期的两个月内, ChatGPT 免费版用户和 Go 计划用户也可以限时试用。

在 OpenAI,这款 MacOS 独立应用程序的代号是「GPT-5.2-Codex」。根据介绍,ChatGPT 桌面端不同,OpenAI 将这款 Codex 应用定义为「AI 编程的指挥中心(Command Center for Agentic Coding)」。

OpenAI 强调,这款应用不是为了让你在里面写几行代码片段,而是为了 端到端地委派(Delegate)整项工程任务:

  • 多智能体并行(Multi-agent Parallelism): 这是最核心的卖点。官方介绍称,你可以在不同的「线程(Threads)」里开启多个 AI Agent。比如,Agent A 在帮你重构数据库,Agent B 同时在给新功能写单元测试,互不干扰。
  • 异步工作流: 官方称其为「Made for always-on background work」。你可以下达任务后直接关掉显示器去睡觉,Codex 会在后台持续运行、测试、修复,完成后将结果放入「评审队列(Review Queue)」等用户确认。

CodeX 中配备的 Skills|图片来源:ZDNET

 

OpenAI 在官网上详细拆解了应用内的三大支柱功能:

  • 工作树(Worktrees): 这是一个非常硬核的 Git 集成功能。每个 Agent 会在独立的、隔离的本地副本中工作,只有当你满意并点击合并时,它的代码才会进入你的主分支。这意味着 AI 不会因为一个幻觉就毁掉你整个本地仓库。
  • 技能系统(Skills): 用户可以为 Codex 预设「技能包」,包含特定的指令、API 脚本或工作流。例如,你可以创建一个「部署技能」,让 Codex 自动把改好的代码推送到生产环境。
  • 自动化(Automations): 支持定时任务。你可以设定它每天早上 9 点自动扫描 GitHub Issue,并尝试给出修复方案。

最重要的,和最近爆火的 Openclaw 不同,CodeX 在系统集成和安全性上,都做到了企业级别:

原生沙箱控制: 针对开发者担心的权限问题,OpenAI 介绍该应用内置了 「Sandbox Mode」 。你可以精确控制 AI 的权限,比如:它可以读哪些文件夹?是否允许它连接外网下载依赖?每次写入文件是否需要人工点击确认?

三位一体架构: OpenAI 表示,Codex 现在的布局是「三位一体」—— CLI(命令行) 、 IDE 插件 和 macOS 桌面应用 。这三个端是互通的,你在桌面应用里开始的任务,可以随时切换到 VS Code 里继续。

 

02

多线程惊艳,

但拒绝小白用户

 

OpenAI 的公告来看,CodeX 似乎已经有和现在最热的 Claude Code 掰掰手腕的意思,很多用户在体验后,确实得到了不少正面反馈。

在 Reddit 上,不少用户普遍认为, GPT-5.2-Codex 版本在「查错」和「逻辑严密性」上是目前的独一档 。有评论提到,它比之前的 5.1 版本聪明太多,尤其在处理大型工程项目时,不会像以往那样写着写着就「失忆」。

在深度体验过后,用户指出,Codex 版更注重「执行效率(Fast)」和「严谨性」,适合用来做大规模的代码重构;而普通 GPT-5.2 版则更擅长「规划(Planning)」。

用户 zproser 反馈,Codex 应用最爽的是可以同时让 3-5 个 Agent 并行工作。比如一个在写单元测试,一个在做数据库迁移,互不干扰,你在侧边栏能清晰看到每个任务的进度条。

同时,加入的 Skills 功能,让用户可以给 Codex 加装插件(类似 Playwright 或特定框架的 Skill),让它不仅会写代码,还懂特定的业务流程。

CodeX 可以知道用户在 IDE 中的工作内容,保持上下文联系|图片来源:ZDNET

 

ZDNET 资深编辑 David Gewirtz 认为这个 macOS 原生应用的杀手锏是它的「沙箱管理(Sandbox Mode)」,解决了开发者最担心的 AI 乱改本地系统权限的问题。

当然,CodeX 距离出道封神,还有很长的路要走。

在论坛评论区,有用户反映,当上下文极其庞大时,Codex 偶尔会陷入一种「自循环」。它会不断地读取文件、制定计划、推翻计划,然后重复这一过程,白白消耗大量的 Token。

另外,对于不懂程序的小白用户来说,CodeX 可能不是一个最好的选择。有用户吐槽说,如果你不是专业程序员(即所谓的 Vibe Coder),你根本驾驭不住这个应用。它不会像 ChatGPT 那样迎合你的语气,如果你给的指令不够专业,它会表现得很「死板」甚至「罢工」。

批评的声音主要集中在「工作流集成」上。许多习惯了 Cursor 的用户认为, Codex 桌面应用虽然强大,但它是一个「外挂式」工具,你需要在 Codex 和 VS Code 之间来回切换 。而 Cursor 直接长在编辑器里,那种「行间自动补全(In-line Completion)」的直觉体验目前仍优于 Codex 的应用模式。

还有,毕竟是原生应用且涉及大量的并发 Agent 计算,部分 M1/M2 基础版 Mac 用户反馈应用开启后风扇狂转,内存占用较高。

 

03

「开发入口」之战

 

从上周末开始,OpenClaw 掀起的 Agent 热潮,再次让本地开发这件事,成为 AI 巨头心上最担忧的事情。

OpenAI 此举远不止发布一个新应用那么简单, 其背后是对未来软件生产方式,以及开发者入口的激烈争夺 。

OpenAI 的首要目标,是 提升 AI 编程的体验与效能天花板 。

此前,开发者在终端、编辑器、浏览器标签页之间来回切换使用 Codex,体验割裂。独立的原生应用提供了更流畅的交互、更佳的性能管理和更丰富的专属功能(如技能包封装、自动化设置)。正如 OpenAI 联合创始人格雷格・布罗克曼所说,使用 Codex 应用后,再回到终端感觉「像回到了过去」。

这旨在建立一种新的、更高效的开发习惯,让开发者对 Codex 产生深度依赖。

另外,这也是 OpenAI 对抗竞争对手,特别是 Claude Code 的关键一击 。

Anthropic 的 Claude Code 凭借出色的代码能力和原生集成体验,赢得了大量开发者口碑。OpenAI 需要一款旗舰级产品来正面迎战。发布独立的、功能更强的桌面应用,并将速率限制翻倍,是典型的组合拳:既提升产品力,又降低使用门槛,旨在快速收复失地并扩大市场份额。

从行业层面来看,这是所有 AI 公司 从提供 API 到定义工作范式的转变 。

Codex 应用不仅仅是一个工具,它通过「工作树」、「技能」、「多智能体协作」等概念,正在定义一套基于 AI 智能体进行软件开发的新方法论。

OpenAI 希望通过推广这套方法论,成为新时代软件工程事实标准的制定者之一。让开发者习惯在这个「指挥中心」里管理 AI 智能体,其粘性将远超使用一个普通的代码补全工具。

对于开发者个体而言,价值评估标准正在悄然变化 。纯编码速度的重要性可能部分让位于「任务分解」、「智能体调度」和「提示工程」的能力。

资深工程师的优势可能不再局限于写出最精妙的算法,而在于能最有效地指挥多个 AI 智能体协同完成一个复杂系统。这并非让程序员失业,而是促使角色进化——更像一个技术总监或系统架构师,专注于高层设计、审查和集成。

Codex 桌面应用的普及,或许将加速 AI 智能体从「偶尔使用的辅助」转变为「常态化、并行化的生产力单元」。

用那句老生常谈的话说就是:未来已来,只是分布不均。

展示量: 42

文章分页

上一页 1 … 8 9 10 … 114 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间