Skip to content
  • 元宇宙社交空间入口
51蛙吖蛙元宇宙 – 3D社交空间

51蛙吖蛙元宇宙 – 3D社交空间

51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

Seedance 2.0 炸场之后,豆包 Seed2.0 能否再度勇攀高峰?

最近一段时间,Seedance 2.0 几乎成为 AI 视频圈绕不开的名字。

从游戏制作人冯骥的赞叹到美国导演的青睐,中国 AI 视频模型首次在全球范围内实现「物理规律遵循」的断层式领先。

不过,视频生成的爆火只是字节 AI 冰山露出海面的一角。更深层的变革发生在 2 月 14 日——豆包大模型 2.0 的跨代升级,标志着字节正式进入「原生多模态 Agent」时代。

这种升级的核心逻辑,在于字节跳动通过底层能力的全面重构,让 AI 真正实现了从「信息分发」到「任务处理」。不同于部署门槛较高的开源项目,豆包 2.0 将多模态理解、思考长度可调节的逻辑推理以及极其稳定的工具调用能力内化为模型本能。

在字节跳动 CEO 梁汝波提出的「勇攀高峰」年度关键词下,豆包大模型 2.0 正在围绕大规模生产环境的用户体验进行优化,发力成为说一句话就能解决用户问题的端到端 Agent。

提升性能的同时,豆包 2.0 在定价上也颇有性价比——豆包 2.0 Pro(32k)输入仅需 3.2 元/百万 tokens,成本优势远超 GPT 5.2 与 Gemini 3 Pro;而性能反超上代主力的 Lite 版更是将单价压低至 0.6 元。

 

01

 

豆包 2.0 的「大脑」升级了什么?

真正决定豆包 2.0 能否承载 Agent 场景的,仍然是底层能力本身。

首先是逻辑推理能力的显著提升。在推理与数学等核心评测维度上,豆包 2.0 已经进入与 Gemini 3 Pro 同一梯队的区间。但比榜单更重要的是,它在真实任务中的表现更加稳定:能够完成复杂任务的结构化拆解,建立因果链条,进行多步规划,并在最终输出前进行结果校验。

 

 

图片来源:字节跳动 Seed

这种能力对 Agent 的意义非常直接。Agent 的本质是「流程更可靠」。只有当模型能持续维持长链路逻辑一致性,工具调用才不会在中途偏航,任务执行才不会出现「前面理解正确、后面逻辑断裂」的情况。换句话说,推理能力的提升,实际上是在为完整任务执行提供一条稳定的骨架。

推理决定了 Agent 的「思考深度」,多模态能力的升级,则决定了它能看见多大的世界。

在豆包 2.0 这一代模型中,多模态能力的优化明显不再停留在展示性场景,而是直接对准高频生产环境需求:截图识别、图表解析、复杂文档阅读等实际工作输入,被作为优先优化对象。这背后的逻辑很现实——企业真实流程里的信息,大量存在于截图、PDF、流程图、设备图纸、报表等非结构化视觉内容中。模型如果无法可靠理解这些输入,就谈不上真正进入生产环节。

在基础识别能力之外,豆包 2.0 在空间理解与运动理解上的提升,也在扩大 Agent 的感知边界。模型不仅能识别图像中「有什么」,还更容易判断「它们之间如何关联、如何运动、如何作用」。

豆包 2.0 的升级是在尝试让模型具备更接近真实世界的输入理解能力。推理能力提供决策结构,多模态感知提供现实世界的上下文,两者叠加,才让 Agent 不再只是处理文本任务,而是能够进入更复杂的生产场景。

当模型既能稳定思考,又能真实感知时,所谓「端到端执行」才真正有了可落地的基础。

 

 

02

重塑 Agent

推理能力与多模态感知决定了模型能看多远、想多深,那么真正决定它能否进入企业流程的,是能不能稳定完成一整条任务链。

豆包 2.0 的变化正在这里。

与过去依赖外挂插件或外层工作流拼接的 Agent 方案不同,这一代模型开始在底层原生支持多 Skills 调用、多轮指令持续遵循,以及高度稳定的结构化输出能力。换句话说,工具调用、搜索、格式控制不再是额外补丁,而成为模型推理过程的一部分。

这种差异在长程任务中尤为明显。真实企业流程往往不是一次问答,而是一串连续动作:理解需求、拆解步骤、查询外部信息、调用工具处理数据、生成中间结果、再汇总输出。过去的模型即使单步能力很强,也容易在多轮执行中出现上下文断裂、目标漂移,或在最后输出阶段格式失控。

豆包 2.0 的改进,本质上是在尝试把这条链路变得更可控。其中容易被低估的一点,是「格式输出稳定性」。

在消费级场景里,格式波动只是体验问题;但在企业场景里,格式稳定往往直接决定流程能否自动化衔接。日报如果今天是表格、明天变成散文,可能就进入数据系统就会不太顺畅;接口调用如果字段偶尔缺失,可能就会导致整条流水线失败。因此,稳定输出并不是美观问题,而是生产可用性的前提。

在 Function Call、搜索工具调用与多轮指令遵循能力的增强之外,豆包 2.0 还通过更灵活的上下文管理机制,缓解了模型在复杂任务中的「断片」问题。模型能够在更长的执行周期里保持目标一致性,理解当前步骤在整体流程中的位置,从而减少中途逻辑跑偏或重复执行的情况。这种持续状态感,才是 Agent 真正需要的能力。

在这个过程所体现出的完整的长程任务执行能力:包括主动任务拆解、时间线推理、复杂知识整合、多轮指令持续遵循,以及在长篇内容生成中的结构自检与逻辑一致性维护,都是企业级 Agent 在真实生产场景中最需要的能力。

 

03

字节的「飞轮」与「野心」

不只在模型能力与应用形态,字节跳动真正试图拉开差距的,反而是在更底层、更长期的 AI 云市场。

火山引擎正在承担一个更关键的角色:把模型能力变成可规模化交付的生产基础设施。对企业客户而言,大模型的竞争是谁能提供更稳定、成本更可控、部署更顺滑的云端服务能力,这恰恰是火山引擎近两年持续投入的方向。

从市场结构看,字节跳动在 AI 云上的优势,是 AI 原生业务带来的真实生产流量。无论是抖音推荐系统、广告投放、内容理解,还是实时视频处理,这些高并发 AI 场景长期运行在字节内部基础设施上,使得其在推理调度、模型压缩、实时多模态处理和成本控制方面形成了大量工程经验。火山引擎把这些原本服务内部业务的能力产品化后,天然更接近企业真实生产环境,而不是实验室式的模型服务。

这种路径也让火山引擎在企业侧的落地速度更快。对于客户来说,选择 AI 云其实是在选择一整套从算力、模型、数据处理到业务工具的组合方案。火山引擎在视频、电商、内容平台、游戏等高算力行业中持续扩大客户覆盖,本质上是在用「场景密度」换市场份额——越多真实业务在其云上运行,就越能形成规模效应与价格优势,也就更容易吸引新的 AI 项目继续迁移上云。

 

图片来源:视觉中国

 

这也解释了为什么在豆包大模型 2.0 发布的同时,会反复强调 API 服务、生产环境适配与价格区间。据悉,豆包 2.0 Pro 按「输入长度」区间定价,豆包 2.0 Pro(32k)输入仅需 3.2 元/百万 tokens,成本远低于 GPT 5.2 和 Gemini 3 Pro;而豆包 2.0 Lite 更是将单价压至 0.6 元,在保持低价的同时,综合性能已全面超越上一代主力模型 1.8。

模型只是入口,真正决定企业是否长期使用的,是云平台能否持续提供稳定推理成本与弹性扩展能力。当模型进入大规模调用阶段,云的市场份额就不再只是基础设施之争,而成为 AI 商业化能力的直接体现。

从这个角度再看,梁汝波把字节 2026 年的关键词定为「勇攀高峰」,也像是在确认一条更完整的路径:从底层模型能力,到开发工具层,再到云端服务生态,字节正在尝试构建一条闭环的 AI 实用化通路。而火山引擎所争夺的市场份额,正是这条通路能否真正形成产业壁垒的关键节点。

如果说模型决定了技术高度,那么云的市场占位,才决定了这套能力最终能覆盖多少真实世界。

 

*头图来源:豆包 AI 生成

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

展示量: 3

华为 2025 年收入超 8800 亿;雷军:小米未来 5 年攻坚 AI、芯片;大疆起诉美国 FCC

用插件「杀死」软件?!Anthropic 更新 Claude Cowork 插件系统

2 月 24 日,Anthropic 更新了 Claude Cowork 插件系统,用户可以从零开始定制化打造 AI 插件,将 Claude 能力直接以工具包的方式融入工作流中,打开整个企业级定制化插件市场。

不仅如此,Anthropic 还同步配置了插件创造、使用以及管理的工具平台。Claude 会通过提问,引导用户定制技能、设置相关命令并接入 MCP 协议。所有新增的插件功能都可在新增的自定义菜单中查看、管理。团队和企业管理员还可以直接访问公司配置的插件以及 MCP 控制功能。

目前,Claude 可以接入企业已使用的工具,例如 Slack、Salesforce 和 Excel,Claude 的插件可以在 Cowork 以及任何基于 Claude Agent SDK 构建的系统中运行。所有插件的用户体验更新均面向所有 Cowork 用户开放。

这次,Anthropic 还一口气推出 10 个横跨 HR、运营、设计等领域的官方插件,它不仅是示范 AI 插件玩法,更是在设定标准、圈定企业级 AI 应用的边界。

苹果宣布 Mac mini 首度实现美国本土化生产,今年将采购超 1 亿片台积电美国造的芯片

2 月 24 日消息,苹果公司宣布,将大幅扩建其在休斯顿的工厂运营,首次将 Mac mini 带到美国本土进行生产。

除此之外,该公司还将在此工厂内扩大先进 AI 服务器的制造能力,并于今年晚些时候在其新建的先进制造中心开始提供实践培训。苹果承诺将在休斯顿创造数千个就业岗位。

「苹果公司深深致力于美国制造业的未来,我们很自豪能大幅扩展在休斯顿的业务,从今年晚些时候开始生产 Mac mini,」苹果 CEO 蒂姆 · 库克表示,「我们已提前在休斯顿开始发运先进 AI 服务器,并且我们很高兴能进一步加速这项工作。」(来源:IT 之家)

 

AMD 与 Meta 达成第二份超大型芯片供应协议

AMD 周二表示,它已同意在五年内向 Meta 出售价值高达 600 亿美元的人工智能芯片,这项交易允许 Facebook 所有者购买这家芯片公司多达 10% 的股份。

该公司去年与 OpenAI 签订了类似协议,被誉为对其芯片和软件投下的信任票,从而大幅提振了股价。

最近的一系列芯片供应协议凸显了人工智能行业对处理器的巨大需求。Meta 公司已分别与 AMD 更大的竞争对手 Nvidia 达成一项协议,购买数百万个人工智能芯片。

在循环交易日益受到关注的背景下,双方的合作凸显了人工智能行业一些顶级企业之间日益加深的联系。Meta 和 OpenAI 将拥有其最重要的供应商之一的股份,而此时竞争对手芯片制造商 Nvidia 正盯着包括 ChatGPT 母公司在内的一些最大客户的投资。(来源:环球市场播报)

 

大疆起诉美国联邦通信委员会(FCC)

2 月 24 日消息,美国东部时间 2026 年 2 月 20 日,大疆创新正式向美国第九巡回上诉法院提起上诉,挑战美国联邦通信委员会(FCC)2025 年 12 月 23 日将大疆及产品列入「受管制清单」的不当决定。大疆创新方面 24 日表示,此举旨在维护大疆创新的合法权益、保护依赖大疆产品却受到禁令影响的美国消费者及广大农业行业用户利益。

大疆在诉状中表示,FCC 的这一决定存在严重的程序瑕疵和实质缺陷。FCC 在未能提供任何实质证据证明大疆产品对美国国家安全构成威胁的情况下,即将其列入「受管制清单」,此举不仅违背正当程序原则,更涉嫌违反美国宪法及联邦相关法律。

据路透社此前报道,FCC 曾于当地时间 2025 年 12 月 22 日表示,已将大疆以及所有外国制造的无人机及其零部件列入一份被认定「对美国国家安全构成不可接受风险」的企业清单,并将禁止批准新的无人机型号对美国进口或销售。

根据美国《安全可信通信网络法案》以及 2022 年 11 月 25 日 FCC 发布的关于该法案的新规,被列入上述清单的外国无人机企业,将无法获得 FCC 的批准,在美国销售新的无人机型号。而获取 FCC 的授权证书是通信产品或服务进入美国市场的必要条件。(来源:环球时报)

华为 2025 年成绩单曝光!销售收入超 8800 亿元

2 月 24 日上午,华为技术有限公司董事长梁华在 2026 广东省高质量发展大会上发表讲话时透露,2025 年华为公司销售收入超过 8800 亿元人民币。梁华表示,2025 年,公司持续做强核心竞争力,战略聚焦;坚持走高质量发展道路,以质取胜;努力为全球客户提供有竞争力的产品和服务,公司整体经营稳健。

对比来看,2024 年,华为实现销售收入 8621 亿元人民币,净利润 626 亿元,2024 年研发投入达 1797 亿元,约占收入的 20.8%,近 10 年华为累计投入的研发费用超过 12490 亿元。由此可见,2025 年华为销售收入相较 2024 年微增。(来源:证券时报)

 

雷军:未来五年小米将重点攻坚芯片、AI、操作系统等底层核心技术

2 月 24 日,小米集团董事长兼 CEO 雷军表示,小米计划未来五年重点攻坚芯片、AI、操作系统等底层核心技术,向着成为全球硬核科技公司的目标不断努力。(来源:北京日报)

 

京东刘强东要造游艇,宣布投资 50 亿在广州创立 Sea Expandary 品牌

2 月 24 日消息,京东集团创始人、董事局主席刘强东宣布创立独立游艇品牌 Sea Expandary 进军该行业,并计划在广东投资 50 亿元人民币从研发、制造、销售、运营、租赁、经纪、服务等全产业链布局游艇产业。

「这样才能够去跟欧美全球顶级的游艇制造公司竞争。」刘强东指出,他的精力依然放在京东集团,要造百分百新能源游艇。

刘强东表示,正如 40 年前普通人很难买得起汽车,游艇产业未来也将实现大众化普及,他期待未来能推出 10 万元级、空间充足的亲民游艇,让工薪阶层也能享受游艇生活,「让游艇像汽车一样进入千家万户」。

刘强东表示,此次投资为个人行为,他不会直接参与品牌运营管理,同时表达了未来推出 10 万元级别游艇的愿景,以使普通工薪阶层也能负担得起游艇生活。(来源:时代财经)

PGYTECH 预热 RetroVa 手机摄影套装下月国内上市:含 235mm 长焦镜头、拍照手柄、配套胶片滤镜 App

2 月 24 日消息,PGYTECH 宣布旗下 RetroVa 复古影像手机摄影套装将于 3 月(下月)在国内上市,该套装专为苹果 iPhone 16 Pro / 17 Pro 设计,包含长焦镜头、拍照手柄、配套 App,号称「从外到内还原经典相机美学」。

据官方介绍,其中长焦镜头等效 235mm,使用「13 片 / 3 组光学模组」组合,解像力≥200 lp / mm、畸变率≤2%,配有多层纳米镀膜,反射率小于 0.5%。

在拍照手柄方面,其提供了实体快门按键、变焦拨杆、自定义拨轮及快捷按键,同时内置了 microSD 存储卡槽,支持为手机扩容,用户可结合 PGYTECH App 拍照应用使用。(来源:IT 之家)

 

宇树科技发布新一代四足机器人,续航可达 4 小时

2 月 24 日,宇树科技发布新一代四足机器人 Unitree As2,该产品搭载仿生具身大模型,并开放二次开发生态。

这款定位为「行业应用」的新品,以小巧身躯融合高爆发性能,旨在为专业领域提供更灵活的智能化解决方案。具体来看,Unitree As2 动力性能约为 Go2 的两倍,具备 90N·m 峰值扭矩,极限速度可达 5m/s,即使在复杂地形和恶劣环境下也能稳定行走;空载续航时间超过 4 小时,具备 IP54 级防雨水能力,在负载 15kg 的情况下仍可连续行走超 13 公里。

去年 9 月 2 日,宇树科技曾在社交媒体上披露旗下产品的营收结构。2024 年,宇树科技四足机器人、人形机器人及零部件产品的收入占比分别为 65%、30% 和 5%。其中,约 80% 的四足机器人应用于研究、教育及消费领域,其余 20% 用于检测和消防等工业场景。人形机器人的应用则完全聚焦于研究、教育和消费领域。(来源:红星新闻)

腾讯、快手、百度、小米等多家大厂发 2026 年开工红包,最高 2026 元

2 月 24 日消息,腾讯发布开工红包,每人 400 元,还有 19.98 元 ~66.66 元随机「加油包」。领取范围为合同地为中国内地的腾讯集团本部正式员工、毕业生、实习生和长期顾问。

快手给全员发开工红包,正式员工 366 元,实习生 200 元。

百度创始人李彦宏的数字人,通过工作软件「如流」的服务号,向全体员工发送定制祝福及开工红包,实习生同学也有份。

据报道,百度这次发放开工红包的金额,在 365 元、588 元、666 元、888 元、2026 元不等,员工最高可以获得 2026 元的超大额开工红包,实习生则可获得 188 元的开工红包。百度此次开工红包金额跟在职年限无关,而是系统随机分配。

此外,小米创办人,董事长兼 CEO 雷军今日发文,和高管团队一起,给小米同学们发开工红包。(来源:IT 之家)

展示量: 20

人权高专办呼吁减少儿童拘留 强化以儿童为中心的司法体系

联合国人权事务副高级专员纳西弗在第六十一届联合国人权理事会会议上指出,儿童不应身陷囹圄,而应在校园、家庭和安全友善的社区中成长。她强调,刑事司法系统中的儿童数量越少,他们遭受暴力、创伤及终身伤害的风险就越低。
联合国人权事务副高级专员纳西弗在第六十一届联合国人权理事会会议上指出,儿童不应身陷囹圄,而应在校园、家庭和安全友善的社区中成长。她强调,刑事司法系统中的儿童数量越少,他们遭受暴力、创伤及终身伤害的风险就越低。
展示量: 3

副人权高专:全面落实《德班宣言》承诺 消除种族主义需要坚定行动

在周二纪念《德班宣言和行动纲领》通过二十五周年高级别小组讨论会上,联合国人权事务副高级专员娜达·纳西弗表示,《德班宣言》是种族正义与平等的蓝图,各国必须履行所作承诺。
在周二纪念《德班宣言和行动纲领》通过二十五周年高级别小组讨论会上,联合国人权事务副高级专员娜达·纳西弗表示,《德班宣言》是种族正义与平等的蓝图,各国必须履行所作承诺。
展示量: 4

古特雷斯:乌克兰战争是“集体良知上的污点” 呼吁立即实现全面无条件停火

联合国秘书长古特雷斯周二在安理会就乌克兰问题举行的部长级会议上发表讲话指出,俄罗斯全面入侵乌克兰四年后,这场战争依然是“我们集体良知上的污点”。他表示,这一公然违反国际法和《联合国宪章》的行径,持续引发连锁后果,生命受到摧残,社区遭到摧毁,地区与全球动荡愈演愈烈。
联合国秘书长古特雷斯周二在安理会就乌克兰问题举行的部长级会议上发表讲话指出,俄罗斯全面入侵乌克兰四年后,这场战争依然是“我们集体良知上的污点”。他表示,这一公然违反国际法和《联合国宪章》的行径,持续引发连锁后果,生命受到摧残,社区遭到摧毁,地区与全球动荡愈演愈烈。
展示量: 0

难民署呼吁紧急拨款 支持在布隆迪的难民保护计划

难民署周二在日内瓦呼吁紧急拨款,以扩大在布隆迪的援助规模。该机构警告称,过去三个月内,布隆迪收容了逾9万名逃离刚果民主共和国冲突的难民,人道主义压力持续加剧。
难民署周二在日内瓦呼吁紧急拨款,以扩大在布隆迪的援助规模。该机构警告称,过去三个月内,布隆迪收容了逾9万名逃离刚果民主共和国冲突的难民,人道主义压力持续加剧。
展示量: 2

联大通过《支持乌克兰持久和平》决议 美国投弃权票

联合国大会周二就乌克兰问题召开紧急特别会议续会,通过了题为《支持乌克兰持久和平》的决议。此前美国提出程序性异议,要求对重申乌克兰主权及呼吁依据国际法实现全面和平的关键段落进行单独表决。
联合国大会周二就乌克兰问题召开紧急特别会议续会,通过了题为《支持乌克兰持久和平》的决议。此前美国提出程序性异议,要求对重申乌克兰主权及呼吁依据国际法实现全面和平的关键段落进行单独表决。
展示量: 1

最新评估报告:索马里650万人面临高度急性粮食不安全

全球粮食安全监测机制“粮食安全阶段综合分类”最新评估显示,自2025年初以来,索马里面临急性粮食不安全第3级危机及以上更严重阶段的人口数量在2026年2月至3月间几乎翻倍,达到650万人,其中超过200万人处于第4级紧急状态阶段。
全球粮食安全监测机制“粮食安全阶段综合分类”最新评估显示,自2025年初以来,索马里面临急性粮食不安全第3级危机及以上更严重阶段的人口数量在2026年2月至3月间几乎翻倍,达到650万人,其中超过200万人处于第4级紧急状态阶段。
展示量: 5

千问 3.5,用第一性原理打破大模型的不可能三角

作者| Cynthia

编辑| 郑玄

 

大模型行业走到 2026 年,所有人都陷入了集体焦虑。

Scaling Law 的红利彻底见顶,万亿参数模型继续向上的边际收益无限趋近于零,行业陷入了参数越卷越高,落地越来越难的死循环;

闭源巨头牢牢把持着性能天花板,GPT、Claude 的 API 定价一涨再涨,顶级模型的使用成本,成了中小企业和开发者迈不过去的门槛。

开源模型始终跳不出性能追平闭源,就闭源收割;想要极致性价比,就要牺牲性能的怪圈。

久而久之,行业形成了一条无人敢质疑的铁律: 顶级性能、完全开源、极致性价比,构成了大模型的不可能三角,三者最多选其二 。

于是,一到年底,国内外的万亿参数模型就一个接一个发布,但普通企业是否用得上所谓的 SOTA 模型,却不在考虑范围。半年多时间,GPT、Claude 的定价也一涨再涨,哪怕作为顶级牛马的程序员,也需要公司报销,才用得起顶配 200 美金一月的 cursor 与 claude code。

直到,除夕当天阿里千问 Qwen3.5 的发布。

千问 3.5 总参数量仅 3970 亿,激活参数更是只有 170 亿,不到上一代万亿参数模型 Qwen3-Max 的四分之一,性能大幅提升、还顺带实现了原生多模态能力的代际跃迁。

而横向对比同行,千问 3.5 不仅是当下的开源大模型 SOTA,同时也在认知能力、指令遵循、通用 Agent 评测等方面超越了 GPT5.2、Claude 4.5、Gemini-3-Pro 等同期闭源模型。

但成本上,千问 3.5 也做到了每百万 Token 输入低至 0.8 元,是 GPT5.2 的 1/15、Gemini-3-pro 的 1/18。

那么,千问究竟如何做到的?答案藏在大模型的第一性原理中。

 

01

回到第一性原理,

千问 3.5 如何打破不可能三角?

 

大模型的第一性原理是什么?

过去三年,答案或许是 Scaling Law。包括上一代 Qwen3-Max,也是阿里是用 36T tokens 的海量预训练数据训练出的暴力美学的成果。

但时至今日,Scaling Law 攀升的代价,已经到了行业难以承受的临界点。紧随其后,架构创新成为新的行业关键词。

剥掉所有参数、算力、跑分的外衣,所有大模型的底层核心,都是 Transformer 架构的 attention 注意力 + FFN 前馈网络 双塔结构:前者决定了模型的理解能力,后者决定了模型的表达能力。而这两者,也是当前技术红利最集中的突破点。

先看决定理解能力的 attention 层。

一直以来,大模型长上下文落地的最大瓶颈,从来不是窗口能开多大,而是算力成本和性能的平衡。

传统 Transformer 的全局注意力机制,计算复杂度与上下文长度呈 O (N²) 关系。 翻译过来就是,上下文长度翻 10 倍,算力需求就要翻 100 倍。这就是为什么行业里很多模型号称能支持百万 token 上下文,却根本不敢开放商用:成本高到用户用不起,强行降价就要亏到吐血。

为了解决这个问题,行业做了无数尝试:线性注意力把复杂度降到了 O (N),却损失了长文本的推理精度;稀疏注意力只计算部分 token 的注意力,却无法解决全局语义依赖的问题,泛化能力大幅缩水。

而 千问 3.5 的解法,更像是人类思维模式在大模型上的迁移:既然人对不同事情可以有精力分配的不同,那么对大模型来说, 也不是所有 token,都配得上同等的全局注意力。

基于这个最朴素的原理,千问团队打造了 全局注意力 + 线性注意力的混合架构 :

对非关键的冗余信息,采用线性注意力处理,把计算复杂度从 O (N²) 直接砍到 O (N),算力消耗呈指数级下降;

对核心语义、关键逻辑信息,保留标准全局注意力,保证模型的长文本依赖建模能力,推理精度几乎零损失。

这一改动,使得大模型在大幅减少算力消耗的同时,提升了输出的效率,并带来上下文窗口的大幅增加——千问 3.5 的上下文长度已经达到 1M token。约等于把刘慈欣的三体三部曲一起塞给模型,或者在每轮对话 500 字上下的基础上,支持 600~800 轮连续对话不遗忘。

如果说混合注意力解决了理解效率的问题,那么极致稀疏 MoE 架构,就解决了表达成本的痛点。

传统稠密大模型,架构出场天生就带着极致的浪费:不管你输入的是一句早上好,还是一篇十万字的行业报告,模型每次推理都要激活全部参数。

这就意味着,90% 以上的算力,都被白白浪费了。

MoE 混合专家架构的出现,就是把模型拆成多个专家子网络,内容进来,只激活最对口的那几个专家模型,不用全量参数跑一遍。

但行业里绝大多数的 MoE 模型,都陷入了两个死穴:要么专家路由效率低下,激活参数占比过高,成本下降有限;要么专家之间的协同能力不足,模型性能出现滑坡。

而 千问 3.5 的极致稀疏 MoE 架构,直接把这个路线的潜力榨到了极致: 总参数量 3970 亿,单次推理的激活参数仅 170 亿,不到总参数的 5% ,即可调动全部知识储备,顺便实现部署成本大降 60%,最大推理吞吐量可提升至 19 倍,

到这里,可能又有很多人会问, 同样是混合注意力、MoE 架构,为什么只有千问能做到这个程度 ?

答案是,架构创新的潜力,必须靠全栈协同才能彻底释放。阿里独有的阿里云、平头哥自研芯片与千问模型全栈协同能力,是其他厂商根本无法复刻的核心壁垒。

其中,阿里云的 AI 基础设施,为 文本 + 视觉混合预训练数据,提供了稳定、高效的算力支撑,让大规模的架构创新实验得以落地。

平头哥真武 810 芯片,针对 MoE 架构、混合注意力机制做了专项优化,能充分发挥集群算力效率,进一步把模型训练和推理的效率拉到极致。

千问团队的模型架构创新,又反过来给云基础设施、芯片的优化指明了方向,形成了正向循环的闭环。

也正是这套闭环,让千问 3.5 的价格能进一步探底,把 API 成本压到 0.8 元/百万 Token,彻底打破了国外模型的价格垄断,让 sota 模型成为人人可用,阿里云上用的成本还能更低的普惠存在, 也让不可能三角成为可能。

 

02

千问 3.5,全民友好型模型如何练成的?

 

很多人会问:千问 3.5 把成本打下来,是不是就会牺牲了推理性能?

恰恰相反,千问 3.5 最亮眼的地方就在于,它实现极致性价比的同时,也把性能和体验,拉到了行业的新高度。

对普通用户来说,最直观的体验升级,就是即使用 sota 模型,也能享受流畅的生成体验。

过去,为了给模型生成提速,大部分团队都是在推理阶段加个投机采样的补丁,先猜后面的内容,猜对了就快一点,猜错了就回滚,结果就是要么快但容易错,要么准但还是慢。

而千问 3.5 的解法,是从训练阶段就 原生支持多 Token 联合预测 ,让模型从一个字一个字地想,进化成一次想好几步再说。这个过程类似于人类说话,先想好完整的语义,然后在表达的过程中组织连贯的语言。

这对长文本生成、代码补全、多轮对话等高频场景带来的是质变的体验升级:问一个复杂的科普问题,10 秒内就能给出连贯的回答;写一篇千字短文,几秒就能生成初稿。

另一个被彻底解决的痛点,是大模型的上下文腐烂问题。

过去,大模型输入上下文越长,就会让模型的注意力越分散,有效信息被无效噪声淹没,输出质量直线下降。一个完整的长内容,模型往往只会注意到开头和结尾的内容,中间的关键信息被忽略,或者多轮对话之后,它会忘记你最初的问题或者要求。

针对这个痛点,Qwen3.5 对模型做了系统级的训练稳定性优化,其中最核心的,就是阿里千问团队斩获 NeurIPS 2025 最佳论文奖的注意力门控机制。

这个机制,本质上是在注意力层的输出端,加了一个智能降噪开关:它能根据信息的重要程度,智能调控信息的传递,有效信息被放大,无效信息被过滤。

最终的结果是,哪怕是在 1M token 的超长上下文下,模型依然能精准记住所有的关键信息,开发者不用再把长文档拆成十几段反复投喂,用户不用再把需求翻来覆去重复三遍,百万级上下文的全量信息精准调用,终于成为了现实。

除了这些核心痛点的解决,千问 3.5 的细节升级,覆盖了从个人用户到企业开发者的全维度需求。

比如,它首次把支持的语言扩展到了 201 种,预训练数据里大幅新增了中英文、多语言、STEM 和推理类数据,不管是小语种的精准翻译,还是复杂的数理化博士级难题,都能轻松应对。

测试案例:STEM 表现

在 Agent 能力上,千问 3.5 同样实现了生产级的跨越式提升。目前,千问 3.5 在移动端已经与多个主流 APP 与指令打通,PC 端则能处理跨应用数据整理、自动化流程执行等复杂多步骤操作。

更关键的是,千问团队构建了可扩展的 Agent 异步强化学习框架,端到端速度可加速 3 到 5 倍,并将基于插件的智能体支持扩展至百万级规模,为后续 Agent 的规模化落地打下了基础。

如果说其他模型,还停留在开发者友好型,那么千问 3.5,就是全民友好型。它既照顾了开发者对成本、效率的需求,也兼顾了普通用户对体验的期待,让大模型真正走进了日常生活,而不是停留在实验室里的黑科技。

 

03

原生多模态,

千问 3.5 开始能读懂复杂世界

 

如果说性能、成本、体验的全面升级,是千问 3.5 在解决当下大模型落地过程中的困境,那么统一多模态,就是 千问 3.5 把大模型推向 AGI 的重要一步探索。

长期以来,业界都有一个共识:统一多模态,是通往通用人工智能(AGI)的必经之路。但直到今天,行业里绝大多数的多模态模型,都还是伪多模态:先训好一个纯语言大模型,再外挂一个视觉编码器,靠适配层把两个模块粘在一起,本质上就是两个语言不通的人靠翻译聊天,信息传递必然出现折损。

千问 3.5 的不同之处在于,从预训练第一天起,就是在文本+视觉混合数据上联合学习,让视觉与语言在统一的参数空间内深度融合。

简单说,它看到一张图,就能自然理解图中的语义,不用先把图像转换成文本再进行理解;读到一段文字,就能在脑中构建出对应的画面,就像人一样,真正具备了跨模态的直觉理解力。

测试案例:输入一张电影截图,千问 3.5 就能生成图文并茂的电影解析

为了实现这种原生的多模态融合,千问 3.5 对整个训练架构都做了革新:它让视觉和语言模态,各走各的最优路径,只在关键节点上高效汇合,既保证了两个模态各自的性能上限,又实现了真正的协同工作,大幅提升了多模态混合训练的效率。

这种原生融合的架构,带来的是视觉能力的飞跃式提升 :在多模态推理(MathVison)、通用视觉问答 VQA(RealWorldQA)、文本识别和文件理解(CC_OCR)、空间智能(RefCOCO-avg)、视频理解(MLVU)等众多权威评测中,Qwen3.5 均斩获最佳性能,碾压同类开源模型,甚至比肩顶级闭源模型。

测试案例:通用视觉问答

还有一个容易被忽略,却至关重要的细节优化,是精度策略的设计:千问 3.5 采用了 FP8/FP32 的精度策略,在保证模型性能零损失的前提下,把激活内存减少了约 50%,训练速度提升了 10%。更关键的是,这套方案被统一部署到了强化学习训练和推理的全流程里,全面降低了多模态模型扩展的成本和复杂度。

这些性能提升,最终都转化成了实实在在的生产力:

在学科解题、空间推理上,它比千问此前的专项多模态模型 Qwen3-VL 表现还要更优,空间定位、带图推理的精度大幅提升。

在视频理解上,它支持长达 2 小时的视频直接输入,刚好对应 1M token 的上下文窗口,会议录像、课程视频、直播素材,一次性投喂就能完成核心内容提取、脚本生成、待办梳理。

通过视觉与代码的原生融合,手绘的 APP 界面草图,也能直接转化为可运行的前端代码;机械图纸、建筑结构图、几何题目,全都能精准拆解空间关系、完成推理计算。

测试案例:复杂网页生成

而这,也是让大模型从能聊天的工具,变成看懂现实世界的基座,最终通往 AGI 乃至 ASI 的关键一步。

 

04

尾声

 

如果说架构与多模态的创新,让 千问 3.5 打破了不可能三角的技术枷锁,那么开源生态,让千问 3.5 彻底颠覆了行业对开源模型的固有偏见。

在此之前,开源模型在行业里的定位,永远是闭源模型的替代品:性能追不上闭源,体验打不过闭源,只能作为开发者的练手工具,无法进入核心生产环境。

现在千问 3.5 的问世,彻底打破了这种偏见——它用开源的身份,实现了超越同级闭源模型的性能,再加上极致的性价比和完善的生态支持,让开源、高性价比、最强的不可能三角成为可能。

一组可验证的数据,足以证明千问开源生态的行业影响力:截至目前,阿里已开源 400 余个千问模型,覆盖全尺寸、全模态、全场景,全球下载量突破 10 亿次;全球开发者基于千问开发的衍生模型超 20 万个。

而站在千问生态的肩膀上,中小企业不用再为顶级模型的 API 支付高昂的费用,用极低的成本就能落地自己的 AI 应用;

个人开发者不用再被闭源模型的商用权限锁死,基于开源的千问 3.5,就能打造创新的 AI 产品;

科研机构不用再重复造轮子,基于开源的底座,就能专注于前沿技术的创新。

从此,AI 不再是巨头的专属游戏,而是变成了全行业、全开发者都能参与的创新浪潮。

展示量: 3

春晚之后,中国智造的「未来」选择了追觅

作者|李苏

编辑| 郑玄

当 2026 年央视春晚序幕缓缓展开时,追觅显然又创造出了一个「神奇」的场景。

这家公司以春晚首个智能科技生态战略合作伙伴的身份,站上这个全年收视规模最大的国家级舞台,带来前所未有的产品量级登台,覆盖汽车、家电、影音、个护、清洁等全场景智能科技生态产品矩阵。

将追觅的登台仅看作品牌露出的常规操作,实则误读了这一事件的特殊性。过往登上春晚的企业不计其数,但无一以「生态级」姿态出现——过去我们靠人力、靠资源堆出来的增长,正在让位于真正的技术创新。

这也意味着中国科技产业的竞争逻辑已经发生变化,也许是时候有一家公司,来推动中国硬科技生态在全球产业格局中占据引领地位。

 

01

追觅和春晚的双向奔赴

 

春晚四十余年的商业合作史,本身就是一部浓缩的中国产业升级史。

每一次变化,都踩在中国经济转型的关键节点上,一切都在展示,什么是新的经济增长点,什么是全民化的最新生活方式。

八十年代初,春晚的舞台上活跃的是日化、酒类、钟表等传统消费品——一瓶好酒、一块名表,承载着那个时代人们对美好生活的朴素向往。合作形式也简单直接:一句朗朗上口的广告语,一个醒目的标版画面,便是品牌与观众的全部连接。

互联网浪潮袭来后,BAT 们相继登场。红包互动、扫码抽奖、社交裂变——技术让单向传播变成了双向参与,春晚从「看电视」变成了「玩手机」。但这仍是流量逻辑的延续,平台们争夺的是用户时长与数据沉淀,而非产业能力的系统性呈现。

最近两年,硬科技企业开始在春晚崭露头角。但细究之下,此前的科技类品牌合作仍带着明显的「试水」痕迹:或聚焦单一产品,或局限于消费电子范畴。科技元素确实多了,却尚未形成完整的生态叙事。

当人工智能与硬核科技站上风口,春晚选择「队友」的标准也在悄然进化。「十五五」规划开局之年,制造业升级与科技创新被置于国家战略的核心位置——春晚需要的不只是热闹,更是一个能够承载时代命题的叙事载体。

放眼本届春晚,机器人元素形成了一支特殊的科技方阵:宇树科技的人形机器人以高难度动作展现硬核实力;松延动力的仿生机器人呈现生命模拟的精密;银河通用的机械臂展示工业自动化的力量,魔法原子的「国宝」级别表现,更是最接近未来机器人应用落地的选手。毕竟不是每个场景都需要机器人完成弹射空翻,反而端茶倒水、与人互动,这类走入大众生活的服务特性,也许离商业化的距离更近。技术不仅要秀肌肉,更要回归国民生活;不仅要证明能力,更要创造普惠价值,走进千家万户。

与此同时,追觅的上场,恰好回应了这一深层需求。此次合作中,追觅的身份是「智能科技生态战略合作伙伴」——央视这几个字的分量,远非普通合作伙伴可比,换句话说,追觅选择了春晚,更是春晚选择了追觅。

从智能科技和国民舞台的结合之作《智造未来》的内容来看,为这一问题提供了极具象征意义的答案。根据相关了解,春晚节目组先是编排好了歌舞内容和节目次序,作为科技智能相关压轴登场的节目,其背后深意更是想要通过此来传递「科技生态」「中国智造」的时代主题,和追觅的携手,恰好能够展现具有跨时代意义的先进技术和智能产品,这种全生态的硬科技产品,正好与春晚呼唤时代科技新血液的国民诉求相匹配。

因此,双方的相遇,更像是科技史上的神来之笔。

春晚「智造未来」节目图

 

这种从「技术展示」到「生态落地」的叙事递进,构成了春晚舞台上最完整的「新质生产力」图景。

值得注意的是,追觅这种 「 全品类、全场景、全链条 」 的呈现方式,在春晚历史上尚属首次。

追觅作为春晚「智能科技生态战略合作伙伴」登台

 

作为全民共同观看的超级场域,春晚天然具备将新旧范式并置对照的影响力——截至 2025 年,其全媒体累计触达 168 亿人次,电视直播收视份额 78.88% 创十二年新高,移动端受众达 3.72 亿人。在这个舞台上,谁能给出更完整、更可感、更触手可及的全场景智能生活答案,谁就能成为新范式的代表。

而这一次,追觅接过了这个角色——以「智造未来」之名,扛起了「大国智造」的旗帜。

 

02

一场即将到来的产业变革

 

追觅近来的发展轨迹,恰似一条精心设计的路径:先在全球高端市场建立产品力的话语权,再将这种势能转化为本土市场的品牌资产。这与常见的「国内成功—海外扩张」模式恰好逆向而行。

通常,「国际出圈」与「本土认同」是两条难以并行的轨道。前者指向全球市场的技术竞争力与行业话语权,后者关乎社会层面的广泛信任和情感连接。多数企业不得不在其间做出取舍。

追觅的「既要也要」选择逻辑显得更为坚定:自 2017 年成立即确立全球化战略,却并未遵循中国企业惯常的「新兴市场跳板」路径——先以性价比打开东南亚、中东等市场,再逐步向欧美渗透——而是直接切入欧美日韩等高端市场。其底层逻辑在于,新一代企业的全球化应当立足产品力本身,而非价格优势;只有在最苛刻的市场环境中验证过的技术标准,才能真正支撑长期的品牌价值。

这一策略的市场反馈已然显现。截至目前,追觅产品已进入 120 余个国家和地区,实体门店超 6500 家,服务全球超 4200 万家庭。截至 2025 年,追觅科技海外营收占比近 80%;追觅扫地机器人在全球 30 个国家市场占有率第一,其中 11 个国家市占率超过 40%;洗地机产品在全球近 20 个国家市场占有率第一,在部分国家市占率超过 70%。在欧美市场,是行业绝对领先的高端科技品牌。

追觅产品亮相春晚

 

对于春晚而言,选择追觅也有其现实考量。在硬科技成为国家发展重点的背景下,春晚需要能够代表这一趋势,同时具备全球竞争力和系统生态构建能力的合作方。追觅的全球化业绩既是它成为「大国之选」的品牌资本,也是它作为中国品牌在全球市场树立的标杆。

当然,春晚的聚光灯终会暗去,留下的问题关乎行业剩余的 364 天。

长期以来,智能制造行业的市场格局由单品类的领先企业分别主导——电视、空调、洗护、清洁设备,用户若要组建完整的智能家庭,需要面对不同品牌、不同系统、不同操作逻辑的拼凑。

追觅在春晚舞台展示的全场景智能科技生态,预示着智造行业竞争规则也将迎来新的变化。追觅试图证明的是,其统一技术底座支撑下的跨品类协同,能够提供更连贯的用户体验。这种「生态级」打法与「单品级」打法的差异,在春晚被展示之后将被行业普遍接受,推动行业格局将进入洗牌期:具备全品类布局和通用技术能力的企业将获得优势,而依赖单一品类的企业可能面临压力。

追觅的模式意味着更高的可预测性和抗周期性。企业的价值不再绑定于单一品类的兴衰,而是取决于整个生态系统的健康度。春晚合作所传递的 「 大国之选 」 等信号,进一步强化了这一逻辑的确定性。

2026 年春晚与追觅的携手,可以视为观察中国科技品牌发展路径的重要样本。而春晚科技时代的分水岭已然划定:追觅之前,追觅之后。

展示量: 6

文章分页

上一页 1 … 7 8 9 … 2,272 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间