Skip to content
  • 元宇宙社交空间入口
51蛙吖蛙元宇宙 – 3D社交空间

51蛙吖蛙元宇宙 – 3D社交空间

51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

作者: admin

马斯克都忍不住转发的 AI 应用,是怎么做出来的?

 

前两天晚上,马斯克在X上转了一个小视频的帖子。视频里的问题是 “Which is the best LLM in the world?” 画面里有两个选项,Grok 和 Others。

在视频里的人始终点不到Grok的按钮,按钮还在不断变小。直到Grok 终于被点到,视频里的「马斯克」开始了搞怪舞蹈。

图片来源:Loopit

这个视频里可以互动起来的产品就是Loopit。

从百川智能离职后,陈炜鹏和李施政创办了涌跃智能。

他们bet的点有3个:

AI Coding 多模态生成融合能吃掉最大的智能增量、通用是最该坚持的产品品味、互动是内容的未来。

虽然AI Coding多模态生成的技术框架探索从没变化,但具体产品设想是模糊的。他们尝试过互动PPT、互动绘本、互动影游,但始终没能同时满足这3个信念。在探索的过程中,他们逐渐将注意力从「用代码提升生产力」,转向「用代码定义可交互的世界」。于是,与行业怎么把一件事做得更高效的主流不同,涌跃智能的产品Loopit 选择了另一个方向。

 

Loopit 使用页面|图片来源:极客公园

 

它没有瞄准提升生产力,也不打算做下一个游戏引擎,而是试图回答一个更模糊、也更有想象力的问题——如果内容不只是「被观看」,而是可以被「玩」,会发生什么?

 

精彩观点:

  • 现在的 AI 应用面临的普遍问题是:要么想到做不到,要么做到了也没想象力。。
  • 如果内容形态没有逃脱上一个时代的范畴,即使强如Sora,最终也只会沦为既有平台的供给。
  • 互动内容是一种更高维的方式,一次性游戏、可以玩的视频等描述都只是其在低维概念的投影
  • 在 AI 时代,内容的共识产生会非常快,因为每一个内容的生成上下文都是透明的,这使得 Remix(魔改) 变得极度简单。
  • 我们不担心商业化,即使沿用广告模式,互动比观看更能俘获频注意力。

 

以下是极客公园与涌跃智能团队的对话,经编辑整理。

一、 不是游戏,也不是工具

极客公园: Loopit这款产品的定位是怎么样的?

陈炜鹏: 我们做的Loopit是一款面向 C 端的互动内容产品。在这个内容平台上,每一条内容都是可交互的。它能调用并「接管」手机硬件(如摄像头、麦克风、陀螺仪等权限)。比如,用户手指在屏幕上的位置会实时触发画面亮起或物理反馈,这种创意内容必须依赖硬件交互才能实现。

极客公园:这听起来像是一个通过 vibe Coding 生成的 Mini Game(小游戏)。

陈炜鹏:不完全是游戏。比如一些艺术类交互装置,其底层模态其实是视频,但前端呈现出交互效果。我们想传递的理念是:「让一切变得好玩。」

极客公园:也就是「Make the World Playable」。

陈炜鹏:没错。我们避开「Game」这个词,是因为不想被局限在游戏范畴,而是希望现实生活的一切都能转化为可交互的内容。

极客公园:如果拆解「互动内容平台」这个定义,互动的维度和程度具体该怎么描述?

陈炜鹏:互动的维度涵盖了当前手机硬件能处理的所有范围,比如陀螺仪、摄像头、声音传感器以及常规的点击操作。这些简单的定义可以组合出无限的可能性。

Loopit,意指「循环」。我认为所有的游戏、音乐甚至故事,本质上都是由一个个 Loop 组成的。比如在《星露谷物语》中,播种收割是一个小 Loop,一天的农活是中 Loop,而将手工农场升级为自动农场则是大 Loop。大循环嵌套小循环,就构成了整个世界。短剧的一集是闭环,音乐是节奏循环,这种有限的定义最终能组合出无限的可能。

极客公园:目前主要还是围绕手机终端的交互。

陈炜鹏:对,因为手机是我们的核心分发场景。

极客公园:除了调用硬件传感器,Loopit 相比传统 Web Coding 工具的优化点在哪里?

陈炜鹏:比如用户上传一段视频,Agent 可以自动生成一个「鱼眼镜头滤镜」的程序逻辑套用在视频上,瞬间将其转化为可实时操控的 3D 视角,并可干预互动。

 

二、AI Coding + 多模态,一次被 AI 技术推动的产品转向

极客公园:依然是 Vibe Coding ?

陈炜鹏:核心是 Vibe Coding 结合多模态生成。我们想打通屏幕与真实世界的界限。

极客公园:具体的创作交互过程是怎样的?需要用户具备专业的逻辑定义能力吗?

陈炜鹏:不需要,完全是基于自然语言的对话式修改。用户不需要设定具体参数,只需描述感受或目标并进行挑选,创意、编程、设计都交给Loopit。

极客公园:那 Loopit 这个产品,从明确形态到今天这个状态用了多久?

陈炜鹏:产品形态明确是 3 个月前,但底层的引擎技术我们磨了 7 个月。

极客公园:过程中最核心的技术难点是什么?毕竟你们磨了 7 个月逻辑。

陈炜鹏:核心难点在于 Code(代码) 与 多模态生成 的深度结合。代码负责保证整个交互过程和底层逻辑,而多模态则负责视觉张力的呈现。这两者在生成过程中相互影响、相互约束,要在这种双重约束下实现通用性并达到优质效果,技术难点很多。

。

极客公园:当时卡点的难点主要是在代码(Code)能力,还是多模态能力上?

陈炜鹏:卡在两者的结合上。我们满意的点在于构建了一个框架,未来不论是 Coding 还是多模态能力的提升,都会成为产品的助力。大家常说大模型应用是水涨船高,而我们这艘船下面,其实有「两片海」。

我是做语言模型的背景,另一位合伙人是做文生视频出身,且做出过国内领先的结果。。

极客公园:对于 Loopit 来说,模型侧的要求是否可以理解为:需要最旗舰的大语言模型提供的 Coding(编程)能力,以及当前顶尖的多模态模型能力?

陈炜鹏:对,我们集成了多种模型,涵盖了文生图、文生视频以及音频生成等多个维度。

极客公园:你们的思路从最初偏向 Pro C 的工具视角,逐渐转向了更广众的 C 端。这中间最重要的变量是这一年 AI Coding 技术的快速进展?

陈炜鹏:多模态和 Coding 技术的进展都非常快。不过我们一直没变的核心是「互动内容引擎」,即 AI Coding 与多模态的结合。至于包装成什么产品、面向什么用户,我们一直在根据技术环境进化。

最初尝试过互动 PPT、互动绘本、AVG(冒险游戏)等内容。随着 AI Coding 技术和多模态模型的进展我们开始向短内容、低门槛的方向迁移,并逐步看到了UGC平台的可能性。

 

三、重塑平台双边逻辑

极客公园:新平台的产生必须有新交互,从而脱离传统的分发渠道。

陈炜鹏:没错。如果内容模态没有逃脱上一个时代的范畴,即使强如Sora最终也只会沦为既有平台(如 TikTok)的供给。我们坚信互动内容能产生新的交互维度,这种维度是传统短视频平台无法通过增加一个 Tab 就能消化的。

陈炜鹏:基本上,我们现在看到的文生图、文生视频加 Coding(编程)能够组合的所有形态,都可以用这款产品做出来。例如互动故事书、交互式艺术作品,甚至是 Mini Game(小游戏)。

极客公园:所以你们的产品核心是在 App 侧,而不是 Web 端?

陈炜鹏:对,目标和用户不同,自然选择不同的端。

 

极客公园:目前大多数基于 Web Coding 的 AI 产品都偏向生产力工具,走向了 Pro C(专业消费者)端,重点在于拼 ARR(年度经常性收入)和渗透率。而在普通的 C 端用户层面,最近反而很少有人触碰。我们一直在期待 C 端能出现这种有趣的、真正达到 UGC(用户原创内容)层级的创新。

陈炜鹏:一个新的UGC内容平台产生需要两个条件:一是人人皆可创作(极低门槛);二是新的内容维度。这个新维度必须能提供传统分发渠道所不具备的价值。

极客公园:这种交互带来了很大的个性化。过去用户只能消费被封装死的既有内容,而交互能解锁新的维度,根据用户的心情或操作交付不同的价值。

陈炜鹏:交互是随着技术的解锁而解锁的。目前我们通过 Coding 定义状态机,从而创造出一个自由的交互空间。未来,像谷歌那样的纯 Prompt(提示词)驱动的世界模型会是另一种空间。最终这两者会合并,这只是技术解锁深度的问题。

极客公园:如果最终能一步到位直接生成可交互空间,那确实了不起。不过分步走更务实。

陈炜鹏:我们采取的是分步走的策略。在目前的产品定义里,未来的视频世界模型只是我接入的一个模态。过去多模态靠 Coding 或后台状态驱动,未来可以转为实时驱动。

 

四、靠 Remix 生长的社区

极客公园:目前内测的反馈如何?用户特征是怎样的?

陈炜鹏:我们正在海外进行内测,几千名用户小规模跑。其中核心创作者约 100 多人,主要由艺术系学生构成。

创作门槛被降到了极低。不少创作者在 TikTok 发布一个高质量伪交互作品大约需要 5 天,但在我们这里,两小时就能做出 5 个。一个 5 分钟的对话轮次就能完成一轮逻辑生成。

极客公园:目前内容池里已有的内容风格,是否会影响现阶段新用户的获取?比如让用户误以为这只是一个特定方向的平台。

陈炜鹏:这本质上是社区「破圈」的过程。我们有非常明确的取舍:不希望被定位为一个游戏平台。游戏市场通常是供大于求的,我们追求的不是纯粹的游戏开发。

极客公园:所以你们更希望呈现的是一种「Playable」(可玩式)的体验?让用户把日常生活中的各种事物变成可玩的交互内容?

陈炜鹏:没错,就是一种「可玩的体验」。

极客公园:在初期,你们核心瞄准的用户群体是哪一类?

陈炜鹏:主要是年轻人,特别是那些极具想象力和创造力的人群。具体来说,包括美术生、艺术生和设计师。从目前观察来看,大学生群体对产品的上手程度非常高,几乎没有门槛。

极客公园:感觉这些种子用户有点像早期 B 站的群体,脑洞很大,想法也比较独特。

陈炜鹏:是的,脑洞非常大。

极客公园:现在的计划是什么?重点打海外市场吗?

陈炜鹏:我们打算国内、国外同步推进。内容属性比较轻量,且没有很强的语言隔阂。下周国内会启动「体验官」招募,先采取邀请制小规模开放创作权限,但所有人都可以下载试玩。

极客公园:国内分享到微信朋友圈的功能打通了吗?

陈炜鹏:打通了,它是以网页链接的形式打开,用户可以在链接里直接进行交互。

 

五、基于「技术想象力」,构造互动内容产品

极客公园:你看起来不太像典型的 To C 创业者。

陈炜鹏:外界看我职业生涯跨度大,从搜狗做搜索、推荐到 Soul 做社交,但我认为核心逻辑是一脉相承的。在 Soul 期间,我管理过运营和产品,甚至负责过洛丽塔社群的运营,对 18-23 岁的年轻用户群体很有感觉。

极客公园:你之前在 Soul 的经历,对现在的项目有什么启发吗?

陈炜鹏:Soul 对我最大的启发不在于具体的经验,而在于产品价值观。过去我在搜狗做搜索和推荐,是在被定义的市场里把产品做得更好。但在 Soul 期间,我们只关心用户价值和创新体验,这对我做 Loopit 的理念很重要:也就是我们究竟能给用户提供什么样的增量价值和创新体验。

现在的 AI 应用面临的普遍问题是:要么想到做不到,要么做到了也没想象空间。我们要追求的是基于「技术想象力」去构造产品,提供增量。

极客公园:在百川智能的经历呢?

陈炜鹏:在百川负责通用模型训练的经历,加深了我对模型本身的理解。我的判断是: AI 时代核心变量就是技术,脱离技术无法思考产品。只有将技术与产品深度融合,才可能做出让用户尖叫的产品。。

极客公园:在互动内容平台中,社交扮演什么角色?

陈炜鹏:内容本身就具备社交属性。互动天然能产生人与人、人与内容的连接。内容会创造一个「场」,只要场域存在,关系自然会产生。

极客公园:你们的内容深度结合了手机硬件交互。但现在 AI 硬件(如 AI 眼镜、轻量化终端)发展很快,如果未来手机被更简单的终端取代,你们会担心吗?

陈炜鹏:我们完全不担心,甚至非常期待。我们提供的是一套通用框架。手机对我们而言只是「硬件能力的集合」。如果未来出现更先进的智能眼镜,对我们来说只是增加了一个新的 API(接口)和能力维度。只要内容本质上仍通过程序(Coding)实现,硬件的迁移对我们来说是天然友好的。

极客公园:现阶段推荐算法在平台中的比重高吗?

陈炜鹏:随着内容量的积累会更重。

极客公园:如果用一句话来传播 Loopit,你会如何定义?

陈炜鹏:第一,它是一个极具创新性、让人眼前一亮的产品;第二,它就是「可以玩的抖音」,让生活中的一切都变得好玩。

极客公园:用户创作出内容后,他们的动力主要来源于什么?

陈炜鹏:早期是「为爱发电」和获得认同感。过去的内容平台逻辑是:用户创造内容,获得他人追捧,从而产生愉悦感。 在 Loopit,创作动力多了一个维度:创作过程本身的探索性和成就感。这种通过技术实现脑洞的过程,本身就是一种高质量的消费体验。互动循环的核心在于反馈。创作者渴望有人参与互动,而这种良性循环长期发展下去,必然会催生顶部创作者的商业化需求。

关于内容商业化,我观察到一个演进路径:第一阶段是分发效率提升。 早期以推荐系统为主,讨论的是 Feed 流(信息流)的通话效率和广告位密度,核心是解决分发效率。

第二阶段是内容即广告(升维品质)。 到了直播和种草(如小红书)时代,讨论的是品质,即让广告等同于内容,从而提升广告本身的价值。

AI 生成的互动内容让「消费广告」与「消费内容」接近等同。比如海外火爆的「可乐熊」案例,用户在玩的过程中就已经在不知不觉中被植入了品牌概念。这种植入是无感的、潜移默化的,不像直播带货那样仍有明显的广告痕迹。

如果我们的终极目标是去制造一个世界,那么在这个世界里看到的所有广告,都应该是被自然植入其中的。

展示量: 14

零下 20 度的田野里,它在拍星星,我们在合影丨 New Things

作者 | Li Yuan

编辑 | 郑玄

你有在晴朗的沙漠里看过清楚的银河吗?

一次这样的体验就仿佛能够净化灵魂。

但回到城市之后,我们很难产生抬头的欲望。即便偶尔望向夜空,几颗暗淡的孤星也显得索然无味。

不过,一台有趣的设备,意义是可以让平淡的生活产生变化。

 

 

 

 

这两张照片,是使用智能天文望远镜 Seestar S30 Pro 在城市光害和郊区光害下能拍出来的状态。

Seestar 的外观完全不像传统的笨重「炮筒」,更像是一台稍大号的投影仪。不同于传统的天文望远镜,你并不需要成为一名天文高手,也不需要了解复杂的坐标知识、处理繁琐的后期堆栈。只要把这台设备放在城市的空地上一分钟,就能直接拍出这样的深空大片。

作为从未接触过星空知识的小白,夜晚的星空从未变得如此有意义。

 

拍星空,不一定要大体积的天文望远镜

很多人对天文望远镜的认知,还停留在那种需要两人合力搬运的「炮筒」上。在圈子里,这种体积感曾是资深玩家的入场券。似乎口径越大、镜筒越长,才越能彰显探索宇宙的诚意。

因此第一次看到 Seestar S30 Pro 的时候,不少人其实很怀疑这台设备是不是只是一台小玩具。

Seestar S30 Pro 只有 1.65kg 重。折叠起来的大小和一台家用投影仪差不多,单手就能拎走。

 

 

不过,看成玩具,可就太小瞧 Seestar 了。

事实上,Seestar 的能够做到这么小,是源于其专利的折叠光路设计。

传统望远镜为了保证焦距,镜筒必须做得非常长。这种物理长度直接限制了设备的机动性。Seestar 实际上是通过在机身内部设计了一套镜片的反射体系,让光能够在机身内部完成长距离的跋涉,才保证了小巧的机身。

而在其背后,Seestar S30 Pro 还配备了真正严肃的成像方案:长焦端采用了 1/1.2 英寸的 IMX585,广角端则是 1/2 英寸的 IMX586。

这里有一个误解:在很多人的想象里,天文观测者观测星空的时候,应该和看望远镜一样,肉眼贴近「炮筒」观测。

事实上,现代天文望远镜早就不再是为人眼观察而设计的了。

人眼的瞬时快门只有 0.1 秒左右,感光能力存在天然的上限。即便盯着猎户座看一整夜,大脑也无法把那些微弱的光子攒成一张彩色的星云图。

因此现在无论在专业天文台还是资深玩家的设备后端,接入的大多都是专业的的影像传感器。

S30 Pro 使用的 IMX585 传感器,已经是天文摄影领域是相对性能很好的传感器,采用的是 ZWO ASI585MC 等专业天文相机的同款底片。这种基于 STARVIS 2 架构的传感器,核心优势在于高效的弱光采样能力。它能通过长时间的曝光,捕捉到肉眼根本无法察觉的深空细节。

这台看似轻便的设备,本质上就是折叠了一台大型专业天文望远镜,可以看作是一个针对星空摄影专门优化了的长焦相机。同时,还内置了照片叠加的算法,可以直接将叠加后的状态实时呈现在手机上。

在手机摄影的强力算法误导下,很多人看到清晰的月面环形山,漂亮的天体图,第一反应往往是 AI 生成的贴纸。

不过,其实只要试着拍一次飞鸟,就能看出长焦相机和 AI 生成的差别。

AI 并不能根据实时画面,合成出这种具备随机性和动态感的小鸟的一举一动。

 

银河、星野一键出片

当然,S30 Pro 并不只是给望远镜加了一个长焦镜头。

在 极客公园曾经介绍过的 S30 Pro 的前代产品 中,已经内置了一键找星的功能。它内置了一套自动化寻星系统,将原本需要手动调节赤道仪、校准极轴的繁琐过程,直接固化到了硬件底层。

只需要在 app 上选择要观测什么星体,剩下的对齐和跟踪都由机器自己完成。

但随着 S30 Pro 对摄像头传感器的升级,S30 Pro 解锁了更多的玩法。

首先是主摄传感器由 IMX662 提升到了 IMX585。传感器的幅面从 1/2.8 英寸 扩大到了 1/1.2 英寸 。在摄影圈里,底大一级压死人是不变的真理。

如果你用小底传感器去拍仙女座这种尺度巨大的星系,你往往只能拍到中心最亮的一团核心,外围的结构会被直接切掉。这种感觉就像是在用手机长焦看特写,虽然拍到了,但缺乏全局感。

 

 

从这两张社区中的 M42 星云的图就能看出一些差异。左图由 S30 Pro 拍摄,右图是 S30,更大的传感器让暗部的细节和层次感都更加清晰。

更重要的转折点在于另一颗拥有 63° 视场角的广角镜头。在过去,这颗镜头主要扮演找月亮、找太阳的辅助角色。它就像一个指路灯,帮你把视野对准目标。但在 S30 Pro 上,这颗镜头不再是配角,它具备了独立的星野实拍能力。

在天文摄影里,星野是一个巨大的范畴。它指的是不止拍摄某个孤立的球体,而是要把星空与大地的轮廓融合在一起。在这个分类里,银河和星轨是最核心的两个主角。

拍摄银河的逻辑,其实是一场与地球自转的博弈。

因为地球在不停地转动,天体相对于地面其实是动态的。如果你只是进行简单的长曝光,最后得到的只会是一团模糊的光影。为了出一张清晰的、有细节的银河大片,设备必须开启跟踪模式。

S30 Pro 的广角端现在支持这种动态跟踪。它通过长时间的曝光和机内实时叠加,让隐藏在黑暗中的细节显影。它在帮你把微弱的光子攒在一起,直到拼凑出完整的银河纹理。

而星轨则是完全不同的另一种拍摄逻辑。

在星轨模式下,机器保持不动,任由地球自转。它不再去抵消那种位移,而是选择记录这种位移。 星星在镜头前划出的轨迹,被算法一张张叠在一起,最终在手机屏幕上形成一种充满时间张力的同心圆。

这样的玩法让星空拍摄变得更加丰富多元。由于冬季北半球并不适合拍摄银河,笔者尝试拍摄了星轨。

 

 

看着星星在手机屏幕上不断延展,这种实时的反馈感,确实会让你产生一种和宇宙重新建立了连接的错觉。

 

它在拍星星,我们在合影

天文摄影曾经是一场极其孤独的苦修。在漫长的曝光时间里,你只能守在机器旁边,盯着漆黑的荒野发呆。但笔者惊喜地发现,Seestar S30 Pro 正在通过增加更多的互动逻辑,试图让这个等待的过程变得有意义。

最明显的变化是,S30 Pro 正在加入更多的科普功能,比如 GOTO 功能与星空标注的结合。

在 Seestar 的上一代设备中,已经可以通过 app 里的设置,一键寻找你想观测的星座、星云等。虽然照片很漂亮,但如果你抬头看天,依然很难把屏幕上的光点和真实的星空对应起来。

现在的 S30 Pro 增加了一个标注开关。当你把机器对准夜空,手机屏幕上会自动勾勒出星座的连线。你能清晰地看到大熊座的形状,看到猎户座的腰带到底由哪几颗星组成。

这种将虚拟星图与真实物理星点重合的瞬间,让星空不再只是一堆无意义的光斑,也是最好的寓教于乐的场景。

 

 

这种对交互的理解,最终落地在了一个极具生活方式感的卖点上:地景分离。

在传统的星野摄影里,这是一个物理层面的悖论。为了让星空清晰,机器必须跟着星星转动。但如果你想在画面里加入地景或者人物,转动的相机就会让地面的物体变得模糊一团。

如果你想和银河合影,通常需要极其复杂的后期技术。你得分别拍摄星空和地面,再回到电脑前进行手动合成。

S30 Pro 把这个过程内化了。它会利用算法,在地景和星空中找到一个平衡点。它会单独抓取一帧清晰的地景作为「底座」固定住,然后让背景的星空继续通过跟踪来累积细节。

曾经只有通过复杂的后期处理的功能,现在现在变成了小白都可以参与的一部分。

在北京零下 20 度的田野里,我和我的朋友坐在一旁,不断调整拍摄角度,试图把自己也放进那片星空里。虽然天气很冷,但这种「我也在画框里」的驱动力,让我们乐此不疲。

你可以拿着补光灯站在机器前,给自己打个光,或者和朋友一起坐在草地上指点江山。机器负责在那采集千万光年外的光子,而你负责在这定义这张照片的故事感。

 

 

这个尝试虽然不甚完美,但却富有人味儿。

虽然算法接管了几乎所有的技术细节,但当我们一次次进行构图选择,不断调整位置,按下快门,将自己和星空连接在一起的时候,天文摄影从一种冷冰冰的拍摄,变成了一次有温度的社交行为。

一键出片并不意味着浪漫的廉价化。相反,当操作的摩擦力被降到最低,人们才会有更多的精力去关注那片星空本身。

Seestar 的社区里,有人拍下了流星雨穿过地景的瞬间,有人记录下了。这些真实的情感绑定,才是硬件产品能够持续产生生命力的核心。

它给普通人递了一张宇宙的门票,但门票背后的风景怎么看,最终还是由人来决定。

当算法消解了所有的门槛,天文摄影究竟会变成一种像美颜相机一样的快消品,还是会成为一种让人重新审视自我与宇宙关系的媒介?

在万物皆可智能化的今天,我们或许并不缺一台更强大的望远镜,我们缺的是一个能让我们重新产生抬头欲望的契机。

*头图来源:极客公园

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

展示量: 17

安德鲁王子或涉爱泼斯坦案

安德鲁王子若在性侵未成年少女的民事诉讼中败诉,需承担法律赔偿责任。赔偿范围通常涵盖受害者因侵害行为遭受的直接损失,如医疗费用、心理治疗费用等;还会涉及间接损失,像因事件导致的收入减少等。此外,受害者精神遭受严重创伤,安德鲁王子可能需支付精神损害抚慰金。具体赔偿金额,会依据受害者实际损失、侵权情节严重程度、当地经济水平等因素,由法院综合判定。
 
8729735292
51蛙吖蛙3D空间
呱呱id:8729735292

欢迎电脑访问我的元宇宙空间

展示量: 17

元宇宙AI访谈正在逐渐成为流行

在科技飞速发展的今天,AI作为被采访对象的现象逐渐兴起,这不仅是技术进步的体现,更是人类探索未知、追求创新的生动实践。 AI被采访,为传统采访模式注入了新活力。以往,采访多局限于人类之间的对话,而AI的加入打破了这一局限。它拥有海量的知识储备,能瞬间调取古今中外的信息,为采访提供丰富素材。例如,在历史类采访中,AI可精准还原历史场景,讲述鲜为人知的细节;在科技领域,它能深入解析前沿技术原理,让采访内容更具深度和专业性。 同时,AI的客观性也是其成为采访对象的重要优势。它不受情绪、偏见等因素影响,能以中立的态度回答问题。在涉及争议性话题的采访中,AI可基于数据和事实进行分析,避免主观臆断,为公众呈现更公正、客观的信息。 然而,AI被采访也带来了一些挑战。它缺乏真实的情感体验,在涉及人文关怀、情感共鸣的采访中,可能难以给出有温度的回答。而且,AI的回答往往基于预设算法,缺乏灵活性和创造性,有时会显得生硬刻板。 尽管如此,AI作为被采访对象的流行趋势不可阻挡。它为我们打开了一扇通往新世界的大门,让我们在获取信息、探索知识的道路上有了更多可能性。未来,我们应合理利用AI这一工具,让它与人类采访相辅相成,共同推动信息传播和知识共享的发展。
 
8729735292
51蛙吖蛙3D空间
呱呱id:8729735292

欢迎电脑访问我的元宇宙空间

展示量: 50

雷军宣布初代小米 SU7 正式停产;《黑神话:钟馗》发布六分钟实机预告;字节、阿里、腾讯连发多个新模型|极客早知道

国家互联网应急中心预警:新型 RCtea 僵尸网络快速蔓延,我国近万台物联网设备已中招

2 月 10 日消息,国家互联网应急中心(CNCERT)发布《关于 RCtea 僵尸网络大范围传播的风险提示》。

CNCERT 近期监测发现了一个名为 RCtea 的新型僵尸网络正在互联网上快速传播,该网络自 2025 年 12 月下旬开始活跃,主要针对物联网设备发起攻击。

监测数据显示,2026 年 1 月 20 日至 25 日期间,我国境内已确认的受感染设备达 9827 台,单日最高活跃设备数 4870 台,单日最高控制服务器访问量 27.8 万次。该僵尸网络采用高度复杂的加密技术和反追踪机制,目前正处于快速扩张阶段,已具备发起多种 DDoS 攻击的能力。

RCtea 僵尸网络主要针对 ARM 和 MIPS 架构设备发起攻击,包括路由器、摄像头等物联网设备,暂未发现针对传统 Linux 服务器或主机的样本。其传播方式主要依赖 Telnet 暴力破解,利用内置的常见弱口令列表进行设备入侵。为规避安全检测,该木马采用多重防护措施:启动时需特定参数激活核心功能;使用 RC4、ChaCha20 及 TEA 算法变种进行数据加密;为进程设置最高级别内存保护;采用随机 6 字符文件名;执行后会在控制台输出“here we are”调试标记。

CNCERT 建议用户及时修复系统漏洞,包括历史漏洞和最新漏洞;设置高强度密码,建议使用 16 位以上包含大小写字母、数字和符号的组合,并定期更换;发现感染后立即核实受控情况和入侵途径,对受害设备进行清理。(来源:IT 之家)

 

GitHub Copilot 集成 GPT‑5.3‑Codex 代理式开发任务提速 25%

今日,GitHub 宣布,OpenAI 最新的代码生成模型 GPT‑5.3‑Codex 已正式在 GitHub Copilot 中开始推送。该公司表示,在内部使用的多项基准测试中,新模型在推理能力以及对依赖多种工具的复杂、长时工作流的执行方面都有明显提升。在实际应用中,GPT‑5.3‑Codex 在「代理式」(agentic)编码任务上的整体性能相比之前的 GPT‑5.2‑Codex 提升约 25%,显著缩短了开发者在这类任务上的等待时间。

目前,要想使用这一新模型,用户需要订阅 Copilot Pro、Pro+、Business 或 Enterprise 等付费方案。支持选择 GPT‑5.3‑Codex 的环境包括 Visual Studio Code(涵盖聊天、提问、代码编辑和智能代理等模式)、GitHub.com 网页端、GitHub 移动客户端(iOS 和 Android)、GitHub CLI 命令行工具以及 GitHub Copilot Coding Agent。如果用户暂时还未在界面中看到该选项,则意味着本次更新仍处于分批逐步推送阶段。

对于在企业或团队环境中统一配置 Copilot 的用户,GitHub 说明,使用 Copilot Enterprise 或 Copilot Business 方案的组织管理员,需要在 Copilot 设置中显式开启 GPT‑5.3‑Codex 相关策略,才能让团队成员使用该模型。GitHub 表示,此次升级将对负责复杂软件架构设计和自动化重构的开发者带来最大收益,因为新模型专门针对代理式工作流进行了优化。通过将依赖工具链的自动化任务耗时缩短约四分之一,这一更新有望明显缓解以往大规模 AI 辅助代码生成中常见的延迟问题。(来源:cnBeta)

 

CounterPoint 报告 2025 全球手机存量:8 大品牌破 2 亿,苹果三星断层领先

2 月 10日,Counterpoint Research 发布博文,报告称 2025 年全球智能手机活跃设备存量同比增长 2%,换机周期延长至近四年。

目前全球已有八家智能手机厂商的活跃设备存量超过 2 亿台,这八大品牌合计占据了全球超过 80% 的活跃设备份额,呈现出强者愈强的竞争格局。

细分到厂商方面,在所有厂商中,苹果与三星展现出断层式的领先优势,是仅有的两家活跃设备数突破 10 亿大关的品牌,两者合计占据了全球 44% 的份额。附上相关图表如下:

 

(来源:IT之家)

 

累计交付近 37 万辆 雷军宣布初代小米 SU7 正式停产

2 月 11 日消息,昨晚,小米 CEO 雷军开启小年夜直播,这是雷军 2026 年开年以来的第五场直播。

雷军在今晚的直播中透露,最后一辆初代小米 SU7 量产下线,正在运送途中,将安排车主提车,这也意味着初代小米 SU7 正式停产。

据雷军介绍,初代小米 SU7 累计交付量接近 37 万辆。购买最后一辆初代 SU7 的车主是一位 50 多岁的老米粉,从事石油行业,曾长期在国外生活,回国后第一时间选择购买小米汽车。

资料显示,初代小米 SU7 于 2024 年 3 月 28 日正式发布,提供标准版、Pro 版和 Max 版,售价分别为 21.59 万元、24.59 万元和 29.99 万元。据了解,新一代 SU7 预计 2026 年 4 月上市,同样提供标准、Pro、Max 三个版本,预售价分别为 22.99 万元、25.99 万元和 30.99 万元。

新一代小米 SU7 全系标配 V6s Plus 超级电机,全系标配激光雷达、700TOPS 辅助驾驶算力、4D 毫米波雷达、Xiaomi HAD 端到端辅助驾驶。

在安全方面,新一代 SU7 还将全系标配 2200MPa 小米超强钢「内嵌式防滚架」,进一步强化车身结构安全。(来源:快科技)

 

《黑神话:钟馗》发布 6 分钟实机预告 冯骥发文:别太严肃 差不多得了

2 月 10 日,游戏科学官方发布了《黑神话:钟馗》贺岁性质的 6 分钟「实机小短片」。简要展示了似乎是人和鬼共同烹制菜肴的内容。《黑神话:钟馗》是游戏科学继《黑神话:悟空》后,推出的全新作品,本作最早于 2025 年科隆游戏展上亮相,目前仍在开发当中,发售时间暂未确定。

视频发布的同时,游戏科学创始人兼游戏制作人冯骥也发微博谈到了这支实机视频。

他这样写道:「不知各位看完后,是会心微笑?一头雾水?还是马上分析出一堆细节隐喻、剧情方向或者新的技术 feature?(……)别这么严肃,差不多得了。」

他也在微博中回答了大家的疑惑,毕竟这支短片没有操作没有战斗没有玩法更没有钟馗,因为「根本没做啊(bushi」。此外,他还解释了为什么这支短片是以「吃」为主题,因为「只有吃这件事,才能带来最高频也最稳定的幸福感」。文末,他也向各位玩家献上了新年的祝福:「即将到来的马年,祝大家总是享受吃饭,偶尔享受做饭;常有不错的胃口,最好还有人一起愉快的用餐。人生不只游戏,还有很多、很多好吃的东西。」(来源:快科技)

 

传百度临近春节秘密启动「O 计划」,内部人士:与百度 App 有关

近日,网传百度内部启动代号「O 计划」项目,内部人士对新浪科技透露该计划与百度 App 有关。

据此前媒体报道,百度 APP 旗下文心助手月活用户数已突破 2 亿,与豆包、千问形成国内三大亿级 AI 入口。百度也曾以 5 亿红包最早入局春节 AI 战,并拿下《2026 北京广播电视台春节联欢晚会》首席 AI 合作伙伴身份。对比行业玩家春节主阵地多为独立 App,而百度包括此次「O 计划」若仍围绕百度 App 展开,可见其仍是百度重点的 AI 入口。(来源:新浪科技)

 

淘宝闪购:三四线城市年货订单增幅超 580%

2 月 11 日消息,临近小年,即时零售平台年货旺销,淘宝闪购年货销量同比增长超 347%,三四线城市年货订单同比增长超 580%,其中大庆、咸阳、宜昌、潍坊、湛江等城市订单同比增长超一二线主流城市。返乡潮下,下沉市场逐渐成为当下年货节的消费主场。

此外,今年春节,淘宝闪购携手全国零售商超及品质仓门店全程「不打烊」,营业商户数同比增长 32.9%,年货节商品总量较去年显著提升,乡县地区 30 分钟送达已成常态,全国重点城市连锁商超及淘宝便利店等合作门店,春节期间线上门店营业率超过九成。(来源:新浪科技)

 

互联网大厂春节红包大战首日战报出炉 千问 App 日活暴涨 727.7%

2 月 11 日消息,QuestMobile 发布数据显示,新春活动启动后,多款 AI 应用迎来用户规模快速增长。

其中,在新春活动首日(2 月 6 日),阿里旗下千问 App 日活跃用户(DAU)暴涨 727.7%,达到 5848 万,较前一日净增超过 5100 万,增长幅度十分显著。相比之下,腾讯元宝在活动首日(2 月 1 日)的 DAU 规模为 2399 万,较前一日增长 2.1 倍,同样实现明显拉升。(来源:快科技)

 

米哈游法务部:终止与汇业律所合作,远景能源撤诉

2 月 10 日消息,米哈游法务部今日发布《关于终止与上海市汇业律师事务所合作的声明》,宣布终止与原常年法律顾问汇业律所的一切合作关系,停止委托其处理任何与米哈游相关的法律事务,同时将上海市汇业律师事务所永久列入公司合作方黑名单,永不合作。

这份声明同时提到,远景能源有限公司已向江阴市人民法院申请撤回前述其与米哈游之间网络侵权责任纠纷案件的起诉,江阴市人民法院已裁定准许其撤诉。(来源:IT 之家)

 

字节跳动图像生成模型 Seedream 5.0 上线,可免费体验

2 月 10 日,字节跳动旗下图像生成模型 Seedream 5.0 正式上线,在视频编辑应用剪映、剪映海外版 CapCut、字节 AI 创作平台小云雀均已可用。同时,该模型在即梦 AI 平台开启灰度测试,图片生成可限时免费体验。

据悉,新模型主要增强体现在准确性与智能水平、更快的图像创建表现力以及联网知识整合能力。在智能水平方面,Seedream 5.0 能够深入理解提示词语义,生成与用户意图匹配度更高、细节更精准、布局更清晰的图像。针对风格化效果,模型的图像到图像功能增强了风格化表现,提供更清晰细节、精致纹理和平衡的照明效果。本次升级还新增了编辑功能,用户可以通过控制笔刷精准选择并调整相应元素。(来源:新浪科技)

 

腾讯混元推出 0.3B 端侧模型,内存占用仅 600MB

2 月 10 日,腾讯混元宣布,基于首个产业级 2Bit 端侧量化方案,正式推出一款面向消费级硬件场景的「极小」模型 HY-1.8B-2Bit,等效参数量仅有 0.3B,内存占用仅 600MB,比常用的一些手机应用还小。

据介绍,通过对此前混元的小尺寸语言模型——HY-1.8B-Instruct 进行 2 比特量化感知训练(QAT)产出,这一模型对比原始精度模型等效参数量降低了 6 倍,并且在沿用原模型全思考能力同时,在真实端侧设备上对比原始精度模型生成速度提升 2—3 倍,可大幅提升使用体验。(来源:IT 之家)

 

千问发布最新图像模型 Qwen-Image-2.0,超长文字渲染,摄影级真实质感

2 月 10 日,阿里巴巴正式发布新一代图像生成及编辑模型 Qwen-Image-2.0。作为千问大模型的图像生成模型底座,Qwen-Image-2.0 集生图和编辑于一体,在 AI Arena 文生图评测中斩获 1029 分,超过 Seedream4.5、Flux2-Max 等模型,仅次于谷歌 Nano Banana Pro 和 GPT Image1.5。Qwen-Image-2.0 支持 1K token 的超长文字输入和 2K 高分辨率,可准确渲染复杂指令,轻松生成专业的 PPT 及信息图,质感媲美专业级摄影师;同时,千问新模型拥有极强中文汉字渲染能力,数百字的古文全文几乎都能完全渲染在图片中。

Qwen-Image-2.0 在 Qwen-Image 和 Qwen-Image-Edit 两大模型基础上全新升级,首次将图像生成和编辑统一到一个模型中去,以更轻量的模型架构,实现了生图和改图性能的大幅提升。Qwen-Image-2.0 生图质感尤为细腻,小至老人皱纹的褶皱,大到浩然宇宙,模型生成的人物、自然、建筑等常用图片都极其逼真。在权威评测 AI Arena 中,千问新模型在图像生成中得分 1029,位列第三;在图片编辑中得分 1034,仅次于 Nano Banana Pro。(来源:阿里)

 

机器人首次拥有时空记忆!阿里达摩院开源具身大脑基模 RynnBrain

2 月 10 日消息,阿里巴巴达摩院发布具身智能大脑基础模型 RynnBrain,并一次性开源了包括 30B MoE 在内的 7 个全系列模型。RynnBrain 首次让机器人拥有了时空记忆和空间推理能力,智能水平实现大幅跃升。

在 16 项具身开源评测榜单上刷新纪录(SOTA),超越谷歌 Gemini Robotics ER1.5 等行业顶尖模型。

据介绍,RynnBrain 模型创造性地引入了时空记忆和物理世界推理,这是机器人与环境互动所需的两项基本能力。

时空记忆能力可让机器人在其完整的历史记忆中定位物体、目标区域,甚至预测运动轨迹,从而赋予机器人全局时空回溯能力。

物理空间推理不同于传统的纯文本推理范式,RynnBrain 采用文本与空间定位交错进行的推理策略,确保其推理过程紧密扎根于物理环境,大大减弱了幻觉问题。

例如,运行 RynnBrain 模型的机器人,在执行 A 任务中被突然打断要求先做 B 任务,它能记住 A 任务的时间和空间状态,等完成 B 后继续工作。(来源:快科技)

 

iKKO Mind One AI 小手机国行上市:主摄可翻转、方形 AMOLED 面板,2899 元

制造商 iKKO 旗下 Mind One AI 小手机国行版本现已在天猫发售,该机主打迷你外观,整合 AI 助手,还能安装全键盘保护壳,国内销售的均为 Pro 版机型,8GB RAM + 256GB 存储定价 2899 元。

IT 之家注:Pro 版机型配 H9 硬度面板(海外标准版使用 H7 硬度面板),同时 Pro 版号称内置的 AI 助手可以在全球 60 多个国家地区免费使用,无需支付移动流量 / Wi-Fi 费用。

该机整体尺寸为 86 x 72mm,厚度为 8.9 mm,配备一块 4 英寸方形 AMOLED 面板,手机背面提供可以翻转的 50MP 索尼 1/1.56 英寸主摄。机器搭载联发科 MT8781 平台,匹配 8GB RAM 和 256GB 存储,内置安卓 15 和一款 iKKO AI OS 系统,提供 Nano SIM 卡槽 + vSIM(注:不是 eSIM)。其他方面,该机(在海外市场)提供一款全键盘保护壳,相应保护壳提供 3.5mm 耳机接口,同时内置 DAC 芯片(CS43198),强调有线外放音质。(来源:IT 之家)

 

传奇程序员 John Carmack 设想用 200 公里光纤代替内存

传奇程序员约翰 · 卡马克(John Carmack)于 2 月 7 日在 X 平台发布推文,提出一项颠覆性构想:利用长达 200 公里的光纤线路替代传统的 DRAM,充当 AI 数据的二级缓存(L2 Cache)。

卡马克认为,在 AI 模型训练与推理过程中,为了追求极致的带宽和极低的延迟,传统的 DRAM(动态随机存取存储器)可能并非唯一解。他设想构建一个物理上长达 200 公里的光纤环路,利用光信号在纤维中传输的时间差来暂时「存储」数据。

卡马克指出,目前的单模光纤技术已能在 200 公里的距离上实现 256 Tb/s 的传输速率。根据计算,在这个长度的光纤内部,任意时刻都有约 32GB 的数据处于「飞行传输」状态。

这意味着,这根光纤本质上变成了一个拥有 32 TB/s 超高带宽、容量为 32GB 的存储器。这种「在传输中存储」的方式,特别适合处理具有确定性权重参考模式的神经网络数据。

这一前卫设计让不少资深技术专家联想到了计算机发展初期的「延迟线存储器」(Delay-line memory)。计算机先驱们早在上世纪中叶,曾利用水银管或加金酒(Gin)混合液作为介质,通过声波的传播延迟来存储数据。

卡马克的方案在原理上与其异曲同工,只是将介质换成了光纤,载体换成了光子。相比需要持续供电刷新才能保存数据的 DRAM,光传输的能耗极低,这在 AI 能耗日益庞大的今天具有巨大的理论吸引力。

不过这项技术也面临巨大的技术挑战,尽管光传输节能,但铺设或盘绕 200 公里长的光纤本身成本极高,且配套的光放大器和数字信号处理器(DSP)也会消耗额外能源,可能抵消部分节能优势。

埃隆 · 马斯克(Elon Musk)认同这个颠覆性构想,认为这是有趣的想法,使用高折射率材料,可以进一步减慢光速,增加每公里存储的数据量,甚至在讨论中提出了更为激进的「真空存储」设想,但这些目前更多停留在物理思维实验阶段。(来源: IT 之家)

 

展示量: 36

Pro-C 的「拥挤」与 Consumer C 的「空荡」

AI 创投圈中一个清晰的「共识」正在形成。

近期走访了不少创业者,他们反馈的信号,无论是在北美市场还是国内,生产力类的 AI 应用,其 Pro-C(专业级消费者)用户的付费天花板正在被一次次打破。

比如 Manus 在一月首次出现了几十个月度消费达到 5000 美元的用户。5000 美元/月是 Manus 目前系统设定的个人月度充值上限,对应了每月 120 万积分额度。前阵子,在和 YouWare 明超平直播交流的时候,他的产品里也开始批量出现类似的突破上限的情况。

同时像 Lovable 这样的产品,20 万付费用户就支持了 2 亿美金量级的 ARR,而其典型用户对应的是数百万付费用户级的市场,现在的渗透率才是个位数。

这些信号共同指向一个结论:AI 能力服务 Pro-C 这条路,商业和技术上都通了。

正在形成的共识——ToPro-C 的「新瓶新酒」

ToPro-C 的模式,本质上是把过去 ToB 的生意,用一种全新的 ToC 方式来做,是一种「新瓶装新酒」。它不再是传统 SaaS 那套 SLG(Sales-Led Growth,销售驱动增长)的打法,而是彻底的 PLG(Product-Led Growth,产品驱动增长)。

「新酒」(AI 能力)要装进「新瓶」(增长的方式、商业模式,包括团队组织)里,才是通向下个时代的创新(更详细的可以参见我在 AGI Playground 2025 大会上的演讲:聊过 200 个团队后的暴论:不要拿 AI 造工具,要建设「新关系」)。

ToPro-C 的核心逻辑非常性感:那些能用你的产品赚到钱的人,是你最好的用户。他们能带来超越过去软件天花板的 ARR 和 LTV。

Pro-C 可能是分析师、研究员、程序员、设计师、内容创作者……他们可能是某家大公司里的「特种兵」小团队,也可能是近几年涌现的超级个体。他们有一个共同的特征:他们使用 AI,不是为了「省时间」或「找乐子」,而是为了「赚钱」。他们的使用场景天然处在一套商业闭环中,也可能连接着一个组织的预算。

这就建立了一个全新的价值交换模型。对于普通的 C 端用户,AI 产品的费用大概率会被视为「个人开销」归入「成本中心」。而对于 Pro-C,你的产品可能是他们驱动”利润引擎”的关键要素。

这些用户,看起来是 C(Consumer),但他们的决策和消费行为,完全是由 B(Business)的价值逻辑驱动的。你帮助他们提高了生产力,他们就愿意为你的产品支付与这份生产力相匹配的费用。你的产品越强大,就能让用户赚得越多;用户赚得越多,就越依赖你,也越愿意为你的服务支付更高的费用。这是一个极其健康的价值闭环,也为 AI 应用找到了一个可持续、高 LTV 的商业模型。

ToC 不会一直「too early」,但需要在全球抓「非共识机遇」

今天,ToPro-C 正在迅速地从「非共识」滑向「共识」。

共识意味着安全和确定性,但创业的游戏规则往往是,当一个地方从「无人区」变成「拥堵路段」时,价值发现的红利期就结束了,接下来是残酷的执行和效率之战。

当所有人都挤在同一条赛道里,用相似的思路解决相似的问题,很快就会陷入功能与价格的残酷内卷。但比内卷更可怕的,是一种集体性的「创新惰性」。当一条「被验证」的路摆在面前,人们会下意识地放弃探索其他可能性的艰苦工作,整个行业的思维都会因此而「收窄」。

所以,当大家的重心都被集体晃向 Pro-C 时,反而值得思考的是,这里是不是出现了一个新的「错位」的机会:如果说 ToPro-C 的本质是「把 C 当 B 做」,那么在 Consumer C 这一侧,是不是能够通过技术,让普通用户也可以拥有 Pro 级的表达能力?

过去两年,AI 应用在 ToC 方面的探索的确有些拉胯。大家普遍的体感要么是「光有热闹没留存」,要么是「算不过来账」。这背后确实有客观原因:模型成本高,用户付费意愿低,除了「有点意思」,似乎带不来足够「有用」的价值,用户留存更是一大难题。现在回头看,大部分都是 too early。

过去,一个普通用户想要用 AI 进行单纯的「表达型创造」,比如画个有意思的图、做个好玩的视频,所要付出的时间成本、操作门槛都非常高。对于娱乐和自我表达来说,这种摩擦力是很要命的,用户玩个两三次就不玩了。

但我们必须用发展的眼光看问题,最近业界的几个发展,已经让人闻到了不一样的味道。

最近的视频生成模型,比如可灵 3.0、Seedance 2.0 等展现出了令人惊叹的进化,OpenClaw 也让大家看到了 agent 能力的极大演进。在一些创业项目中,我也看到了 agent 将 Vibe Coding 和多模态能力融合后展现出的交互潜力。这些技术的交汇意味着「表达型创造」的门槛正在无限趋近于零。

可以看到,支撑 ToC 产品的底层技术环境,正在发生剧烈的、非线性的变化。而这些变化,正在为 ToC 创造一个全新的、富含养分的土壤。

我们不知道今天是不是依旧「too early」,但我们可以很确定当这些「富养分」的元素足够多时,ToC 领域就可能存在「开天辟地」的机会。新的内容格式 + 新的内容生产方式,可以形成启动双边平台的破局点。当年的图文、短视频,都是如此。当普通用户也能够轻松创造出高质量的 AI 内容时,优质的 AIGC 内容资产就将持续累积,就可以支撑起另一批用户的「内容消费」。AI 时代在娱乐和内容消费维度的平台级机会,大概率也会以这种方式展开。

无论是 ToPro-C 还是 ToC,从获取更高生存概率的视角,都不能只盯着中国市场,甚至应该更坚决地先在全球市场展开。

国内的巨头们,「过于勤奋」,且有很多「应激」动作。

海外市场,虽然也有巨头,但他们的反应机制往往不会那么「应激」,生态也更为开放。在海外市场,创业者可以拥有更长的发育时期,可以更从容地摸透市场、打磨产品、积累用户,建立起自己的优势。退一步,即便巨头入场,你也可以收获一个较为体面的收购价。今年我们看到 Manus 这样的公司,用事实证明了中国团队完全有能力服务全球的高价值用户。

出海不是为了「高大上」,而是为了活得更久、活得更好。

AI 这一波的创业机遇刚徐徐展开,期待 2026 年能看到更多团队在全球市场探寻开天辟地、水银泻地的机会,这样才会更让人兴奋吧。

展示量: 16

Seedance 2.0:AI 视频第一阶段的比赛,结束了|AI 上新

作者| 金光浩

编辑| 靖宇

这两天,AI 视频圈被偷摸摸上线的 Seedance 2.0 刷屏了。

在 AI 视频领域颇有影响力的博主海辛,在即刻分享了自己对它的观点:

「Seedance 2.0 是我 26 年来最大的震撼」、「我觉得它碾压 Sora2」。

真的如此吗?一点都不夸张。

这是它做出来的视频,一句话音画同出,几乎无限逼近于影院里看到的电影。

虚拟科幻眼镜幻想视频|视频来源:Seedance 2.0 飞书文档

 

字节自己在飞书里发了一份产品介绍文档,标题只有几个字,但意味重大:

视频 Seedance 2.0 正式上线!Kill the game(杀死比赛)。

我在 2 月 7 号下午看到了这份文档,出于好奇点进去想快速扫一遍,结果一看就到了晚上。文档右上角显示的同时在线人数, 从下午两点到晚上十二点,几乎没有掉到 300 人以下 。我凌晨四点关掉页面的时候,还有 90 多人同时在线读文档呢(可能是周日的缘故?)。

2 月 8 日凌晨 4 点飞书文档截图|图片来源:飞书文档

 

一份产品说明文档,被几百人同时围观了十几个小时,我活了三十几年还是第一次见。

我敏锐地意识到: 这可能是一款近期热度堪比 Skills、OpenClaw 的产品。

带着这份好奇,我深度体验了这款模型,看看它到底有什么不一样。


 

栏目作者召集

极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!

现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例: Kimi K2.5 深度实测:变强了,但待「封神」|AI 上新 ) 向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。

同时, 优秀作者还有机会进入极客公园 AI 体验群 ,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。

AGI 太久,只争朝夕,让一部分人先 AI 起来吧! 投稿、进群请扫描下方二维码添加极客小助手微信


 

 

01

Seedance 2.0 做到了什么

 

先说能力层面。

Seedance 2.0 目前已经在即梦平台上线,会员用户(至少 69 元)可以直接使用。 它支持文本生成视频、图片生成视频,也支持视频和音频作为参考素材输入。简单来说,你能想到的输入方式,它基本都支持了。

但真正让我觉得「这次不一样」的,是它在几个关键能力上的突破。

第一个,自分镜和自运镜。

以前用 AI 生成视频,你需要非常精确地告诉模型「镜头从左向右平移」、「先给一个全景再推到特写」。稍微复杂一点的运镜描述,模型就开始犯迷糊。Seedance 2.0 可以根据你描述的情节自动规划分镜和运镜。你只需要告诉它故事是什么,它自己决定怎么拍。

一段非常简单的提示词,可以生成堪比导演运镜的效果。这也是视频自媒体圈炸锅的重要原因,很多导演引以为傲的「运镜」能力,被 Seedance 2.0 集成到了模型里。比如:

黑衣男子快速逃亡视频|视频来源:Seedance 2.0 飞书文档

 

第二个,全方位多模态参考。

你可以同时给它最多 9 张图片、3 段视频和 3 段音频,总共 12 个参考文件。这些参考可以用来指定动作、特效、运镜风格、人物外貌、场景氛围甚至声音效果。只要你的提示词写得够清楚,模型基本都能理解你想要什么。这个能力的上限非常高,等于给了用户一个「导演工具箱」。

使用方式:一键 @|图片来源:即梦

 

第三个,音画同步生成。

Seedance 2.0 在生成视频的同时可以生成匹配的音效和配乐,并且支持口型同步和情绪匹配。角色说话的时候嘴型是对的,表情和语气也能对上。

第四个,多镜头叙事能力。

它可以在多个镜头之间维持角色和场景的一致性。这意味着你可以让它生成一段包含多个镜头切换的完整叙事片段,角色不会从第一个镜头到第三个镜头就换了一张脸。

这四个能力单独拿出来看,每一个都很强。

但放在一起的时候,它们构成了一个质变:

Seedance 2.0 给用户提供的,已经接近「导演级」的控制精度。你不再需要反复抽卡碰运气,你可以真正成为一个专注于讲故事的「导演」。

 

02

实测:我亲手试了三个场景

 

能力参数说得再漂亮也是纸上谈兵。我决定自己上手试试,而且故意挑了三个难度递增的场景。

第一个场景,我想生成一个电影感的镜头。

提示词很简单:樱花树下,一个女孩扭头看向一个猫,花瓣飘落,微风吹过她的头发。女孩摸了摸猫的头,对猫说,你好呀,小家伙,最后画面定格在女孩上。

这种画面在 AI 视频里算是「基础题」,但要做好非常考验细节: 花瓣的飘落轨迹要自然,猫的毛发要有质感,风吹头发的动态要连贯,画面的焦距景深要准确。

Seedance 2.0 出的结果让我挺意外。花瓣的飘落有层次感,近处的花瓣大、远处的小,速度也有差异。猫窝在女孩怀里,耳朵偶尔动一下。头发的飘动和花瓣的方向一致,说明模型理解了「风」这个物理条件。整体的色调和光影处理很电影化,不是那种一眼就能看出是 AI 生成的过饱和画面。

同样的提示词放在三天前,无论用什么模型,我可能都需要抽卡十几次才能撞上这个效果。但这次,我一次就出了。

樱花、女孩、猫视频|图片来源:即梦 Seedance2.0

 

效果很不错,于是继续我加大难度,尝试做一个 15 秒的动漫特效画面。

提示词是这样的:少年主角在战斗中被击倒,在伙伴呼喊声中觉醒隐藏力量。身体周围爆发金色气场,头发变色竖起,眼瞳变为异色。随后以超高速冲向敌人,释放一记巨大的能量斩击,斩击波横切整个天空。

这个提示词信息量很大,包含了情绪转变、特效爆发、动作衔接、画面节奏等多个维度的要求。以前的 AI 视频模型处理这种复杂场景,通常会出现角色变形、特效和动作不同步、画面节奏混乱等问题。

Seedance 2.0 生成的结果,节奏感把控得很好。从被击倒到觉醒有一个明确的情绪转折,金色气场的爆发和头发变色是同步发生的,最后的能量斩击有一个从蓄力到释放的过程,斩击波划过天空的画面确实有燃起来的感觉。

说实话,看到这个结果的时候我脑子里闪过一个念头: 这个效果,已经可以直接放到动漫短视频里用了 。

动漫特效片段视频|图片来源:即梦 Seedance2.0

 

而当我闪过这个念头,一切就变得很夸张:

我决定做一件以前不太敢想的事,直接用 Seedance 2.0 做一个 60 秒的 AI 动漫短剧。

Seedance 2.0 目前最长支持 15s 的视频,60 秒意味着 4 个 15s,这意味着我们需要多个镜头衔接、角色一致性维持、剧情推进有节奏。放在以前基本上需要借助视频 Agent 工具,把任务拆解成多个步骤,一个镜头一个镜头地生成,再人工剪辑拼接。整个流程下来,做一分钟的内容可能需要大半天。

而由于 Seedance 2.0 可以方便的引用多张图片,我可以非常简单的通过提前生成人物和背景来保证不同视频的一致性。

动漫短剧提示词|图片来源:即梦

 

于是,我只是分别四次在 Seedance 2.0 里输入了四个只有具体镜头不同的提示词,一段相同的剧情描述,然后再用剪映把他们拼接在一起,就完成了这样的作品:

镜头之间的过渡是连贯的,角色从头到尾没有变脸,情节推进的节奏也很不错,当然由于我只是随意写的提示词,还是有些小瑕疵。

但整个过程我只花了不到 15 分钟,中途没有重新抽过一次卡,效果甚至比某些专门做 AI 视频的 Agent 工具又快又好。

体验到这里,我已经觉得 Seedance 2.0 真的已经杀死比赛了。

动漫短剧片段|图片来源:即梦 Seedance2.0+剪映拼接

 

03

官方案例:更多能力的展示

 

但我做的测试毕竟有限。

于是我翻了翻官方放出来的案例,有几个让我印象很深。

一个案例展示了 Seedance 2.0 对于动作的模仿,上传一个视频,和一张动漫图,AI 可以近乎完美的模仿舞蹈动作。这意味着什么?上传一个视频,用 AI 换脸做数字人也是非常简单。

模仿动作、数字人视频|视频来源:Seedance 2.0 飞书文档

 

有一个案例展示了 Seedance 2.0 的多模态参考能力。创作者同时上传了一张角色设定图作为人物参考、一段视频(含音乐)作为节奏参考,Seedance 2.0 生成的视频中,角色的外貌和设定图高度一致,动作节奏和音乐的节拍也对上了。两种不同模态的参考信息,丝滑的融合到了一个视频输出里。

理解视频里的语音后做的卡点视频|视频来源:Seedance 2.0 飞书文档

 

还有一个案例可以展示口型同步效果的。

视频制作提示词|视频来源:Seedance 2.0 飞书文档

 

一段角色对话的视频,角色说中文时嘴型准确,表情跟随语气变化。角色说到激动的台词时,眉毛会上挑,眼神会变得凌厉。这种级别的情绪匹配,在 AI 视频领域之前几乎看不到。

融合提示词后生成的视频|视频来源:Seedance 2.0 飞书文档

 

另一个案例更直观地展示了多镜头叙事的能力。一段两分钟的短片,包含了远景、中景、特写、跟拍等不同景别的切换,主角从室外走进室内,光线随之变化,衣服上的褶皱和阴影也跟着调整。全程角色一致性没有崩坏。

一镜到底的动漫视频|视频来源:Seedance 2.0 飞书文档

 

如果你最近多刷视频号、小红书,你会发现官方的案例也只是冰山一角。有很多专业的视频创作者和导演,已经在用它制作「电影」了。

当这些案例放在一起看,你会意识到 Seedance 2.0 已经从「能生成一段视频」进化到了「能拍一部片子」。

 

04

对视频行业意味着什么

 

看完产品本身,我更想聊聊它对行业的影响。因为这可能是比产品本身更重要的事情。

第一个冲击,落在视频/漫剧 Agent 身上。

过去几个月,视频/漫剧 Agent 是 AI 视频赛道里为数不多跑通了商业模式的领域。这类公司的赚钱逻辑其实很朴素:一个视频用模型厂商的 API 生成,市场价 50 块钱。漫剧 Agent 公司跟厂商谈年度大单,一年一千万的量,把单价压到 30 块。然后转手卖给用户 45 块。用户觉得比自己去调 API 便宜,Agent 公司中间赚 15 块的差价。

Seedance 2.0 出来之后,这个生意变得微妙了。如果你用其他模型做出来的效果,质量明显比不上 Seedance 2.0。用户一对比就能看出来。但如果你想接入 Seedance 2.0 的能力,你在短期未必能拿到以前那种折扣价,因为所有人都想用上 Seedance 2.0。

漫剧 Agent 以前的价值在于拆解工作流、优化生成流程,用工程手段弥补模型能力的不足。但当模型本身的能力跨过某个门槛之后,工程层面能优化的点就变少了。

很有可能,未来视频/漫剧 Agent 这个赛道里幸存下来的玩家,需要围绕 Seedance 2.0 的模型能力重新设计产品:

未来比的可能就是你对 Seedance 2.0 的理解程度,然后把这套理解做到 Agent 里,这样,你才是有价值的。

字节跳动开发的视频编辑工具将集成 Seedance 2.0|图片来源:X

 

第二个冲击,来自生成质量的稳定性。

做过 AI 视频的人都知道一个行业内的公开秘密:抽卡成功率。

你让模型生成一段 15 秒的视频,能用的概率是多少?行业平均大概不到 20%。也就是说,你得生成五次以上,才有可能得到一个质量过关的结果。

算一笔账。假设每段 15 秒的视频 API 成本是 5 块钱,做一个 90 分钟的片子,理论成本 1800 块。但实际成本呢?因为 80% 的生成结果要扔掉,真实成本直接翻到了接近一万块。

根据我自己的测试和多位从业者在 X 上的反馈,Seedance 2.0 的可用率直接到了 90% 以上。

这意味着实际成本无限逼近理论成本。 同样是做一个 90 分钟的项目,成本从一万多块直接降到两千多块左右 。省了差不多五分之四,而这种量级的成本压缩,足以改变整个行业的底层逻辑。

ai_massive 创始人的观点|图片来源:X

 

第三个冲击,指向了传统影视制作。

一位做了 10 年院线电影的从业者这样评价 Seedance 2.0: 「单从时间和成本来说,已经不是传统流程能比的了。就拿一个特效镜头来说,传统流程下需要一个高级制作人员花将近一个月才能完成,这还不包括其他制作环节」

这样算,如果特效 5s 钟的镜头做一个月,假设工资算 3000 块钱,现在 3 块钱就能在 2 分钟内做完了,这意味着数千倍成本的下降,以及上万倍效率的提升。

短剧领域受到的冲击可能更加直接。短剧的制作成本中,演员、场地、摄像团队占了大头。如果 AI 能够生成足够质量的真人效果视频,这些成本可能被削减 90% 以上。更重要的是,制作周期的缩短意味着你可以快速做 A/B 测试,用数据驱动内容迭代,这是传统拍摄流程完全做不到的。

万粉博主观点|图片来源:X

 

 

05

第一个「世界模型雏形」的 AI 产品

 

聊完行业影响,我想说一个可能有些大胆的判断。

我认为 Seedance 2.0 是第一个展现出「世界模型」雏形的视频生成产品。

为什么这么说?

过去的 AI 视频模型,本质上是在做画面补全。你给它一个描述,它从训练数据里找到最接近的视觉模式,拼凑出一段看起来合理的画面。但它并不真正「理解」画面里发生了什么。

Seedance 2.0 在几个关键维度上展现了不同的东西。它能理解物理规律,花瓣飘落的方向和风向一致,物体的重力表现合理。它能理解因果关系,角色觉醒力量之后的气场爆发和后续动作之间有逻辑上的承接。它能理解情绪,对话时的表情和语气匹配,动作的节奏和剧情的紧张程度同步。

它同时消化文字、图片、视频、音频四种模态的信息,并将它们融合成一个连贯的视频输出。 这已经超越了简单的「模式匹配」,开始接近对世界运行规律的某种「理解」。

画面符合物理规律的动漫视频|视频来源:Seedance 2.0 飞书文档

当然,「世界模型」这个词在学术界有更严格的定义,Seedance 2.0 离真正的世界模型还有距离。但从产品体验的角度来看,它已经让用户感受到了一种此前不存在的东西: 模型不只是在「画」你描述的场景,它在「构建」一个有内在逻辑的世界。

动漫 AI 动画从业者对 Seedance 2.0 的观点|图片来源:X

 

如果这个判断是对的,那么 AI 视频领域的竞争逻辑会发生一个有意思的转移。

当模型的生成能力足够强、成本足够低、成功率足够高的时候,技术本身不再是瓶颈。你用 Seedance 2.0 能做到的事,理论上别人也能做到。

那什么会成为真正的竞争壁垒?

我觉得答案是两个:好故事和好审美。

技术让「生产」变得民主化了,但「创作」从来不是一个技术问题。知道怎么用工具和知道该创造什么,是完全不同的两件事。当所有人都能用 AI 生成电影级画面的时候,能写出让人看完还想看的故事、能做出让人一眼记住的视觉风格,这些能力会变得前所未有的值钱。

AI 视频赛道的第一阶段,比的是谁能生成更好看的画面、更连贯的动作、更稳定的输出。

Seedance 2.0 把这个阶段的天花板拉得很高,高到大多数竞品短期内够不着,以至于说它杀死了比赛。

第二阶段的比赛已经开始了。

 

06

好工具,改变思考

 

回到我测试 Seedance 2.0 的下午,反复生成了大概十几段视频,一个废片都没有,直到现在,我仍然感觉很不可思议。

到后来有一个瞬间,我突然意识到自己思考问题的方式变了。

我不再想「这个模型能不能做到」,而是开始想「我要讲一个什么样的故事」。

这种思维方式的切换,可能比任何技术参数都更能说明问题。

当工具强大到一定程度,它就从你思考的对象变成了你思考的背景。你不会去想「笔好不好用」,你只会想「我要写什么」。

Seedance 2.0 让 AI 视频到达了这个临界点。工具退到了幕后,创作者走到了台前。

如果你也对 AI 视频感兴趣,现在是一个很好的上手时间点,因为此刻的技术已经足够支撑你的大部分创意了。

真正稀缺的,从来都不是工具,是你脑子里那个还没被讲出来的故事。

还有你那独一无二的,对这个世界的独特审美和视角。

展示量: 16

OpenAI 将于今日开始在 ChatGPT 中测试广告投放;微信整治虚假摆拍视频;天涯社区宣布重启,推 1999 元会员众筹

Altman:ChatGPT 增长「已恢复到 10% 以上」,计划本周推出新模型

2 月 9 日消息,Altman 在内部 Slack 平台上告诉员工,ChatGPT”重新实现月度增长超过 10%”。该公司编码产品 Codex 的用户量较一周前增长约 50%,与 Anthropic 的 Claude Code 形成直接竞争。

面对竞争对手 Anthropic 的加速追赶,OpenAI 首席执行官 Sam Altman 正在向员工和投资者强调公司的增长势头。这家人工智能公司正准备本周推出更新的聊天模型,并于周一开始在 ChatGPT 内测试广告投放。

据 CNBC 周一报道,Altman 上周五在内部 Slack 平台上告诉员工,ChatGPT”重新实现月度增长超过 10%”。该公司编码产品 Codex 的用户量较一周前增长约 50%,与 Anthropic 的 Claude Code 形成直接竞争。

这一表态正值 OpenAI 推动可能高达 1000 亿美元的融资之际。据知情人士透露,Altman 和首席财务官 Sarah Friar 正在私下会议中向投资者展示增长数据,包括显示 Codex 正在蚕食 Claude Code 市场份额的内部图表。融资谈判预计在未来两周升温。(来源:华尔街见闻)

特斯拉市值有望达 100 万亿美元?马斯克称并非不可能

2 月 9 日消息,目前市场上有大量特斯拉多头,对该公司抱有极高的预期,尤其是在其业务版图早已超越汽车与能源领域、正式进军人工智能和机器人技术之后。

不过,部分最为乐观的特斯拉投资者认为,这家公司的市值有望达到 100 万亿美元(现汇率约合 694.34 万亿元人民币);而首席执行官伊隆・马斯克也表示,尽管这一数字听起来近乎荒谬,但并非完全不可能。

作为参考,当前全球市值最高的十家公司——英伟达、苹果、Alphabet(谷歌母公司)、微软、亚马逊、台积电、Meta、沙特阿美、博通以及特斯拉,总市值合计约为 26 万亿美元。

方舟投资(ARK Invest)的凯西・伍德认为,考虑到特斯拉在多个行业的长远布局与雄心,这一估值是合理的:「…… 在人工智能领域,想要胜出需要具备什么?你必须拥有专属数据。想想他手中掌握的各类独家数据:特斯拉拥有道路场景相关数据,脑机接口公司 Neuralink 拥有多组学数据,这些都是别家没有的;X 平台的数据同样独一无二。我完全可以预见 100 万亿美元的市值,我认为这会实现,原因就在于生态协同。基于我刚才所说的理由,特斯拉是最有希望冲击这一市值的公司。」

马斯克在去年年底曾表示,他旗下所有公司似乎都在走向协同融合,而这一趋势已开始落地。特斯拉第四季度财报股东演示文件显示,公司已对 xAI 进行投资;不久前,SpaceX 又收购了 xAI,标志着马斯克旗下众多公司有望形成庞大商业生态的第一步。

随着这一进程逐步推进,马斯克对这一惊人估值的态度似乎更加积极。他在 X 平台上表示,100 万亿美元市值的想法「并非不可能」。(来源: IT 之家)

OpenAI 将于今日开始在 ChatGPT 中测试广告投放

据知情人士透露,OpenAI 计划自本周起在 ChatGPT 中启动广告测试,这标志着这款广受欢迎的对话式人工智能产品正式迈入广告变现阶段。这些广告将以「清晰标注」的形式出现,并被安置在对话窗口下方的独立区域,与用户与 ChatGPT 的聊天内容相区分。

根据 CNBC 的报道,接近该项目的消息人士称,OpenAI 预期从长期来看,广告收入在公司整体营收中占比将低于一半,广告只是其商业模式的一部分而非全部。事实上,围绕「AI 要不要上广告」的讨论最近已在行业内升温:竞争对手 Anthropic 此前在一支超级碗广告中公开调侃称「广告正在进入 AI」,但宣称其自家聊天机器人 Claude 不会展示广告,由此在暗中对标 OpenAI。不过,这支广告在真正于比赛转播中播出时做了软化处理,此前 OpenAI 首席执行官 Sam Altman 曾公开批评该广告「明显不诚实」。

按照 OpenAI 公布的安排,此次广告测试对象为已登录的 ChatGPT 用户,包括完全免费的用户以及价格较低的 Go 订阅用户。公司同时强调,将「保持用户与 ChatGPT 的对话内容不向广告主开放」,即广告主无法直接看到用户的具体聊天记录。然而,OpenAI 也表示这些广告仍会根据「对用户最有帮助」的标准进行优化,意味着系统会利用一定的信号对广告投放进行定向,但不会影响 ChatGPT 给出的对话答案本身。(来源:cnBeta)

微信正式推行「剧情演绎」分级分类标注管理,整治虚假摆拍视频

2 月 9 日消息,微信发布虚假摆拍视频阶段性治理公告(二),为进一步压实平台主体责任,维护清朗网络空间与用户合法权益,平台持续深化对「以假乱真」摆拍内容的专项治理。自首期公告发布以来,累计处置相关违规视频 3813 条,封禁恶意账号 39 个。

在此基础上,平台已启动对未标注「剧情演绎」摆拍内容的分级分类管理试点,对累计 3 万余条存量视频实施了补充标注提示。治理范围重点涵盖生活技巧、安全知识(如防骗演示)及搞笑、情感、职场等虚构故事场景。平台将持续强化技术识别与人工巡查,并完善标注引导机制,推动创作规范透明。

在前期试点基础上,微信全平台正式推行「剧情演绎」分级分类标注管理。目前,平台已主动提醒超过 5 万多个创作者进行规范标注提示,旨在提升内容透明度。(来源:IT 之家)

淘宝闪购投入 20 亿元,加大春节城市骑士激励

2 月 9 日消息,淘宝闪购宣布投入近 20 亿元,提前做好运力储备。留岗骑士将比平时至少多收入数千元,一线城市可多挣上万元。

据悉,随着春节订单暴涨,淘宝闪购推出了多重奖励活动,包括节日激励、长线活动和拉新奖励等,很多骑士有望收到万元「年终奖」。其中,春节期间有留岗、返岗奖励,单单奖,天气时段补贴等;长线活动则包括赛事奖励、加油包和叠加奖励等;推荐新人入职,骑士和跑单新人都会收到奖励。

此前,淘宝闪购在 1 月 23 日官宣,1 月 17 日起针对平台内稳定活跃跑单的城市骑士群体,开放回乡和返岗的火车票补贴(回乡车票优惠 50 元,返岗车票优惠 100 元)。

活动覆盖全国直营城市的稳定活跃骑士(段位≥4 星)。(来源:IT 之家)

情怀标价 1999:重启的天涯,是「爷青回」还是「割韭菜」?

2 月 9 日,关停近三年的天涯社区通过「天涯客」微信号官宣重启,计划 2026 年 6 月 1 日恢复访问,此次重启由天涯好东西(海南)电子商务有限公司主导,核心是推出「新天涯创世成员」众筹计划。

该计划推出全球限量 9999 份、售价 1999 元的创世成员服务包,权益包含合规联盟链永久铸造的专属数字徽章、天涯客高级会员礼盒、天涯神帖付费专区 10 年免费阅读权、可找回个人数据并实现数据永存的天涯元空间,以及天涯客 10 年高级会员折扣和等值 1999 元的天涯金豆。目前这一重启举措引发市场和用户不同反响,1999 元的定价成热议点,部分资深用户为情怀支持,也有不少人对定价提出讨论。(来源: TechWeb)

众擎发起全球首个人形机器人格斗联赛,冠军可得 1000 万纯金腰带

2 月 9 日消息,首届全球人形机器人自由格斗联赛(简称 URKL)举行发布会。作为全球范围内首个专注人形机器人领域的商业化自由格斗赛事,本次发布会由深圳众擎机器人科技股份有限公司发起。

公司创始人兼 CEO 赵同阳宣布,URKL 联赛将为最终冠军团队颁发价值 1000 万元的纯金腰带,希望让赛事成为技术创新的「试金石」与人才发掘的「孵化器」。

众擎旗下的 T800 人形机器人于 2025 年 12 月发布,定价 18 万元起。通过搭载全栈一体化高爆发关节模组,众擎 T800 的协同输出可实现 450N・m 峰值扭矩,以及瞬间关节 14000W 峰值功率。赵同阳称人形机器人体能超 90% 男人,先把「身强力壮」做好。(来源:IT 之家)

对标折叠屏 iPhone?华为 Pura X2 升级 16:10 宽屏,主打大屏创作与影音体验

近日,数码博主「体验 more」透露了华为下一代折叠屏旗舰 Pura X2 的重磅产品细节。据悉,新机将突破现有设计边界,成为华为旗下首款「阔大折」设备,即拥有宽阔比例的大尺寸折叠屏手机,其整体尺寸将明显超过前代产品。

屏幕规格是此次升级的核心亮点。Pura X2 配备了一块 7.69 英寸的 WQHD+内屏,外屏尺寸则达到了 5.5 英寸。这一配置不仅大幅提升了外屏的实用性,更让内屏的信息展示能力得以跃升。在屏幕比例上,Pura X2 预计将延续前代的 16:10 宽屏方案。这种接近平板的显示比例,能够有效增加可视面积,从而显著优化用户在观影观影、内容创作以及网页浏览等多种场景下的视觉体验。

核心硬件方面,Pura X2 将迎来大幅性能飞跃。新机预计将搭载与华为 Mate 80 系列同款的麒麟 9030 芯片。这款芯片采用了全新的 9 核心架构设计,预计在运算能力和能效比上均有显著提升。。

值得注意的是,「阔折叠」似乎正成为行业高端折叠屏的新风向。多方爆料已确认,苹果计划于今年 9 月发布的折叠屏 iPhone 也将采用类似方案,展开后的显示比例接近平板电脑。(来源: TechWeb)

消息称 OPPO Find N6 折叠屏手机 3 月 17 日发布,主打轻薄与 2 亿像素影像

2 月 9 日消息,消息人士 Yogesh Brar 在 X 平台透露,OPPO Find N6 折叠屏手机将在 3 月 17 日发布。

这名消息人士透露,Find N6 手机将在中国及南亚、欧盟地区市场全球发布,不过印度被排除在外,搭载 2 亿像素摄像头,支持「AI 手写笔」(AI Pen),可选钛色和橙色两种配色,主打轻薄设计。

此前,OPPO Find 系列产品负责人周意保透露,Find N6 折叠屏手机年后不见不散,主打「更加强大,依旧轻薄」特性。

同时,型号为 PLP110 和 PLP120 的 OPPO 新机已通过 3C 认证,博主 @ 体验 more 认为这两款手机是 Find N6 和卫星通信版,支持 80W 快充,是年后第一款骁龙 8 Elite Gen 5 大折叠,应该是 3 月发布。(来源:IT 之家)

成本仅千元却登顶 App Store:「猫咪语言」成现象级爆款

2 月 9 日消息,主打人猫互动的「猫咪语言」APP 成现象级爆款,登顶苹果 App Store 付费榜且高热态势已持续半月,目前稳居付费榜第二。

该 APP 定价仅 1 元,是其快速圈粉的关键,流量高峰单日下载量较平日激增近千倍,平均增幅超 500 倍,现已实现盈利并产生稳定收益。

这款爆款开发门槛极低,由两人团队利用周末耗时约两个月完成,总成本仅千元左右;功能上精准切中养猫人群核心痛点,提供猫语音频播放、猫咪互动小游戏、猫咪性格测试三大服务,部分音频素材录制自开发者自家猫咪,真实性和实用性突出。该 APP 的走红,也印证了国内应用市场正迎来垂直领域轻量化应用的爆发潮。(来源: TechWeb)

 

展示量: 14

库克,终于开口谈了「退休」,但更让他焦虑的是 AI

最近几年,随着互联网舆论风起云涌,苹果现任 CEO 库克「即将退休」,以及苹果在探索更多 AI 硬件产品形态,似乎都已经成为定数。但苹果对外的宣传主线,一直是 2026 年第一季度即将到来的 Apple Intelligence、关于 AI 硬件的未来规划透露甚少,也让大家对此更加好奇,更无从确认苹果高管对此事的态度。

本周,Apple CEO Tim Cook 在周四与公司员工的一场会议中表示,他对「由 AI 驱动的新产品与服务品类」感到兴奋。

当 Tim Cook 说出「由 AI 驱动的新产品与服务品类」这句话时,语气里其实透着一种少见的急迫感。这不太像他的风格——过去这些年,库克面对外界的「后 iPhone 时代焦虑」,一直都是四两拨千斤地回应,从不正面接招。

但这次不一样,他主动把话题摆到了桌面上。

 

这句话信息量很大。它既像是在回应外界对「后 iPhone 时代」的焦虑,也像是在给苹果内部定一个更具体的方向。

更关键的是,库克其实说出了一个很多人都心知肚明、但苹果一直没公开承认的事实:

下一代硬件入口要出现,但它离不开一个前提——Siri,或者说现在的 Apple Intelligence 必须先被重做。

01

Apple Intelligence 很好,

但它还撑不起「新品类」

 

过去一年多, 观察苹果在 AI 上的推进节奏。说实话,这家公司的做法很「苹果」:先把生成式能力塞进现有设备与操作系统,再谈更激进的新形态。

2024 年 WWDC 上,苹果发布 Apple Intelligence,把生成式模型、隐私与系统体验绑定在一起。同年 10 月,Apple Intelligence 开始在 iPhone、iPad 与 Mac 上落地。到 2025 年 3 月,iOS 18.4 等版本进一步把功能扩展到更多地区与语言,包括简体中文。

听起来进展不错?确实。但这条路线的「天花板」也很清晰:只做写作润色、图片修图、通知摘要,很难支撑库克口中的「新品类」。

 

现有的 Apple Intelligence 距离苹果设想中的完全体还有很大一段距离|图片来源:Apple

 

我自己用 Apple Intelligence 也有大半年了。它确实方便——帮我整理邮件摘要、修改文案语气、快速抠图。但说实话,这些都是「锦上添花」的功能,不是「非用不可」的能力。你把它关掉,生活也不会有什么实质性的不方便。

真正决定新品类成败的,依然是 Siri 的能力上限。

苹果在 2024 年展示过更「懂你」的 Siri:能理解个人上下文、识别屏幕内容,并在应用内外代你完成动作。但苹果随后确认,这些更高级的能力要延期到 2026 年。进入 2025 年后,苹果又把操作系统命名切换到按年份对齐(iOS 26 等),这也让外界更容易用「版本—时间」去对照 Siri 的交付节奏。

更关键的是,苹果对 Siri 的重做看起来分成了「两段式」。

第一段,是把苹果在 WWDC 2024 画过的「个人上下文 + 跨 App 执行」补齐,目标窗口指向 2026 年春季的 iOS 26.4。

第二段,是把 Siri 改造成更接近聊天机器人的系统级入口。路透社引述彭博社称,苹果在内部推进代号为「Campos」的新版 Siri,作为 2026 年后续操作系统更新的核心变化之一,并且会更深地嵌入 iPhone、iPad、Mac。

同一时期,路透社还报道苹果与谷歌达成多年协议,在新版 Siri 等 AI 功能中采用 Gemini 模型;苹果对相关报道未予置评。

把这些线索串起来,你会发现:苹果正在为 Siri 做一场「全面手术」,而这场手术的成败,直接决定了库克口中的「AI 新品类」能不能立得住。

02

    两类「低风险可穿戴」,

都在等 Siri 撑场子

 

把时间线摆在一起看,库克所说的「AI 新品类」,大概率会先从两种「低风险可穿戴」开始:智能眼镜与 AI Pin。

 

两者共同点很明确:传感器与语音交互在身上,算力与屏幕仍可阶段性借力 iPhone。这能把第一代产品的工程风险压到更可控的范围。毕竟,苹果不是创业公司,它不会押宝一个完全独立于 iPhone 生态的新硬件——至少不会在第一代就这么干。

第一种产品现在毫无疑问,就是年单品出货已近千万、且被 Meta 等大厂验证过的 AI 眼镜。

彭博社此前报道,苹果在 2025 年加速推进智能眼镜项目,同时把更便宜的 Vision Pro 方案放到较次优先级,并将部分团队资源转向眼镜。

 

Apple Vision Pro 的研发量产让苹果在头戴式智能硬件领域仍然是最强选手之一|图片来源:视觉中国

 

现有爆料普遍指向「先无屏、后有屏」的两代策略:首代更像带摄像头、麦克风、扬声器的语音终端,提供通话、音乐、翻译、导航等能力;量产时间点更可能落在 2027 年,带显示能力的后续版本再往后。

这类产品体验的「第一性原理」很残酷:用户愿意把眼镜戴一天,前提是它能随叫随到、听得懂、做得到。最终又绕回 Siri。

站在当下,我在自己深度体验过 2025 年的几款「大厂出品」 AI 眼镜之后,包括 Meta 的 Ray-Ban Display 在内。说实话,硬件都已经达到了 60 分的水准,但语音助手的体验都是灾难级别的。你跟它说话,它要么听不清,要么听错,要么听懂了但做不了。试过几次之后,你就不想再用了。

如果苹果的智能眼镜搭载的还是现在这个 Siri,那它跟市面上其他产品的区别,可能只剩下外观设计和价格了。

第二种苹果同样在探索的产品形态就是有着全新 Apple Intelligence 能力加持的 AI Pin。

 

虽然 AI Pin 失败了,但胸针产品形态在 2025 年多次出现,并成为 AI 硬件的重要形态之一|图片来源:AI Pin

 

近期《The Information》的信息被多家媒体转述:苹果在积极开发一款类似「别针」的可穿戴,尺寸接近 AirTag,配双摄与多麦克风,用来感知佩戴者周围环境;最快 2027 年进入市场。路透社同样在「Campos」报道里提到,苹果还在研发带多摄像头的 AI 可穿戴 pin。

这类产品同样高度依赖「能执行的语音助手」:当交互窗口缩小到衣领或胸前,任何一次误触发、误理解、半途失败,都会把产品从「助理」打回「玩具」。

Humane 的 AI Pin 就是前车之鉴。硬件做得很精致,理念也很超前,但最终还是败在了语音交互的体验上。用户不会为「未来感」买单,他们只为「好用」买单。

所以你看,无论是智能眼镜还是 AI Pin,苹果都在赌同一件事:Siri 能不能在 2026-2027 年变成一个真正「能打」的语音助手。赌赢了,这些新品类才有机会;赌输了,它们可能只是又一批「概念产品」。

03

iPhone 仍是中枢,

但苹果在为「交接」做准备

 

即便「AI 新品类」真能跑起来,iPhone 仍会在很长一段时间里承担中枢角色。

一方面,苹果的 AI 能力在系统层面继续扩展:2025 年 9 月,苹果在 iOS 26 等系统更新中继续发布新的 Apple Intelligence 功能,并预告后续语言覆盖。

另一方面,苹果也在为 2026 的 iPhone 产品线做结构调整的准备。根据 The Information 等媒体的消息与二次转述,苹果可能在 2026 年把首款折叠屏 iPhone 与 Pro 系列放在下半年,把标准版延后到 2027 年春季,以消化更复杂的产品组合。

 

折叠屏 iPhone 可能是 iPhone 自诞生以来最重要的形态变化||图片来源:视觉中国

 

对苹果来说,这个节奏变化本身就是一种表态:所谓「后 iPhone 时代」不会在一两代产品内到来,更像是 iPhone 带着新终端一起往前走。

但更有意思的是组织层面的变化。

库克在内部会议里也谈到了接班与退休的语境:他会花很多时间去想五年、十年甚至十五年后的管理层构成,并把这视为领导力的一部分。

 

库克担任苹果 CEO 的时刻已经接近尾声|图片来源:视觉中国

 

过去半年,苹果的高层变动动作明显加速:

  • 2025 年 7 月,苹果宣布 COO 交接;
  • 2025 年 12 月,苹果又宣布政策与法务线的关键交接计划——Lisa Jackson 将在 2026 年 1 月底退休,Jennifer Newstead 将在 2026 年 3 月出任新任总法律顾问,现任总法律顾问 Kate Adams 计划在 2026 年晚些时候退休

与此同时,彭博社与《金融时报》等报道还把「AI 负责人离任/调整、设计团队流动、硬件负责人职责扩大」等变化,解读成苹果在为库克之后的时代加固梯队的信号。

这些线索汇合到一起,库克在 2026 年初释放的信号就更清晰了:苹果一边要把 Apple Intelligence 从「功能集合」推向「可执行的系统入口」,一边要为两类新终端准备落地条件;组织层面也在同步做「可交接」的结构调整。

对外,它回应了「AI 会不会取代手机」的叙事;对内,它更像在要求团队把 Siri 这块短板补齐,因为新品类的门票就在这里。

库克还提到,成立于 1976 的苹果,将在 2026 年 4 月将庆祝公司成立 50 周年。

从「个人电脑」到「智能手机」,苹果过去每一次换代都押对了新入口的交互范式。50 周年节点前后,苹果需要给下一个十年的入口故事定调。

库克这句「AI 新品类」,大概就是这份定调的开场白。但能不能唱下去,还得看 Siri 争不争气。

说到底,苹果这次不是在赌 AI,而是在赌语音交互能不能成为下一个时代的主流界面。这个赌局,微软、谷歌、亚马逊都下过注,但到目前为止,没人真正赢过。

苹果会是那个例外吗?

2027 年见分晓。

展示量: 15

GitHub 上,人类已经干不过 AI 了

作者| 桦林舞王

编辑| 靖宇

如果几年前有人跟码农同学说,「你以后可能要和 AI 抢 GitHub 提交记录了」,他大概会笑掉大牙。

但现在,他可能完全笑不出来了。

根据 SemiAnalysis 最新发布的分析报告,Anthropic 的 Claude Code,目前已经贡献了 GitHub 上 4% 的公开提交量,并且有望在 2026 年底:

达到 20% 的日提交量 。

这不是一个简单的数字游戏。

当一个 AI 工具开始在全球最大的代码托管平台上「刷存在感」, 它实际上正在重新定义什么叫「写代码」 。

 

01

AI「霸榜」GitHub

 

4% 看起来并不是个很大的数字,但可怕的是这个数字背后的意义。

GitHub 每天的提交量是一个天文数字。全球数千万程序员在这个平台上推送代码、修复 bug、发布新功能。而现在, 每 25 次提交中,就有 1 次来自 AI 。

Anthropic Claude Code 负责人 Boris Cherny 在 X 上毫不避讳地「炫耀」: 他的团队现在 100% 使用 Claude Code 写代码 ,连小的编辑都不再手动操作。

更夸张的是,他们用一周半时间就用 Claude Code 构建了 Cowork 应用。

这种效率提升不是线性的,而是指数级的。

但真正让人震撼的不是速度,而是质量。一位企业用户透露,他 80% 的时间在使用 Claude Code,剩下 20% 用其他工具。

「 我的公司为 Claude Code 付费,我甚至不看成本 。」

这句话很有意思——当一个工具好用到让人「不看成本」,说明它创造的价值,已经远超价格。

曾有业内人士曾这样评价 AI Coding 的优势:「AI 能绕过官僚主义。如果犹豫不决会让大型组织陷入瘫痪, AI 不在乎。它会愉快地生成一个版本 1 。」

这句话点出了 AI 编程的核心优势——没有包袱,没有犹豫,没有「完美主义焦虑」。

 

02

程序员的「存在危机」

 

但硬币总有两面。

在 Hacker News 上,一位用户分享了他的挫败感:「多次我希望代码看起来是某种样子,但它不断拉回到它想要做事情的方式… 最终, 我发现不与它争斗、让它按照它想要的方式做事情更容易 。」

这段话透露出一个微妙的权力转移:

从「人指导 AI」到「人适应 AI」 。

Every 公司 CEO Dan Shipper 在博客中写道:「我们正处于自主编程的新时代。你可以在不看一行代码的情况下构建令人惊叹的复杂应用程序。」

听起来很美好,但这也意味着传统意义上的「程序员」,正在消失。

如果你不需要看代码就能构建应用,那「会写代码」,还算是一种核心技能吗?

SemiAnalysis 的分析师预测, 这个趋势将推动 Anthropic 在 2026 年实现爆发性增长,甚至超越 OpenAI 。相比之下,GitHub Copilot 和 Office Copilot 虽然领先了一年,但「几乎没有作为产品取得任何进展」。

这个对比很残酷,也很说明问题:在 AI 时代,先发优势可能不如产品体验重要。

 

03

重新定义「程序员」

 

但程序员同学可能不需要过分焦虑,程序员这个岗位不会消失,只是这个职业的定义在改变。

就像 Dan Shipper 说的,即使在 2025 年,「你仍然需要真正理解底层架构,也许你仍然需要去查看代码」。

但这个「需要」的含义已经不同了。

程序员正在从「代码编写者」变成「AI 协调者」 。

你需要知道如何与 AI 对话,如何审查它的输出,如何在它犯错时纠正它。你需要理解系统架构,但不一定需要亲自实现每一行代码。

一位 Google 工程师的反思很有代表性:社区对 AI 编程能力的讨论「紧张」,一方面惊叹于能力的提升,另一方面担心被替代。但他强调,领域专业知识仍然重要,原型和生产环境之间的差距仍然存在。

当 AI 编程足够便宜、足够好用,整个软件开发的经济学都会改变。

也许 20% 的 GitHub 提交量只是开始。也许几年后,我们会看到 50%、80%,甚至更高的比例来自 AI。

这未必意味末日,而是一个新开始。真正的程序员不会被 AI 替代,而会学会如何让 AI 成为最强大的工具。

就像计算器没有让数学家失业一样,AI 也不会让程序员失业——它只会让那些拒绝进化的人失业。

代码即是机器语言,是 AI 的母语,将机器语言交还给机器本身,人类用自然语言描述 Idea,看起来似乎是个更自然的结果 。

展示量: 22

文章分页

上一页 1 … 25 26 27 … 827 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间