Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

标签: 科技

美国最高法院裁定支持 TikTok 禁令,周受资发视频回应;传网易裁撤战投部;三星与 OpenAI 合作开发 AI 电视

周受资回应,感谢特朗普

北京时间 1 月 18 日,字节跳动集团旗下 TikTok CEO 周受资发布视频,回应美国最高院维持 TikTok「不卖就禁」法案,他称:我们一直在为保护 1.7 亿多美国人的宪法言论自由权利而奋斗,他们每天使用我们的平台连接、创造、发现和实现他们的梦想。
周受资希望代表 TikTok 的每个人和全国各地用户,感谢美国当选总统特朗普致力于与 TikTok 合作,找到一个让 TikTok 在美国可用的解决方案。这是支持第一修正案和反对武断审查制度的坚定立场。(来源:第一财经)
 

亚马逊去年购买的可再生能源比其他任何公司都多

亚马逊去年快速购买可再生能源,新增了约 100 个项目,使其投资组合的发电能力超过 33 千兆瓦。这比与其最接近的竞争对手苹果多出 10 千兆瓦。该公司的总投资组合在公用事业规模的风力和太阳能发电场与现场太阳能发电项目之间大致平分秋色。
亚马逊表示,这些项目总计足以为 830 万户家庭供电。根据 BloombergNEF 的数据,亚马逊成为可再生能源的最大企业买家。(来源:cnbeta)
 

美国最高法院裁定支持 TikTok 禁令

本周日(1 月 19 日)是美国政府强行要求短视频社交平台 TikTok 出售或面临被禁的最后期限。当地时间今天(1 月 17 日)上午 10 点,北京时间深夜 11 点,美国最高法院裁定,支持这一法律。TikTok 在美国有约 1.7 亿用户。
去年 4 月 24 日,美国总统拜登签署一项国会参众两院通过的法案,要求 TikTok 母公司字节跳动在 270 天内将 TikTok 出售给非中国企业,否则这款应用程序将在美国被禁用。(来源:CCTV 国际时讯)
 

消息称网易裁撤战投部:或与海外投资失利有关,超百人受影响

消息人士 1 月 16 日透露,网易在两周前已陆续裁撤整个战略投资部门(以下简称「战投部」),传闻仅留下网易游戏全球投资与合作部总裁朱原(Simon Zhu)坐镇。
报道称,此次裁员规模庞大,或涉及上百人。此次战投部门的大规模裁员,或与网易在近年的海外投资失利有关。知情人士透露,网易战略投资部门的亏损额度很高,这一情况或引起网易最高层的直接不满。
据悉,2024 年 11 月,网易游戏旗下海外工作室 Worlds Untold 宣布暂停运营,该工作室由《质量效应》系列编剧 Mac Walters 于 2023 年 11 月创立。
另外,网易旗下在日本设立的樱花工作室官网已关闭,负责人赤塚哲也似乎已从其领英资料中移除了与樱花工作室相关的所有信息。此外,该工作室唯一作品《圣剑传说:玛娜幻象》的项目总监吉田亮介宣布离职,并确认加入 Square Enix 公司。(来源:雷峰网)
 

消息称地平线组织再调整,苏箐将主导高阶智驾方案落地

1 月 18 日消息,国产智能驾驶解决方案提供商地平线近期发生多项组织调整,主要涉及智能汽车事业部、「土星五号」项目团队等。调整完成后,地平线高阶智驾研发、工程团队的管理权限,将进一步向副总裁兼首席架构师苏箐集中。
地平线智能汽车事业部下属 AE(Application Engineer)应用工程部的大部分人员,将并入智驾算法团队下属的「土星五号」项目。而地平线负责智驾方案测试、交付和功能维护的人员,大部分将继续留在智能汽车事业部。
「土星五号」是地平线高阶智驾研发的项目代号,主要负责基于地平线征程 6P 研发高阶智驾方案 Horizon SuperDrive,团队负责人是苏箐。苏箐此前是华为车 BU 智能驾驶产品部部长,他在 2022 年 10 月加入地平线。
从公开资料获悉,华为于 2021 年 7 月发布的一封人事任免文件显示,免去苏菁智能驾驶产品部部长职务。华为方面当时对此回应称,苏箐在参加外部活动谈及自动驾驶技术与安全时,针对特斯拉,发表了不当言论。
2022 年 1 月,华为方面透露苏箐确已离开华为车 BU,感谢苏箐对车 BU 所做的贡献。(来源:晚点 Auto)
 

极越汽车:启动用户定金退款登记,1 月 22 日起退回

据极越汽车官微,自 2025 年 1 月 17 日起,极越汽车将针对已支付意向金/定金、尚未提车且符合退款条件用户,有序开展全额退款工作。预计 1 月 22 日起,款项会通过银行转账的方式退回至用户的账户。(来源:36 氪)
 

香港破产管理署:香港去年破产呈请增加 17%

据报道,香港破产管理署数据显示,去年破产呈请书数字 9190 宗,是 2015 年后最高,按年升约 17%。单计上月有 781 宗,按月跌逾 6%,按年升近 16%。强制公司清盘呈请方面,去年有 740 宗,按年升逾 30%,是 2009 年后最多。上月呈请有 57 宗,按月跌近 21%,按年升 39%。(来源:界面)
 

拜登要求 AI 基础设施不离岸,巨头海外建设计划或受阻。

近日,拜登签署了一项关于 AI 的行政令,要求美国国防部和能源部租赁联邦场地,然后通过「招标」的方式,让企业在这些联邦场地上建立 AI 智算中心。拜登表示,这项政策旨在确保美国能够快速而大规模地建设 AI 所需的基础设施,包括了大规模 AI 智算中心及 AI 智算中心所需的清洁能源设施。
随着这项行政令出台,云计算厂商的全球 AI 智算中心的建设进程将被减缓。「如果亚马逊、微软和谷歌在海外建设 AI 智算中心计划还处于早期规划阶段的话,那么这些规划可能被搁置或延迟。如果已经投入建设,影响会较小,不过将会改变实际的内部 IT 部署计划。」Omdia 分析师王珅认为。(来源:第一财经)
 

美 FTC 警告:微软与 OpenAI 的合作引发反垄断担忧

美东时间周五(1 月 17 日),美国联邦贸易委员会(FTC)发布报告称,微软与 Open AI 的合作引发了担忧,这家科技巨头可能会将其在云计算领域的主导地位延伸到新兴的人工智能(AI)领域。报告指出,微软与 OpenAI 的合作关系,以及亚马逊和谷歌与 AI 公司 Anthropic 的合作,都增加了 AI 开发公司未来可能被科技巨头「完全收购」的风险。
FTC 主席莉娜·可汗在声明中表示:「FTC 的报告揭示了大型科技公司的合作关系会如何造成锁定、剥夺初创企业的关键 AI 资源,以及泄露可能破坏公平竞争的敏感信息。」(来源:财联社)

三星正着手与 OpenAI 合作开发 AI 电视

据报道,三星电子正在与 OpenAI 协调,在两家公司之间建立「开放式合作伙伴关系」。如果与 OpenAI 的合作关系最终确定,预计将推出各种人工智能驱动的服务,打造新一代人工智能电视。(来源:财联社)
 

苹果首款「负碳」产品,消息称 Apple Watch SE 3 采用海洋回收的塑料材质

1 月 18 日消息,YouTube 频道 Front Page Tech 主播 Jon Prosser 昨日在 X 平台发布推文,曝料称苹果 Apple Watch SE 3 智能手表将采用环保再生塑料材质,并可能推出更多配色以吸引年轻用户群体。
消息称 Apple Watch SE 3 的外壳材质虽然是塑料,但却是从海洋回收的塑料,苹果公司可能会将其宣传为首款「负碳」(Carbon Negative)产品,这与苹果公司一直以来的环保理念相符。

 

负碳(Carbon Negative)指的是一个公司、组织或国家从大气中去除的二氧化碳 (CO2) 比其排放的更多。这意味着他们不仅实现了碳中和(Carbon Neutral 或 Net Zero,排放量等于移除量),而且还产生了净负的碳足迹,有效地帮助减少大气中的 CO2 总量。
彭博社记者 Mark Gurman 在其最新的 Power On 通讯中预测,Apple Watch SE 3 将于 2025 年下半年发布。(来源:IT 之家)

在一家初创公司的帮助下 OpenAI 正在尝试延长人类的寿命

据报道,Open AI 称它与 Retro Biosciences(一家长寿科学初创公司)合作,训练了一种名为 GPT-4b micro 的新人工智能模型,Retro Biosciences 正试图将人类寿命延长 10 年。
报道称,山姆-奥特曼支持的 Retro 公司已经与 OpenAI 就这项研究合作了大约一年时间。GPT-4b 微型模型试图重新设计蛋白质–一组被称为山中因子的特定蛋白质–这些蛋白质可以将人类皮肤细胞转化为看似年轻的干细胞。
Retro 公司认为,这些蛋白质是构建人体器官和提供替代细胞的一个有希望的步骤。
该模型与谷歌获得诺贝尔奖的 AlphaFold 略有不同,后者可以预测蛋白质的形状,但它似乎是 OpenAI 首个为生物研究定制的模型。
OpenAI 和 Retro 表示,他们计划发布有关该模型及其输出结果的研究报告。(来源:麻省理工学院技术评论)
浏览量: 49

只用 45 天达成 100 万美金 ARR,这家创业公司找到了 AI 落地的解法

45 天,3D 生成产品 Rodin 达成了 100 万美元 ARR。这是一个重要的里程碑,作为对比,GenAI 领域最成功的初创公司之一 HeyGen 达到这个数字花了 7 个月。

Rodin 来自影眸科技,刚刚完成数千万美元的 A 轮融资,投资方包括字节跳动和美团龙珠等。

四位联创,平均年龄 25 岁,但他们已经创业四年。四年前,都是同学,技术多自信,业务就多坎坷。

我们和 CEO 吴迪、CTO 张启煊坐下聊了很久,听到很多他们问自己的问题,那些问题在四年的探索中慢慢有了答案。

「我们技术这么好,客户为什么不用?」第一个问题,超典型技术小天才。

影眸已经花了四年求解这个问题。

01

3D 的表达是「割裂」的

Rodin 1.0 用 45 天迈过了 100 万美元 ARR,那已经是半年前的故事了。现在 Rodin 陆续完成几次版本迭代,升级到 1.5 版本,模型性能已经完成一次跨越。

1.5 版本最重要的特点是:能够生成直角。听上去却很「简单」,就是更准确地生成直线、直角和或者平滑曲面,以及更好的边缘锐度。

当外界对 3D 生成的期待变成动辄用几句自然语言就能变出现实世界一角,一个更准确的「直角」,价值在哪里?

使用 Rodin 创建的影视级作品

「3D 生成,生成的究竟是什么?」这是最基础,但也最关键的问题。

有人觉得是视频,或者说,大多数人对 3D 的理解,很大程度上等同于一段充满 3D 元素的视频内容。90 年代的《玩具总动员》,后来李安的数字版威尔史密斯,早年多边形的游戏,去年爆火的《黑神话:悟空》,所有人都能通过平面感受到 3D 作为一种影像呈现方式的魅力,不管是电影银幕,还是游戏电脑的屏幕。

于是,从 2D 视频出发模仿 3D,成为了一条很重要的技术路线。

Sora 在 2024 年初横空出世,demo 视频里的高一致性,引发了人们探讨它是否会直接覆盖 3D 生成的工作。但很快,Sora 迟迟不发,追随者表现一般,视频模型距离「电影级」或加入游戏管线还有很长的时间。

原因很多,比如生成式 AI 的能力仍然被高估了,就像电影概念艺术家和插画家里德·索森(Reid Southen)在早些时候的判断,「这些视频有点太草率了,有太多问题,尤其是时间一致性和额外肢体之类的伪影」。

但一个被忽视的问题在于,一段演示着 3D 形象的画面,到底是「3D」,还是更偏向「视频」?

视频作品意味着直接面对着它的消费者,但游戏和影视创作中的「3D」概念,本身是一个完整工业中的一环,比如一座虚拟建模的花果山,它需要能够在后续的创作环节中被继续使用。

「3D 生成,究竟生成的是什么?」

「与视频不同,3D 是个工业,它有下游环节。视频输出之后用户可以直接分享,手机里就可以看,但是 3D 生产好之后要想去进一步使用,需要适配渲染器,需要适配游戏引擎,如果是具身智能的话,需要适配仿真软件。这就要求我们对(模型)输出的东西,需要和一些工业标准需要去做好对应。」

「在我们的理解里,3D 是一种资产」,启煊说,「文字、图像、视频,都是消费级,直接与 C 端用户见面,但 3D 不是。」

用户使用 Rodin 批量生成的 3D 资产

文字、图像或者视频发展到现在,都已经成为消费级的内容,这意味着他们都是直接与 C 端用户见面的。这在技术层面也就意味着,三个模态的表达已经在行业里达成基本的一致。

「视频有它的主流编码,图像可能目前主流的是一个二维矩阵,每个位置上记录它颜色。文字可能就是一些字符上的编码」,启煊说,「但 3D 不是,到现在为止它的表达还是很割裂的」。

这种割裂是指,比如一个 3D 数字人的面部建模,可能会使用特定的格式来支持复杂的面部表情和身体动画,这通常需要高精度的网格和骨骼绑定技术;大逃杀游戏中的建模更注重性能和效率,对地上的一把枪通常采用低多边形风格的建模方式;而一款车在设计阶段的 3D 建模,重点在于精确的几何形状和功能性表现,需要详细地展示其内外结构、机械部件以及空气动力学特性,这种建模通常需要使用专业的 CAD 软件,并结合工程和设计的严格标准,以确保模型的准确性和实用性。

所有对 3D 数据有需求的行业,目前几乎都有着一套只对自身场景适用的标准和表征方式,它们的数据信息相互之间不可复用。

影眸科技团队一直希望将 3D 数据的表征统一起来,变成一种标准化的资产,这件事从 Rodin 1.0 开始就在做,团队提出了一种 remesh 的模型重置策略,通过把每个模型都稍微「变厚」一点点来达到表征一致,「变厚」之后对生成 3D 的美观性和它所包含的信息其实没有太大的影响,但是整个模型会看起来都圆鼓鼓的。

但在 Rodin 1.0 真正落入工业的过程中,表征的统一并不意味着生成的 3D 数据就可以顺利的作为资产被被使用了。在大量真实的产品设计或游戏工业里,对 3D 资产大量的需求并不是可爱的萌宠或者一个用云朵质地拼成的字母「A」,而是更偏向于无机形状(用数学的构成方式,由直线或曲线,或直曲线相结合形成的面)以及锐利边缘感觉的东西。

无机形状的生成能力、锐利的边缘以及非常干净的拓扑结构,这是 Rodin 1.5 在 3D 生成能力上最凸显出来的的性能提升。而这种对于 3D 生成数据在一致性和「可用」上的重视,是吴迪和启煊这几年用一个个坑踩出来的。

02

一定要 Production-Ready

几年前,一个大客户让初出茅庐的吴迪和启煊等人第一次碰壁,那就是《流浪地球 2》。

《流浪地球 2》的中有一些刘德华和吴京变年轻的镜头,后期团队希望用特效来呈现。2021 年年初,影眸团队在上海张江搭了一座直径 3 米的黑色球形框架,光源和摄像机遍布球体内部,整个装置占满了一整个房间,这是影眸科技当时用于高精度人物面部采集的第一代穹顶光场。穹顶光场做出来后,一些影视行业的团队陆续来问,其中就包括《流浪地球 2》。

穹顶光场

吴迪和启煊对自己研发出来的人脸扫描设备非常自信,但现实也非常惨淡。据吴迪回忆,「流浪地球团队的人来看了效果后,问的第一个问题:这玩意咋用?」

不能用的原因是,最初的穹顶光场其实本质上是一套纯打光的系统。一个人进入球体中心,通过 360 度的光源可以采集所有方向的光照,在这个基础上,可以在后期去合成不同的光照环境,然后再通过换脸的方法把它给换上去。,逻辑上更偏向现在说的视频生成。这使得它很难进入电影工业的 CG 管线。

「真的要用在 CG 管线上的 3D 人脸,它首先得是一个完整的 3D 模型,它有优秀的拓扑、可以反映出各种光照变化的材质、能控制并且做出各种表情,这样它才能够很好地被接入在后面去使用。」

在那之后不久,影眸科技做了一个重大的决定——砍掉了当时所有 base 2D 的技术研发投入,全面 all in 3D。生成路线从 2D 往 3D 的转向背后,是影眸科技团队内部对于「Production-Ready」的共识。

「Production-Ready」这个词来自 CG 行业。CG 行业中有一个词——后期(Post-Production),而「Production-Ready」的意思就是后期可用。

用户作品,70% 模型来自 Rodin

从第一代侧重平面数据采集的穹顶光场,在与客户不断碰撞的过程中慢慢演进到后来第二代采集 3D 人脸数据的穹顶光场,再到随着与客户的接触,技术最终达到了采集数据可以直接用于影视游戏数字角色的构建,「Production-Ready」逐渐成为影眸科技由内而外的一种理念。

「Production-Ready 不是个容易量化的指标,如果一定要说的具体一点,那就是在技术路线的设计、选择的优先级上,我们会把生成结果的可用性作为一个很重要的思考点。打个比方,如果一个技术它能带来视觉质量的提升,但是不会让 Production-Ready 的距离更近,我们就不一定会去做」,启煊说。

「Production-Ready」的观念也直接决定了影眸科技在生成式 AI 浪潮来临后,在 3D 生成上选择了一条反常识的道路。

在当时最主流的观念里,3D 生成本质上是一种从 2D 的升维,在 Stable Diffusion 出现之后,通过 2D 扩散模型,结合 NeRF 等方法实现三维重建的过程。由于可以利用大量的 2D 图像数据进行训练,这类模型往往能够生成多样化的结果。

随着多视角重建工作通过把 3D 资产的多视角 2D 图像加入 2D 扩散模型的训练数据,在一定程度上缓解了这类模型对 3D 世界的理解能力有限的问题,但局限性在于,这类方法的起点终究是 2D 图像,2D 数据终究只记录了真实世界的一个侧面,或者说投影,再多角度的图像也无法完整描述一个三维内容,因此模型学到的东西依旧存在很多信息缺失,生成结果还是需要大量修正,难以满足工业标准。

2D 升 3D 的路线,更像是在证明一个图像模型见识了足够多的图像之后能够理解 3D,但这种对 3D 的理解和工业上能够被使用的 3D 数据仍然相去甚远。从另一个角度,2D 升 3D 也反过来意味着一种对于 3D 信息的压缩——就像一个 200 条边的正多边形仍然离一个理想的圆形有差距一样。

影眸团队,在大量的数字人和 3D 扫脸工作之后,面对这条 3D 生成里看起来最有共识的技术路线,「没办法说服自己」。

「我们知道三维扫描这件事的上限在哪里。当前,它达到最完美的地步也很难直接投入到实际生产里,而拿 2D 的 Stable Diffusion 去升维到 3D 最好的情况也就是无限逼近了三维扫描的质量,凭什么这种方法可以一步到位?」吴迪说。

3D 生成要能够与人类工业对齐,只能走 3D 原生这条路,也就是抛弃从 2D 升维的想法,直接构建出 3D 模型。

计算机图形学顶会 ACM SIGGRAPH 2024 大会上,影眸科技团队的两篇论文——可控 3D 原生 DiT 生成框架 CLAY 与 3D 服装生成框架 DressCode——均入围了最佳论文提名。论文中提出了一种 3D 原生的 diffusion transformer 架构,也就是完全从 3D 数据集训练生成模型,从各种 3D 几何形状中提取丰富的 3D 先验。

这两篇论文的探索工作也引领了 3D 生成业内的技术路线变化,这之后 3D 原生开始取代 2D 升 3D,到现在已经是目前全球范围内 3D 生成主流的探索路径。

影眸团队在 SIGGRAPH 上

03

从实验室到创业公司

早在影眸创办第一年,他们就曾做出过一款明星产品。

2021 年,一款叫「WAND」的二次元角色生成产品上线,上线第二天被一个知名的日本博主看到,然后迅速在国内热闹起来,在很短时间内拿到了 160 万的用户量。

WAND 当年的 App Store 页面

流量与关注随之而来,「接不住」吴迪说。

流量并没有给吴迪和启煊带来选择成为哪种公司的机会,反而是要剥夺了这种选择的权利。

「所有人都觉得我们应该把自己做成个「WAND」公司,包括我们周围的人,还有一些想投资我们」,吴迪说。

但最终「WAND」公司没有出现。不久后,吴迪和启煊就主动停掉了「WAND」这个产品。现在外界更加熟悉的名字,是影眸科技和 Rodin。

「我们没有走那条大家认为该走的路,因为我们的技术能力和我们想做的事情,还是在 3D 上。」

完全抛开图片生成路线的决心,得到了陆奇博士的支持。

「既然做了这个决定,你们就要狠下心来,只做那个你们认为对的东西。」陆奇博士在 2021 年奇绩创坛秋季路演之后和影眸团队说。

2021 年末的奇绩创坛 2021 秋季创业营路演上,陆奇博士像「教练」一般,边回收着麦克风,边与刚完成路演的创业者激情击掌。这一期 4226 家创业公司中,最终录取了 53 个项目。1.25% 的录取率,其中就包括了影眸科技。

WAND 最终变成了让吴迪和启煊从实验室走向商业世界的敲门砖。

吴迪在之后有问过陆奇博士为什么会投自己这个团队。同年爆火的 WAND 是那个让奇绩注意到这个上科大年轻团队最初的契机,但最根本的原因在 WAND 背后,奇绩看到了一个纯研发团队能够难得在早期就具备商业化的思维。

这对一支 2021 年时平均年龄才 21 岁的创始团队来说并不容易,但产品化和商业化这两个非常企业式的思考维度,从影眸科技这个名字一开始在上科大的 MARS 实验室中酝酿成立时就有了。

吴迪在 2015 年进入上科大,启煊则是 2018 年,两人先后进入了上科大以人工智能结合计算摄影为主要研究方向的 MARS 实验室,那时的实验室里只有三位学生,也就是影眸科技最早的三位成员,第四位联创在 2020 年进入 MARS 实验室,这时候第一代的穹顶光场正在搭建,外界正是元宇宙和数字人概念势头正盛,吴迪和启煊们看到了这套数字采集设备背后的商业前景,就在实验室里决定了影眸科技的成立。

上海科技大学是一个非常非常年轻的学校,创办于 2013 年,吴迪是第二届学生,那时候上科大还不是「双一流高校」,校园只有一个宿舍楼,上课都要借其他学校的教室。

但有意思的地方在于,在上科大,无论是实验室、学生会、还是最开始的课程,一切都要从头开始搭建。吴迪很喜欢这种感觉,「念书念出了创业的味道」。

或者用启煊的话说,「(上科大头两年的情况)决定了当时学生的属性,都是他们这种胆大的,aka 创业精神。」

影眸团队在 SIGGRAPH Real-time Live! 环节展示 Rodin 3D 生成

公司成立于 2020 年 6 月,之后的整整一年多时间,吴迪和启煊都在生成内容和工业真实需求间的巨大落差之间受挫。将「Production-Ready」作为技术研发最核心的校准方向最初也是在这无数次受挫中形成的。

2021 年秋天,影眸拿到了第一笔来自奇绩创坛的融资。在奇绩创坛的路演日之后,他们又很快拿到了第二笔。

第二笔来自红杉,吴迪记得敲定红杉这笔融资的时候是 2021 年的圣诞节,那天下午他们见了好几波投资人,直到很晚。「那天刚好是我们圣诞聚会,但弄到最后我跟吴迪就只是去聚会上结了个账」,启煊说。

这条创业道路并没有从此一帆风顺。从 2022 年开始,影眸科技在接近两年时间里没有拿到融资,其中有一次融资过程消耗了吴迪大量的精力,却最终没能 close。

那次失败带来了两个结果:

第一,影眸的性格,做 AI 创业,第一天就要考虑商业化,先活下去,保证现金流;

第二,彻底坚定 3D 原生路线的选择。

「在这之前,我们做 3D 生成的想法是,招一个在 3D 生成领域有过尝试的人来帮我们一起做,但那样很可能跳不出当时技术路径的惯性」,吴迪说,「恰恰是因为那次融资失败,让整个核心研发团队下定决心,一定要做出真正可用的 3D 生成。」

几个月后,有了最初的 Rodin 1.0。

04

3D 就是那块拼图

影眸希望 Rodin 成为 WAND 一样的爆款 toC 产品吗?

这个答案很明确。

「3D 生成最终一定会走向 C 端,但不是现在。」启煊说,「现在拍一张图片或者一段视频可以很直接的分享社交平台上,但 3D 还不是一个可被分享的格式。」

或许新的硬件有机会,但肯定还需要时间。在那之前,「当你不清楚这个东西的终局在哪里,不如先做,眼前永远有很多值得攻克的问题。」吴迪确信,当前 3D 生成的机会,就在存量市场里。

影视娱乐不必多说,工业领域对 3D 生成的需求也越来越多。比如建筑设计,以往建筑效果图大多仰赖二维贴图,算力限制了可视化的选择。这种方法的局限性相当大,比如灯光永远看起来不正确,摄影机总是要在一定的高度上,动画也是大禁区。3D 原生技术可以让整个虚拟空间在任何光线情境、任何摄影机下运作,给建筑可视化带来了更多的想象力。

目前影眸已经与多个游戏、影视、制造业等行业的龙头企业展开合作,Rodin 的 SaaS 产品也积累了大量平面设计师、AR & VR 开发者、3D 打印爱好者等专业用户人群。

Rodin 用户在 X 上的评价

「我们现在的目标是存量市场,存量市场有真实的需求,它能告诉我们,大家到底需要怎么样的 3D 生成模型?」吴迪说道。

那以后呢?

一年前 Sora 石破天惊的时候,曾经一度让人怀疑行业是否还需要 3D。

启煊印象很深,「视频生成刚出来的时候,所有做传统图形学的——我们——都觉得它会被颠覆掉。」他解释说,对 3DCG 来说,视频生成意味着不再需要三维空间,直接拿到渲染结果,「这对传统 CGI 技术冲击非常大,做 3D 生成的会担心有一天 3D 不再被需要了。」

尤其,虽然 Sora 当时是「期货」,「但 OpenAI 在期货这件事上,reputation 还挺好的。」

影眸的研发团队开始频繁了解、测试视频模型。他们很快意识到,视频生成在做的只是「仿真」,是「模拟」,再「逼近」最终想要的结果。

「它是一个 frame consistency(帧间一致性)的生成器,并不是建立在 World Model 之上,它做不到 world consistency(世界一致性)。」启煊说,「这是两个 level 的概念,如果只靠视频生成,就只能停留在这里。」

「但有意思的是,3D 模型原来在 CGI 工业里做的,就是 world consistency。」

一段电影中的 CG 视频,比如房间里的一个人,首先需要房间里每个物品的模型,每个模型都需要表达光照属性的材质,人物需要动作的动画,需要虚拟世界里有一个摄影,对人物的每一帧动作做光线追踪,这时候光追就是渲染器的工作,通常离线渲染一个电影级 CG,往往需要集群级别的渲染才能达到逼真效果。

意识到这点,再看视频生成,在以上的管线里,似乎「只取代了离线渲染器的工作——而不是整个 CGI 工业」。

「视频不是 world model,」吴迪说,「它可能是 world model 输出,展示给大众时的一种形态。」

「一致性问题,尤其是 world-level 一致性,这是个信息量的问题,」启煊解释说,「如果这个世界的信息变化的描述,不能输入给 AI,它就一定做不到这种 consistency。」

通向世界模型,至少需要 world consistency,所以这个时候,就需要一个新的模块做好控制(control)。

缺少一块拼图,恰好就是 3D。

「我们有自己心目中的 World Model。」有很多正在做、值得做的事,想想都很兴奋。

「这段就别写了,等我们做好再拿给大家看吧。」

*头图来源:影眸科技

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

浏览量: 26

只有模仿没有创新?国产 AI 用行动打破质疑

作者 | Li Yuan 

编辑 | 郑玄

 

大模型时代已经正式迈入第三年。

回首过去的两年,不禁令人感慨。每年都有基座大模型架构已经尘埃落定的声音,然而每年,技术都在飞快地迭代创新,突破人们想象。

2024 年,OpenAI 的推理模型,通过对模型架构的创新,用 RL 的方法延续 Scaling Law,让大模型的智力水平持续进展;而中国公司也并没有落后,价格屠夫 DeepSeek 通过 MLA 的架构创新,让推理成本直接降低了一个数量级。

2025 年开年,令人欣喜的是,我们看到了一向在人们印象中是「低调做产品」的 MiniMax 公司,也加入了开源行列,将最先进的底层技术直接与社区和行业分享。

1 月 15 日,大模型公司 MiniMax 正式发布了 MiniMax-01 系列模型。它包括基础语言大模型 MiniMax-Text-01,和在其上集成了一个轻量级 ViT 模型而开发的视觉多模态大模型 MiniMax-VL-01。

开源界面|图片来源:GitHub

「卷」起来的大模型公司,令人乐见。开源会提升创新效率,越来越好的基座模型之上,才搭建越来越有用的应用,进入千家万户,帮人们解放生产力。

这是 MiniMax 第一次发布开源模型,一出手就是一个炸裂模型架构创新:新模型采用了 MiniMax 独有的 Lightning Attention 机制,借鉴了 Linear Attention(线性注意力)机制,是全球第一次将 Linear Attention 机制引入到商业化规模的模型当中。

效果也是立竿见影,模型上下文长度直接达到了顶尖模型的 20-32 倍水平,推理时的上下文窗口能达到 400 万 token。模型效果立刻在海外上引起了关注。

X 用户感叹 MiniMax-Text-01 可以在 400 万 token 上实现完美的海底捞针 | 图片来源:X

另一个来自中国公司的强大模型,在学术测试集上表现优越|图片来源:X

模型的上下文窗口,指的是模型在生成每个新 token 时,实际参考的前面内容的范围。就像是模型能够一次性从书架上取下的书籍数量。模型的上下文窗口越大,模型生成时可以参考的信息量就越多,表现也就更加智能。

站在 2025 年年初的时间点,长上下文窗口还有一个新的意义:为模型的 Agent 能力,打下坚实基础。

业界公认,2025 年,Agent 能力将是 AI 届「卷生卷死」的重点,连 OpenAI 都在本周内推出了 Tasks,一个 AI Agent 的雏型。在 2025 年,我们很有可能看到越来越多真正「全自动的」AI,在我们的生活中起作用。甚至不同「全自动的」的 AI 共同协作,帮我们处理事务。而这对基座模型的能力,有极大的考验。而长上下文是 Agent 能力实现的必要条件。

看起来,2025 年,基座大模型之战仍未结束;中国公司发力,也才刚刚开始。

 

01

Linear Attention 架构

的第一次大规模使用

 

此次 MiniMax 开源的模型,最大的创新点,在于使用了 MiniMax 独有的 Lightning Attention 机制,这是一种线性注意力。

在传统的 Transformer 架构中,最「烧」算力和显存的部分往往是自注意力(Self-Attention)机制。 原因在于,标准的自注意力需要对所有的词(Token)两两计算注意力分数,计算量随着序列长度 n 的增长是平方级(O(n²))。

如果用通俗的语言来形容,类似于你在举办一场联谊会,人很多。如果每个人都要两两打招呼,沟通成本会随着人数增加而急剧上升,每个人都得重复无数次「握手」。

这带来了一系列的问题——其中一个就是,联谊会的人数,也就是模型的上下文的窗口,很难无限扩展。硬要扩展,对于算力的需求就非常高。

为了应对这一挑战,传统上,研究人员提出了各种方法来降低注意力机制的计算复杂度,包括稀疏注意力、Linear Attention(线性注意力)、长卷积、状态空间模型和线性 RNN 等方式。

此次 MiniMax 开源的模型,就是借用了其中的 Linear Attention(线性注意力)的方式。

Linear Attention 的思路就像给会场安排了几位「速配助理」。每个人先把自己的关键信息交给助理,比如「希望认识什么样的人、擅长什么」。助理整理这些信息后,直接告诉每个人最适合交谈的对象。这样,大家不必一个个自我介绍,整个匹配过程更高效,沟通成本大幅降低。

不过,Linear Attention 之前虽然在理论上有所创新,但在商业规模模型中的采用有限。而 MiniMax 团队则第一次验证了 Linear Attention 机制在商业规模的大模型之上的可行性。

这意味着一项技术从实验室走向真实世界。

MiniMax 团队使用了一个传统的 Linear Attention 的变种,被 MiniMax 团队称为 Lightning Attention。Lightning Attention 解决了现有 Linear Attention 机制计算效率中的主要瓶颈:因果累积求和操作的缓慢,使用新颖的分块技术,有效规避了累加和操作。

在一些特定任务,如检索和长距离依赖建模上,Lightning Attention 的性能表现可能不如 Softmax 注意力强。

MiniMax 团队又引入了混合注意力机制解决这一问题:在最终的模型架构中,在 Transformer 的每 8 层中,有 7 层使用 Lightning Attention,高效处理局部关系;而剩下 1 层保留传统的 Softmax 注意力,确保能够捕捉关键的全局上下文。

这样的架构创新,效果十分惊艳。

MiniMax-01 系列模型参数量高达 4560 亿,其中单次激活 459 亿。在主流模型目前的上下文窗口长度仍然在 128k 左右的时候,MiniMax-01 系列模型能够在 100 万 token 的上下文窗口上进行训练,推理的时候上下文窗口可以外推到 400 万 tokens,是 GPT-4o 的 32 倍,Claude-3.5-Sonnet 的 20 倍。

在面向现实情景,进行长上下文多任务进行深入的理解和推理的第三方测评 LongBench v2 的最新结果中,MiniMax-Text-01 仅次于 OpenAI 的 o1-preview 和人类,位列第三。

模型在 LongBench v2 上的评测表现 | 图片来源:GitHub LongBench

在模型的基础表现上,MiniMax-01 系列模型也在标准学术基准测试中可与顶级闭源模型相媲美。不仅如此,在模型上下文长度逐渐变长的过程中,模型的表现下降也最平缓——部分模型虽然宣布上下文窗口长度较长,但真正使用起来,在长上下文情况下,效果并不好。

MiniMax-01 系列模型可与顶级闭源模型相媲美 | 图片来源:MiniMax 论文

MiniMax 团队对比了在 CSR(常识推理)、NIAH(大海捞针)和 SCROLLS 等基准测试上,在同样的计算资源下,用采用了 7/8Lightning Attention 和 1/8 的 Softmax 的混合注意力模型可以放更多参数、处理更多数据,并且训练效果还比只用 Softmax 注意力的模型更好,损失更低。

基准测试上混合 Lightning Attention 的架构表现更好 | 图片来源:MiniMax 论文

 

02

为 Agent 时代爆发的前夜做准备

 

自 2024 年开始,长上下文一直是模型迭代的一个重要方向。

在这个领域,国外的 Google、Anthropic,国内的 Kimi,都是坚定的投入者。2024 年年末,DeepMind 的 CEO Demis Hassabis 曾表示,在内部测试中,Google Gemini 正在向无限上下文窗口发起冲击。

或许有人会困惑,此次 MiniMax 发布的 MiniMax-01 系列模型,上下文窗口长度已经达到 400 万 token,如果按照1个 token 约等于1.7个中文汉字的计算方式,已经约等于 700 万字的上下文窗口。人类需要和 AI 聊出这么多的上下文吗?

答案是, 盯住长上下文的各家公司,可能盯住的并不是目前的一问一答的问答 AI 场景,而是背后的 Agent 时代。

无论是单 Agent 所需的持续记忆,还是多 Agent 协作所带来的通信,长链路的任务都需要越来越长的上下文。

长上下文,在多种 Agent 应用场景中,将具有极大的意义。

在搜索场景中,这可能意味着用户可以一次性看到更多答案的综合,直接获得更精准的回答。

未来的效率工具中,这可能意味着用户拥有了无限的工作记忆。在无数版本的修改之后,当甲方让你还是用第 1 版的文章结构和第三版的小标题的时候,你可以无痛回复「好的」,然后让 AI 一键生成两个版本的融合。

未来的学习工具中,这可能意味着用户可以直接具有更大的知识库。直接上传一本教材,就能让 AI 根据其中的内容,进行教学。

而在和 AI 助理的对话中,它将像聪明的人类助理一样,真正记住你之前说过的话,并在你需要的时候「记起来」。MiniMax 团队的论文当中的一个场景就很能说明问题。

模型被要求从最多 1889 条历史交互(英文基准)或 2053 条历史交互(中文基准)中精确检索出用户的一条历史互动——用户重复要求 AI 写关于企鹅的诗歌,同时进行了多轮不相关的对话,而在最后,要求 AI 提供第一次写的关于企鹅的诗。而 MiniMax-01 仍然很好地完成了这一任务。

长上下文的任务表现 | 图片来源:MiniMax 论文

对于 Agent 来说,另一个重要能力,则是视觉理解 ——MiniMax 此次同系列也发布了 MiniMax-VL-01。这是一个同样采用了线性注意力架构、以及拥有 400w token 上下文窗口的视觉多模态大模型。

在 2024 年 Rayban-Meta 眼镜爆火之后,今年的智能硬件的一大看点在于 AI 眼镜能否真正让 AI 成为人们的随身助手。而能成为随身 AI,AI 必须的能力就是长上下文——记住你的所有生活场景,才能在随后为你提供个性化的提醒和建议。

这样的记忆将是「真记忆」,与 ChatGPT 目前的记忆功能所能提供的简易效果完全不同。

要真正实现随身的 AI Agent,跨模态理解、无限上下文窗口都是基础能力。

论文最后, MiniMax 表示未来将在线性注意力这一路径上做到极致,尝试完全取消 Softmax 注意力层,最终实现无限的长上下文窗口。

 

03

基座模型创新未死,

中国公司大有可为

 

值得注意的是,这次是 MiniMax 公司,第一次推出开源模型。

此次的大模型命名的 MiniMax-01 系列,在 MiniMax 的内部序列中,原本是 abab-8 系列模型。

MiniMax 在上一代 abab-7 模型中,已经实现了线性注意力和 MOE 的架构,而在 abab-8 中,取得了更好的效果。

此次,MiniMax 选择在这个时间点,将模型开源出来,并以这个节点为开始,重新命名模型 MiniMax-01。

这似乎代表着 MiniMax 的公司哲学的一种改变。

在过往,MiniMax 公司给外界一向的印象是:业务很稳定,做事很低调。

从星野、Talkie 到海螺 AI,MiniMax 有自己忠实的一波用户群体。在去年的公开发布中,MiniMax 曾经表示每天已经有 3 万亿文本 token 的调用,在国内 AI 公司中名列前茅。

这些应用背后的 AI 技术则一直较为神秘,在此之前主要用于支持公司本身的业务。 这次开源,似乎是一个转折,是 MiniMax 第一次对外高调展示技术实力。

MiniMax 方面表示,模型可以在 8 个 GPU 单卡、640GB 内存上,就能够实现对 100 万 token 进行单节点推理。希望此次开源帮助其他人开发能够突破当前模型的局限。

回顾过往,自 OpenAI 推出 ChatGPT、Meta 发布 Llama 系列开源模型以来,一直有声音表示基座模型的创新已趋于终结,或仅有少数国际科技巨头具备未来模型架构创新的能力。

最近两次中国公司的开源动作,告诉我们并非如此。

2024 年,DeepSeek 凭借其突破性的 MLA 架构,震撼了全球 AI 行业,证明了中国企业的技术创造力。

2025 年年初,MiniMax 再次以其全新的 Lightning Attention 架构刷新了行业认知,验证了一条此前非共识的技术路径。

中国 AI 公司不仅具备工程化和商业化的能力,更有能力推动底层技术创新。

新的一年,不论是 AI 应用的普及,还是技术金字塔尖的攻坚,我们可以对中国 AI 公司有更多的期待。

 

*头图来 源:视觉中国

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

浏览量: 11

Switch2 正式公布;多邻国学中文的美国人数量激增216%;蓝色起源火箭首飞成功|极客早知道

任天堂 Switch 2 游戏机正式公布:屏幕更大、磁吸手柄

1 月 16 日消息,任天堂 Switch 2 游戏掌机今日首发亮相,首个介绍视频展示了其造型设计等细节。据了解,该产品还能向下兼容 Switch 掌机的游戏,官方将在 4 月 2 日的专场直面会上详细介绍这款新机。

细节部分,其外观表面采用了磨砂材质,配备有可调整角度的支架,并在机身上方新增了 USB-C 接口。相比前代机型,Switch 2 拥有更大的屏幕和 Joy-Con 手柄,手柄采用磁吸式设计。

其全新的 Joy-Con 控制器在设计上进行了多项改进。根据官方发布的预告视频,新款 Joy-Con 在连接方式、外观设计以及功能布局上均有显著变化。

值得一提的是,前代 Switch Joy-Con 饱受「摇杆漂移」问题的困扰,即玩家未操作时摇杆仍会检测到移动信号,类似于电脑光标在未移动鼠标时自行移动的现象。然而,任天堂尚未透露新款 Joy-Con 是否解决了这一问题。

在官宣视频中,任天堂确认 Switch 2 支持原版 Switch 的游戏卡带,也就是说可以降低老玩家的游戏成本(可能不支持部分游戏,详情将在任天堂后续官网页面公布)。

宣传片中展示的信息表示,Switch 2 将在今年 4 月 2 日的任天堂直面会上正式发布。(来源:IGN 中国 / IT 之家)

挑战马斯克 SpaceX:贝索斯的蓝色起源「新格伦」火箭首飞成功入轨,助推器回收失败

1 月 16 日消息,北京时间 1 月 16 日 15 时 03 分,蓝色起源「新格伦」重型运载火箭点火升空,开启首飞任务。

经过一个多小时的飞行,蓝色起源官方宣布 GS2 和蓝环探路者(Blue Ring Pathfinder)试验卫星已成功到达目标轨道。

对此,贝索斯的竞争对手——SpaceX 创始人埃隆・马斯克在 X 平台表示祝贺:「恭喜你第一次尝试发射就进入了轨道!」

新格伦是蓝色起源首枚轨道级运载火箭,采用了可重复使用的一级助推器。该助推器计划在发射后返回地球,并在大西洋上以杰夫・贝索斯的母亲命名的回收船「Jacklyn」号上着陆。

不过,直播评论员证实,火箭的第一级在尝试降落在大西洋上的无人船上时损毁,未能完成这次发射任务的次要目标。(来源:CnBeta)

多邻国上学中文的美国人数量激增 216%

全球语言学习平台多邻国(Duolingo)披露,去年 12 月至本周一(1 月 13 日)的数据显示,平台上开始学习中文普通话的美国人,出现同比激增 216% 的惊人变化。根据最近公开的数据,TikTok 在美国已坐拥约 1.7 亿庞大用户群体,营造了一个充满活力的中文社交媒体氛围。面对这股中文热潮,众多美国网友纷纷借助翻译软件应急,同时急不可待地投身于中文学习的浪潮之中。

以多邻国为例,该公司在 TikTok 上发布的一条仅 25 秒的「教美国人学中文」短视频,凭借其独特的魅力和实用性,迅速走红网络,截至目前,已收获超过 83 万次的点赞,彰显了中文学习的巨大吸引力和广泛关注度。

这股中文学习热潮不仅激发了广大美国网友的学习热情,也极大地推动了多邻国软件在美国市场的知名度与影响力。

数据显示,在过去一周内,多邻国在美国苹果应用商店的排名实现了质的飞跃,从原先的 40 名开外一跃进入前 20 强,充分证明了中文学习需求的旺盛以及多邻国平台在其中的重要作用。(来源:快科技)

日本警方逮捕 Switch 游戏机破解人士,任天堂法务部再添「战绩」

1 月 16 日消息,游戏盗版监管进入了一个新时代,日本警方首次逮捕了被指控破解 Switch 游戏机硬件的人。

据 NTV News 报道,1 月 15 日,一名 58 岁的日本男子因涉嫌违反《商标法》被捕。他涉嫌在出售 Switch 游戏机之前修改 Switch 硬件从而运行盗版游戏。

这名男子被指控在硬件上加载了 27 款非法访问的游戏,并以每台 28000 日元(IT 之家备注:当前约 1312 元人民币)的价格出售这些游戏机。

据警方说,该男子已经承认了这些指控,目前正在调查其他可能的违法行为。

任天堂此前一直在和盗版游戏行为作斗争,已经成功「消灭」了热门 Switch 游戏模拟器 Yuzu,还阻止了 GameCube 和 Wii 模拟器 Dolphin(海豚)在 PC 游戏平台 Steam 上发布,并且起诉了游戏文件共享网站 RomUniverse 等。(来源:CnBeta)

支付宝被曝出严重事故 Bug 5 分钟内所有订单减免 20%

根据 V 快科技报道,今天支付宝发生了堪称为 P000 级的事故。爆料称,从目前的情况来看,在购物、还信用卡、缴纳签证等场景下,在今天下午 14:40-14:45 期间,所有订单都被「政府补贴」减免 20%。

有可能是支付宝在测试国补时出现线上 Bug,从而导致所有人线上支付时可以直接使用国补减免。

爆料者还称这是其见过最严重的支付宝 Bug,「不知道后面支付宝会怎么处理这个事情,反正程序员春节是过不好了」。

也有不少网友晒出了减免的相关截图,包括游戏充值、转账等场景在付款时都显示有政府补贴。(来源:快科技)

黄仁勋在英伟达年会向中国员工发最高 4 万元红包,「下次来 10 万」

1 月 16 日消息,据界面新闻报道,英伟达 CEO 黄仁勋昨晚出席了在深圳公司的年会,并对员工的努力工作致谢,发放了数额 1 万元、2.5 万元的红包各十余个,还发放了 5 个 4 万元的红包,「下次来是 10 万块!」

在稍早之前谈到此行的目的时,黄仁勋表示是与员工一同庆祝春节。根据此前的爆料,黄仁勋本周赴中国计划访问多个主要城市,深圳之后还计划访问上海和北京,晚些时候飞往台北。而在今日下午,黄仁勋则来到了台中并造访硅品精密台中潭子新厂。另据台媒「中央社」报道,黄仁勋在台中表示,英伟达 Blackwell 平台 CoWoS-L 产能增加,所以 CoWoS 产能没有减少的问题,预期今年 CoWoS 整体产能可继续大幅增加。

据此前报道,黄仁勋去年的中国之行中,为北京、上海、深圳三地的年会准备了不同的活动。其在年会上身着「大花背心」与员工们一起扭秧歌,以庆祝龙年春节。(来源:IT 之家)

为扭转销售颓势,特斯拉 Cybertruck 电动皮卡打折促销

1 月 16 日消息,据 Business Insider 报道,特斯拉开始对其 Cybertruck 电动皮卡进行打折促销,以应对该车型近期销售下滑的局面。根据特斯拉美国官网信息,购买全新 Cybertruck 的消费者可享受高达 1600 美元(备注:当前约 11743 元人民币)的折扣。此外,特斯拉还提供少量行驶里程仅为数百英里的 Cybertruck 展车,折扣幅度达到 2600 美元(当前约 19082 元人民币)。

特斯拉此前已将其位于奥斯汀工厂的部分 Cybertruck 生产线员工调至 Model Y 的生产线,这一调动并不常见。Model Y 是特斯拉目前最畅销的车型,而 Cybertruck 则是特斯拉自 2020 年推出 Model Y 以来的首款全新乘用车,自 2023 年上市以来,其销售表现一直备受关注。

尽管特斯拉并未单独公布 Cybertruck 的销售数据,但该公司表示,2024 年共售出 8.5 万辆「其他车型」,包括 Cybertruck、Model X 和 Model S。根据 Electrek 发布的在线追踪数据,Cybertruck 在发售前已积累了 200 万份预订。特斯拉声称,这款非传统的越野车目前已实现盈利,并且行业数据显示,其销量仍超过福特 F-150 Lightning 等竞争对手。

尽管特斯拉在 2024 年底推出了大量激励措施,但这并未能阻止其在 2024 年首次出现年度销量下滑。目前,特斯拉正致力于实现埃隆・马斯克提出的 2025 年销售增长 20%-30% 的目标,并于上周在亚洲推出了改款 Model Y。

此外,Cybertruck 在 2024 年还面临多次召回,问题包括巨大的雨刷器故障以及加速踏板可能卡在全油门位置的风险。这些质量问题无疑对消费者的购买信心造成了一定影响。(来源:IT 之家)

特斯拉的自动驾驶出租车业务将于下半年开始商业运营

由于特斯拉庞大的市值现在几乎全部取决于其在 FSD/自动驾驶出租车和 Optimus 人形机器人方面所宣称的雄心壮志能否获得有利的结果,华尔街的反应可想而知,在过去的几周里,华尔街推出了大量的研究报告来描述特斯拉的技术进步。今天,轮到高盛分析师马克-德莱尼(Mark Delaney)阐述他对特斯拉的看法。

德莱尼首先指出,”根据我们自己最近的试乘、众包数据和第三方评论”,刚刚发布的特斯拉 FSD 第 13 版的性能有了”有意义的改进”。

这与目前市场上的普遍评论不谋而合,comma.ai 总裁乔治-霍兹(George Hotz)最近称赞特斯拉 FSD 第 13 版”非常出色”。

因此,这位高盛分析师现在预计,特斯拉的自动驾驶出租车业务将”在下半年开始商业运营”,使用”远程协助和地理围栏”,这”在方向上类似于竞争对手目前在道路上使用的自动驾驶出租车的方法”。(来源:CnBeta)

三星将与 OpenAI 合作开发”AI 电视”

据报道,三星电子正在与 ChatGPT 的创建者 OpenAI 合作开发人工智能电视。这标志着三星的战略,即在竞争日益激烈的电视市场中保持领先地位。三星希望将 OpenAI 的力量融入电视,进一步巩固其作为世界顶级电视品牌的主导地位–这一头衔它已连续保持了 19 年。

值得注意的是,三星和 OpenAI 已经在一项”开放合作”中进行了合作,为产品和服务(尤其是电视)中集成了先进的人工智能功能,例如点击搜索(类似于 Circle to Search)、实时翻译、生成壁纸等。

通过与 OpenAI 合作,三星旨在推出创新功能,如文本生成功能”ChatGPT”、图像创建功能”DALL-E”、语音识别功能”Whisper”以及其他 OpenAI AI 模型。人工智能电视的一些潜在功能可能包括:

个性化内容推荐

对话助理

支持多任务处理

实时翻译

定制医疗保健建议

定制娱乐

例如,用户可以就正在观看的演员或电影向电视提问,并获得类似节目的推荐。根据市场研究公司 Omdia 的数据,三星希望通过与科技巨头合作并为其电视推出新功能来提高其电视市场份额,该市场份额在 2024 年上半年达到 28.8%。最近,该公司与 Google 合作推出了”Eclipsa 音频”,这是一种 3D 音效技术,其目的是对抗杜比全景声(Dolby Atmos)。

OpenAI 尚未就其与三星的合作发表评论。与此同时,苹果也被认为正在评估再次制造电视产品的想法,但这可能需要一段时间才能实现。(来源:CnBeta)

「超薄款」iPhone 17 Air 电池容量将低于 4000mAh

据知名数码博主 @ 数码闲聊站爆料,苹果即将推出的 iPhone 17 Air,为了轻薄设计,可能配备容量在 3000 至 4000mAh 之间的电池。这一数据,相比此前的 iPhone 16,其电池容量可能有所减少,这与其主打的极致轻薄设计密切相关。

目前,苹果尚未正式透露 iPhone 16 的具体电池容量,但拆解数据显示,iPhone 16 的电池容量为 3561mAh。

如果 iPhone 17 Air 能保持这一水平,或许能解决续航问题。

不过,泄漏信息显示,iPhone 17 Air 的机身最薄处仅为 5.5mm,接近 13 英寸 iPad Pro 的 5.1mm 厚度,这将使大容量电池的设计面临更大挑战。

除了电池容量引发关注外,iPhone 17 Air 还可能取消物理 SIM 卡槽,仅支持 e-SIM,并配备一颗 4800 万像素的后置摄像头以及苹果自研的 5G 调制解调器。

iPhone 17 Air 预计售价在 900 美元左右,定位于替代现有的 iPhone Plus 系列,预计将在 2025 年 9 月与 iPhone 17 系列一同发布。(来源:CnBeta)

地球当背景,谷歌 Pixel 联手 NASA 前工程师推出太空自拍项目

1 月 16 日消息,谷歌 Pixel 与 NASA 前工程师、YouTube 网红马克・罗伯特(Mark Rober)合作,推出了一项极具创意的太空自拍项目。通过这一合作,用户的自拍照将有机会被一颗名为 SAT GUS 的卫星拍摄,并以地球为背景在太空中定格。这一项目不仅充满趣味,还旨在激发年轻一代对科学、技术、工程和数学(STEM)领域的兴趣。

据了解,这一项目的核心设备是 SAT GUS 卫星,它将在太空中拍摄用户通过 Pixel 手机提交的自拍照,并以地球作为背景。参与者只需通过谷歌商店的专属链接注册并提交自拍照,即可实时追踪 SAT GUS 的运行轨迹。当卫星处于最佳位置时,它将拍摄用户的自拍照,并将这张独特的太空自拍照发送给用户,供其与亲友分享。

马克・罗伯特以其在 YouTube 上发布的寓教于乐的科普视频而闻名。他希望通过这一项目,让更多人尤其是年轻人感受到科学与工程的魅力,并鼓励他们探索 STEM 领域的职业发展机会。他表示:「这个项目将尖端技术与趣味性相结合,是激发人们对 STEM 好奇心的绝佳方式。」

值得一提的是,这一项目此前曾通过 T-Mobile 的「T-Mobile Tuesdays」计划向 T-Mobile 用户开放。如今,该项目已向所有感兴趣的用户开放,任何人都可以参与这一太空自拍活动。(来源:CnBeta)

 

浏览量: 15

TikTok「硬刚」之下,转机来了

 

这可能是人类商业历史上第一次,高达1.7亿用户量和千亿美金价值的公司,选择不自由,毋宁死。

1月15日,据报道,TikTok 准备周日在美国立即关闭服务,除非最高法院介入阻止「不卖就禁」禁令。

报道称按照这一计划,用户在尝试打开TikTok时,将看到一条弹窗消息提示他们访问一个网站以了解禁令的详细信息。与此同时,TikTok还会提供数据下载选项,允许用户将个人信息保存下来。

若此举落地,这一决定将标志着,TikTok从不断的抗争到无路可退的关键,最终坚持不退,「生是人杰,死亦鬼雄」。

但看起来也并非没有转机。最新消息是,据央视新闻报道称,有知情人士透露,拜登政府正在考虑如何让TikTok在美国继续运营,「官员们正在『探索选择』如何实施该法律,让 TikTok 不会在本周日被禁。」

图片来源:央视新闻

 

自2019年美国政府提出国家安全审查以来,TikTok面临的压力几乎从未停歇。

随着「不卖就禁」最后期限的逼近,TikTok宁愿采取果断措施,直接关闭应用,让所有用户都直面禁令的冲击。这一选择无疑将让全球最大的短视频平台面对前所未有的挑战。

倒计时只剩3天,无论转机是否能在最后时刻之前出现,TikTok的坚持已展现出强大的抗压能力和对自身价值的坚定捍卫。

TikTok的故事,已不再只是一个科技企业如何应对政治与商业压力的简单叙事,它早已变成了一个关于全球化背景下,国家、企业与用户之间复杂博弈的缩影。

正如几年前其初出茅庐时一样,TikTok已超越了短视频平台的定位,成为全球化竞争中的重要棋子。

如今,站在生死抉择的关头,TikTok显然不是单纯以商业利益为导向,而是选择了更具历史意义的「刚」——不畏强权、不轻易妥协的姿态,这种态度或许将影响未来科技行业与海外互动的深远格局。

 

TikTok 已退无可退

 

过去两天,小红书正在被外国人疯狂涌入,中外网友在这个App上嬉笑怒骂,打成一片,但在这副表面繁荣的互联网「胜景」背后,其实是商业史上少见的一个关键的时刻逐步逼近。

 

一家在美国拥有高达1.7亿用户量和千亿美金市值的公司,正处于前所未有的生死存亡的关键节点,这种局面,恐怕在商业史上也难以找到先例。

 

去年4月,美国国会通过了一项立法:禁止或强制母公司字节跳动出售 TikTok。该法案后经总统拜登签署成为法律,标志着TikTok将遭遇最严峻的命运——TikTok 将于今年 1 月 19 日在美国被禁用,除非它与中国母公司字节跳动断绝关系。

 

但我们知道,这场刁难从2019 年 11 月就开始了,当时,美国政府对 TikTok 母公司字节跳动收购 Musical.ly 进行了国家安全审查,关注点在于用户数据的处理和存储。

 

此后的几个月里,美国参议院多次举行听证会,推动立法禁止TikTok。到了2020年8月,时任总统特朗普签署了行政命令,要求TikTok在90天内剥离美国业务,并采取一系列限制措施。尽管这些禁令并未立刻生效,但美国外国投资委员会(CFIUS)紧接着对TikTok展开了更为严格的审查。

 

2021 年 6 月,拜登政府虽然撤销了特朗普时期的禁令,但实际上相关的施压和限制力度更为加强。

 

TikTok 过往尝试了多种努力试图解决问题。包括建立「透明度和问责中心」;成立内容顾问委员会;成立专门的美国数据安全公司(USDS),负责管理美国用户的数据; 实施名为「Clover」的数据隔离工程和「Texas」的数据安全工程,这两项计划的年度运营成本均达到了大约 10 亿美元;聘请具有美国背景的高管;与甲骨文(Oracle)达成协议,甲骨文将成为 TikTok 在美国的「可信技术提供商」,根据协议,甲骨文有权对 TikTok 美国的源代码进行安全检查。

 

过往的努力以及后来TikTok 为阻止提案所做的一系列努力——包括劝说用户向国会代表投诉,以及在距离最终投票仅剩几天的时候投放广告,宣传 TikTok 在数据安全方面所做的努力,随着美国国会通过这项法案,均以失败告终。

 

但 TikTok 并没有停止抗争的步伐。去年5月,TikTok及其母公司字节跳动向美国联邦法院提起诉讼,要求法院裁定旨在封禁TikTok的《保护美国人免受外国对手控制应用程序法》违宪,并要求推翻。

 

图片来源:视觉中国

 

9月,TikTok及其创作者诉美国政府的诉讼在美国哥伦比亚特区联邦巡回上诉法院正式审理。TikTok及字节跳动主张,该法案要求的「合格的资产剥离」在商业、技术及法律上均不可能实现,且无法在规定的270天内完成;即便法案要求的「有条件的剥离 」在操作上可行,也从根本上违背了美国宪法对言论自由和个人自由的承诺。

 

12月,美国联邦上诉法院驳回TikTok的上诉,维持了要求字节跳动剥离TikTok美国业务的禁令。

 

一路以来,TikTok尽力抗争,如今已退无可退,或许只有「刚」到底,未来才可能有一线转机。

 

与此同时,据报道,当选总统唐纳德·特朗普正在考虑发布一项行政命令,暂缓执行禁令60至90天。特朗普的任期将从禁令生效的第二天开始,但报道上并没有说明特朗普将打算如何合法地实施这一措施。

 

此外,上周,美国马萨诸塞州参议员爱德华·马基在参议院发表讲话并在TikTok上直播。他在讲话中提到计划提出立法,要求将TikTok「不卖就禁」禁的最后期限再延长270天,称禁令生效将重创美国社会和文化生态,数百万美国人将失去表达渠道,并对那些依赖该应用建立社会联系和维持生计的美国人造成严重影响。

 

但最后期限已迫在眉睫,倒计时只剩3天,变数会发生吗?

 

中美互联网世界,打开一扇窗?

 

是直接关停,还是继续运营,抑或是缓刑等待川普上台后再作审判,TikTok 在美的结局将在 3 天后得到答案。

 

但站在今天的时间点上,尤其是看到发生在小红书上的「drama」一幕,我们已经可以开始思考:TikTok 存亡尘埃落定之后,中美互联网世界会何去何从。

 

首先可以肯定的是:TikTok 封禁以后,抖音开放国际注册,然后美国TT用户涌入国内避难大概率是无稽之谈。

 

图片来源:视觉中国

 

1月15日起,抖音上出现大量IP属地显示为美国、英国、俄罗斯、泰国等地的用户视频,手机号注册页面也显示全球多国国际电话区号可选。

 

不过这并不代表抖音开放了海外IP注册,字节方面并未直接回应抖音是否开放海外用户注册,而抖音集团李亮则在微博回应称,「有海外IP不代表是海外注册用户。另外我们发现,这一波也有很多人浑水摸鱼,搬运视频仿冒外国用户,尤其是一些黑产团伙想借机涨粉养号。这些账号鉴别起来有一些难度,这几天我们在积极治理,目前已经处置了1万多个仿冒外国用户的账号。」

 

换句话说,目前出现在抖音的大量外国人录制视频,有部分可能是海外搬运或者国内黑产团队利用「假老外」引流。

 

即使不谈外国用户注册国内APP可能涉及的国内外监管问题,外国创作者和用户进入抖音和小红书等平台后,能否融入这些中国互联网社区也是一个巨大的挑战。

 

显然小红书并没有做好国际化的准备。一个例证是,今天小红书APP并没有X、ins、TikTok等国际化APP必备的翻译功能,大量海外用户涌入后,评论区的跨国交流还是靠中国用户说英文或者翻译器。当然,这并不是复杂的技术问题,以今天的AI基础设施发展水平,高质量多语种翻译很容易实现,如果有需要的话小红书的产品团队不难短时间内作出功能更新。

 

更深层次的挑战,在于如何在这些以国内社区为主的平台上做好国际化的用户运营。

 

今天来小红书「避难」的海外用户,最初的动机大多是出于对封禁TikTok的反感,而与国内用户交流甚欢,则大多出于初次接触真实中国用户的「新鲜感」。小红书社区的特点是「分享真实生活」,当然可能比现实世界有的时候更精致了一点,但对于95%以上都没有去过对方国家的中美用户而言,这种交流充满了新鲜感。

 

不论是分享对方的美食美景宠物,还是帮忙做英语作业,抑或是玩一些「你给我发F22舱内图,我找你要六代机设计图」的国际梗,这种真实交流无疑对中美用户而言都是新鲜的。

 

但对于一个社区的长期用户运营,新鲜并不足以「保鲜」,就像是中国给部分国家民众开放免签停留后,不少外国人来中国旅游一样,小红书现在也成了一部分美国人的赛博打卡地。

 

而在新鲜劲过去以后,重要的是要让海外用户在这里「生活」,每天使用消费内容;让海外创作者持续投稿,并获取商业收益。小红书依然要像所有海外产品做过的那样分IP区域运营用户,并进一步构建海外的运营、商业化体系,这与字节当年做过的事情并无区别,并且还要与字节的lemon8和ins等同类产品展开竞争。

 

不过即使做不成海外同类产品的替代品,在一些特定场景下发挥价值,为海外民众了解真实的中国打开一扇窗户,小红书依然有可能借着这次机会挖掘出新的可能性。

 

事实上,就像过去留学生群体使用小红书作为留学生活攻略指南一样,在小红书的海内外用户交流中,依然可以看到热闹和新鲜之外给双方带来了不少实用性的交流。比如中国用户为希望前来中国旅游的外国人提供当地的景点、美食攻略,地道的欧美人来为中国学生讲解英文语法,这种对用户的「真实有用」一直是小红书的社区基石,加上这次契机,也可能成为小红书国际化破局的开始。

 

无论如何,这次 TikTok 的深远影响,早已超越了单纯的产品范畴。1月19日后,一切答案将逐渐揭晓,而由此引发的诸多挑战与机遇,必将成为我们未来长期思考的重要课题。

头图来源:视觉中国

浏览量: 68

AI 公司是真「饿了」,开始砸钱买你拍的「废片」

做过 Up 主、YouTuber 或是视频自媒体从业者都知道,一部传到平台上 10 分钟的成片,背后可能是几个小时的素材。如同快充般的「拍摄 1 小时,剪出 1 分钟」。而在电影行业,常见素材比也在 10:1 到 20:1 甚至更高。

那些被弃用的素材叫做「废片」,在成片输出后,这些素材就如同废品一样,留着只会占据硬盘空间。

但就像现实生活有愿意花钱收废品,现在大 AI 公司想开始花钱「收废片」了。

1 月 11 日,据外媒报道,Open AI、Google、Moonvalley 等公司正在购买视频创作者们拍摄但未使用的「废片」。 高质量 4K、无人机、3D 动画素材,1 – 4 美元(约合 7.3 – 30 元)一分钟 ,为了 YouTube、TikTok、Instagram 等网络视频制作的素材 1 – 2 美元(约 7.3 – 15 元)一分钟。

这么看,只要废片质量足够好,一个小时的废片最高能卖 1800 元,可能比平台给 Up 主的分成还高。

 

01

AI 巨头,是真的「饿了」

 

为什么这些科技公司,要花钱买用户拍了不用的废片?

原因很简单: 视频数据不够用了 。

生成式视频模型、自动驾驶系统甚至机器人训练,都需要大量的视频作为训练数据。而优质视频不仅创作门槛高,在 AI 时代的版权划分也很模糊。

广告、电影公司的版权价格昂贵,网络平台通常也只有发行权而非使用权,和导演及制作团队签署的版权合同里,也鲜少涉及到 AI 使用权的条款。

视频网站同理,如果视频模型想合法抓取 YouTube 的视频,那应该联系 YouTube 还是 YouTuber?这同样是 AI 时代还没解决的版权灰色问题。

YouTube 也没有第三方内容的使用许可权|图源:YouTube

2024 年 4 月美国众议员提出的《生成式 AI 版权披露法案》,要求数据集制作者向注册员提交「任何受版权保护的作品的充分详细摘要」,否则将面临罚款。

在此背景下,Open AI、Google 还有其他 AI 公司就想到了「不买成片买废片」的方式。

不过 AI 大公司并不直接和创作者对接,而是通过第三方专业公司去联系平台和创作者 ,他们只付钱。怎么谈、找谁买、买回来怎么用,这些都由中介公司和平台协商。

几家中介公司表示,目前已经买了 500 多万美元的素材,对接的 AI 公司多达 17 家,包括 OpenAI、Meta、微软等。

AI 公司买回来后也不能乱用,由第三方专业公司做「中介担保」限制了废片的使用范围:AI 公司不能创建创作者的数字分身;不能在 AI 模型里重现专属创作者的 AI 场景,比如直接生成某个 Up 主固定的背景或是用 ta 的经典梗、口头禅等;不能用有损创作者声誉的方式使用素材。

对网红 YouTuber 而言,脸是「身份标识」|图源:PewDiePie

YouTube 在上个月也加入了类似的新功能:YouTuber 自行决定 AI 是否能抓取自己的视频内容,甚至可以选择授权的 AI 公司(当然也可以全选)。不过目前 YouTube 还没有给出授权费用的政策。

授权名单中有十八家主流 AI 公司|图源:YouTube

 

02

视频模型的军备竞赛

 

互联网内容的发展,随着带宽和信息量的增长,轨迹从文字逐渐转向视频,大模型也是如此。

视频模型成为过去一年大模型最卷的赛道,很多 AI 公司更进一步,直接开始卷可以生成动态场景的「世界模型」,但无论哪种模型,数据养料都离不开视频。于是各大 AI 公司纷纷开始了军备竞赛,谁能拿到更多的视频数据,谁的视频模型可能就会更好。

在前不久的 CES 2025 上,英伟达发布了世界基础模型平台 Cosmos。据介绍,Cosmos 经过了 2000 万小时的视频训练量。然而英伟达在去年就曾被 404 Media 爆出,在未经授权的前提下,违规抓取了大量 YouTube 和 Netflix 的视频以训练「内部名称为 Cosmos 的产品」。

英伟达内部在 Slack 的聊天记录|图源:404 Media

据爆出的英伟达内部聊天记录,英伟达的 AI 科学家和高管汇总了大量 YouTube 精选视频数据集用于模型训练,包括一个名为 HD- VG-130M 的数据集,该数据集由北大的研究人员构建,包含 1.3 亿个 YouTube 数据,使用权限仅限于学术研究。

在被质疑「YouTube 服务条款禁止下载,数据也只能用于研究目的」后,英伟达高管表示「受版权保护的数据能否用于训练,目前是一个悬而未决的法律问题……在大语言模型上,我相信我们的法律团队已经批准了这种做法,因此也可能会批准视频训练。」

在英伟达之前,OpenAI 的视频大模型 Sora 已经被 YouTube 点名批评了。正在和 OpenAI 打官司的《纽约时报》率先报道称,OpenAI 采集了超一百万小时的 YouTube 视频用来训练 GPT-4。

而对 Sora 训练数据来源,当时的 OpenAI 首席技术官(已离职)Mira Murati 直言「实际上,我也不确定」YouTube CEO Neal Mohan 回应称「如果 OpenAI 使用 YouTube 视频来训练 Sora,就明确违反了 YouTube 的使用条款。」

同样的态度,YouTube 又把这段采访发给了 404 Media,回应了一次英伟达。

也有视频模型另辟蹊径,将在未来两个月内公布的新视频模型「Marey」要做行业里「最干净」的,他们号称全部训练数据都拿到了授权,而且 Marey 的目标用户就是好莱坞和整个电影行业的大型工作室。

图源:Moonvalley

这是因为电影不仅是视频质量素材的巅峰,也是对版权规范最严格的视频领域。

对网络视频创作者而言,废片本身的归宿就是备份硬盘甚至回收站,如今有大公司愿意出钱让「废片再利用」,如果这种模式能持续运转,也不失为对小创作者的一种营收手段。

对更大牌的「创作者」,比如电影公司、制片厂而言,技术早已渗透甚至改造了电影行业,从 CGI 生成、虚拟制作到 AI 合成语音、面部去老化等等,AI 无非是一种提高影视制作效率的新技术手段。

但无论大小创作者,或许对 AI 视频生成都有着「杀鸡取卵」的警惕感。试想,当一个创作者源源不断地把自己的废片卖给 AI 模型,当 AI 模型已经足够以假乱真的时候,我们是否还真的需要一个具体的创作者出镜?当 AI 可以生成电影级空镜头,极具视觉冲击的特效后,电影行业还是否需要技术高超的摄影师、数字特效制作者……

「学习你,追赶你,替代你」这是每一个创作者面对生成式 AI 的进化时,都难以避免的恐惧。只能自我安慰道:在挡不住的 AI 浪潮下,废片还能卖钱,这总比免费当个「数据提款机」要强吧。

*头图来 源:www.zoetispetcare.com

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

浏览量: 19

传 TikTok 计划周日完全关停美业务;OpenAI 推出新功能「Tasks」;《王者荣耀》纯血鸿蒙版上线

TikTok 硬刚美国禁令:消息称计划周日完全关停在美业务,用户可下载保存个人数据

1 月 15 日消息,据外媒 The Information 今日报道,除非美国最高法院介入阻止禁令,TikTok 计划于当地时间本周日(1 月 19 日)全面关闭其在美国的应用。与其让已经下载的用户继续使用,TikTok 选择直接关闭应用,届时所有用户切身感受到禁令的影响。

报道称根据计划,尝试打开 TikTok 应用的用户将会看到一个弹出消息,指引他们前往一个介绍禁令信息的网站。其中一位知情人士表示,TikTok 还计划为用户提供下载个人数据的选项,以便他们保留自己的信息记录。

这项法律要求 TikTok 于 2025 年 1 月 19 日前,从母公司字节跳动拆分出来,否则将在美国被禁用,这一裁决让 TikTok 在美国这一关键市场的前景更加不明朗。

TikTok 已经以第一修正案为依据向最高法院提起上诉,并等待裁决。然而,上周五最高法院就此案的口头辩论中,法官们的提问表明,法院很可能维持该禁令。(来源:IT 之家)

消息称小红书团队在加班了:针对 TikTok 难民做优化

1 月 15 日消息,据媒体报道,从本月 1 月 13 日起,因为大量发帖自称「TikTok 难民」的美国用户涌入小红书平台,这一行为推动小红书在 1 月 14 日登上了 App Store 美区免费排行榜第一。

据一位接近小红书内部人士透露,小红书团队从 1 月 13 日当天就开始加班了,目前正在针对外国用户做功能优化,他们希望努力承接住这波泼天流量。

同时,小红书内部合规、安全相关的团队也同步开展工作了。此外,他还表示,这波「TikTok 难民」用户,或许很快就能体验到小红书开发的新功能。。

相比其他社交类软件,目前小红书没有自带翻译功能,国外使用者只能使用英文和第三方翻译软件交流。

此外,因为抖音与 TikTok 对内容进行了划分,并且能限制注册手机号的所在地。但紧随其后的小红书,目前还暂未对内容进行模块区分,海外用户注册来源相对简单。(来源: 快科技)

 

美团推出「浣熊食堂」外卖集合店,可一次性下单不同商家餐品

1 月 16 日消息,据 Tech 星球报道,美团正在北京试水名为「浣熊食堂」的业务,这是一家外卖集合店,店内商家几乎都是连锁餐饮品牌,比如老乡鸡、全聚德、云海肴等。

用户可以在「浣熊食堂」一次性下单不同商家的餐品,骑手一次性就可以配送到位。取餐方式上,浣熊食堂目前不支持堂食,用户可以选择到店自取或者骑手配送。

报道称,浣熊食堂的商家都要通过培训上岗,菜品现炒先做,每天会有安全卫生检查,包括商家的食材进货清单、打烊后的厨具、储存空间是否保持整洁等方面。

美团相关负责人透露,推出浣熊食堂,是希望提升纯外卖店的食品安全标准,由平台统一监督食品安全问题,保障消费者点到放心外卖。

浣熊食堂计划在北京望京、东直门、大郊亭桥等地区开设外卖服务,目前望京地区已可以使用浣熊食堂线上店进行外卖点单。

浣熊食堂在线上有两个入口,一个位于美团外卖 App 的功能频道内,与拼好饭等热门业务并列;另一个则是通过微信搜索浣熊食堂小程序。(来源:IT 之家)

 

OpenAI 推出新功能「Tasks」ChatGPT 可变身成 AI 私人助理

1 月 15 日消息,据外媒报道,OpenAI 今日在社交网络上宣布,为 ChatGPT 引入「Tasks」(任务)功能,支持用户安排提醒、更新和警报,来增强用户体验。目的是将 ChatGPT 转变为一个主动的助手。

新功能「Tasks」目前还处于测试阶段,仅向付费订阅用户开放。

凭借这一新增功能,用户可以使用简单、自然的语言提示轻松安排各种活动。ChatGPT 现在可以提供每日天气更新,提醒用户诸如护照续签或门票销售等重要日期,甚至还可以每天晚上给孩子们发送有趣的笑话。

一旦安排好,ChatGPT 将在指定时间自动执行这些任务,使其成为管理日常活动的高效工具。

要使用此功能,符合条件的用户必须从模型选择器中选择「带计划任务的 GPT – 4o」,并描述所需任务及其时间。虽然可以在任何平台上设置任务,但目前只能通过网页版的「任务」部分在个人资料菜单中管理和修改任务。

该功能还提供一定程度的自动化,ChatGPT 会根据用户互动建议任务。用户可以选择接受或拒绝这些建议,让助手更好地满足个人需求。(来源:来源: TechWeb)

 

微软悄然撤下仿冒谷歌搜索的界面,曾被指试图误导必应用户

1 月 15 日消息,TheVerge 今日报道,微软悄然撤下了其仿冒谷歌搜索的界面,该界面此前被用于让必应用户误以为自己在使用谷歌搜索。本月初,用户在必应上搜索「Google」时,会出现一个与谷歌极为相似的页面,包括一个特殊的搜索栏、类似谷歌涂鸦的图片,甚至搜索栏下方还有与谷歌搜索相似的小字提示。

然而,本周这一误导性界面已从必应的「Google」搜索结果页面中消失。此前,Reddit 论坛上的用户称,微软仿造的界面甚至会自动将页面略微向下滚动,以掩盖必应搜索栏出现在页面顶部的真实情况,这一做法显然是为了让必应用户误以为自己正在使用谷歌。

对于这一做法,微软拒绝置评,但谷歌方面则毫不掩饰地表达了不满。谷歌 Chrome 负责人帕里萨・塔布里兹(Parisa Tabriz)上周在 X 平台上发文称:「模仿是最真诚的奉承,但微软仿冒谷歌主页是其长期混淆用户、限制选择的又一伎俩。新年新低,微软。」(来源:IT 之家)

苹果 AI 功能冷遇:超过 60% 用户对 Apple Intelligence 不感兴趣

海外的报告指出,苹果用户对 Apple Intelligence 的使用反应显得有些冷淡,有超过 60% 的用户表示,对 Apple Intelligence 的兴趣不高,认为手机的其他功能对日常的使用体验更重要。

另外,报告也给出了 iPhone 用户为何对 Apple Intelligence 无感的原因:

数据显示,未升级到最新 iOS 系统版本是主要原因,占比超过 5 成,这意味用户不会因为 Apple Intelligence 而积极升级系统;此外,部分用户认为实用性不足,或对 AI 的准确性抱持怀疑态度。

知名分析师郭明錤也泼了 Apple Intelligence 冷水。他指出,至今尚无证据显示 Apple Intelligence 能贡献苹果的硬件换机潮与服务营收,推测苹果在 2025 年可能会面临更大的挑战。(来源:快科技)

 

阿里巴巴等公司入股人形机器人研发商星动纪元

1 月 15 日消息,北京星动纪元科技有限公司发生工商变更,新增阿里巴巴旗下杭州灏月企业管理有限公司、成都高新策源优产股权投资基金合伙企业(有限合伙)等为股东,注册资本由约 874.8 万人民币增至约 1095.9 万人民币。

IT 之家从星动纪元官网获悉,该公司由清华大学交叉信息研究院孵化,也是唯一一家清华大学占股的人形机器人企业。创始人陈建宇是清华大学博士生导师、助理教授。

北京星动纪元科技有限公司成立于 2023 年 8 月,法定代表人为张志,经营范围含智能机器人的研发、服务消费机器人销售、智能机器人销售、人工智能基础软件开发、人工智能应用软件开发、人工智能公共数据平台等。(来源:IT 之家)

 

MiniMax-01 开源:新架构开启 Agent 时代

1 月 15 日消息,MiniMax 发布并开源了 MiniMax-01 全新系列模型,其中包含两个模型,基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01。

在 MiniMax-01 系列模型中:首次大规模实现线性注意力机制,传统 Transformer 架构不再是唯一的选择。这个模型的参数量高达 4560 亿,其中单次激活 459 亿。模型综合性能比肩海外顶尖模型,同时能够高效处理全球最长 400 万 token 的上下文,是 GPT-4o 的 32 倍,Claude-3.5-Sonnet 的 20 倍。

受益于架构的创新、效率的优化、集群训推一体的设计以及内部大量并发算力复用,MiniMax 提供文本和多模态理解的 API 的标准定价是输入 token 1 元/百万 token,输出 token 8 元/百万 token。。(来源:MiniMax)

 

《王者荣耀》纯血鸿蒙 HarmonyOS NEXT 版明日 10 点正式上线,支持 120 帧刷新率、跨平台匹配、账号互通与继承

1 月 15 日消息,据王者荣耀官方消息,《王者荣耀》HarmonyOS NEXT 版本的适配工作已完成,将于 2025 年 1 月 16 日 10 点上线鸿蒙 HarmonyOS NEXT 应用市场。

《王者荣耀》HarmonyOS NEXT 版功能介绍如下:

1、支持 120 帧高刷新率

  • 在支持高刷新率的鸿蒙设备上,王者游戏画面可以达到 120 帧的超高刷新率,带来更加流畅的游戏体验。

2、跨平台匹配

  • 鸿蒙系统用户可以与其他平台 (安卓、iOS) 的玩家进行跨平台匹配。

3、账号互通与继承

  • 原安卓账号与鸿蒙系统互通,系统安心切换,账号无缝衔接,畅享王者荣耀丝滑体验!
  • 无需重新注册,完整保留所有游戏资产。(来源:IT 之家)

OPPO Find X8 Ultra 渲染图曝光:外观设计基本保持不变

据知名数码博主 @ 定焦数码 最新发布的信息显示,与此前曝光的消息基本一致,全新的 OPPO Find X8 Ultra 在外观上将延续此前 OPPO Find X8 系列的设计,其后置相机模组依旧为对称设计,哈苏的标志位于影像模组中间。

值得注意的是,此前 OPPO Find 系列产品负责人周意保也曾在回复网友时透露,OPPO Find X8 Ultra 将与另外两款 Find X8 系列机型保持一致,并配备实体拍照按键,让拍照更加方便。

其他方面,根据此前曝光的消息,全新的OPPO Find X8 Ultra将会配备一块2K分辨率的OLED曲面屏,搭载高通骁龙8至尊版移动平台。将后置四摄,其中包括一颗索尼LYT 900传感器的5000万像素1英寸超大底主摄、两颗5000万像素的大底潜望式长焦镜头和一颗5000万像素的大底超广角镜头。

此外,该机一次性塞进了两颗潜望长焦,其优势在于用户不必局限于单个镜头在3倍或5倍范围二选一,而是同时能在3倍至6倍的范围内实现丝滑变焦。

据悉,全新的 OPPO Find X8 Ultra 将会在 3 月与大家见面,预计价格会进一步上涨,考虑到前代定价为 5999 元起,这次该机的起售价可能超过 6000 元。(来源: TechWeb)

 

三星 Galaxy S25 Slim 细节曝光:厚度仅 6.5mm 对标 iPhone 17 Air

日前三星官方正式宣布,作为安卓机皇的三星 Galaxy S25 系列将于 1 月 23 日正式发布。有外媒进一步晒出了该系列机型中新增的 Galaxy S25 Slim 的更多细节。

据海外知名爆料达人最新发布的信息显示,与此前曝光的消息基本一致,全新的三星 Galaxy S25 系列今年将新增一款轻薄版本机型——三星 Galaxy S25 Slim,其定位将介于三星 Galaxy S25+与三星 Galaxy S25 Ultra 之间,厚度相比此前已经得到不少曝光的 iPhone 17 Air 要稍厚一点,预计在 6.5mm 左右,而 iPhone 17 Air 的厚度为 6.2mm。

其他方面,根据此前曝光的消息,全新的三星Galaxy S25系列将首发搭载高通骁龙8至尊版for Galaxy处理器,CPU主频达到了史无前例的4.47GHz,同时该系列还将升级16GB内存,这将是三星史上内存最大的旗舰手机。

虽然三星Galaxy S25 Slim的机身非常轻薄,但三星还为其配备了S24 Ultra同款2亿像素摄像头ISOCELL HP2,超广角摄像头和长焦摄像头都将采用5000万像素的JN5传感器,同时将配备一颗支持3.5倍光学变焦的长焦镜头,并采用三星最新发布的ALoP(全透镜棱镜,All Lenses on Prism)技术。

三星将在 1 月 23 日举办 Unpacked 活动,届时全新的三星 Galaxy S25 系列将正式亮相,而新增的 Galaxy S25 Slim 版可能要到 4 月才能发布。(来源: TechWeb)

消息称任天堂 Switch 2 将配备神秘「C 键」,首次引入群聊及语音聊天功能

1 月 15 日消息,本月中旬曾有消息称任天堂将于 1 月 16 日发布 Switch 2,尽管这一日期正不断接近,但相关的泄露信息仍源源不断地流出。这次的爆料来自 Nintendo Switch 2 的 Discord 服务器,该频道上的数据挖掘者昨日宣称发现了一个新功能,似乎与右侧 Joy-Con 上的神秘「C 键」有关。

代码提到了一个名为「Campus」的新功能。据悉,这一功能将首次为 Switch 引入群聊和语音聊天且支持屏幕共享,支持最多 12 个 Nintendo Switch Online 用户同时在线,暗示它可能与付费订阅服务相关。由于群聊和语音聊天需要网络连接,如果 Switch 2 要提供这些功能,就很可能只会提供给 NSO 订阅用户。(来源:IT 之家)

 

浏览量: 22

每年 CES 都在产生共识,今年的共识是「端侧 AI」

上周刚刚结束的 CES 2025,共计吸引了 4000 余家厂商以及超过十万名观众参展,统观活动和展览的全程,从内容丰富程度来看,仍然无愧于「全球最大消费电子展」的名号。

 

但真正让 CES 配得上「消费电子届春晚」的,除了各家厂商都会展示的不少「花哨」新技术,还有隐藏在其中的,但仍能被捕捉到的「年度趋势」。

从 CES 每个人讨论最多的话题,到现场各种产品展台前受关注的情况,就不难判断出接下来一整年内,全球消费电子产业将会出现的重要变革。对于未来趋势的预判,通过 CES 这个全球各地消费电子从业者交流的平台,在真正意义上变成「共识」,带回世界各地生根发芽。

比起 CES2024 上每个人都在兴奋地讨论「AI 硬件」,CES2025 的现场少了几分因为看不清 AI 硬件的发展前景、而在兴奋中夹杂着茫然的狂热,讨论中多了不少明确的指向性。

今年的 CES 现场,众多具有试水性质的 AI 硬件产品逐渐变得无人问津,已经被初步验证过的 AI 眼镜、AI 智能宠物等产品品类的展台前,体验产品与咨询产品相关信息的用户大排长龙。

在产品功能展示中,端侧 AI 因为实时响应速度更快、成本更加可控,迅速脱颖而出,成为今年不少新品 AI 功能的主要卖点,并且通过各种基于端侧 AI 实现的多模态内容识别、或是端侧数据分析等能力,给现有的硬件体验带来改变。

如果说去年的共识是「AI 硬件是未来」,那 CES2025 中诞生的这个共识,无疑是「端侧 AI,才是 AI 硬件的未来」。

 

01

 

端侧 AI——AI 硬件落地的关键

 

在刚刚结束的 2024 年,AI 硬件快速发展。从通用的 PC 和手机终端,到机器人、眼镜、耳机,再到更多更细分的垂类赛道,几乎每一种存在人机交互的硬件终端,都有厂商尝试将其与大模型结合。

最常见的是方案调用云端算力完成 AI 推理——这在基础大模型快速迭代,开发者还在探索 AI 能力与硬件结合的阶段更加实用。但当 AI 硬件走出企业的研发中心,开始面向消费者时,只有云端 AI 的方案面临三个挑战。

 

  1. 调用云端算力的成本居高不下
  2. 网络传输导致 AI 在终端的响应速度较慢
  3. 数据隐私问题,用户在关注隐私安全的同时,也希望终端 AI 能提供更个性化的服务

 

过去一年,行业逐渐形成共识:端侧 AI 将是 AI 硬件落地的关键,这点在 CES2025 期间得到更进一步的印证。

以今年最火热的人形机器人赛道为例:CES 期间发布的机器人,不少在外观设计上愈发贴近人类,但它们在动作灵活性、智能感知与决策,以及交互体验等核心领域,依然存在较大的提升空间。

究其原因,人形机器人的研发瓶颈集中在三大关键部分:负责自主学习/决策的「大脑」,掌控跑跳、抓取等复杂动作的「小脑」,以及由躯干四肢组成的「本体」。这些核心部位的技术突破,直接决定了机器人的整体性能。

阿加犀展示的、以端侧 AI 技术为基础的人形机器人,通过使用高通端侧 AI 处理器支持部署端侧大模型,赋予机器人强大的端侧多模态处理能力,将视觉、听觉、触觉等多种感官输入深度融合,结合端侧 AI 的高能效优势、实现高效的端侧实时数据处理,为机器人提供更流畅、更精准的交互体验。

在体验中,阿加犀这款人形机器人能轻松完成智能交互,它能够用流利的英语「Welcome to the Qualcomm booth!」问候走近的参观者,与用户流畅自然地规划,并且准确地提供服务。

在高通展台展示的阿加犀人形机器人|图片来源:极客公园

除了高性能和低延迟以外,隐私安全也是端侧 AI 的主要价值之一。极客公园在 CES 现场注意到,在各家汽车厂商的智能驾驶展台中,面对车中部署的众多摄像头,会有很多观众问出「这些摄像头收集到的驾驶员/乘客个人隐私数据如何进行处理」这样的问题。

相比今天主要运用于 B 端的机器人,智能汽车属于用户私人所有,把数据全都传到云端,用户难免会担心隐私数据的泄露。

相对于云端 AI,端侧 AI 更适合解决这样的顾虑。终端侧 AI 从本质上有助于保护用户隐私,因为查询和个人信息完全保留在终端上,即使是与车载智能语音助手进行沟通,也能通过端侧 AI 得到需要的信息,在保护隐私的同时无损于用户的智能化体验。

在 CES 期间,笔者在高通展台看到了车机系统的端侧 AI 解决方案,例如打通支付系统,将支付信息保存在本地;此外还可以在车机系统中整合各种常用的在线服务,例如匹配用户生物特征信息,完成在充电站充电后,自动支付充电费用,「拔枪即走」,或是直接在车上点餐、订购流媒体服务等场景需求。

高通在 CES 期间展示的骁龙数字底盘概念车|图片来源:极客公园

 

整个过程中能看到,无论是算力调用还是数据处理,都以端侧的 AI 算力作为「主场」,只有在必要的情况下向云端请求相关数据,或是在面临复杂任务时向云端分流任务。

在「离用户最近的地方完成数据处理」也能在车辆驾驶这样情况复杂的辅助驾驶场景下,显著降低驾驶员分心的可能,将信息以最高效的方式,传递给用户。

从 CES 现场硬件产品的发展趋势来讲,这一点对于 AI 进一步深入更多用户场景,有着比想象更多的可能性:大量如今不得不依赖云端推理才能完成的请求能在端侧完成,这将在全球范围内带来成本的大幅降低:每一个时代最流行的产品,一定也是普通人能负担得起的产品,这一点同样重要。

更强的端侧 AI,不仅能更好地保护用户隐私,同时也在为更加聪慧的主动智能奠基:用户在 PC、智能手机乃至智能眼镜、汽车中,都有愈发强烈的「让 AI 主动帮我处理一些工作」的趋势,尤其是对于手机/笔电这样需要使用自带电池运行的设备来讲,这不仅意味着更大的数据处理量,同时也对硬件本身所采用的芯片功耗提出了更高的要求。

AI PC 能够在端侧调用本地模型的算力,处理更多 AI 大模型任务|图片来源:极客公园

性能、隐私、成本三大优势的加持下,今年在 CES 现场,无论是中国厂商百花齐放的「百镜大战」,还是 AR/VR 头显新锐厂商发布的各具亮点的产品,都能看到相关厂商选择引入端侧 AI 解决方案。

事实上,在 2024 年,我们其实已经观察到这一趋势,无论是掀起 AI 眼镜浪潮的 Ray-Ban Meta,还是各家主打端侧 AI 能力的智能手机与 AI PC,都离不开以高性能和高能效为核心优势的高通芯片的支持。

在笔者与现场硬件创业者的沟通中,「我们用的是高通的方案」是听到次数最多的产品介绍之一,这甚至已经成为了一种无需更多介绍的产品背书,只要听到这句话,双方对于这款产品在端侧 AI 性能基准上应该拿出怎样的表现,就有了一个相对的心理预期,无论是在 XR、AI PC、智能汽车还是机器人领域都是如此。

在 CES 上,高通公布的最新数据是,搭载骁龙 X 系列平台的 AI PC 已经超过 60 款,预计到 2026 年这个数字将超过 100 款,这些 PC 来自你能想到的几乎所有主流 Windows PC 厂商;零跑汽车、极氪、德赛西威、Garmin 佳明和松下汽车等汽车产业链厂商都宣布了基于骁龙座舱平台的合作,而高通此次带来十余项的汽车合作动态,更是囊括座舱、智能驾驶、甚至还有电动摩托车等领域;索尼、三星、Rokid 和雷鸟等厂商,都在展会期间带来了使用骁龙 XR 产品线的空间计算新品。

 

观众在 CES 上体验 XR 产品|图片来源:极客公园

 

正是因为有了携手多领域终端厂商打造的丰富品类的 AI 硬件,让高通这样一家 To B 企业的展台反而成为了 CES2025 硬件产业链上存在感最强的厂商之一。

 

02

 

从 AI 到 Agent UI

 

端侧 AI 已经成为共识,而如果从 CES2025 现场各家厂商各类产品的展示,推测 2025 年 AI 硬件的下一个趋势,那一定是 Agent UI 的普及与推广。

从最早以应用为核心的 Apple Macintosh 搭载的 systems1 系统算起,以应用程序为核心的操作系统逻辑已经诞生并进化了四十余年,以至于我们很容易混淆,直接将其与「智能操作系统」画上的等号。

但在 CES 现场,你会听到众多不一样的回答:无论是行业领袖在 CES 开幕前的主题演讲,还是高通所强调的「AI 是新的 UI」观点,亦或是现场硬件/软件创业者的探讨中都能发现,Agent UI 取代传统操作界面 UI,将会是 AI 硬件时代带给所有硬件产品影响最深刻的变革之一。

或许很快,我们目前熟悉的车机、手机桌面等概念,都将被全新的、以AI为主要交互方式的 UI 取代,从而让系统从「App 的主场」,变成「AI 的主场」,这就是 Agent UI 的核心所在。

Agent UI 并不是「AI 语音助理」的直接迭代:它的诞生源于业界越来越多意识到,更聪慧的智能体验需要依赖全新的架构,来强化 AI 的决策、交互与适应能力——这些要求对目前众多仅靠大模型本身实现 AI 功能的硬件来讲,是难以逾越的天花板。

这一趋势同样离不开端侧 AI 算力的深入:从笔者在 CES 2025 现场看到的情况,无论是本田、宝马这样的传统车企,还是 Waymo、Rivian 这样的新锐厂商,都将「从车载助理,到基于 AI 重新设计车机交互」当作了主要的演讲主题与展示内容。

 

在智能座舱中应用 Agent UI 实现的效果|图片来源:极客公园

在高通在其 CES 展台展出的骁龙数字底盘概念车中,Agent UI 取代传统操作界面给交互体验带来的改变已经初现雏形:除了最基本的时速等信息,驾驶员一侧的显示屏幕内容几乎全部被 AI 智能助理取代,传统的 App 不见踪影,取而代之的是 Agent 接收各种来自驾驶员的指令、并顺畅完成任务。

除了车机系统,智能眼镜其实是更早向我们展示 Agent UI 未来前景的硬件品类。去年现象级的智能眼镜 Meta Rayban,由于没有传统的图形 UI 和手势识别、操作手柄等智能眼镜产品场景的交互控制器,从一开始就依赖于语言指令。

一开始这种交互还比较单一,只能执行用户的拍照、放歌等简单命令,这时候更像是手机智能助手的翻版,还很难称得上是下一代的 Agent UI。但随着 Meta Llama 大模型的不断升级,从 2024 年年中开始,越来越多用户开始与 Meta Rayban 进行更复杂的交互,包括翻译、计算卡路里、去博物馆识别物体并进行讲解等等。

通过与 Agent 进行语音交互,让智能产品在各个场景下提供服务,此时的 Meta Rayban 已经有了新一代 UI 的雏形。而在 CES 2025 期间,我们观察到了更多的尝试。

比如搭载第一代骁龙 AR1 处理器的雷鸟 V3,同样在 AR 眼镜体验中融入了 Agent UI 的概念:借助端侧 AI 计算,雷鸟 V3 能实现平均 1.3 秒的 AI 响应速度;在新架构的支持下,更多即将上线的新功能,包括手机通知 AI 总结播报、录音内容 AI 总结、AI 新闻播客等,都能通过更强的端侧算力,给用户实际使用带来更好的体验。

 

03

 

结语

 

虽然站在当下,我们对未来的畅想并不总是会变成现实,但如果结合足够多的真实用户反馈,自然能看到未来的产品进化趋势,以及今天在追求、终有一天能到达的那个「终点」。

如果全行业都同时认可一个想法,那它极大概率真的会变成一个「趋势」,并最终孕育出新的未来。

这某种程度上也是 CES 独特的魅力之一:这里不是「巨头通吃一切」的战场,也不是谁有钱租得下华丽展位就能吸引到来自用户最多的目光,而是通过产品和技术赢得用户传达出的最真实的反馈。

在通过端侧 AI 提供解决方案的基础上,各家使用高通平台的终端品类在云端模型应用上仍然呈现出「百花齐放」的状态,通过「云+端」的混合 AI 模式,面向不同应用场景、不同用户需求灵活采用对应的处理方式,最终诞生我们在 CES 2025 上看到的一款款展台前人满为患的爆款产品。

那些在 CES 现场人头攒动、几乎堵得水泄不通的展台,是产品是否真正受到用户关注的最佳回答。

虽然 CES2025 已经结束,但在这几天内来自世界各地的行业从业者们所形成的「端侧 AI 是共识」,会随着接下来一整年之中一批批的 AI 硬件发布而不断强化,真正推动行业发展。

 

浏览量: 32

黄仁勋本周将赴京沪深;阿里美团携程到小红书发英文帖揽客;知名博主试驾法拉第 FF91:基本没优点|极客早知道

阿里美团携程等国内互联网公司,在小红书发英文贴玩梗揽客

1 月 14 日,随着近日大量 TikTok 用户注册小红书账号并分享内容,很多国内互联网公司也借机以玩梗名义试图吸引这波流量。

携程向 TikTok 用户喊话:Say go,let’s go(说走就走),欢迎他们并且如果有出行需求可以使用携程;

饿了么直接把 App 名称中译英:Are you hungry(你饿了么)?告诉 TikTok 用户可以点外卖吃;

阿里巴巴发帖称:Do you want to make money(你想赚钱吗)?而且阿里巴巴还「阴阳」一把亚马逊,直接向 TikTok 用户宣传称自己是亚马逊供货源,想赚钱就找阿里;

瑞幸咖啡简单点明:Want to drink coffee?Use this(想喝咖啡吗,选我);

美团告诉 TikTok 用户:Use this discount(用美团享受折扣)。(来源:三言科技)

Salesforce CEO 抨击 Copilot:微软 AI 战略令人失望,用户使用率极低

1 月 14 日,Salesforce CEO 马克・贝尼奥夫再次抨击微软的 Copilot,称其令人失望且客户使用率低。

在做客 The Bartlett Show 节目中,贝尼奥夫表示:「微软处理 AI 的方式让所有人失望,回顾 Copilot 及其技能,概括来说就是重新包装 OpenAI 并将其放入 Excel」。贝尼奥夫表示基于客户反馈,Copilot 并未给客户带来变革性的体验,使用率极低,客户更倾向于 ChatGPT 等工具的情况。

这并非贝尼奥夫首次批评微软的 AI 战略。早在 2024 年 10 月,他就将 Copilot 比作新的 Clippy,称其无用且无法提供价值,并认为微软的 AI 工作对行业有害。(来源:IT之家)

 

英特尔 Vision 2025 活动定档 3 月 31 日- 4 月 1 日,去年推出 Gaudi 3 AI 加速器

1 月 14 日,英特尔官网现已上线 Vision 2025 活动页面。该活动仅限受邀者参加,将于美国当地时间 3 月 31 日~4 月 1 日在拉斯维加斯举行。英特尔临时联席 CEO 兼英特尔产品 CEO 米歇尔・约翰斯顿・霍尔索斯将担任本活动的演讲人。

英特尔目前通常一年举行 2 场 ON 系列活动,其中 Innovation 所涉范围更广,Vision 则更聚焦 toB 商业业务,面向业务经理、技术经理和企业 CxO 高管。

英特尔在去年的 Vision 2024 上推出了新款 AI 加速器 Gaudi 3,并公布了至强品牌更新计划。而在 Vision 2025 上英特尔有望收尾至强 6 系列处理器的发布工作,将 Granite Rapids-SP、Sierra Forest-AP 等变体正式发布。(来源:IT之家)

 

继 Meta 之后,亚马逊也将终止部分 DEI 项目

1 月 14 日,一份内部备忘录报道,亚马逊正在停止部分多元化、公平和包容性(DEI)计划。

该电子商务巨头表示,正在对数百项举措进行广泛审查,并「逐步淘汰过时的计划和材料」。据报道,Facebook 母公司 Meta 上周五也采取了类似举措,立即终止了其主要的 DEI 计划。

最近几个月,包括麦当劳、沃尔玛和福特在内的其他公司也对其 DEI 计划做出了改变。保守派的强烈反对和最高法院在 2023 年对平权法案的裁决促使许多公司改变或停止了他们的 DEI 项目。(来源:白鲸财经)

 

欧盟将重新评估针对苹果、Meta 和谷歌等科技巨头的调查

1 月 14 日,据《金融时报》报道称,欧盟委员会正在重新评估其针对苹果、Meta 和 Alphabet 旗下谷歌在内的多家科技巨头的调查。苹果、Meta、谷歌和欧盟委员会均未立即回应置评请求。

在完成审查期间,所有决定和潜在罚款都将暂停,但案件的技术性工作仍将继续进行。《金融时报》称,此次重新评估可能导致布鲁塞尔方面缩小或改变调查范围,将涵盖所有自 2024 年 3 月以来根据欧盟《数字市场法案》(DMA)启动的案件。(来源:IT之家)

 

报道指英伟达计划在中国台北设立亚洲总部

1 月 14 日据报道,全球知名半导体公司英伟达计划在中国台北设立亚洲总部,预计将雇佣 2500 名员工。(来源:金融界)

英伟达 CEO 黄仁勋据悉本周将赴京沪深

1 月 14 日,据报道,英伟达首席执行官兼联合创始人黄仁勋本周将前往中国、走访数个大城市。

据知情人士透露,黄仁勋将于 1 月 15 日前后抵达深圳,参加该公司一年一度的春节庆祝活动。黄仁勋也计划前往上海和北京。 (来源:DoNews)

 

知名博主陈震同学试驾法拉第 FF91:直言基本没啥优点

1 月 14 日,知名汽车博主「陈震同学」日前远赴美国,体验了特斯拉 FSD,甚至还亲自坐到了一台法拉第未来 FF91 上驾驶了一番。

截至目前,这款车全球仅有 10 多辆上牌,视频里,陈震表示这款车的设计其实是 10 年前就已存在,搁在现在其实并不过时。对于这款车的造型,陈震表示了认可,他称设计很超前,整体确实很漂亮,但唯一的问题就是「生不逢时」。

陈震称,如果这款车在 10 年前就能量产,那么应该可以支撑起贾跃亭当年想买的预期价。

那么这款车开起来坐起来到底表现如何?陈震并未在视频里明说,不过在评论区回答网友提问时倒是说了更多更重磅的信息。

有人称「这个有什么缺点你可以随意表达」,陈震回复称「基本没啥优点」;还有人关心它的智驾水平,和当地特斯拉比怎样,陈震更是表示就是「0 和 1 的区别。」(来源:快科技)

 

NVIDIA 公版 RTX 5080 大年初一解禁,RTX 5090/D 定在 1 月 24 日

1 月 14 日,据媒体报道,NVIDIA 的最新显卡——GeForce RTX 5090/D 和 RTX 5080 的性能测试解禁日期已经确定。根据最新的消息,RTX 5090 和 RTX 5090D 的性能测试将于 1 月 24 日解禁,所有型号的 RTX 5080 评测均在开售的 1 月 30 日,也就是大年初二解禁。

RTX 5090 作为 NVIDIA 的旗舰显卡,拥有 21760 个 CUDA 核心和 32GB GDDR7 显存,而 RTX 5080 则配备了 10752 个 CUDA 核心和 16GB GDDR7 显存,两款显卡都将在 1 月 30 日开售。(来源:新浪科技)

 

Steam 平台 2024 年游戏数量激增,低质量作品泛滥成灾

1 月 14 日,Twitch 游戏部门负责人 Bill Young 在领英上分析了 Steam 平台 2024 年的游戏销量数据。数据显示,2024 年 Steam 共上架 18995 款新游戏,比 2023 年增长了 33%。然而,令人担忧的是,其中 79% 的游戏被归类为「受限制的游戏」,即销量低下、内容空洞且缺乏社区功能的低质量作品。

自 2018 年以来,低质量游戏的比例逐年攀升:从 2018 年的 33% 到 2023 年的 73%,再到 2024 年的 79%。Bill Young 指出,虽然 Steam 平台上游戏数量不断增加,但许多开发者只是为了快速获利,导致市场上游戏过剩,优秀作品愈发难产。(来源:DoNews)

大疆 DJI Flip 可折叠航拍无人机发布,支持 AI 智能跟拍

1 月 14 日,大疆现已发布 DJI Flip 可折叠航拍无人机,其搭载 1/1.3 英寸影像传感器,支持拍摄 4K / 60fps HDR 视频,续航 31 分钟,主打「可折叠全包保护罩设计、轻于 249 克」。

该无人机适用于 Vlog 场景,主打 AI 智能跟拍技术,号称「无需遥控器也能掌上起飞」,定价为 2788 元起,带屏遥控器版:3988 元,畅飞套装(带屏遥控器):4988 元

大疆表示,DJI Flip 是大疆首款自带可折叠全包围桨叶保护罩的航拍无人机,保护罩采用碳纤维支撑结构,号称在同等刚度下重量仅为传统工程塑胶材质(PC)的 1/60,整体重量「轻于 249 克」,在大部分国家 / 地区无需参与培训或考试即可起飞。(来源:IT之家)

 

古尔曼:苹果计划年底推出 2025 款 HomePod mini 和 Apple TV

1 月 13 日,据彭博社记者马克·古尔曼在其最新一期的《Power On》通讯中透露,苹果计划在「今年年底」发布新款 HomePod mini 和 Apple TV。这一时间点意味着新设备可能会在 9 月至 11 月之间亮相,而非此前猜测的 3 月至 4 月或 2025 年 6 月的全球开发者大会(WWDC)。

新款 HomePod mini 和 Apple TV 将成为苹果智能家居路线图的重要组成部分。据悉,苹果还计划在今年推出一款全新的家庭中枢设备,并最早在明年发布支持 Face ID 的门铃 / 门锁和安全摄像头,进一步丰富其智能家居生态系统。

据古尔曼此前报道,这两款设备将搭载苹果自研的 Wi-Fi 和蓝牙组合芯片,支持 Wi-Fi 6E 技术。与 Wi-Fi 6 相比,Wi-Fi 6E 将频段扩展至 6 GHz,配合兼容的路由器,能够提供更快的网络速度和更低的延迟。(来源:凤凰科技)

苹果 iPhone USB-C 控制器被攻破,有望用于永久越狱

1 月 14 日,据科技博客 SiliconAngle 最新博文称,苹果公司专有的 USB-C 控制器存在安全漏洞,有望助推新的 iPhone 越狱方式出现,并可能引发其它安全问题。

在 2024 年 12 月召开的第 38 届混沌通信大会(Chaos Communication Congress)上,安全研究员 Thomas Roth 展示了攻击 ACE3 USB-C 控制器的过程,相关信息于今年 1 月公开。

Roth 成功逆向工程了该控制器,暴露了其固件和通信协议,然后通过重新编程控制器,可以注入恶意代码并绕过安全检查。

对于绝大多数用户来说,这种攻击方式的风险较低,因为实施该攻击,需要定制的 USB-C 线缆和设备,并且需要物理接触目标设备。

该漏洞更有可能被用于 iPhone 越狱,实现持久固件植入,并维持越狱状态。苹果公司目前尚未对此研究结果及其潜在影响发表评论。(来源:IT之家)

浏览量: 32

3 天,5 万台!特斯拉新 Model Y 又卖爆了!

近日,汽车博主@长三角行健者透露,特斯拉新款Model Y在1月10日上市当天就迎来了高达5万台的订单量,此情况与汽车博主胖虎Shawn发布的信息一致,他表示某些特斯拉门店单日订单量甚至超过了100台。据了解,尽管消费者现在支付了意向金,但由于需求过于旺盛,预计要等到四至五月才能提车。

此前的1月10日,特斯拉焕新 Model Y 突然上市,后轮驱动(标准版)和全轮驱动(长续航)的预售价分别为 26.35 万元、30.35 万元起,较现款分别上涨了 1.36 万元和 1.26 万元,上线后即同步开启预售。这引起了小米、极氪、鸿蒙智行等厂商的积极回应。

尽管网络上有不少声音对新Model Y持保留态度,但其预售销量的火爆程度却令业内外人士吃惊,充分证明了特斯拉在市场中的影响力。

面对国内车企的轮番围剿,Model Y为何依然能实现爆单?

Model Y 爆单了

虽然业内传言特斯拉新款Model Y在1月10日上市当天取得了超过5万台的订单量,但值得注意的是,特斯拉官方至今并未正式公布相关订单数据。关于这一数字的来源,实际上是博主根据订单号进行推算所得。因此,尽管这一数据令人振奋,但仍需谨慎看待。

特斯拉5万订单的由来 | 图片来源:截图

一位名为「Tesla Α & Ω」的网友分享了一些关于特斯拉新款Model Y订单号的观察。他表示,1月10日早上,新款Model Y的订单号从81024xxxx开始,截至目前已经达到了81028xxxx,据此该网友推测一天销量订单超过5万辆。这一趋势表明Model Y的订单量正在迅速攀升,可能很快就会打破此前的销量记录。

在线下门店,特斯拉新款Model Y的订单表现令人瞩目,反映出其强大的市场吸引力。根据一位特斯拉销售人员的透露,1月10日当天,新款Model Y的订单量出现了“爆发式增长”。尽管老款Model Y提供了价格优惠,吸引了一部分消费者,但更多的消费者仍然选择了新款Model Y。这一现象不仅体现了特斯拉品牌的强大号召力,也证明了新款Model Y在市场中具有巨大的潜力和竞争力。

根据订单数据推算,新款Model Y在中国市场的表现可谓十分抢眼,甚至有可能相当于Model Y在中国市场一个月的销量。2024年,特斯拉在中国市场共完成了65.7万辆的交付,同比增长了8.8%。其中,Model Y依然是2024年中国市场上最畅销的单一车型,无论是按照动力形式还是价格区间进行划分,Model Y都以48万辆的交付量位居榜首。

这样的订单成绩仅次于小米SU7。2024年3月29日,小米汽车通过官方微博宣布,小米SU7在上市24小时内便获得了高达8.9万台的大定。最终,2024年,小米汽车的全年总交付量达到了13.5万辆,顺利完成了13万辆的年度目标,使得小米SU7成为2024年最成功的车型之一。

模仿特斯拉,无法打败Model Y

此次焕新款Model Y尽管在外观、座舱、续航、安全和智能等多个方面进行了升级,但整体来看,这一变化可视为一次小改款,改动幅度并不算巨大。

焕新 Model Y 的驾驶舱渲染图 | 图片来源:特斯拉中国官网

作为20-30万元新能源市场的标杆车型,特斯拉Model Y吸引了大量竞争对手的「围攻」。2023 年发布的小鹏 G6 ,从产品力本身来说,无论是空间、能耗管理还是智能驾驶的体验,二者也都做到了媲美 Model Y 的程度。前者还搭载了 800V 超快充架构,在补能速度上率先做到了同级领先。

随后,2024年9月到10月之间,包括乐道、极氪、智界、智己、阿维塔、岚图在内的六家车企陆续发布了新产品,这些车型几乎都将Model Y作为竞争对标对象。这一现象被外界戏称为“六大门派围剿特斯拉Model Y”

从实际销量来看,这些新兴品牌的车型订单量有所提升,且产品力逐步增强,但它们仍未能真正动摇Model Y在纯电SUV领域的领先地位。

深究来看,特斯拉能够在竞争激烈的市场中继续维持领先地位,背后有着深刻的品牌优势和技术积累。首先,特斯拉作为新能源汽车领域的先行者,早在2003年便开始了研发工作,经过多年的积累与发展,已经成为该领域第一个进入消费者心智的品牌。

从Model S、Model X到Model 3和Model Y,特斯拉的每一款产品都为消费者带来了创新性的技术和卓越的性能。更重要的是,特斯拉不仅仅是一个汽车品牌,更是科技、未来和绿色能源的代名词。这对于开始切换到新能源的主流用户来说,影响巨大。

同时,马斯克个人的影响力无疑加速了这一品牌形象的塑造。他通过旗下的SpaceX、X.AI等公司,塑造了一个极具未来感且勇于突破的形象,这些光环效应也无形中增强了特斯拉的品牌吸引力。

Model Y依然是2024年中国最畅销的单一车型 | 图片来源:视觉中国

其次,特斯拉的成功离不开其在智能汽车时代的技术突破,尤其是在两大核心要素上的领先:

  • AI计算芯片:特斯拉通过自主研发的AI芯片,打造了强大的计算能力。这些芯片为其FSD(全自动驾驶)系统提供了支持,极大地提升了自动驾驶的智能化水平,成为智能驾驶领域的先行者。
  • 驾驶数据闭环:特斯拉的自动驾驶系统通过收集全球数百万辆车的实时驾驶数据,形成了一个全球性的数据闭环。通过这一闭环,特斯拉的AI系统不断优化,提升了驾驶安全性和智能化水平,使得特斯拉在自动驾驶技术的领先地位愈发稳固。

除此之外,特斯拉还通过垂直整合,成长为一个超级大型的科技汽车公司,具备了完整的汽车产业链和足够的市场规模,拥有自己的汽车生产基地和庞大的科技垂直整合能力,从芯片制造、大数据应用到Autopilot软件,甚至云端计算芯片。

在与特斯拉竞争的过程中,企业应注重从自身的基本面出发,探索适合自身发展的路径,而非仅仅模仿特斯拉的做法。成功的关键在于深刻理解中国消费者的独特需求,制定灵活开放的技术路线。今年年中,小米第二款纯电动车YU7即将上市,届时它将成为特斯拉Model Y强大的竞争对手。

浏览量: 60

文章分页

上一页 1 … 48 49 50 … 85 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间