Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

标签: 科技

超音速民航「全球竞赛」,这家中国公司要「换道赛车」

2024 年 3 月,一架名为 XB-1 的小型超音速验证机在美国加州莫哈维航天港成功试飞。这是自 2003 年协和超音速客机最后一次飞行后,人类再次向民航超音速客机发起挑战。

XB-1 背后的公司叫做 Boom Supersonic,由著名的 Y Combinator 孵化,OpenAI 创始人 Sam Altman 是他们的早期投资人。此外,Sam 近些年的「死对头」马斯克也经常在社交平台表达对这家公司的关注。作为 SpaceX 和特斯拉的创始人,马斯克坚定地认为人类可以靠科技改变出行的方式以及效率。

其实,除 Boom Supersonic 外,近年来商业航天领域里还有很多玩家都瞄准了超音速客机这个领域。美国的另一家初创企业 Hermeus,希望把飞行速度提高至 5 倍音速;在欧洲,瑞士初创公司 Destinus 提出以氢能源作为高超音速客机的动力,立志将绿色能源与航空技术相结合。

自然也包括中国。近日,一家名为「凌空天行」的商业航天公司开始从幕后走向台前。这家成立于 2018 年的公司,希望在未来推出一款巡航速度 4 倍于音速的高超音速客机——比曾经的协和号还要快 2 倍,从北京到纽约只需 3 小时。

那么,现在全球的超音速客机竞争到底发展到了什么阶段?凌空天行又将以怎样的技术底气和研发思路参与这场竞争呢?近日,笔者有幸和凌空天行总设计师团队进行了线下交流,本文即是交流后得到的一些信息和思考。

 

探索从未停止探索的超音速客机

说到民用超音速飞行,就一定绕不开协和号客机。这个由英法联合研发的项目,于 1976 年正式投入商业运营。它代表着那个时代人类最前沿的航空技术,也是迄今为止唯一实现长时间大规模商业使用的超音速客机项目。

协和客机可以以超过 2 倍音速(折合约为 2140km/h)的速度巡航,是普通民航客机的 2.5 倍以上。从伦敦到纽约,协和号最快的一次飞行只用了 2 小时 52 分 59 秒,而两地之间本身有 5 小时时差。英航当年为这趟航线打出了一句霸气的广告语:「还没起飞就已到达」(Arrive Before You Leave)。

协和号的票价高昂,比普通亚音速民航客机的头等舱全价票还要高 2-3 倍。但因为它打破了时间的概念,提供了一种前所未有的高效出行方式,因此在运行初期,它还是受到了欧美商务旅客的大量欢迎。

1976 年 1 月,首架协和客机起飞 | 来源:视觉中国

然而尽管如此,协和客机本身作为一个商业项目仍然很难盈利。

最大的两个问题在于音爆和油耗。

音爆限制了协和客机的航线——无法在陆地上空飞行,只能执飞跨洲际的航线。又因为航程问题,协和号无法直飞跨太平洋航线(如日本东京到洛杉矶),因为留给航空公司的选择几乎就只有从欧洲到美国东岸的大西洋航线。所以,早期来自日本甚至中国的意向订单全部流失。

油耗又进一步推高了航空公司的运行成本——协和号的油耗是普通民航客机的 4 倍,而载客量却只有大型亚音速飞机的 1/3 左右。这就要求它在保证高票价的同时,还要时刻担心油价变化造成的冲击。

2000 年,法航 4590 号协和客机在起飞阶段着火坠毁,机上 109 人全部死亡。叠加第二年的 911 事件,让世界民航业陷入恐慌情绪。随后的伊拉克战争推高了油价,成为压垮协和号的最后一根稻草,航司无力维系协和号的运营,更无意扩大协和号机队。协和号最终于 2003 年退出历史舞台。

尽管如此,人类并没有放弃对民用超音速飞行领域的探索。这其中又分成了两条不同的技术线:

美国的 Boom Supersonic 被认为是目前最接近实现超音速客机飞行的公司之一,由 Y Combinator 孵化,曾经拿到过 Sam Altman 、8VC、沙特 NEOM 等著名投资机构和个人的投资。其正在研发的超音速客机 Overture 基本延续了协和客机的空气动力学设计思路,通过使用复合材料,改进发动机等方式减轻重量、控制油耗、增大航程。

该公司称,Overture 的巡航速度可达 1.7 倍音速,并将适配超过 600 条航线,计划于 2026 年试飞,2030 年进行商业飞行。

Overture 设计概念图:采用三角翼设计+四发动机布局,像协和号和波音 747 的结合 | 来源:Boom Supersonic

来自美国的另一家明星公司 Hermeus 则代表了另一条完全不同的科技树。它旗下的飞行器目标巡航速度达到了马赫 5(即 5 倍音速),是协和客机的 2.5 倍——按这个设计速度,从纽约到伦敦只需要一个半小时。同时,为了降低启动阻力和摩擦热,这类飞机的飞行高度要比普通亚音速民航客机高一倍,可以达到 25000 米以上,其整体的气动布局、表面材料、发动机类型都和曾经协和号有较大不同。

说白了,虽然都是超音速,那上述的这种高超音速路线,对应的完全就是一种崭新的「下一代飞机」。

 

中国公司和「换道赛车」

由于「下一代飞机」的飞行速度、高度都和现有的亚音速民航客机有较大不同,所以新一代产品无论在发动机工作逻辑、飞机整体气动布局、机身材料,甚至可能包括起降的方式和基础设施,都和过去有极大不同。

这就像新能源车和传统燃油车,尽管一新一旧,但两者之间并不是一个简单由后往前的升级关系,而是一套「换道赛车」的全新叙事逻辑。所以,在这条全新的路线上,大家相对可以在同一条起跑线上开始竞争。

自然,除了前文介绍的欧美公司外,也少不了来自中国的力量。成立于 2018 年的中国商业航天企业「凌空天行」是我国在这条技术路线上的先行和探索者。

凌空天行专注于临近空间(一般指离地高度 20000 米以上)高速飞行技术的商业化开发和服务,是我国在这一领域的唯一企业。据了解,该公司研发主力团队大多具有「国家队」背景,研发实力雄厚。

2024 年,凌空天行旗下的「云行」系列超音速验证机和「筋斗云」高速冲压发动机双双试飞成功。本周一,他们在成都发布了新一代验证机「窜天石猴」。

关于产品本身,笔者先简单给各位画个重点:

 

凌空天行新一代超音速飞机验证机「窜天石猴」 | 来源:凌空天行

第一,基本数据层面:下一代超音速验证机「窜天石猴」长 7m,总重量为 1.5t,航程 3000km,巡航速度 4 马赫,无人,预计 2026 年首飞。

第二,动力层面:下一代超音速验证机「窜天石猴」将搭载两个「冲压发动机」——这和普通民航客机采用的涡轮发动机有着显著不同。优势是结构简单,在高超音速的工况里性能卓越,但它无法从零速状态下静止启动。

因此,这将直接影响产品的起降方式。目前,验证机没有采取传统飞机的滑跑起飞方式,而是通过火箭发射,将验证机送到相应高度并提供初速度,再启动冲压发动机。

不过,这并不代表最终的载人版客机将采用上述这套起降方案。据了解,目前为客机准备了两套方案,分别对应机场跑道和发射场两个不同的场景。「大概率还是用跑道,只是起飞方式会有些区别。」

第三,气动布局层面:过去的超音速飞机通常采用飞机和发动机一体化的设计,以获得更好的空气动力学造型。而凌空天行却采用了「飞发分离」的模块化设计,在测试和验证阶段可以提高效率,在后续产品化的过程里,也可以提供更多商业落地的可能场景。

高速冲压发动机 JINDOU400 | 来源:凌空天行

第四,未来目标:从现阶段的 7m 无人超音速验证机,「最终形态」大致是一款长度在 30 米量级,可以搭载 50-80 人的超音速客机,以 4 马赫速度巡航,预计从北京到纽约只需 3 小时抵达。在凌空天行的时间线上,他们希望在 2031 年前后可以实现客机原型机的首飞。

简单总结一下就是:凌空天行真的用了一套完全不同于以往的思路,设计出了一个「新玩意」,并且进入了快速验证和测试阶段。

 

「快速求证,大步快跑」

看到这里,你可能会问了:听起来这是一个「无人区」项目,所需要的技术以及资源投入都非常大。那作为一家成立 6 年多的公司,凌空天行的底气来源于哪里呢?

前文提到,凌空天行核心研发成员多有「国家队」背景,拥有不止于飞机和发动机研发本身的技术积累。据了解,从成立至今,凌空天行一共完成了 90 次发射任务,这在中国所有商业航天公司里是首屈一指的。

更重要的是,和上世纪全球各国那场轰轰烈烈的航天竞争不同,超音速民航客机的竞争,并不是无限资源投入的宏大叙事,而是一场和技术有关的现代商业竞赛。在技术之外,如何制定更合理的计划也是关键。换句话说,「造飞机」这个过程本身,也是一种创新。

「筋斗云」高速冲压发动机试飞发射现场 | 来源:凌空天行

从一个商业组织的角度去观察凌空天行,我们又发现了几点有趣之处:

第一,团队善于拆解关键问题,一步一步快速求证。例如,团队现阶段核心的问题就是要验证高速冲压发动机的一系列数据,因为在他们看来,低速发动机是「成熟的产品」。所以他们选择要火箭发射的方式,跳过低速部分,用解耦的方式达到快速验证高速冲压发动机的效果。

第二,和传统航天企业相比,在控制成本上有一套自己的方法论。去年 12 月完成试飞的 JINDOU-400 冲压发动机,外壳采用的是普通的市售钢管。邓帆在沟通时表示:商业机构选择材料的核心逻辑是「刚刚好的才是最好的」,而不是一味堆砌最好的材料。所以在制造、生产等工艺流程中,要通过设计流程本身,打造一套全新「低成本、高技术」方案。

第三,把每一步都当成产品而非试验品去做。如果只盯着超音速客机那个「最终形态」,那么现阶段的无人验证机就只是一个试验品。但实际上这个已被验证的临近空间高速飞行器,还可以在其他场景里作为产品。据了解,凌空天行不同阶段的技术成果,也都收到了相应的产品需求。

第四,在技术和产品上保持着一种共创心态。以大疆无人机为例,刚开始的产品对应的航拍场景,但后来却在农业喷洒、消防等其他场景衍生出了基于无人机技术不同的应用场景。凌空天行希望以这种开源的心态,为技术寻找到更多可能的 PMF(Product Market Fit)。

「窜天石猴」亮相欧洲航展 | 来源:凌空天行

当然,回到高超音速客机这个产品形态,现阶段还面临诸多技术、资源以外的问题。按照目前的法律规定,离地 20000 米以上的属于国际空域,和民航飞行有关的管制条例暂时空白;同时,由于高超音速飞机属于一个全新形态,民航客机商业运行前需要进行的适航审核相关条文同样处于空白。

所以,肉眼可见的是通往未来的道路仍是遥远且崎岖的。邓帆在沟通中表示,目前能给出的时间线是,2031 年争取实现客机原型机的试飞,但何时可以落地商业飞行,还尚未可知。不过,和传统科研过程的「大胆假设、小心求证、小步快跑」,他相信凌空天行作为一家商业航天企业,已经找到了一条自己的创新道路,那就是:

「大胆假设、快速求证、大步快跑」。

浏览量: 25

针对 DeepSeek 网络攻击暴增上百倍;苹果在华销售额下降 11%;《鱿鱼游戏》第三季公布 | 极客早知道

苹果在华销售额下滑 11%

当地时间周四,Apple 公布第四季度财报。四季度整体营收 1243 亿美元,略高于分析师预期的 1241 亿美元;但 iPhone 收入 691.4 亿美元,低于预期的 710 亿美元。同时,第四季度大中华区净销售额为 185.1 亿美元,也低于市场预期的 213.3 亿美元。

在其他方面,iPad 产品线净销售额 80.9 亿美元,市场预期 73.2 亿美元;Mac 产品线净销售额 89.9 亿美元,市场预期 79.6 亿美元;可穿戴设备、家居与配件产品线净销售额 117.5 亿美元,市场预期 120.1 亿美元。

虽然苹果的整体销量在本季度有所上升,但该公司备受关注的 iPhone 销量实际上同比略有下降。12 月这个季度是 iPhone 16 销售的第一个完整季度,苹果在这个季度发布了针对 iPhone 16 的 AI 套件。

苹果 iPhone 的销量低于 LSEG 的预期,这是该公司自 2023 财年第一季度财报发布以来两年来最大的一次。

该公司在大中华区的表现明显疲弱。当季中国市场总销售额下降 11.1%,至 185.1 亿美元。这是自去年同期中国销量下降 12.9% 以来的最大降幅。(来源:新浪财经)

Anthropic CEO:不认为 DeepSeek 是对手,但出口管制至关重要

据 CNBC 报道,Anthropic 首席执行官达里奥·阿莫迪 (Dario Amodei) 周三在一篇博客文章中表示,他并不将中国的 DeepSeek「视为对手」,但他认为,在人工智能方面,出口管制比以往任何时候都更加重要。

周一,美国议员 呼吁采取行动,遏制 这家中国科技初创企业的发展,一些人称 DeepSeek 是「严重威胁」。美国商务部长提名人 Howard Lutnick 在周三的听证会上暗示 DeepSeek 窃取了美国的技术。新任白宫人工智能和加密专家 David Sacks 在 X 上发帖称,DeepSeek R1 表明「特朗普总统撤销」拜登总统的行政命令是正确的。

Amodei 写道,DeepSeek 的崛起使得对华芯片出口的控制比一周前更加重要。尽管拜登政府出台了一系列控制措施,限制向中国出售某些可以增强军事能力的先进芯片,但该模型还是被创建出来了。

「需要明确的是,这不是避开美国和中国之间竞争的方法,」阿莫迪写道。「归根结底,如果我们想获胜,美国的人工智能公司必须拥有比中国更好的模型,但我们不应该在没有必要的情况下将技术优势拱手让给中国。」(来源:鞭牛士)

 

OpenAI 希望再筹 400 亿美元,继续叠算力

据证实,日本软银集团正在洽谈向 OpenAI 投资高达 250 亿美元,这将使其取代微软成为 OpenAI 的最大投资者。

本月早些时候,软银、OpenAI 和甲骨文合作成立了一家人工智能公司「星际之门」。据 OpenAI 和甲骨文高管称,星际之门正在美国得克萨斯州建设数据中心,初期计划投入 1000 亿美元,最终累计投资将达到 5000 亿美元。

软银的新投资预计将补上微软放慢的资本支出缺口,以继续支持 OpenAI 的人工智能军备竞赛,用资本和更多的计算能力来维持后者在行业中的领先地位。

目前,私人投资者预估 OpenAI 的市值在 1570 亿美元左右。该公司同时也在向营利性组织转变,从而表现出高增长初创公司的特征。

值得注意的是,本周初,中国一家初创公司 DeepSeek 推出了成本远低于、但性能堪比甚至超过 ChatGPT 的人工智能模型,引发全行业地震。OpenAI 强调以高算力打造最尖端模型的说法也被广泛质疑。

但 OpenAI 首席执行官奥尔特曼却对 DeepSeek 发布的模型十分欣赏,称其令人印象深刻。不过他强调,OpenAI 会提供更好的模型,拥有新的竞争对手令其十分振奋。(来源:财联社)

 

英特尔 2024 年营收同比下降 2%,预计 2025 年底前交付超 1 亿台 AI PC

近日,英特尔发布 2024 年 Q4 及全年财报。其中 2024 年 Q4 营收 143 亿美元,同比下降 7%;第四季度毛利率为 39.2%,净亏损 1 亿美元,同比转亏。

英特尔 2024 年全年营收 531 亿美元,同比下降 2%;全年毛利率为 32.7%,较上年同期 40% 下降 7.3 个百分点,净亏损 188 亿美元。其中,英特尔 2024 年产品总收入为 489 亿美元,代工收入为 175 亿美元,其他收入为 38 亿美元。

英特尔官方预测,公司有望在 2025 年底前交付超过 1 亿台 AI PC。预计 2025 年第一季度营收将在 117 亿到 127 亿美元之间,市场预期为 128.7 亿美元。(来源:IT 之家)

奇安信:针对 DeepSeek 网络攻击暴增上百倍

1 月 30 日凌晨,奇安信 XLab 实验室监测发现,针对 DeepSeek(深度求索)线上服务的攻击烈度突然升级,其攻击指令较 1 月 28 日暴增上百倍。

XLab 实验室观察到至少有 2 个僵尸网络参与攻击,共发起了两波次攻击。据悉,此次攻击共涉及 16 个 C2 服务器的 118 个 C2 端口,分为 2 个波次,分别为凌晨 1 点和凌晨 2 点。

XLab 实验室通过对 DeepSeek 持续近 1 个月的监测发现:攻击模式从最初的易被清洗的放大攻击,升级至 1 月 28 日的 HTTP 代理攻击(应用层攻击,防御难度提升),现阶段已演变为以僵尸网络为主。攻击者使用多种攻击技术和手段,持续攻击 DeepSeek。

「僵尸网络的加入,标志着职业打手已经开始下场,这说明 DeepSeek 面对的攻击方式一直在持续进化和复杂化,防御难度不断增加,网络安全形势愈发复杂严峻。」XLab 表示。(来源:快科技)

 

微信公众号上线辟谣功能

1月30日,微信公众号新增了一项“辟谣”功能,申请通过在微信公众平台发表辟谣文章,类似于之前加入微信公众平台辟谣中心的第三方机构。

这项功能目前仅对医疗类、政府类、学校类、专业类相关机构及已认证个人类科普账号开放申请。目前,已经有超过 900 所机构进行了认证,大都是早先已经加入微信公众平台辟谣中心的机构。(来源:IT之家)

 

马斯克:「公交车道」是FSD 入华的最大挑战之一

近日,特斯拉 CEO 马斯克在财报电话会议上表示,特斯拉将于 6 月在美国得克萨斯州奥斯汀推出「无人监督、无人驾驶」的 Robotaxi 出租车服务。

不过,尽管马斯克此前声称用户可以将自己的车辆添加到特斯拉车队中(将自己的车辆用于接客赚取外快),不过即将上线的「无人监督、无人驾驶」出租车服务仍为特斯拉自家车队。

与此同时,马斯克也谈到了 FSD 入华在技术上最大的难点。马斯克表示:

「中国是个庞大的市场,我们确实面临着一些挑战,因为中国不允许我们将训练数据转移到境外,美国政府也不会让我们在中国进行训练。

因此,我们找到互联网上的中国道路视频进行训练,然后放进模拟器中。就像是中国的公交车道是 FSD 在中国落地的最大挑战之一,他们公交车道非常复杂。一天中有些时间可以通行,另一些时间不允许。如果不小心在错误时间进入公交车道,你就会立即收到罚单。」(来源:IT 之家)

 

丰田 2024 年销量减少 3.7%,仍是连续 5 年全球第一

丰田汽车公司 1 月 30 日公布的 2024 年集团全球销量较上年减少 3.7%,为 1082.148 万辆,但仍远高于竞争全球第一的德国巨头大众(VW)约 903 万辆,连续 5 年位居榜首。

受认证违规导致部分工厂停产以及在中国竞争激化的影响,销量低于上年。集团业绩包含大发工业和日野汽车。全球产量为 1061.5 万辆,减少 7.8%。

在这之前,丰田还确定了 2025 年全球产量(包括雷克萨斯品牌)定为近 1000 万辆的计划。整体计划中,日本国内为 340 万辆,海外为近 660 万辆。丰田已在 1 月 23 日前将生产计划通知给主要零部件企业。

在中国市场,由于激烈的竞争,丰田被中国品牌压制。去年 1—11 月其在华产量降至 158 万辆,同比下降 15%,同期销量也下滑了 8%。(来源:快科技)

苹果 AI 预计今年 4 月亮相中国市场

库克表示,Apple Intelligence 将于 4 月登陆中国等更多市场,预计与 iOS 18.4 同步推出,而且 Siri 会进一步增强互动体验,以使用 iPhone 中的上下文内容来完成请求。

库克认为,iPhone 16 系列销量超出预期,主要归功于 Apple Intelligence。(来源:苹果汇)

 

微软宣布为 Win11 用户优化 DeepSeek-R1 模型,实现本地化推理

1月30日,微软发文,宣布推出针对 NPU 优化的 DeepSeek-R1,首批将面向搭载高通骁龙 X 芯片的 Copilot+ PC 推出,随后是英特尔酷睿 Ultra 200V 等平台。

微软表示,首个版本 DeepSeek-R1-Distill-Qwen-1.5B 将在 AI Toolkit 中提供,7B 和 14B 版本也将很快推出,从而帮助开发者充分利用 Copilot+ PC 中强大的 NPU 配置。微软表示,Copilot+ PC 上的 NPU 开启了一种新的范式。在这种范式下,生成式 AI 不仅可以在被调用时执行,还可以支持半连续运行的服务。这使开发者能够利用 AI 推理引擎来构建主动和持续的体验。

「通过我们在 Phi Silica 上的工作,我们实现了高效的推理 —— 在首次生成 token 的时间和吞吐率方面表现出色,同时对电池续航和 PC 资源消耗的影响降至最低。」(来源:IT之家)

《鱿鱼游戏》第三季定档 6 月 27 日,迎来最终章

Netflix 宣布,《鱿鱼游戏》第三季将于 6 月 27 日正式上线,并且这将是该剧的最终一季。相比第一季与第二季之间长达三年的等待,第三季的到来将更快。自 2021 年首播以来,《鱿鱼游戏》迅速成为 Netflix 平台上最受欢迎的剧集之一。

第三季距离上一季仅隔约六个月,第二季于去年 12 月 26 日首播。尽管具体剧情尚未公布,Netflix 已通过新发布的图片展示了上一季中幸存的角色。随着剧集即将落幕,Netflix 计划通过推出真人秀、多人游戏以及由 David Fincher 执导的衍生剧,继续维持《鱿鱼游戏》的热度。(来源:DoNews)

 

浏览量: 29

我合理怀疑,春晚节目组混进了 B 站的人

作者 | Moonshot
编辑 | 郑玄

「春晚」已经 42 岁了,随着百姓们消费内容的形式和质量日益增长,它从每年的期待,沦为了年夜饭的背景板。
尤其是对年轻人来说,吐槽春晚可比欣赏春晚有意思多了。
于是,今年春晚也算顺势而为,摘下了过去「正式」的帽子,选择和弹幕视频平台 bilibili(简称「B 站」)搞了一次大联动。B 站成为 2025 年总台春晚的独家弹幕视频平台,口号就定位「和 3 亿年轻人一起看春晚」。
1 月 9 日,B 站频道 @ 春晚 成立,截止到春晚播放前,首个官宣视频就收获了 1600 多万播放量。1 月 22 日,B 站还正式上线过往 42 届的春晚「全集」,所有 2010 年之前的春晚还用上了 AI 智能修复画质,让年轻观众和长辈一起感受「回忆杀」。

但这些「预告」,都比不上我对边发弹幕边看春晚的期待。然而我在 B 站看完了整场春晚后,是又失望又惊喜,完美诠释儿时口号:严肃活泼。

01

B 站看春晚:严肃活泼
前几年的春晚,网友们眼盯电视,手拿手机,在节目播出后马上刷微博看看最新吐槽。
但直播加弹幕,互动更即时,还能给人「一起看」的共享感,这不正是春晚想要的合家欢嘛!
所以哪怕此前抖音、快手、微信、腾讯、优酷都有过春晚的转播权,但没有一家视频平台有着 B 站的独特的社区氛围和弹幕文化。
B 站也为春晚直播定制了全新的互动方式,比如实时答题分红包,以及春节弹幕模版。
而这些题也够逗的,诸如「宫廷玉液酒多少钱一杯?」「1996 年的宫廷玉液酒和 2009 年的苏格兰打卤面,哪个更贵?」「如果你在沈阳逛菜市场,最容易碰到哪个明星?」,甚至成立了许多 B 站答题学习小组。

但备受期待的春晚直播弹幕环节,实际效果相当一般。

春晚直播时,屏幕上方飘过的实时弹幕只会显示春晚模版弹幕,手打的都难登春晚公屏,只能在直播的交流区上显示,诸如「谁谁谁看得到吗?」「王菲怎么还没出来呀?」「这小品还可以哈」都不会成为弹幕,只会沦为直播评论。
而带有诸如「难看」、「没意思」、「不好笑」等关键词的评论,可以发布,只是既不会显示在公屏上,也不在弹幕列表里,属于自嗨型评论。
评论也不算实时,发送后都会有几秒的延迟,才会显示在评论区。
其次,国际版 B 站完全拿掉了弹幕和答题的互动功能,只保留了刷礼物功能。

国际版哔哩哔哩|图源:哔哩哔哩

 

而在直播结束后的单一节目回放里,弹幕就回归了正常显示,只是诸如「不好笑」等关键词还是会被自动过滤,发送后自动成为「自嗨型弹幕」。

图源:哔哩哔哩

所以 B 站这次在春晚的直播里,更多是走个形式,讨个彩头,并没有充分发挥他们弹幕文化。
在 B 站看春晚,观众可以收获 4K 分辨率和不低的画面码率,观感良好同时,调侃和吐槽还是要回归到公域的微博或私域的微信群。
这次 B 站和春晚的合作,重点还是在呈现围绕春晚展开的各类内容,而非在直播形式上做创新和突破,毕竟春晚是全国每年最重要的一次晚会。
有 2022 年,@ 央视频在 B 站直播春晚时,被弹幕骂到关闭直播间的窘境在前,B 站官方很难不选择「控评」,来避免舆情。

2022 年 @ 央视频的春晚直播|图源:哔哩哔哩

所以想象中的实时吐槽、真实点评、该夸夸该骂骂的弹幕文化,并没有在 B 站的春晚直播里体现出来。
所以今年的「春晚+B 站」,意外地产生了严肃活泼,对撞又拧巴的感觉。
但这届春晚办的其实还可以,甚至有了些 B 站跨年晚会的感觉。难道这就是春晚和 B 站合作的原因?

02

B 站和春晚的双向奔赴
春晚找上 B 站,着实属于双向奔赴了。春晚这几年可「蹭」了 B 站不少热度。
过去电视时代的经典春晚小品,在网络视频时代重新被翻出来,在 UP 主剪刀手下完成了二次创作,养活了 Up 主,延续了生命力,让「经典咏流传」,再结合花式弹幕,甚至达到了三次创作的效果。
走技术流的 UP 主,用 AI 修复了众多经典小品,让各位老艺术家们,没想到以这种方式在年轻人群体里「翻红」了。
所以只要春晚内容够硬,以二创和「创梗」而闻名的 B 站,就能让春晚不止于一年一响。

这恐怖的播放量|图源:哔哩哔哩

在鬼畜和搞笑之外,B 站还涌现了许多回顾历届春晚的长视频,节目制作精良,佐以对背景时代的解说,也都收获了百万级播放量,顺便给 90 后 00 后科普了一波改革开放后的「内娱」简史。
老春晚在 B 站靠这些新生代的创作者们「翻红」。而新春晚,也正需要迎合这些新生代的观众。

《难忘今朝》已经成了一档自制栏目|图源:@ 培根悖论唠唠嗑

根据春晚的统计数据,2024 年春晚的 15-44 岁观众群体的比例达到 51.59%。拥抱年轻化,了解年轻人在看什么,现在什么综艺正在火,一起杂烩汇集到春晚,这是春晚这几年的变化。
春晚主持团队,从父母辈的老熟人换到了更年轻的面孔,语言风格也更幽默和平易近人。当微博上出现热搜「小撒的眉毛是谁画」的之后,撒贝宁马上能在春晚直播里,主动拿这个梗做互动。去年尼格买提「搞砸」了刘谦的魔术,今年在魔术前先来个自嘲。
语言类节目引入了大量出自网络喜剧综艺节目的演员,今年一年一度喜剧大赛赛过了脱口秀,直接改了两个春晚小品,终于到了我给父母解释「这是谁,干什么的」的时候了。
在歌舞类节目里,也形成了「独唱留给老牌唱将,群唱让给明星流量」的安排,一晃眼我还以为点开了《声声不息:大湾区》
在经历了几年「无聊」「难看」「老艺术家走后青黄不接」「催婚煽情上价值」的网络群嘲后,春晚正在用它的方式辞旧迎新,主动拥抱年轻人。
这不巧了,B 站主打的正是年轻人聚集的创意社区与文化平台,据统计,B 站用户主要集中在 30 岁以下,用户平均年龄 24 岁,90 后和 00 后用户占比高达 78.67%。
近年来,B 站年轻用户的风向也愈发有正能量和「家国情怀」。不只是春晚,国学、名著、传统文化……年轻的创作者在用他们的方式在 B 站宣传着中国文化,这刚好贴合了春晚的调性和要求,以及大国自信的时代风潮。

「入站必看」里有大量类似内容|图源:哔哩哔哩

何况,B 站是真的会办晚会。
此前各大电视台的跨年夜,还是参考春晚节目的编排方式:小品唱歌送礼物,流量明星来跳舞。没有历史包袱的 B 站从 2019 年起,上来就办了一场豆瓣评分 9.0 的跨年晚会,我愿称之为「三化」思路:
年轻化,不玩老梗只玩热梗,同时加上怀旧,让 90 后感受一波「爷青回」。
亚文化,游戏、动漫、电影电视剧,只要年轻人爱看的都能「上桌」。
国际化,把 YouTube 名人到难请的日韩女团,「小众」乐队都请上台,也不用把日语歌改成中文,要得就是原汁原味。
这波办晚会的方式,精准对位年轻观众,从此 B 站跨年晚会,成为很多年轻人跨年夜的首选晚会,B 站也积累了丰富的转播和直播经验。

B 站是真知道年轻人爱看什么|图源:哔哩哔哩

 

所以这波合作还真是双向奔赴,不只是 B 站承接了春晚,而是春晚也在学习 B 站。
今年春晚的语言类节目,终于不在结尾煽情和歌颂了,也不对年轻人「催婚催育」了,我们总算摆脱了三句半、包饺子、一起过大年和网络热梗了。
取而代之的是,黄鹤楼下的 One Republic,8D 网红城市重庆的无人机表演,抽象但可乐的机器人扭秧歌,脱胎于喜剧大赛的两个小品,在武汉敲响的曾侯乙编钟,各路方言在语言类和歌唱类中的融合……
这些节目,年轻观众或许不一定都爱看,但能看到春晚的求新求变。
春晚总算辞旧迎新了,今年不骂,那明年能不能让直播弹幕解封?
浏览量: 22

美国对 DeepSeek 开展国家安全调查;传 DS 训练模型绕过英伟达 CUDA;春节档刷新初一票房纪录|极客早知道

OpenAI 表示,有证据显示 DeepSeek 使用了其模型辅助训练

1 月 29 日消息,OpenAI 表示,已经发现证据表明,中国人工智能初创公司 DeepSeek 使用美国公司的专有模型来培训自己的开源竞争对手。

OpenAI 告诉告诉《金融时报》,它看到了一些「蒸馏」的证据,它怀疑来自 DeepSeek。

开发人员使用该技术通过使用较大,功能较强的输出的输出来获得更好的较小模型性能,从而使他们能够以更低的成本在特定任务上获得相似的结果。蒸馏是行业中普遍的做法,但如果 DeepSeek 正在这样做以建立自己的模型,是违反 OpenAI 的服务条款的。其服务状态用户条款表示,不能「复制」其任何服务,也不能「使用输出来开发与 OpenAI 竞争的模型」。

OpenAI 拒绝进一步评论或提供证据的详细信息。(消息来源:Financial Times)

美国正对 DeepSeek 开展国家安全调查

1 月 29 日消息,据参考消息援引美媒报道,美国海军基于「潜在安全和道德问题」,已要求人员避免以任何形式使用中国公司的 DeepSeek 模型。

另据 @ 玉渊潭天 消息,当地时间 1 月 28 日,美国多名官员回应 DeepSeek 对美国的影响,表示 DeepSeek 是「偷窃」,正对其影响开展国家安全调查。

「有大量证据表明,DeepSeek 将 OpenAI 的知识,通过蒸馏提炼到 DeepSeek 中,我认为 OpenAI 对此并不高兴。」白宫人工智能和加密货币事务负责人受访时表示。

同时,美国新任白宫新闻秘书卡罗琳·莱维特(Karoline Leavitt)在首次简报会中也提及了中国人工智能初创公司深度求索(DeepSeek)。她表示,白宫正在努力确保美国人工智能的主导地位,美国国家安全委员会正在调查 DeepSeek 带来的影响是什么。

而就在此前一天,美国总统特朗普还认为 DeepSeek 崛起也可能传递了一种积极信号,并表示此事应当为美国企业敲响「警钟」,美国公司「需要专注于竞争以赢得胜利」。(消息来源:上游新闻)

 

「DeepSeek 甚至绕过了英伟达 CUDA」,论文细节再引热议

硬件媒体 Tom’s Hardware 带来开年最新热议:DeepSeek 甚至绕过了 CUDA,使用更底层的编程语言做优化。

DeepSeek-V3论文中的更多细节,被人挖掘出来。来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3 的硬件效率之所以能比 Meta 等高出 10 倍,可以总结为「他们从头开始重建了一切」。

在使用英伟达的 H800 GPU 训练 DeepSeek-V3 时,他们针对自己的需求把 132 个流式多处理器(SMs)中的20 个修改成负责服务器间的通信,而不是计算任务。变相绕过了硬件对通信速度的限制。

这种操作是用英伟达的 PTX(Parallel Thread Execution)语言实现的,而不是 CUDA。PTX 仍然是英伟达GPU架构中的技术,它是 CUDA 编程模型中的中间表示,用于连接 CUDA 高级语言代码和 GPU 底层硬件指令。

使用PTX编程非常复杂且难以维护,很难移植到不同型号的 GPU,但能带来极致的优化效果。从业者表示,针对 H100 优化的代码迁移到其他型号上可能效果打折扣,也可能根本不工作了。所以说,DeepSeek 做了 PTX 级别的优化不意味着完全脱离了 CUDA 生态,但确实代表他们有优化其他 GPU 的能力。

一位亚马逊工程师提出灵魂质问:CUDA 是否还是护城河?这种顶尖实验室可以有效利用任何 GPU。(消息来源:量子位)

特斯拉公布第四季度财报

1 月 30 日,特斯拉公布 2024 年第四季度财报,未达市场预期,营收同比仅增长 2%,至 257.1 亿美元,远低于分析师预期的 272.6 亿美元。汽车业务收入同比下降 8%,利润率进一步承压。特斯拉在加大折扣促销的同时,继续押注自动驾驶与能源业务,以寻找新的增长点。

特斯拉 2024 年总营收达 977 亿美元(当前约 7098.18 亿元人民币),全年共交付 1789226 辆汽车。

同时,财报显示,在第四季度,特斯拉单车销售成本达到了历史最低水平,低于 35000 美元(约合人民币 25.3 万元)。特斯拉解释道,这主要得益于原材料成本的改善,这帮助特斯拉部分抵消了提供有吸引力的金融和租赁方案所做的投入。

财报还提到,2024 年第四季度,特斯拉在车辆交付和能源存储设备装机量方面均创下了纪录。预计 Model Y 将在 2024 年再次成为包含所有车型在内的全球最畅销车型。

特斯拉此前还表示,正在为推出更加经济的新车型做准备,并给出时间展望——将在 2025 年上半年开始推出。(消息来源:FX168、快科技)

 

Meta 第四季度营收 483.85 亿美元同比增长 21%,净利润同比增长 49%

1 月 30 日早间消息,Facebook 母公司 Meta 今天发布了该公司截至 12 月 31 日的 2024 财年第四季度及全年未经审计财报。

报告显示,Meta 第四季度营收为 483.85 亿美元,与上年同期的 401.11 亿美元相比增长 21%,不计入汇率变动的影响同样为同比增长 21%;净利润为 208.38 亿美元,与上年同期的 140.17 亿美元相比增长 49%;每股摊薄收益为 8.02 美元,与上年同期的 5.33 美元相比增长 50%。

由此,Meta 2024 财年营收为 1645.01 亿美元,与 2023 财年的 1349.02 亿美元相比增长 22%,不计入汇率变动的影响为同比增长 23%;运营利润为 693.80 亿美元,与 2023 财年的 476.51 亿美元相比增长 48%;运营利润率为 42%,与 2023 财年的 35% 相比有所上升;净利润为 623.60 亿美元,与 2023 财年的 390.98 亿美元相比增长 59%;每股摊薄收益为 23.86 美元,与 2023 财年的 14.87 美元相比增长 60%。

当日,Meta 股价在纳斯达克常规交易中上涨 2.16 美元,报收于 676.49 美元,涨幅为 0.32%。在随后截至美国东部时间周三下午 5 点 19 分(北京时间周四早上 6 点 19 分)的盘后交易中,Meta 股价再度上涨 30.84 美元,至 707.33 美元,涨幅为 4.56%,突破 52 周最高价。在截至美股收盘周三收盘为止的过去 52 周,Meta 的最高价为 682.58 美元,最低价为 387.10 美元。(消息来源:新浪科技)

微软 2025 财年第二财季营收 696.32 亿美元同比增长 12%,净利润同比增长 10%

1 月 30 日早间消息,微软今天发布了该公司的 2025 财年第二财季财报。

报告显示,微软第二财季营收为 696.32 亿美元,与去年同期的 620.20 亿美元相比增长 12%,不计入汇率变动的影响同样为同比增长 12%;净利润为 241.08 亿美元,与去年同期的 218.70 亿美元相比增长 10%,不计入汇率变动的影响同样为同比增长 10%;每股摊薄收益为 3.23 美元,与去年同期的 2.93 美元相比增长 10%,不计入汇率变动的影响同样为同比增长 10%。(注:微软财年与自然年不一致。)

微软第二财季调整后每股收益和营收均超出华尔街分析师此前预期,但其盘后股价仍旧下跌逾 1%。(消息来源:新浪科技)

苹果 iPhone 用户禁用 Apple Intelligence 可释放最多 7GB 存储空间

1 月 29 日消息,从 iOS 18.3、iPadOS 18.3 和 macOS 15.3 版本开始,苹果最新的人工智能功能「Apple Intelligence」将默认开启。不过,如果用户不打算使用这个功能,可以手动关闭并释放存储空间。

 

特朗普媒体科技集团进军去中心化金融

1 月 29 日消息,特朗普媒体科技集团公司宣布推出金融服务和金融科技品牌 TruthFi,进军去中心化金融领域。董事会已批准投资高达 2.5 亿美元,可以分配给 SMA、ETF 以及比特币和类似的加密货币或加密相关证券。(消息来源:新浪财经)

Boom 的超音速试验飞机首次成功突破音障

1 月 29 日消息,在去年三月首次完成亚音速飞行 10 个月后,Boom Supersonic 的原型测试飞机 XB-1 今天在第 12 次飞行中三次突破音障。XB-1 是 Boom 希望最终建造的大型 Overture 客机的小型示范版本,可搭载 64 名乘客进行超音速国际航班飞行,巡航速度可达 1.7 马赫,类似于协和飞机 2003 年退役前提供的服务。

Boom 公司的首席试飞员特里斯坦-布兰登伯格(Tristan Brandenburg)从加利福尼亚州的莫哈韦航空港(Mojave Air & Space Port)起飞后,将 XB-1 飞到 34000 英尺的高空,然后以 1.1 马赫(约 844 英里/小时)的最高速度飞行了约四分钟。今天的飞行不仅是 Boom 公司的验证机首次突破音速,也是私营公司的民用飞机首次实现超音速飞行,协和式飞机是由英国和法国政府合资建造的,并不是一家私营公司。(消息来源:cnBeta)

宝马 iX 纯电 SUV 迎来中期改款

宝马公司于近日正式推出了 2026 款 iX 中型 SUV,这款中期改款车型不仅在车型阵容上进行了调整,更在外观、内饰以及动力系统方面进行了全面优化升级,旨在提升市场竞争力。

自 2021 年上市以来,宝马 iX 的市场表现略显平淡。为了吸引更多消费者,宝马公司对 iX 进行了大幅改进。在动力方面,主力车型 xDrive60 的动力和续航得到了显著提升,效率提高了 10%。新款 iX 还新增了入门级车型 xDrive45,为消费者提供了更多选择。

在车型阵容方面,2026 款宝马 iX 进行了重新调整。除了新增的 xDrive45 车型外,原 xDrive50 和 M60 车型也分别更名为 xDrive60 和 M70,以更好地反映其动力性能的提升。xDrive60 的最大马力从 523 PS 增加至 543 PS,0-96 公里/小时加速时间缩短至 4.4 秒,最高时速可达 200 公里/小时。而 M70 则更加出色,最大马力高达 659 PS,0-96 公里/小时加速时间仅需 3.6 秒,最高时速可达 250 公里/小时。(消息来源:ITBEAR)

中国电影史单日票房新纪录,2025 年大年初一总票房超 17 亿元

1 月 29 日消息,根据国家电影专资办统计,截至 1 月 29 日 19 时,2025 年春节大年初一票房已达 17.01 亿元,观影人次已达 3306.78 万,票房超过 2021 年春节大年初一,创造了新的单日票房纪录。

节档票房(含预售)已达 22.11 亿元,六部春节档新片票房分别为:

  • 《哪吒之魔童闹海》5.60 亿元
  • 《唐探 1900》5.48 亿元
  • 《封神第二部:战火西岐》4.35 亿元
  • 《射雕英雄传:侠之大者》3.95 亿元
  • 《熊出没・重启未来》1.63 亿元
  • 《蛟龙行动》9193.10 万元

2025 年春节档已破多个纪录,刷新中国影史预售最快破千万纪录、刷新历史春节档平均时长最长纪录等。(消息来源:IT 之家)

 

浏览量: 12

宇树领衔,众多黑科技登台蛇年春晚;奥特曼回应 DeepSeek 爆火;抖音李亮评论雷军、余承东直播被封

蛇年春晚黑科技:宇树人形机器人首登台,AI、XR、3D 技术打辅助

蛇年春晚汇聚哪些黑科技?

最亮眼的莫过于人形机器人。张艺谋导演的创意融合舞蹈节目《秧 BOT》由十几个人形机器人和新疆艺术学院的演员们联袂主演。

节目中,穿上红色大花袄的机器人会变换队形、舞动身体,还会多角度转手绢。上场表演的是宇树科技旗下的人形机器人 H1。

除此之外,鸿蒙智行尊界 S800、小米 SU7 车模、赛力斯问界等亮相。

其他黑科技还有 AIGC、8K 超高清、XR、3D 等技术。其中,总台联合阿里云计算有限公司通过人物动态化 AIGC 算法,让古籍、古画中的人物「动起来」。(来源:科创板日报)

DeepSeek 火爆全网,OpenAI 首席执行官发声

近日,名为 DeepSeek(深度求索)的中国 AI 初创公司在不到 30 天的时间里先后发布 DeepSeek-V3 和 DeepSeek-R1 两款大模型,火爆全网,持续引发热议。据美国彭博社报道,美国开放人工智能研究中心(OpenAI)首席执行官萨姆·奥尔特曼 27 日晚在社交媒体平台 X 上发文,对 DeepSeek-R1 模型首次亮相表示欢迎。

「DeepSeek-R1 是一款令人印象深刻的模型,尤其是考虑到它能够以这个价格提供(这样的产品)。」奥尔特曼在帖文中说,「有这样的新竞争对手确实令人振奋。」

此外,奥尔特曼还在帖文中提到,OpenAI 将加快推出新产品。(来源:环球网)

 

特斯拉和宝马就电动汽车反补贴调查向欧盟法院提起诉讼

欧盟委员会当地时间 1 月 27 日证实,特斯拉和宝马已向欧盟法院提起诉讼,反对对自中国进口的电动汽车加征关税。欧盟委员会发言人奥洛夫·吉尔当天表示,欧盟注意到这些案件,将在法庭上作自我辩护。去年 10 月,不顾各方反对,欧委会执意对自中国进口的电动汽车加征为期五年的反补贴税。此后,不少企业对欧委会在反补贴调查中对补贴的认定、计算方式以及补贴对欧盟单一市场造成损害等提出质疑。(来源:新华社)

 

波音 2024 年巨亏 118.3 亿美元,2020 年来最大亏损

1 月 28 日消息,波音发布 2024 年第四季度财报,营收 152.4 亿美元(约 1106.52 亿元人民币),同比下降 31%;亏损 38.6 亿美元(约 280.26 亿元人民币),核心每股亏损 5.9 美元。

波音 2024 年第四季度经调整自由现金流为负 41.0 亿美元(约 297.69 亿元人民币),预估为负 41.7 亿美元。

此外,波音报告 2024 年度亏损 118.3 亿美元(约 858.93 亿元人民币),为 2020 年以来最大,该公司正在努力解决其商业和国防部门的问题,以及美国西海岸工厂工人罢工造成的后果。(来源:IT 之家)

DeepSeek 称近期线上服务受到大规模恶意攻击,暂时限制部分注册

1 月 28 日消息,DeepSeek 于服务状态页面公告称:近期 DeepSeek 线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86 手机号以外的注册方式,已注册用户可以正常登录,感谢理解和支持。(来源:界面新闻)

 

抖音李亮回应雷军、余承东直播间被封:平台不建议开车期间直播

1 月 28 日消息,日前,雷军、余承东在抖音车内直播时被封,引起网友关注。

对此,抖音集团副总裁李亮在微博回应称,抖音平台不建议在开车期间进行直播。

李亮表示,如果确有需要,可由副驾驶或后座乘客拍摄,直播不能干扰驾驶,驾驶员需专心驾驶,不能与直播间进行互动,不能看手机等。

他还指出,虽然智能驾驶发展很快,但目前情况下,对于驾驶时双手离开方向盘的情况,交规是不允许的,随着汽车厂家智能驾驶技术的成熟,这些规则也会修改。

据悉,1 月 25 日,雷军开启龙年收官直播,下午 1:48,雷军的抖音直播间突然遭到封禁。

1 月 27 日上午 10:00,余承东开启「自驾回安徽老家过年」的直播,12:00 左右,余承东的抖音直播间被封禁,直播停止,此时有 846.9 万人观看直播。(来源:快科技)

 

阿里云通义开源 Qwen2.5-VL,视觉理解能力全面超越 GPT-4o

1 月 28 日,阿里云通义千问开源全新的视觉模型 Qwen2.5-VL,夺得十余项权威评测中的视觉理解冠军,全面超越 GPT-4o 与 Claude3.5。

新的 Qwen2.5-VL 能够更准确地解析图像内容,突破性地支持超 1 小时的视频理解,无需微调就可变身为一个能操控手机和电脑的 AI 视觉智能体(Visual Agents),实现给指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。(来源:36 氪)

苹果发布 iOS 18.3 正式版:默认开启苹果智能、新增视觉智能

1 月 28 日消息,苹果今天正式推送了 iOS 18.3 正式版,是 iOS 18 的一次重磅更新。

iPhone16 系列机型加入了「视觉智能」(Visual Intelligence)功能,用户可以通过摄像头识物功能将海报或宣传单上的活动添加到「日历」应用,并识别植物和动物。

同时,此次更新还删除了新闻和娱乐应用程序的苹果智能(Apple Intelligence)通知摘要,以防止误导性警报。

此外,还将 Apple Intelligence 完成的所有摘要变为斜体,以便于和其他通知进行区分。(来源:快科技)

 

微信送礼物增加「群礼物抽奖」功能

1 月 28 日消息,近日引起网友热议的微信「礼物」功能迎来更新,从一对一赠送给微信好友,升级到可一对多在微信群聊发送。

该功能入口和微信红包并列,除了常规的「群发礼物」,微信今天又增加了一项「群礼物抽奖」功能。

据了解,该功能可以选择「谁能抽奖」,设定礼物份数,以及填写文字说明,付款之后就可以发起抽奖。未收下的礼物,将于 24 小时后自动退款。

微信小店于 2024 年 12 月 17 日发布了送礼物相关使用指南。据了解,除了珠宝首饰、教育培训类目外,其余微信小店商品将默认支持「送礼物」功能,且商品款式原价不得高于 1 万元。(来源:IT 之家)

Hugging Face 号召打造完全开源版 DeepSeek R1 大模型

1 月 28 日消息,自从 DeepSeek 发布了与 OpenAI o1 竞争的开源推理模型 R1 以来,已经过去了大约一周,引发全球关注。

现在,AI 大模型社区 Hugging Face 宣布了 Open-R1 项目,计划填补 DeepSeek R1 未开源的部分组件,为这个全球热潮「再加一把火」。

根据 Hugging Face 的说法,虽然 DeepSeek 使用的权重是已知的,但用于训练模型的数据集和代码是未知的。通过 Open-R1,Hugging Face 希望填补这些空白。(来源:IT 之家)

 

浏览量: 34

DeepSeek 深夜再放大招;迅雷将以 5 亿元人民币收购虎扑;华尔街押注特斯拉销量不达预期

DeepSeek 深夜再放大招:7B 参数人人可用的视觉多模态模型 Janus-Pro-7B 开源

1 月 28 日消息,就在北京时间今日凌晨,DeepSeek 宣布开源全新的视觉多模态模型 Janus-Pro-7B,其在 GenEval 和 DPG-Bench 基准测试中击败了 Stable Diffusion 和 OpenAI 的 DALL-E 3。

Janus 的表现超越了传统的统一模型,并且在与任务特定模型的比较中也同样表现出色。凭借其简洁、高灵活性和高效性的特点,Janus-Pro 成为下一代统一多模态模型的有力竞争者。(来源:IT 之家)

Meta 被曝组建 4 个小组专门研究 DeepSeek 模型

1 月 27 日,据 Information 网站,脸书母公司 Meta 成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型 DeepSeek 的工作原理,并基于此来改进旗下大模型 Llama。其中两个小组正在试图了解幻方量化如何降低训练和运行 DeepSeek 的成本;第三个研究小组则正在研究幻方量化可能使用了哪些数据来训练其模型;第四个小组正在考虑基于 DeepSeek 模型属性重构 Meta 模型的新技术。(来源:澎湃新闻)

 

DeepSeek 多岗位招新,实习生日薪最高上千元

招聘网站显示,深度求索公司的北京子公司正在招人,现共放出了 52 个岗位,包括深度学习研究员、核心系统研发工程师以及资深 ui 设计师等,均为 14 薪。其中,薪资最高的为核心系统研发工程师(校招),薪资范围为 6 万元-9 万元;除此之外,大部分岗位的起薪在 2 万元及以上。值得一提的是,该公司正在招聘实习生,AGI 大模型实习生的工资为 500 元/天-1000 元/天,数据百晓生实习生为 500 元/天-510 元/天。(来源:红星新闻)

 

迅雷将以 5 亿元人民币收购虎扑

1 月 27 日消息,迅雷有限公司公告宣布,与上海匡慧互联网科技有限公司(注:虎扑的运营方)达成协议,计划以人民币 5 亿元现金收购该公司,交易金额可能根据一定的调整因素有所变化。交易的完成将依赖于特定条件,预计将在 2025 年上半年完成。

迅雷董事长兼首席执行官李金波表示:「收购虎扑将使迅雷与之形成强大的协同效应。这一战略举措将充分发挥迅雷在互联网内容传输领域的庞大用户基础和技术优势,同时结合虎扑的优质体育内容和活跃社区,促进内容下载、社区互动以及忠实用户群体中的体育消费。此外,收购还将通过虎扑的优质内容和活跃用户群体,进一步丰富迅雷的内容生态系统,增强其社区运营,并通过迅雷的技术和品牌优势提升整体用户体验。」(来源:新浪)

DeepSeek 暴击华尔街 欧美科技股市值或蒸发 1.2 万亿美元

北京时间 1 月 27 日夜间,美股期货重挫,纳斯达克 100 指数期货跌近 5%,标普 500 指数期货跌近 3%,道指期货跌近 1%。博通跌超 11%,阿斯麦跌近 11%,超微电脑跌超 10%,台积电跌近 10%,美光科技跌近 9%。

英伟达跌逾 13%。若收盘时维持这一跌幅,将成为历史上单个公司市值最大的单日蒸发之一。有分析认为,R1 的成功可能削弱了市场对英伟达 AI 芯片需求的预期。

欧洲科技股也未能幸免。芯片设备制造商 ASML 领跌,股价最多下跌 12%。如果这些损失持续到收盘,纳斯达克 100 指数和欧洲 Stoxx 600 科技子指数的总市值可能蒸发高达 1.2 万亿美元。

截至发稿,其中英伟达美股收跌 16.86%,现报 118.58 美元每股,目前市值 2.90 万亿美元。(来源:华尔街见闻)

 

北京 2025 年家电以旧换新补贴细则公布

北京市商务局发布关于印发《北京市 2025 年家电以旧换新补贴实施细则》的通知。其中提出,对个人消费者购买二级及以上能效或水效的冰箱(含冰柜)、洗衣机(含洗烘一体机)、电视(含激光电视)、空调、电脑、热水器(含家用燃气壁挂炉)、家用灶具、吸油烟机、净水器、洗碗机、电饭煲、微波炉等 12 类家电产品予以补贴。

 

华尔街投行押注:特斯拉今年销量将不达马斯克预期

据报道,华尔街投行现在预计,随着特朗普试图废除拜登时代有利于电动汽车的气候政策,特斯拉今年的汽车销量增长速度将远低于其联合创始人马斯克的预测。FactSet 编制的分析师预测显示,特斯拉今年有望售出 207 万辆汽车,较 2024 年增长 16%。这将是自去年以来的反弹,当时该公司公布了自 2011 年以来的销量首次下滑,但这远低于马斯克 10 月份预测的 20% 至 30%,也低于此前两年约 40% 的年增长率。摩根士丹利分析师 Adam Jonas 表示:「特朗普 2.0 对电动汽车激励措施的反对打击了 2025 年的销量预期。」(来源:新浪财经)

 

国补落地一周:补贴省份新增 17 个 部分商家手机销售额倍增

中国家用电器商业协会常务副秘书长吴咸建 1 月 27 日告诉记者,国内已有 30 个省份出台了手机、平板、智能手表等数码产品以旧换新国家补贴实施细则。有商家表示,近期手机销售额同比实现了倍数级的增长。今年「国补」实施一周以来,手机「国补」落地的省份新增了 17 个,从 1 月 20 日(截至 15 点)的 13 个省份,增至 30 个省份,包括黑龙江、云南、海南、北京、内蒙古、广西、吉林、上海、江苏、广东、四川、湖南、江西、河南、湖北、重庆、贵州、陕西、新疆、福建、浙江、辽宁、天津、山东、青海、安徽、宁夏、山西、甘肃、河北。(来源:第一财经)

 

育碧裁员 185 人 并关闭一家支持工作室

育碧(Ubisoft)是最新一家掀起大规模裁员浪潮的游戏发行商。该公司今天宣布,185 名员工受到其工作室最新裁员的影响,这次裁员主要集中在欧洲的工作室。其中一个辅助工作室也将被完全关闭。

育碧发言人向 Eurogamer 表示:”作为我们持续努力的一部分,我们将优先安排项目并降低成本,以确保育碧的长期稳定,我们已经宣布在育碧杜塞尔多夫、育碧斯德哥尔摩和育碧回声工作室进行有针对性的重组,并永久关闭育碧利明顿工作室。不幸的是,这将影响到 185 名员工的整体利益。我们对他们的贡献深表感谢,并承诺支持他们渡过这一过渡时期。”

育碧杜塞尔多夫工作室以开发《Anno》和《Settlers》城市建设和策略游戏而闻名。目前,该工作室正在与 Blue Byte 公司合作开发 Anno 117,预计在 2025 年推出。目前还不清楚裁员将如何影响这些发行计划。(来源:网易)

苹果 macOS 15.3 正式发布

1 月 28 日消息,苹果今日向 Mac 电脑用户推送了 macOS 15.3 更新(内部版本号:24D60),这也是 macOS Sequoia 系统的第三次重大更新,本次更新距离上次发布正式版间隔 46 天。

苹果将 Genmoji 带到了支持 Apple Intelligence 的 Mac 上,意味着用户现可创建自定义表情符号。

该更新还移除了新闻和娱乐类应用的通知摘要,以防止 AI 生成误导性的「Apple 智能」头条。(来源:快科技)

 

史上最烧钱?国产动作游戏《影之刃:零》成本将达 4 亿

据媒体报道,国产动作游戏《影之刃:零》目前已经烧掉了 2 亿元,「未来还要消耗至少 2 亿」,有望成为最贵的国产单机。相比而言,《黑神话:悟空》开发成本在 3 亿元左右。

在半开放世界冒险游戏《影之刃:零》中,玩家将扮演一位名为「Soul」的菁英刺客,为一个强大却难以捉摸的组织「The Order」所任用。玩家被陷害为谋杀团长的元凶,在组织的追捕下身受重伤,尽管获得一位神秘的治疗师所搭救,但仅能再维持 66 日的生命,而玩家必须在生命来到尽头以前与强大的敌人与非人类的怪物作战,尝试找出背后阴谋的主使者。(来源:3DMGame)

苹果正在为未来的智能眼镜开发 visionOS 版本

据报道,苹果公司正在开发一个版本的 visionOS(用于 Vision Pro 的操作系统),该版本将与未来的智能眼镜配合使用,这也是苹果公司不断扩大其 AR 产品阵容的努力的一部分,使其不再局限于笨重的头显。

苹果的视觉产品部门正在关注 Vision Pro 以外的产品,并考虑推出与 Meta 的雷朋合作类似的智能眼镜。据报道,参与这项工作的高管认为,由于仍有大量的研究工作要做,产品在三年或更长时间内都不会面世。

为此,该公司目前正在其办公室进行用户研究,”以评估功能和界面的吸引力”,并且已经在开发一个可以在眼镜上运行的视觉操作系统版本。这些研究代号为”Atlas”,由苹果公司硬件工程部门的产品系统质量团队领导。(来源:cnbeta)

 

浏览量: 29

Deepseek又出连招:刚发布了超越DALL-E3的多模态模型

作者|Li Yuan

编辑|靖宇

 

AI 时代就这么悄悄降临了。

大概谁也没想到,今年春节,打的最热的不再是传统互联网的红包大战,谁和春晚合作了,而是 AI 公司。

临近春节,各家大模型公司都完全没放松,更新了一波模型和产品,而最受关注的,却是去年崭露头角的「大模型公司」DeepSeek(深度求索)。

1 月 20 日晚,DeepSeek 公司发布推理模型 DeepSeek-R1 正式版,使用低廉的训练成本直接训练出了不输 OpenAI 推理模型 o1 的性能,而且完全免费开源,直接引发了行业地震。

这是第一次国产 AI 大范围在全球,特别是美国引起了科技圈的震动。开发者纷纷表示,正在考虑用 DeepSeek「重构一切」,在这一浪潮下,经过一周的发酵,甚至一月才刚刚发布的 DeepSeek 移动端应用,迅速登顶美区苹果应用商店免费 App 排行第一,不但超越了 ChatGPT,也直接超越了美区的其他热门应用。

DeepSeek 的成功甚至直接影响了美股,没有使用巨量昂贵 GPU 就训练出的模型,让人们重新思考了 AI 的训练路径,直接让 AI 第一股英伟达最大跌幅达到 17%。

而这还没结束。

1 月 28 日凌晨,除夕夜前一晚,DeepSeek 又开源了其多模态模型 Janus-Pro-7B,宣布在在 GenEval 和 DPG-Bench 基准测试中击败了 DALL-E 3(来自 OpenAI)和 Stable Diffusion。

DeepSeek 真的要血洗 AI 圈了吗?从推理模型到多模态模型,拿 DeepSeek 重构一切,是蛇年开年的第一主题吗?

Janus Pro,多模态模型创新架构的验证

DeepSeek 此次深夜一共发布了两个模型,Janus-Pro-7B 和 Janus-Pro-1B(1.5B 参数量)。

从命名上就能看出,模型本身来自之前 Janus 模型的升级。

2024 年 10 月,DeepSeek 才第一次发布 Janus 模型。和 DeepSeek 的一贯套路一样,模型采取了一个创新的架构。在不少视觉生成模型中,模型都是采用了统一的 Transformer 架构,能够同时处理文生图和图生文任务。

而 DeepSeek 则是提出了一种新的思路,对理解(图生文)和生成任务(文生图)的视觉编码进行解耦,提升了模型训练的灵活性,有效缓解了使用单一视觉编码导致的冲突和性能瓶颈。

这也是 DeepSeek 为什么将模型命名为 Janus (杰纳斯)。Janus 是古罗马门神,被描绘为有分别朝向相反方的两个面孔。DeepSeek 表示命名为 Janus,指的是模型可以像 Janus 一样,用不同的眼睛看向视觉数据,分别编码特征,然后用同一个身体 (Transformer) 去处理这些输入信号。

在 Janus 系列模型中,这种新思路已经产生了不错的效果,团队表示,Janus 模型的指令跟随能力很强,有多语言能力,且的模型更聪明,能读懂 meme 图像。同时还能处理 latex 公式转换、图转代码等任务。

而在 Janus Pro 系列模型中,团队对模型的训练流程进行了部分修改,直接做到了在 GenEval 和 DPG-Bench 基准测试中击败了 DALL-E 3 和 Stable Diffusion。

随着模型本身,DeepSeek 也发布了 Janus Flow 新型多模态 AI 框架,旨在统一图像理解与生成任务。

Janus Pro 模型能做到使用简短提示提供更稳定的输出,具有更好的视觉质量、更丰富的细节以及生成简单文本的能力。

模型既可以生成图像,也可以对图片进行描述,识别地标景点(例如杭州的西湖),识别图像中的文字,并能对图片中的知识(如「猫和老鼠」蛋糕)进行介绍。

X 上不少人已经开始试用新模型。

上图左为图像识别的测试,右图则为图像生成的测试。

可以看到,在高精度读图上,Janus Pro 也做的很好。能够识别数学表达式和文字的混合排版。未来搭配推理模型使用,可能有更大意义。

1B 和 7B 的参数量,或能解锁新应用场景

在多模态理解任务中,新模型 Janus-Pro 采用 SigLIP-L 作为视觉编码器,支持 384 x 384 像素的图像输入。而在图像生成任务中,Janus-Pro 使用一个来自特定来源的分词器,降采样率为 16。

相对而言,这样的图像规模尺寸仍然较小。X 上有用户分析认为,Janus Pro 模型更多是方向上的验证,如果验证靠谱,就会推出可以投入生产的模型了。

不过值得注意的是,此次 Janus 发布的新模型,不但在架构上对多模态模型有创新意义可以参考,在参数量上,也是一个新的探索。

此次 DeepSeek Janus Pro 对比的模型,DALL-E 3,之前公布的参数量为 120 亿,而 Janus Pro 的大尺寸模型只有 70 亿参数。在这样紧凑的尺寸下,Janus Pro 能够做到这样的效果已经十分不错。

尤其是 Janus Pro 的 1B 模型,只使用了 15 亿参数。外网上已经有用户将对模型的支持添加到了 transformers.js。这意味着模型现在可以在 WebGPU 上的浏览器中 100%运行!

虽然截止发稿,笔者还没能成功地在网页版上使用到 Janus Pro 的新模型,但是参数量小到能够在网页端直接运行,仍然是一项令人惊叹的进步。

这意味着图片生成/图片理解的成本,正在进一步下降。而我们有机会在更多原本无法使用生图和图片理解功能的地方,看到 AI 的使用,改变我们的生活。

2024 年的一大热点,在于加入了多模态理解的 AI 硬件,能够如何介入我们的生活。而参数量越来越低的多模态理解模型,或者可以让我们期待能够在端侧运行的模型,能够让 AI 硬件进一步爆发。

DeepSeek 搅动新年,万事万物可以用中国 AI 重做一遍?

AI 世界一日千里。

去年春节前后,搅动世界的是 OpenAI 的 Sora 模型,而一年下来,中国公司已经完全在视频生成方面迎头赶上,让年尾 Sora 的发布显得有些暗淡了。

而今年搅动世界的,变成了中国的 DeepSeek。

DeepSeek 并不算传统的科技公司,然而用远低于美国大模型公司 GPU 卡和成本,做出了极其创新的模型,直接让美国同行感到震动——美国人纷纷感叹:R1 模型的训练,仅仅花费 560 万美元,甚至只相当于 Meta GenAI 团队任一高管的薪资,这是什么神秘的东方力量?

DeepSeek 创始人梁文峰直接在 X 上发布了一张有趣的图片:

图片使用了爆火的 2024 年全球爆火的土耳其射击选手的梗。

在法国巴黎奥运会射击项目混合团体 10 米气手枪决赛中,51 岁的土耳其射击男选手迪凯奇,仅佩戴了一副普通的近视眼镜和一对睡眠耳塞,便以单手插兜的潇洒姿态,稳稳地将银牌收入囊中。而在场的全部其他射击选手都需要两块聚焦和遮光的专业镜片和一副防噪声耳塞,才能开始比赛。

自从 DeepSeek「破解」了 OpenAI 的推理模型,美国各大科技公司开始背上了巨大的压力。今天,Sam Altman 也终于扛不住压力出来回应了一段官方发言。

2025 年,会是中国 AI 冲击美国认知的一年吗?

DeepSeek,手里还藏着什么秘密——这注定是个不平凡的春节。

 

 

浏览量: 45

2025 年,多模态会诞生下一个 Super App 吗?

今天,如果你问创业者 2025 年 AI 赛道最大的机会在哪?那么 10 个人里至少有 5 个会回答:多模态。

过去一年,我们见证了多模态模型领域的飞速发展:从 Sora 到 4o,从生成到感知,从图片、视频再到 3D,各种模态的基础模型在短短一年内完成了革命性的进化。

就像多点触屏催生了智能手机,推荐算法催生出头条、抖音,GPT-3.5 催生出 ChatGPT……每一轮基础技术的进步,都将在不久之后解锁创新的应用。而随着多模态模型的快速发展,越来越多从业者相信,2025 年多模态领域有望诞生出新的 Super App。

但真正置身其中,就会发现一切并没有那么简单,在这个赛道上有至少三个关键问题需要搞清楚:

  1. 多模态模型的技术能力进步有多大,到底是革命还是噱头?具体哪些模态是真正颠覆性的进步。

  2. 多模态到底解决的是什么问题?给用户创造的价值是什么。

  3. 多模态模型如何落地?什么领域适合原生应用,什么领域适合原有产品改造,还有大厂和创业者的边界在哪里。

带着这些问题,我们不久前参加了火山引擎 Force 大会。在字节跳动内部,火山引擎是承担技术 ToB 的组织,涵盖豆包模型能力的调用以及云计算相关业务。众所周知,字节在 AI 上投入巨大,模型能力和基础设施快速提升,进而带来了国内 AI 应用创业者在火山引擎上的密度迅速提升。

图片来源:火山引擎

从这些创业者的实践上,我们最明显的感觉就是大家正在形成共识:多模态技术在快速进步,而充分运用好多模态的 AI 应用,正在接近用户体验突破和用户价值突破的临界点。

 

01 2024 年,多模态确实「卷」出了进展

基础技术的进步会解锁应用的创新,但能否真正实现应用创新,其实也取决于基础技术的进步幅度。多模态模型这个赛道也不会例外,只有理解了多模态模型的发展现状、未来走向,摸清楚这些「新武器」的能力与边界,才能找到多模态应用创新的方向。

过去一年,图片生成、视频生成、视频理解、音乐生成、3D 生成等迎来了不同程度的突破,但在业内人士看来,目前技术已经成熟,未来一年最有可能的落地的,还是图片生成和视频生成。

对开发 AI 应用来说,主要考验模型技术在三个维度的能力:生成质量、生成速度、和可控性。按照这个标准,图片生成模型比视频生成模型的能力更成熟,现在能解锁的应用也更多。

图片生成领域起步时间早,2022 年 8 月就出现了 Stable Diffusion(第一款文生图开源模型),并在一定程度上解决了图片生成的可控性和质量问题、做到了可用的程度。随着模型算法全面向 DiT 架构转换,图像领域的可控性越来越好。同时,生成图片的效果和推理速度也在持续提升。随着工具层打造出更多的能力,图像生成领域已经能够做到在严肃场景实现高度个性化的图像生成效果。

图为豆包图像大模型生成的图片,无论是精细程度、美感、光影都越来越自然和真实。|图片来源:字节跳动

在越来越丰富多样的场景驱动下,图片生成的需求正在由开源模型承接为主,转变到以定向优化的闭源模型及其生态为主,从而满足更多样、更个性化的行业需求。同时,像 ComfyUI 这样能够让用户自己调整工作流和生图模型特定能力的中间层工具正在发挥关键作用。

火山引擎 AI 开放平台产品总监傅鹭翔介绍,目前在互动娱乐、分享陪伴、小说配图、二创影视剧解说、儿童绘本等等场景下,图片生成模型都已经开始被广泛应用。

「现在的需求是多样化的,比如我要 A 风格的图片,你想要 B 风格的图片,他想要把某一个元素(比如一瓶水、一台车)融进图片里,这就很强调满足个性化需求的能力,同时这样的场景对图片生成效果的可控性要求也非常高。」傅鹭翔表示,「在这样的条件下,火山引擎把工具层的能力开放出来,比如把图像、视频前后的控制组件、基于豆包大模型的 Lora 精调等能力开放,再把搭载 ComfyUI、搭建 workflow 的能力开放给用户,避免 100 个用户提 100 个需求,一个一个排期来做定制化。」

如果说上述图片生成模型的最新进展是由需求驱动,那么视频生成大模型的进展则主要靠供给方们「卷得有质量」。

年初 Sora 横空出世,此前采用 U-Net、GAN 等算法架构的技术路线快速向 DiT 架构收敛,之后一年里,谷歌、快手可灵、字节即梦、爱诗科技等大厂和创业公司相继推出比肩 Sora 效果的视频生成模型。

值得一提的是,在这个领域国内公司已经快速实现了技术赶超,今天国内顶尖视频生成模型的质量公认达到全球第一梯队,甚至已经被 Meta 等大厂拿来作为跑分对比的标杆。明势资本夏令认为,这是由于当技术路线和竞争点收敛成为明牌后,就进入比拼工程和产品能力的阶段,这也正是中国创业者最擅长的地方。

这是一位戏剧学院老师、编剧小文通过「即梦 AI」及其背后的「豆包视频生成大模型」制作的一位女明星的奇幻旅程,还原了电影的发展史,从默片时代到有声时代。可以看出,视频生成模型已经可以在商业场景下做到如此精细的程度。|来源:字节跳动

很多尝鲜者都是被社交媒体上的 AI 视频惊艳,但自己上手以后却发现做不出同样的效果,这是因为今天 AI 生成视频的质量不够稳定,业内将这种现象称为「抽卡率」,即输入同一条 Prompt 后生成多少条视频中能有一条可用,目前业界常见的抽卡率是「8 抽 1」「10 抽 1」,更别说想要拿到效果特别好的,就需要抽更多次卡。

过去一年,我们可以看到各种社交媒体上人们分享的惊艳 AI 视频,这种效果就是 AI 生成视频已经「可用」的最好例证,但从「可用」到「商用」,短期内视频大模型还有一个必须解决的关键问题,就是「可靠性」。在尝鲜的使用场景这不是太大的问题,用户只是拿来分享社交媒体的话完全可以花上一天生成几百条并从里面选择最好的一两条发布,但对于效率、质量、成本要求更高的商用场景,稳定性就成了一个必须解决的问题。今天业内不少团队都在尝试通过工程化的方式来提升生成视频的稳定性,也就是所谓的「技术不够,产品来凑」。

 

02 多模态到底解锁了什么?

关于多模态模型的意义和价值,一个言论在业界广为流传:每多一种模态的解锁,意味着用户渗透率的进一步提升。

这句话背后的意义是:只有文字的人机交互是单一的,是被限制的。人机交互的未来必然是多模态的,AI 需要多模态理解真实世界和真实的人,人也需要 AI 提供文字以外的输出。

最典型的就是语音交互之于 ChatBot 这个今天使用最广泛的 AI 场景。今天越来越多 ChatBot 类的产品都已经加入语音交互功能,而在一些特定的使用场景下(比如用豆包等 AI App 学英语),语音交互就能极大地提升用户的使用体验。

造梦次元上,用户可以选一个故事进入,与故事角色交互|截图来源:造梦次元官网

最近大火的造梦次元是一个典型的案例,在这个平台上,用户可以按照自己的想象创作「角色」,并让其他用户与自己创作的角色「互动」——聊天、咨询、调情、网恋都不在话下。

从各种乙女游戏、二次元游戏的火热中不难发现,与虚拟角色在一定的故事背景下,通过对话聊天、养成挑战等玩法形成情感连接,这种需求其实一直存在。造梦次元创始人、CEO 沈洽金向极客公园表示,「造梦次元解决的是一个已经存在了很长时间的需求。现在有了 AI 之后,我们这个互动体验就可以交给 AI 去解决,于是就做了现在这个公司,我们称之为——想法流。」

而 AI 能力的持续进步,实际上也在解锁造梦次元的体验边界。比如大语言模型的对话能力,以及构建智能体的技术,形成了造梦次元的产品基石;图片、音乐生成的技术,进一步解放了创作的技术门槛,让更多比「动手」更擅长「动嘴」的普通人也能做出高质量的虚拟角色。

而语音交互的加入,则进一步改善了用户体验。打开对话框,符合你对霸总、学霸、御姐等人设想象的声音自然流出,相比文字更容易让人产生在与真人交流的真实感。而过去要做到这一点,需要一名在专业学校培养数年的职业声优,花上数天或者数周时间熟悉角色、调整声线,还无法实时交互,而现在只要定好人设,AI 就能帮创作者完成一切。

据极客公园了解,使用多模态能力提升产品体验后,造梦次元的获客成本、用户时长、次日留存以及付费率四个关键业务指标提升明显,其也获得了锦秋基金和明势创投等多家 VC 的联合投资,成为当下 AI 应用领域的热门初创公司。

除了利用多模态的交互形式创造用户价值,多模态应用的另一条路径是:用产品补基础模型的不足。

就像上文提到的视频生成领域的可靠性问题,今天多模态模型直接用到生产环境存在各式各样的问题,针对特定的场景做产品层面的优化,反而能给用户更好的交互体验。

现在,Fotor 作为一个在图片生成赛道上跑出来的产品,在全球两百多个国家和地区提供 11 种语言,一共有接近 7 亿用户,月活 2000 万上下。Fotor 几乎已经把所有模态的模型嵌入到了产品工作流。

Fotor CTO 颜河向我们分享了 Fotor 利用多模态能力获得高速增长背后从 0 到 1 的过程,其中最行之有效的一个方法论就是「核心技术固本,优质产品拓新」。

围绕视觉图像处理场景,Fotor 通过将生成式 AI 的能力整合到产品工作流中,带来了更好的图像编辑体验。|截图来源:fotor.com

比如用户上传了一张自己的图片,想对这张图片做一定的风格上的转换。从上传图片的那 1 秒开始,Fotor 会先利用图像识别模型的能力进行精准识别,识别出来的结果是一个结构化的数据,中间包含了这张图片的构图是什么样的、有没有人物、主体是什么等等。接着根据这些细分的意图利用模型的能力对这个图片进行一定的分割,再到下一步使用大模型进行相应的生成,再到下一步,通过视频模型让生成的图片动起来,最后再给到用户一个结果。

像造梦次元和 Fotor 所代表的 AI 互动内容平台和生产力产品也是当前用到多模态技术最多的主要场景。火山引擎方舟解决方案负责人冯书云告诉我们,就所有模态的 AI 应用来看,当前主要有四个场景把产品做到了接近 PMF(产品市场匹配)。

  • 第一类是泛娱乐,主要提供情绪价值。这类产品基于「类人」的互动体验,为用户提供情绪价值,比如社交、陪伴、内容等。比如阅文旗下「AI 男友平台」筑梦岛,为女性用户提供沉浸式虚拟陪伴的体验。

  • 第二类是生产力场景,帮助用户提高工作效率、创造价值或者完成任务的工具或软件。由于生产力场景要求 AI 能够在特定任务上达到相对高的完成度,所以当国内模型达到 GPT-4 水平的时候,生产力应用开始大规模落地。

  • 第三类是教育场景,以在线教育为核心,包括 K12、成人教育、职业教育,整个教育的全流程从教学大纲、出题、讲题、解析、互动陪练等等一个系列,基于大模型不同模态的能力,现在已经能形成一些很完整的解决方案。

  • 第四类是终端或者叫硬件,包括手机、汽车、PC 这样有比较强的智能 OS 的产品,或者是一个点读笔、小的玩具、智能音箱,已经能进行一些自然互动、完成一些具体的任务。

作为字节跳动平台对内对外服务的大模型一站式服务平台,火山引擎 MaaS 平台火山方舟在过去两年的时间服务了字节内部所有的应用大模型的需求以及外部所有的客户。2024 年,火山引擎成为大模型调用量增长最猛的云厂商,半年里增长了数十倍。

火山引擎 V-Start 加速器负责人程子莹认为,随着豆包相继发布了视频生成、音乐视频、视觉模型,多模态模型供给越来越丰富,2025 年多模态一定会掀起第二波大模型应用的浪潮,会有相当多的 Token 消耗和算力发生在图片理解、视频理解、生图、生视频、语音等方面。随着模型能力变强、模态变多,也会解锁越来越多的新场景。

 

03 看清边界,选对技术,做好产品

「多模态模型技术会如何影响 2025 年做 AI 应用的走向」,当我们分别向模型厂商从业者、应用创业者、投资人提出这一问题时,三种不同角色身份的实干家们给出了几乎同一个答案:

不担心被模型吃掉、不担心大厂进入、不担心模型成本、多模态也成不了护城河。

「最重要的事情只有一件,围绕目标用户,越来越好地解决需求;但前提一定是要了解 AI 技术的最新边界。」这是大家对新的一年如何做好多模态 AI 应用的一致判断。

「做 AI 应用的产品节奏要与模型技术发展的节奏同频。否则,产品上不仅会做无用功,也可能会做不好」。这是沈洽金在过去一年的实践中得到的教训,「最重要的是节奏,根据对当下、未来模型技术的判断,做应用的迭代」。

2025 年,多模态模型整体上一定还是在可控性、一致性、渲染力、生成速度上做持续的能力提升。尤其是视频生成模型的可控性和一致性,亟待进一步提升来降低废片率。

但具体不同模态的模型在不同场景里,各项性能表现发展到什么程度、可以被优化到什么程度,只能在场景中反复探索、调试。Fotor 颜河表示,哪怕是同一个技术路线如都是 DiT 架构,不同公司做出来的模型表现也差别巨大,而且同一个模型在不同场景里的表现也差别巨大。「同一个场景、同一批用户,同一个时间同一个内容我们接两个模型,最好的模型跟最差的模型的数据差距可以差到 10 倍,非常夸张,这与模型参数、数据配比、做研究实验的轮次等等都有关系」。

这时候,创业者探测模型边界、找到最匹配模型的经验都是 A/B Test,同一个能力在用模型的时候会反复嵌套,不停地在背后收集用户反馈(比如人均互动次数、漏斗率等指标),谁效果好就用谁,其次才是考虑模型成本,因为后者是早晚一定可以实现的事情。

对于 2025 年,多模态会解锁哪些新应用的可能,冯书云更期待在内容消费和硬件上能打开更多空间。

作为火山方舟解决方案负责人,过去一段时间,冯书云观察、走访了各个行业最活跃的多模态模型的应用创新者。在她看来,视频生成能力再进化,可能会解锁内容消费的新场景,给更多人带来更好的创作形式。

现在,视觉内容的巅峰是电影,大模型显然在效果上还比不过电影,但是围绕电影成片的整个工作流已经有大模型介入的机会。比如,一部电影其实是上百上千个镜头的拼接,在每个镜头从布景到实现的过程中,要做很多类似于 demo 的东西,如果视频生成模型进一步成熟,可以让导演用更简单、更高效的方法去将自己的创意灵感分享给剧组。

但她最期待的还是视频理解模型的突破,比如豆包 VLM 模型,可以输入文字、图片、视频到模型让它理解,这会给 AI 硬件带来更大的新空间。

2024 年 12 月 18 日,火山引擎发布豆包视觉理解模型时,总结了其能解锁的新场景|图片来源:火山引擎

对于硬件来说,大语言模型可能只是一个大脑,而视频理解模型则是眼睛,能看「我」看到的东西,再去发挥它智力,会在很多场景中发挥作用。

比如现在看到的一些落地场景,工厂的监测、安保的巡逻,或者孩子拍了一道题,视觉理解模型加语言模型就可以帮着孩子一步一步去解题。

甚至有一些创业者认为,未来再做硬件创业时,那些简单的小机器人不需要嵌入式工程师了,人可以告诉大模型说,「根据你对世界的理解做一些动作」「如果做高兴的动作,胳膊的扭矩是多少,可以摆动多少度」,像这样通过一些比较基础的、人完全可以理解的指令去控制硬件,交互会变得非常自然,脑子变得越来越聪明,同时还有了眼睛可以理解世界。

过去几年,从 GPT-3.5 到 GPT-4,再到 Claude-3.5,每一次基础模型的迭代都引领了一波 AI 应用的爆发。展望未来,随着视频生成和视频理解模型的不断成熟,2025 年无疑将成为 AI 多模态领域的关键节点。一场新的技术浪潮正在酝酿,新一批现象级 AI 应用的诞生,势必会为这个领域注入更多可能性和想象力。

 

浏览量: 19

豆包大模型 1.5 不走「捷径」,火山引擎要造「长坡厚雪」

2025 开年,AI 领域有重回「卷模型」的架势,堪比两年前「百模大战」般热闹。短短一周内,先是 MiniMax 加入开源的队伍并表示坚定探索模型的上限;接着 DeepSeek、Kimi 接连更新推理模型;阶跃、混元在多模态上也有新动作。

创新是「密度」和「浓度」的产物,越来越多中国模型厂商继续探索模型边界、开放地交流技术进展,决定了 2025 年中国的基础模型势必会由「跟随者」逐渐转向「创新者」的姿态。

最新的例子是 1 月 22 日上线的豆包大模型 1.5。

通过模型架构和 AI Infra 层面的技术创新,豆包大模型 1.5 在性能与推理成本上再一次突破了平衡的极限,这也让它能在性能超过 GPT-4o、Claude 3.5 Sonnet 等业界一流模型的同时,模型调用价格不变。更重要的是,豆包大模型 1.5 在训练过程中,未使用任何其他模型生成的数据,这让豆包大模型 1.5 上线即引发热议。

在此之前,从一个大而复杂的预训练模型中蒸馏数据,来训练一个更小更高效的模型,是更普遍的做法。这也是很多模型能够迅速缩小与 OpenAI 模型能力上的差距的主要手段之一。

显然,豆包大模型选择了一条更难的路径。对此,行业人士称,像豆包大模型这样构建完全自主的数据生产体系,意味着模型可探索的天花板更高,字节跳动不用说也要无限探索 AGI 的边界。

拉远看,其实自 2024 年 5 月正式对外推出以来,豆包大模型便不断带来更强模型、一并保持价格竞争力和初始并发。目前,它已经成为国内使用量最大、应用场景最丰富的大模型,在火山引擎去年底公布的最新数据中,豆包大模型日均 tokens 使用量超过 4 万亿,火山引擎也因而成为大模型时代最积极的一朵 AI 云。

 

01 不使用任何其他模型数据,豆包大模型 1.5 怎么样?

在这次豆包大模型 1.5 的升级发布中,豆包通用模型 pro、豆包通用模型 lite、豆包·视觉理解模型均有大幅增强,新发布的豆包·实时语音模型也在拟人化、低时延上有独特优势。目前,豆包大模型 1.5 已全面上线火山方舟。

我们也在火山方舟平台官网,第一时间体验了这几个新模型的实际能力。

在同时向 Doubao-1.5-lite 和 Doubao-1.5-pro 提出数学和逻辑问题时,豆包通用模型 lite 主打一个快且准、没有废话,也几乎不需要等待。所以在一般的简单场景下,你甚至会更喜欢简单直接的它。

这一点官方报告中也有提到,Doubao-1.5-lite 可以比肩 9 月份的 Doubao-pro-32k-0828 的模型效果,客户在众多场景中,可以直接用 lite 模型成本,获得过去 pro 模型的效果。

但在更精巧复杂的一些题目上,豆包通用模型 pro 就会展现出它更强大的推理能力,比如:

显然,Doubao-1.5-pro 模型综合能力显著增强,尤其它已经在一些场景里展现出了一定的复杂推理能力。在豆包大模型 1.5 的评测中,Doubao-1.5-pro 的综合得分也优于 GPT-4o、Claude 3.5 Sonnet 等业界一流模型,模型效果达到全球领先水平。

豆包·视觉理解模型,测试了几个看图提问题,基本上半秒到 1 秒就可以识别图像并做出回答。且大体上也是准确的。

火山引擎官方发布的评测案例,专门测试了豆包·视觉理解模型对不同尺寸、分辨率下图像的适应性,以及复杂指令遵循的能力。火山引擎表示,豆包·视觉理解模型在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级,视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力均得到了提升,并让模型的回复模式也变得更加精简、友好。

最印象深刻的是豆包·实时语音模型,现在已经可以通过手机端豆包 App 来体验它的「端到端语音聊天」能力。

打开豆包 App 右上角「打电话」功能,你可以跟它悄悄说话、可以跟它讲方言让它模仿、跟你对唱流行歌曲、它也懂你的戏精体质,不需多言就可以陪你「角色扮演」,你会感觉跟你讲话的「豆包」是一个有灵魂通人性的小机灵,将豆包 App 升级至 7.2.0 版本即可解锁这些奇妙的新体验。

依托豆包·实时语音大模型,用户在豆包 App 中跟它唱歌、说悄悄话、角色扮演等等,它都能秒懂并作出最恰当的回应。|视频来源:火山引擎

作为一款语音理解和生成一体化的模型,豆包·实时语音大模型在语音表现力、控制力、情绪承接方面的体验惊艳,并且对话中可随时打断、整个交互过程几乎感受不到时延。

从小红书上网友在豆包 App 实测的 AI 语音聊天功能的反馈来看,大家对这一模型的整体满意度还要高于 GPT-4o,哪怕天天用 GPT-4o、第一次切换到用豆包 App 的网友,也会对它的「拟人化」有很深刻的印象,因为豆包·实时语音大模型的语音语气自然度和情绪饱满度更高,也贴合中国用户实际需求。

体验了一番新模型,总体感觉被豆包大模型推着、在智能的边界上又向前迈了一步,丢给它实测的问题越多,你就更能感受到哪怕是非常微妙的进步,也会带给你解决问题后的满足感。同时,它也越来越懂我们的喜怒哀乐,让你忍不住想跟它多聊几句。尤其是在豆包 App 中,常常边写作业,边挂着「电话」,想起来问它一嘴,聊上几句,它始终就在那里陪伴你。

以豆包大模型家族中的最强代表——Doubao-1.5-pro 为例,豆包大模型团队首次披露了其中的技术创新点,给行业带来了「高效模型结构,但超低成本」的另一种思考。

这首先体现在模型架构和训练算法优化上,豆包大模型 1.5 采用大规模稀疏 MoE 架构,并通过训练-推理一体化设计,使得 Doubao-1.5-pro 仅用较小激活参数,即可等效 7 倍激活参数的 Dense 模型性能,远超业内 MoE 架构约 3 倍杠杆的常规效率。

值得注意的是,豆包大模型 1.5 在训练过程中,未使用任何其他模型生成的数据,而是构建了完全自主的数据生产体系,以标注团队与模型 self-play(自提升)技术相结合,高效优化数据质量,提升数据标注多样性和难度,确保数据来源的独立性和可靠性。团队介绍称,「坚持不走捷径」的扎实数据原则体现在后训练、微调、奖励模型、强化学习的各个阶段。

而在这之前,获取高质量数据更常见的方法是通过知识蒸馏技术,把高质量数据快速获取并转移到更小更高效的模型中。只是这样做也有局限,不少论文研究得出,过度蒸馏可能会导致同质化、降低模型多样性,并削弱它们稳健处理复杂或新任务的能力。换言之,蒸馏而来的「学生模型」无法超越「教师模型」,这对于做产品来说可以快速实现模型适配,但对探索 AGI 的上限来说显然是不合适的。

豆包大模型 1.5 发布后,豆包大模型团队在公众号发文称,依托字节在推荐、搜索和广告领域的 A/B Test 经验,他们研发了基于用户反馈的高效 Post-Training 全流程,基于豆包的大规模用户反馈,构建了从问题发现、数据挖掘、人机结合标注到快速迭代的闭环优化系统,实现大模型的数据飞轮。

今天,豆包 App 的 MAU 超过 7500 万,同时豆包大模型还通过火山引擎的大模型服务平台火山方舟提供给千行百业的企业用户,其去年底的日均 tokens 调用量超过 4 万亿,与去年 5 月相比增长了 33 倍。海量的真实数据,结合基于用户反馈的高效 Post-Training 全流程,让豆包大模型在过去一年里飞速进化,成为国内落地进展最快的大模型。

 

02 大模型落地进展最快的一朵「云」

 

去年都在找 AI 的超级应用,也在探索中逐渐形成共识,聊天机器人形态的 App,显然不是 AI 落地的唯一场景。字节跳动也把豆包大模型的能力外溢给千行百业,共同探索并加速 AI 在各个场景的渗透。

火山引擎作为承载这一使命的云与 AI 服务平台,在 2024 年成为大模型落地进展最快的 AI 基础设施。过去两年,它在更好的模型、更低的价格、更低门槛更易用的工具上持续发力,成为迭代最快、最贴近市场需求的基础设施。

这首先体现在 8 个月里多次迭代的豆包大模型家族上。

2024 年 5 月,包括豆包通用模型 pro 和 lite 版在内的 9 个模型正式推出;2024 年 9 月,发布豆包·视频生成模型;2024 年 12 月,豆包·视觉理解模型首次亮相;2025 年 1 月 22 日,豆包大模型 1.5 以及豆包·实时语音模型来了。

在贴合用户需求和使用场景上,豆包大模型家族一方面发布了不同尺寸、性能、推理能力的模型;另一方面,还基于字节跳动多年来的积累和优势场景,发布了语音、角色扮演等方面的专有场景模型。

豆包大模型家族成员|来源:火山引擎

除了模型的全面、多样,火山方舟作为一站式大模型服务平台也在让大模型开发更友好、更专业、更高效上持续发力。

过去一年,火山方舟先后推出了 AI 搜推引擎、更灵活的批量处理方案、应用实验室、RAG 技术和上下文缓存技术等等多种能力,并在高并发算力保障、安全可信会话无痕方案等方面持续升级,有力支撑 AI 大模型从开发到落地应用的全生命周期,降低 AI 应用开发周期和门槛。

还有价格,豆包大模型从服务器集群到 AI Infra 层面的不断迭代,通过算法、软件、工程和硬件结合的方案实现成本的优化,使得豆包大模型在每次面向市场时都做到了同一时间里最低的价格,而且仍然能够获得可观的毛利。

随着火山方舟一站式大模型服务平台在模型效果、性能、最优推理成本、易使用这几方面不断提升,随之而来地,平台上客户调用豆包大模型的 tokens 使用量也在不断攀升。

截止去年 12 月 18 日,豆包大模型的日均使用量达 4 万亿 tokens,与去年 5 月 15 日相比,翻了 33 倍。|图片来源:火山引擎

根据量子位统计的市场数据,2024 下半年国内大模型商用落地日均 tokens 消耗量翻了近 10 倍,从 1000 亿级规模到 10000 亿规模,只用了 6 个月,月复合增长率达到 45%。

其中,只有 1 家云厂商——火山引擎的商用 Tokens 日均消耗量的月均复合增长率超过 60%,近期日均 Tokens 市场份额占比更是超 50%,超过其他玩家份额总和。

增长如此迅猛背后,越来越多 AI 应用选择火山引擎,从 ToC 应用到垂直行业的客户,都通过火山引擎实现了 AI 落地。

此前,AI 内容互动平台——造梦次元创始人、CEO 沈洽金和 AI 图形图像处理软件——Fotor CTO 颜河向极客公园表示,模型选型就是两句大白话:哪个模型成本低就用哪个、哪个模型在场景里的效果好就用谁。

这个标准下,火山引擎成为 Fotor 多云部署、多模型调用的策略下,增长最快的一家供应商,「我们是全球部署,火山一定不是唯一的选择,但哪怕跟火山合作时间不长,其用量增速是有史以来最快的,是其他云厂商的大约十几倍增速」,颜河称。

具体到使用上,他们会在同一个场景里接不同的模型不断做 A/B Test,根据不同模型下的用户反馈指标(比如互动率),决定用哪个模型。

沈洽金举例称,在同一个场景、同一个时间、同一批用户的情况下,不同模型表现之间的差距甚至有 10 倍。但在做了大量的 A/B Test 之后也会发现,基本上性能更好的模型在整个场景里大部分时候都表现优秀,除非和专门做了场景定向调优的模型比。在他看来,这背后是也因为基础模型足够聪明,模型的泛化性当然也会更好。

这样的例子还有很多,在去年底火山引擎发布会上,火山引擎总裁谭也介绍过豆包大模型调用量的高速增长背后,市场的真实反馈与使用分布。

他举例称,在信息处理场景,3 个月内豆包大模型的调用量增长了 39 倍,帮助了企业更好地分析和处理内外部数据;在客服与销售场景,豆包大模型的调用量增长 16 倍,帮助了企业更好地服务客户、扩大销售;在硬件终端场景,豆包大模型的调用量增长了 13 倍,AI 工具增长 9 倍。

而随着模型能力变强、模态变多,也会解锁越来越多的场景。

金融、汽车、教育、互联网、智能终端等等垂直行业中的众多企业都在过去一年通过火山引擎实现了 AI 落地的大发展。

5 年前立项时定位为「你的下一朵云」的火山引擎,正在利用 AI 书写最积极的「超级进化论」,不到一年时间,成为越来越多 AI 实干家们的下一朵云。

 

 

浏览量: 64

Deepseek 升至美区苹果应用榜第六;特朗普:30 天内决定 TikTok 命运;Switch 2 发售时间疑似泄露|极客早知道

DeepSeek 升至美区苹果应用榜第六,曾现短时闪崩

1 月 26 日,DeepSeek 在美区苹果 App Store 免费榜升至第六位,超越 Google Gemini、Microsoft Copilot 等美国科技公司的生成式 AI 产品。

同在昨日,DeepSeek 出现了短时闪崩现象。不少网友反映,使用时遇到「服务器繁忙」的提示。

对此,DeepSeek 回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。不过,官方状态页并未将这一事件标记为事故。

此前 DeepSeek 在美区榜单的排名并无特别突出表现,处于稳步上升阶段,但未进入前十。此次突然蹿升,与其近期一系列突出表现有直接关系。(来源:界面新闻)

或 3 月发布,苹果 iPhone SE 4 机模上手:首次刘海屏+后置单摄

1 月 26 日,综合多方信息,苹果将于 3 月份发布全新 iPhone SE 4 已经基本实锤。目前供应链工厂已经备货,甚至进入量产阶段,各种详细数据也不断确认。

知名爆料人「Majin Bu」最新晒出了 iPhone SE 4 机模,该机是 SE 系列首次引入刘海屏,大大增加了 SE 机型的可用性。

同时也是首次用上 Face ID 人脸解锁,2022 年发布的 iPhone SE 3 也就彻底成为了最后一款采用正面指纹 Home 键的苹果手机。根据爆料,苹果还将屏幕更换为 OLED 材质,这也是 SE 系列首次。

整体来看,iPhone SE 4 是看齐 iPhone 标准版的,但受限于定位和成本,后摄仅有一颗 4800 万像素主摄,用来满足日常扫码、记录等需求。(来源:快科技)

 

特朗普:倾向于未来 30 天内就 TikTok 的命运做出最终决定

1 月 26 日,据新华社援引美媒消息,特朗普在「空军一号」总统专机上与记者们进行了近 20 分钟的交谈。谈到 TikTok 的未来时,特朗普称,很多人正在和他讨论收购 TikTok 的可能性,他倾向于未来 30 天内就 TikTok 的命运做出最终决定。

而在当地时间 1 月 20 日,特朗普签署行政令要求短视频社交媒体平台 TikTok「不卖就禁用」法律在未来 75 天内暂不执行。(来源:IT之家)

 

英伟达宣布冻结对 Maxwell、Pascal 和 Volta 架构的支持

1 月 26 日,英伟达在本月发布的 CUDA 12.8 发行说明中宣布,Maxwell、Pascal 和 Volta 三代 GPU 架构将不再获得新功能更新。这三款架构分别发布于 2014 年、2016 年和 2017 年,代表了英伟达显卡发展历程中的重要阶段。

Maxwell 架构的首批产品包括备受赞誉的 GeForce GTX 750 Ti,广泛应用于中端市场;Pascal 架构则带来了显著的性能与能效提升,并引入了 GP100 大核心,奠定了英伟达计算卡专用核心的基础;Volta 架构首次导入 Tensor Core 张量核心,主要面向企业级 AI 应用。

随着这些架构支持的冻结,未来 CUDA 工具包将持续更新支持的消费级 GPU 将仅剩光追时代的 Turing、Ampere、Ada Lovelace 和 Blackwell 四代。这一决定标志着英伟达进一步专注于最新技术的发展与优化。(来源:DoNews)

 

机构:AI 软件市场规模将在 2024 年增长 32% 至 970 亿美元

1 月 26 日,据Omdia 最新报告指出,人工智能软件市场规模将在 2024 年达到 970 亿美元,较 2023 年增长 32%。该机构预计市场将以 18% 的复合年增长率(CAGR)增长,到 2029 年达到 2180 亿美元。

市场增长源于企业对 AI 两大能力的潜在需求:实现工作流程自动化(以节省时间或成本)以及向客户提供更加个性化的内容(以提高消费者互动和收入)。生成式 AI(GenAI)市场将在 2024 年增长一倍以上,达到 150 亿美元,到 2029 年将达到 730 亿美元,CAGR 为 38%。(来源:36Kr)

德国多家企业因马斯克言行抵制特斯拉新车采购

1 月 26 日,据外媒报道,德国多家知名企业纷纷表示将不再购买特斯拉的新车。

能源供应商 Badenova、房屋建筑公司 Viebrockhaus 及连锁药店 Rossmann 均对特斯拉首席执行官埃隆·马斯克的言行表示不满。

Badenova 董事会成员汉斯-马丁·赫勒布兰德批评马斯克的行为削弱了德国作为商业地点的吸引力,并强调公司在现有车辆租赁期满后将不再采购特斯拉汽车;Viebrockhaus 表示曾认可特斯拉在德国推动电动出行的贡献,但其 CEO 拉尔斯·维布洛克也表示无法继续支持特斯拉当前的发展路径;Rossmann 早在去年夏天就宣布不再为其车队购买特斯拉汽车,理由是马斯克的言论与特斯拉产品所代表的价值观不兼容。特斯拉德国公司对此未作评论,仅表示不予置评。(来源:DoNews)

 

欧盟委员会对 X 平台的初步调查已完成,马斯克恐将难逃一罚

1月 26 日,据德国《商报》道,欧盟委员会已完成对社交媒体平台 X 的初步调查,并预计很快会决定对其罚款,金额可能高达数亿欧元。该消息来源于欧盟三位高级官员。

自 2023 年 12 月以来,欧盟根据《数字服务法案》,对该平台展开了多项调查。该法案对互联网公司实施严格监管。委员会的指控包括:X 平台不遵守广告透明度规定,未向研究人员提供充分的数据访问权限,并通过授予所谓的「蓝 V 认证」误导用户。

如被判处罚款,X 公司将面临高达其全球年营业额 6% 的罚款。(来源:IT之家)

 

抖音发布 2024 年平台治理报告:严打虚假信息与网络水军

抖音近日发布了 2024 年平台治理报告,详细披露了其在内容管理方面的多项举措与成果。报告显示,2024 年抖音累计处理虚假谣言 452 万条,处置涉企谣言视频 4.8 万条。针对老年人易受骗内容,平台日均下架违规视频 5000 余条,并通过电话提醒高风险用户,每日成功劝阻约 1 万人。此外,抖音与百家媒体合作,联合发布辟谣热点 1200 余个,总播放量达 26 亿。

在打击网络水军方面,抖音全年封禁违规「水军」账号 110 万个,日均拦截违规信息 6200 万次,并向警方提供线索,协助抓捕犯罪嫌疑人 90 名。

抖音计划进一步升级算法,打造谣言治理闭环机制,确保用户在观看谣言后能及时接收到准确的辟谣信息。(来源:快科技)

 

TikTok 恢复运营后陷入「审查风波」,官方回应

1 月 26 日,据路透社报道,在恢复运营后,TikTok 用户感到该平台的审查力度加大,使用体验「与以前不同」。针对这一情况,TikTok 回应称,这只是暂时的不稳定。

TikTok 回应称:「我们的政策和算法在周末并未改变,我们正在努力使美国业务恢复正常,在恢复服务的过程中,预计会出现一些暂时的不稳定情况,这可能会影响 TikTok 的功能或用户对该应用的访问。」

本周,特朗普签署了一项行政令,延缓了 TikTok 禁令的执行期限。之后,TikTok 在美国重新恢复运营。然而,某些用户表示,他们发现直播变少了,一些活动因违反社区准则而被删除或标记的频率更高了,其中包括一些以前被允许的行为。

一些用户称,他们现在看到了更多的内容审核,比如搜索结果受限,以及有关错误信息的警告和提示用户核实信息来源等情况。(来源:凤凰科技)

百川智能开源全模态模型 Omni-1.5 上线,称多项能力超越 GPT-4o mini

1 月 26 日,百川智能宣布正式上线 Baichuan-Omni-1.5 开源全模态模型。该模型不仅支持文本、图像、音频和视频的全模态理解,还具备文本和音频的双模态生成能力。在视觉、语音及多模态流式处理等方面,Baichuan-Omni-1.5 的表现均优于 GPT-4o mini。

官方宣称,其在视觉、语音及多模态流式处理等方面,Baichuan-Omni-1.5 的表现均优于 GPT-4o mini;在多模态医疗应用领域,其具备更突出的领先优势。

Baichuan-Omni-1.5 不仅能在输入和输出端实现多种交互操作,还拥有强大的多模态推理能力和跨模态迁移能力。

其在音频技术领域采用了端到端解决方案,可支持多语言对话、端到端音频合成,还可实现自动语音识别、文本转语音等功能,且支持音视频实时交互。

据介绍,在视频理解能力方面,Baichuan-Omni-1.5 通过对编码器、训练数据和训练方法等多个关键环节进行深入优化,其整体性能大幅超越 GPT-4o-mini。(来源:界面新闻)

 

史上最大 AR/AI 眼镜众筹项目出炉,Halliday 上线 3 天刷新纪录

1 月 26 日,据 Kickstarter 消息,在 2025 CES 上引发轰动的 Halliday AI 眼镜已完成超过 137 万美元的众筹,创下 AI/AR 眼镜行业众筹新纪录。该项目于北美时间 1 月 22 日启动众筹,仅用 3 天便完成了 6861% 超额认购。Halliday 是由中国最大彩瞳品牌 moody 核心团队孵化并独立运营的智能穿戴品牌,其 CEO 慈然同时担任 Halliday Holdings CEO。

Halliday 首代产品由 Halliday 团队与新加坡 Gyges Labs 联手打造,是全球最轻(35g)、续航最长(12 小时+)的 AI 显示智能眼镜。产品采用 Gyges Labs 独家研发的 DigiWindow 显示技术,通过全球最小的近眼显示模组将 Micro LED 显示屏光线投射到视野右上角,隐形显示不被察觉,同时解决了传统波导方案的彩虹纹、漏光等问题。这一创新技术让 Halliday 成为首款真正实现日常佩戴的 AI 眼镜。

Halliday 眼镜零售价为 489 美元,Kickstarter 支持者可享 399 美元的优惠价格,并获免费定制镜片服务(支持度数)。(来源:PingWest)

 

三星研发无创连续血糖监测设备,有望革新健康管理

1 月 26 日,三星在美国加利福尼亚州圣何塞举办的 Galaxy 技术论坛上,移动体验业务数字健康团队高级副总裁 Hon Pak 博士透露,公司正在研发基于光学技术的无创连续血糖监测设备。这一技术被誉为现代健康追踪领域的「圣杯」,将为糖尿病患者及普通用户提供革命性的健康管理方案。

Hon Pak 博士表示,虽然具体发布时间尚未确定,但对当前进展感到非常兴奋。如果成功,这将是改变游戏规则的技术。该设备将利用光学技术,可能与现有 Galaxy Watch 或 Galaxy Ring 中的传感器结合使用。不过,初期阶段传感器尺寸较大,需作为独立设备推出。

目前,血糖监测主要依赖有创方法,如针刺采血或体内植入传感器,这些方法不仅不便,还存在感染风险。无创技术的突破将极大改善患者生活质量,并为普通用户提供监测血糖波动的可能性,例如追踪饮食相关的血糖峰值变化。(来源:DoNews)

芬兰零售商泄露 Switch 2 或将于 5 月 9 日发售

1 月 26 日消息,任天堂 Switch 2 的发售日期可能已被零售商泄露,该消息来自芬兰知名零售商 Konsolinet,他们已经将 Switch 2 的售价定为 999 欧元,这无疑是一个占位符价格,但奇怪的是,其发售日期却并不像是一个占位符日期。

占位符日期可能会是「2025 年」或任何给定月份的第一天或最后一天,例如 2025 年 6 月 1 日或 2025 年 5 月 31 日。相反,该零售商将 Switch 2 的发售日期定为 2025 年 5 月 9 日,这是一个非常具体的发布日期。

有趣的是,这个日期是星期五,与 Switch 发售的那一天一样(2017 年 3 月 3 日),并且这一天还是全球 Switch 2 线下体验会结束的日子。(来源:3DMGame)

浏览量: 20

文章分页

上一页 1 … 45 46 47 … 85 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间