Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

分类: 科技

WPeMatico Campaign中添加的类别

短剧出海的秘密:ReeIShort如何让外国人爱上「霸总」?

整理|连冉

编辑|靖宇

 

头图来源:ReelShort

 

在内容面前,全球观众的相同性远大于不同,当短视频网站和 APP 席卷全球之时,影视剧的制作和展现形式也因为这个新型媒介的诞生而发生变化,让国内网友趋之若鹜的短剧,也在让外国网友废寝忘食。

在这一全球化趋势的背景下,ReelShort作为一个面向海外市场的短剧平台,到今年 9 月已实现全球双端内购收入约 1.42 亿美元,是 2023 年全年收入(2888 万美元)的 4.92 倍,增长势头强劲。

ReelShort是CMS于2022年面向海外推出的短剧产品,也是首家将国内一分钟短剧落地北美市场的平台,其母公司CMS(枫叶互动)旗下还拥有多个面向C端用户的其他产品,包括互动式视觉阅读平台Chapters、动画产品Spotlight、浪漫小说平台Kiss 等。

在极客公园 IF2025 创新大会上,Crazy Maple Studio 副总裁南亚鹏在主题演讲中详细回顾了ReeIShort从进入海外市场到获得成功的历程,阐述了中国制造的短剧为何能够在海外市场脱颖而出,并分享了未来海外市场还有哪些机会。

 

以下为南亚鹏核心观点摘录:

  • 海外用户对短视频的接受程度越来越高;较强的付费意愿;碎片化时间消费的需求增长;偏好紧凑、富有节奏感的内容;特定题材的吸引力——这些都是海外市场短剧能做起来的原因所在。
  • 作为海外短剧市场的领先者,ReelShort对爆款定义类似于游戏行业的思路,主要关注三个关键维度:吸量(引流)效果,引流效果直接影响剧集是否能成为爆款;留存率,高留存率代表剧集具备较强的吸引力和内容粘性;变现能力,用户进入平台后,是否愿意为内容付费,成功的爆款需要在用户付费上有显著表现。
  • 一个爆款短剧,必须在上述三个维度上都表现出色;当这三者协调并达到最佳效果时,一个大爆款就出现了。
  • 目前,海外市场的主要制约因素是优质本土自制内容的稀缺。虽然北美市场占主导地位,东南亚市场也在逐步发展,但整体市场对于本土高质量自制内容的需求仍然非常强烈且供给不足。
  • 海外市场目前处于供不应求的状况,国内企业可以通过开发本地化APP;在当地制作短剧内容再通过平台分发;与短剧平台合作,将短剧及长剧内容推向全球观众;品牌植入等方式抓住海外市场的机遇。

预计未来几年,短剧出海市场规模有望达到百亿美元级别,海外市场供需不平衡的现状,对国内出海企业来说,正是机遇所在。

以下为南亚鹏在极客公园 IF2025 创新大会上的演讲实录,由极客公园整理。

 

南亚鹏:今天我来跟大家回顾一下 ReeIShort在海外做海外短剧的一些经历与收获,以及对于未来海外短剧市场发展的一些看法。

今天的主题是《微短剧为什么能够在海外收获海外观众》,回顾在海外推广微短剧的历程,最早可以追溯到两年前——2022年8月,CMS推出了ReeIShort微短剧APP。

在此之前,CMS已经在美国市场运营了7年的内容公司,专注于互动视觉小说类游戏,并且取得了较为显著的市场成绩,成为细分赛道的头部产品,用户粘性较强。到2020年,CMS开始涉足网文产品,直到2022年正式进入海外微短剧市场。

在当时,中国的微短剧市场也正处于快速发展的初期阶段。那么,为什么CMS会选择从海外市场切入微短剧呢?这与CMS自身的海外经历密切相关。

接下来,简要回顾一下CMS在海外市场推广微短剧的历程。ReeIShort微短剧APP于2022年8月上线,实际上,早在2022年初CMS就开始了内部立项。

在产品正式推出后,我们首先面临的挑战是如何丰富内容,找到能够打动海外观众的微短剧形式。在这个过程中,我们进行了大量的探索,经过约10个月的努力,直到2023年6月,我们通过一系列剧集尝试在YouTube平台进行推广,其中每集时长约1分钟的短剧集在三天内便获得了几百万的播放量。这给了我们很好的信心,我们看到海外用户对微短剧这种产品也能够接受。

随后,我们借助在游戏产品中积累的流量投放能力,采用类似的推广模式,不断复制和优化我们的内容。到了2023年第四季度,我们看到市场开始关注ReeIShort这款产品。在美国苹果应用商店和安卓应用商店,ReeIShort的下载量一度跻身榜单前列。在这一过程中,TikTok及其他平台也体现了微短剧内容的受欢迎程度,进一步增强了我们对海外市场潜力的信心。

《Trailer – Never Divorce a Secret Billionaire Heiress Full Movie》|图片来源:ReelShort

 

这是新放的一部当时在 YouTube 上表现非常好的剧集,大家可以感受一下。

大家看了这个剧集,是不是感觉很有中国短剧的元素在里面?其实这是我们去年做的一些尝试,通过这些剧集让我们看到了海外市场的用户对中国微短剧的形式有一个比较好的接受度,所以后面我们自己在产能提供上不断地加大这方面的投入。

海外用户为何也爱短剧?

我们自己也分析了一下,为什么海外的用户会喜欢微短剧。

1. 整个海外用户对短视频的接受程度越来越高,像 TikTok、YouTube 等很多竖屏的短视频在欧美普及程度越来越高,让微短剧这一内容形态得到了更好的接受和认可,为中国微短剧在海外市场的推广提供了良好的基础。

2. 较强的付费意愿。海外用户的付费能力比较强,对于微短剧这种新产品形态,他们也愿意进行付费,这也是能把海外微短剧做起来的一个重要的推动因素。

3. 碎片化时间消费的需求增长。在消费上来讲,区别于长剧,现在用户对于碎片化时间的消费需求越来越重。通过短视频,通过 TikTok,可以看到用户对于碎片化时间或者优质碎片化时间的内容是非常渴望的,这也是海外用户喜欢微短剧的一个重要的因素。

4. 偏好紧凑、富有节奏感的内容。从内容消费上来讲,用户更愿意看到节奏非常紧凑,情节反转,包括爽点比较密集的产品形态。 TikTok 里面已经有很多这样的内容,微短剧做的比 TikTok 上免费的内容更加精致一些,它里面的内容爽点会更加经过细心的设计,能够让用户很快地、高效地在很短的时间内得到满足。

5.特定题材的吸引力。 在题材选择上,微短剧在海外市场有着较大的潜力,尤其是女性题材、狼人、吸血鬼、大女主反转、隐藏身份等类型。

ReelShort一直在做新内容的尝试,希望能有更多的品类、题材的内容能够扩圈现有的用户,毕竟海外微短剧的 APP 主要是满足用户对于内容的消费。

跟大家汇报一下整个大致的市场规模。

2023 年,ReelShort收入规模大概是 1.7 亿美金,累计下载 5000 多万次,已经能够验证出这会是用户真实喜爱的一种形态。

 

图片来源:ReeIShort 

这是中国市场的规模。两三年的时间,中国微短剧的收入已经超过了中国电影票房的收入规模。

再看海外,2024 年的时候,光看 2024 年上半年,对比 2023 年有 10 倍以上的增长,2024 年截至到上半年月度流水收入,ReelShort通过 APP 充值的流水收入已经达到了 1 亿美金,现在月度收入已经在 1.5 亿美金以上,全年的规模会在 15 亿-20 亿美金之间。

回顾最初进入微短剧行业的动机和思考,其实是基于CMS在内容领域积累的经验。因为我们一直在做内容,我们希望通过网文、网游和微短剧,构建一个内容生态的闭环。

CMS的内容生态闭环|图片来源:极客公园

 

网游是我们比较早做的一个产品,第一款产品是互动视觉小说的游戏产品。后来我们又做了网文的产品,当时网文产品有很多优秀的作品经过深度化的改编推向了海外市场。

这让我们建立了一个信心,很多中国的内容和产品形态,在海外是有相当大生存空间的,特别是当我们做网文的时候,我们发现在网文变现方式上来讲,还有网文内容的情节设计,对于海外用户来讲还是比较新颖的。

过去在我们做海外网文之前,海外的网文通常都比较短,没有像中国几百万字的长篇网文,我们把中国的网文经过深度改编,世界观改编以后,推向海外用户的时候,用户是非常喜欢的。

正是基于这两款产品的成功经验,我们看到了可以将之前的积累应用到微短剧这个新领域的巨大潜力。我们之会有一个漏斗模型,优秀的故事首先来自于网文,验证了这些故事的市场潜力之后,我们再尝试进行游戏化改编,进一步验证这些故事的变现可能性,最后才会考虑投资制作短剧,特别是考虑到好莱坞短剧制作的成本较高,我们在这一过程中会更加谨慎和精细化地运营。

经过两年的发展,这一模型也在不断调整和完善。大家知道微短剧现在在海外的产品形态上是大 DAU 的产品,相对于网文来讲,它的门槛是非常低的,它的用户群是更大的,我们现在也在尝试很多故事,观众看完微短剧以后,我推给用户,喜欢玩游戏的用户,可以玩互动视觉小说游戏,就像奈飞上现在播完剧以后,底下也会出一些游戏产品,另外喜欢看网文的观众可以在看完我们的短剧之后,可以到网文里面看更完整的故事。所以短剧现在其实已经在给我们其他的产品引流了。

ReeIShort商业探索之路

最初,在我们开始制作微短剧时,投入的资源相对有限。在2022年,我们不仅参考了中国微短剧小程序的发展模式,还对标了海外一些竖屏短剧尝试的企业。

Quibi就是一个典型案例,它成立于2017年,由梦工厂创始人创立,它的目标是做竖屏版的奈飞,当时融了十几亿美金,得到了好莱坞主要Studio的投资,并投入了两年多的时间打造片库,最终在2020年上线。然而,经过半年多的市场尝试后,这个项目宣告失败。

当时可能很多人会说用户是不是真的会喜欢这种微短剧的形式?其实我们自己在做这个市场的时候跟它进行了对比和对标,我们正是在比较有限资源的情况下,更多的是用一种移动互联网的打法去做这款产品。

首先根据我们自己的资源禀赋,优先切入我们最熟悉的用户,之前做Chapters 产品时,我们对欧美女性用户有着较深入的了解,因此决定将她们作为目标用户,以她们偏好的内容为主打,而不是一开始就选择更广泛的市场。通过这种细分市场的切入,我们能够更精准地触达目标观众。

在付费模式上,我们也没有像Quibi那样一开始就采用订阅制,因为在初期,内容量较少时,很难让用户一开始就接受订阅形式。所以我们采取了更灵活的付费方式,比如说分集解锁进行付费,用户在这个过程中不喜欢看了可以随时离开,这为用户提供了更多的选择权。

这些策略让我们能够在初期有限的资源投入下,持续摸索市场需求,最终探索出一种可持续发展的商业模式。

做剧、做视频,大家都希望能够出爆款,但作为一个平台方,我们自己在做自制内容的时候,我们给自己的爆款定义有点类似于游戏行业的一些思路,主要关注三个关键维度:变现性、吸量性以及留存。

吸量是说我们做微短剧的是用很多短剧剧集来进行引流,投放的效果是不是很吸量,这是能够决定你的剧是不是能成为一个爆款的关键因素。

留存是指用户观看剧集后是否会继续留在平台,是否会观看多集,甚至会持续关注更多剧集。良好的留存率意味着用户对剧集的兴趣和内容的粘性较强。

最后是变现,用户进入平台后,是否愿意为内容付费。

一个爆款短剧,必须在这三个维度上都表现出色。当这三者协调并达到最佳效果时,一个大爆款就出现了。

《The Double Life of a Billionaire Heiress》|图片来源:ReelShort

 

目前,我们已经拥有了一些在全球范围内播放量突破亿次的作品。像《the Double Life of a Billionaire Heiress》这部剧,其生命周期已超过一年,而且流水收入已经可以跟一些电影的票房收入媲美了。除此之外,我们还有《Baby Just Say Yes》等改编自中国故事的作品,通过深度改编,邀请欧美演员参与拍摄,效果也非常好。

我们也在不断尝试新的题材,《Breaking The Ice》是部冰球题材的短剧,结合了运动题材,在今年8月的奥运期间,取得了非常好的成绩,播放量一度超过了当时奥运转播的一些平台。

目前看到海外用户对于欧美本土自制的内容,需求量非常大。ReeIShort 今年主要解决的是如何建立海外微短剧的工业化产能的布局,主要是通过自己扩建自己的团队,包括在日本、韩国找一些公司合作,迅速地拉升产能,目前每周能够上线 4 部剧,这些给了用户一个比较好的正向预期,因为用户希望进入到 ReeIShort 平台上总是能够看到一些新的内容。

做了两年的时间,ReeIShort 在欧美用户的心智中有了一些品牌的认知,很多用户会开始陆陆续续到平台上搜索一些新剧,可能这些新剧不一定是我们自己自家去做的,但用户慢慢在认为 ReeIShort 可能是一个微短剧的精品平台,大家会在这个平台上找到自己喜欢的优秀内容,也是因为这个原因,美国的《时代周刊》也把ReeIShort评选为「2024 年最有影响力的全球 100 家公司」,也是说海外的媒体上已经看到了这种微短剧的形态很可能对于整个视频分发行业会有巨大的变化。

海外市场还有哪些机会?

刚开始介绍到,我们一个好的故事会在三个平台上,网文和网剧同时进行变现,前面的嘉宾也介绍了,如何把 IP 更好地变现,提供更好的价值,我们目前在做这方面的尝试,短剧播放完以后,网文和游戏都可以有进一步的变现。

ReeIShort一直跟中国的一些出海的合作伙伴们在合作,特别是中国这两年诞生了非常多优秀的中国短剧,我们会把这些短剧有两种模式,一种模式是经过翻译配音推向海外市场,另外一种模式是将这些短剧的剧本,包括一些网文经过改编,请美国演员进行拍摄,这给整个市场上半年带来了 1000 亿人民币以上的回报,可以看到不管是中国的翻译剧出海,还是中国剧本的改编,海外都有非常好的市场。

我们也在跟中国头部的出海公司企业来联合合作,游戏和电商通过短剧进行植入,帮他们进行推广,同时也跟 OPPO、VIVO 等一些手机端的厂商合作,能够很好地丰富他们应用商店里面的内容。

目前,海外市场整体上来讲,内容稀缺是制约这个市场发展的一个非常关键的因素。整个市场目前还是以北美为主,东南亚市场也在不断发展跟进过程中。但整个大盘上来讲,大家对于优质本土的自制内容是非常渴望和稀缺的。

海外市场存在供需不平衡,我们分析有几个方面,国内出海的伙伴们有可能会介入到这个市场里面:

  1. 可以在特定的区域市场布局开发自己的 APP,但这个前提可能要求这些开发商最好是之前有过类似市场的产品,对于本地市场的用户有比较深入的了解。
  2. 短剧内容创作者可以在当地进行制作,再在平台上进行分发,包括在日本、韩国、东南亚、北美等地区,创作者可以提供优质内容来丰富整个市场,也能够从中获得非常好的回报。
  3. 国内内容版权方可以将自己的短剧,包括长剧来跟短剧平台进行合作,通过短剧进行分发到全球主流用户的观众面前。
  4. 品牌企业,特别是出海品牌企业,无论是游戏,还是电商,都可以通过短剧平台进行品牌植入。我们之前跟腾讯有一些合作,进行过品牌的植入,这种品牌植入也能够通过短剧帮助把产品推广到最主流的欧美人群面前,也是一个双赢的方式。

以上,大家都可以一起参与到海外微短剧发展的进程。

 

浏览量: 45

999 元的 AI 眼镜来了,闪极拉开「百镜大战」序幕

作者 | Li Yuan 

编辑 | 郑玄

 

2024 年最火的 AI 硬件之一,当属「Ray-Ban Meta」智能眼镜。在出货量突破 100 万台后,科技界的人们迅速意识到,这非常可能是智能硬件的下一个超级品类。

笔者自己 自费购买了一台 之后,在生活中,无意种草的概率也高的惊人。不过,对于被种草的人,笔者经常补充一句,如果不着急的话,可以等等国内的仿款——「Ray-Ban Meta」智能眼镜虽好,但是由于众所周知的原因,语音功能的使用时常受限,AI 功能的开启更是相对较难。

业界消息一直显示,国内目前有数十款甚至上百款「Ray-Ban Meta」智能眼镜的仿款正在研制。年末,包括百度、小米、雷鸟等知名厂商更是宣布了自己的无显示功能的 AI 眼镜计划。

而跑的更快的小厂,则已经拿出了自己的产品。12 月 19 日,闪极科技在深圳举办发布会,正式推出了首款产品「AI 拍拍镜」,并表示将是中国 AI 眼镜的首批量产产品。

从产品功能和外观而言,「AI 拍拍镜」几乎完全对标「Ray-Ban Meta」智能眼镜,而价格则约为「Ray-Ban Meta」智能眼镜的一半——前五万台共创版的价格为 999 元,还可以通过打卡返现金券。优惠的价格,导致发布会后没多久,各平台的预定链接已经全部卖空下架,而闲鱼上已经挂上了不少 1499 的原价链接。

虽然硬件较「Ray-Ban Meta」智能眼镜更便宜,闪极留下了软件使用付费的商业模式的空间——两个 AI 功能,AI 闪极和 AI 云盘,年订阅价格 299 元,不过首年免费。

极客公园在线下参与了闪极的发布会,简单体验了产品,并采访了闪极 CEO 张波。

张波是魅族手机的老兵。2020 年,张波成立闪极,最出名的产品为充电宝系列。闪极的充电宝走高端路线,利润率较高。2024 年,闪极年度营收达到接近 2 亿,60% 的产品销量在海外。

在采访中,张波发表了不少对 AI 眼镜的行业观察,并透露商业数据:闪极预期第一年能够卖 50 万台 AI 眼镜,就能做到盈亏平衡,而目前手里已经掌握大量订单,已经完成了明年的大部分销量。

 

01

AI 拍拍镜:长续航是亮点

 

闪极此次发布的眼镜,本身与 LOHO 眼镜合作生产。首批发布,主要为黑色镜框款。预计春节期间,可在千家线下 LOHO 店体验到闪极的产品。

闪极介绍,目前选择黑色树脂材质,主要是出于量产的考虑。金属和板材材料大批量生产相对更加困难。不过明年闪极预计还将推出数十款其他款式的 AI 眼镜。

对于一款 AI 眼镜,人们最关心的问题之一,就是重量。在这点上,闪极的 AI 眼镜和「Ray-Ban Meta」智能眼镜相差不多,重约 50g。在目前国内生产的 AI 眼镜中,不算最轻便的一批。

闪极似乎在重量和续航上做了一个取舍,选择了比普通眼镜(15-30g)更重的重量,但是使用了更高的电池容量,增强续航时间。同时闪极也采用了平衡性的设计,宣传让眼镜戴起来像 30g。在短暂的试戴中,笔者确实觉得第一感觉比「Ray-Ban Meta」智能眼镜稍轻一点。

拍照是闪极重点发力的领域。

搭载索尼 1600 万像素、123 度超广角装置摄像头模组。从拍照参数上,闪极的 AI 眼镜比起「Ray-Ban Meta」智能眼镜有微弱优势。而摄像上是 1080p,30 帧,与「Ray-Ban Meta」智能眼镜一致。

极客公园没有实测到拍照效果。不过以「Ray-Ban Meta」智能眼镜作为对比的话,目前的 AI 眼镜基本上拍照处于刚刚可用的阶段,微弱的优势对于习惯了高清拍照的用户而言可能不会有太明显的感知,不过如果比「Ray-Ban Meta」智能眼镜的拍照更弱,则可能用户更容易有比较明显的感知。

视频单次录制时长 1-5 分钟可调,目前还没有直播功能——团队表示并不是技术问题,而是目前并没有平台合作直播接口,如果有直播接口可以马上更新直播功能。

与「Ray-Ban Meta」智能眼镜相比,一个有趣的地方是闪极的录制为横屏,而「Ray-Ban Meta」智能眼镜的录制为竖屏,如果接入直播功能的话,后续可能会有些不同的影响。

虽然整体产品对标「Ray-Ban Meta」智能眼镜。几处细节,仍然能体现出闪极在做 AI 眼镜时,还是有加入自己的思考。

首先是长续航功能。

除了前面所述的闪极 AI 眼镜本体的 450 毫安的电池设计,闪极还推出了一个略不优雅但很实用的长续航解决方案——增程环。

增程环挂在脖子上,相当于眼镜的一个移动充电器,使用磁吸式接口,可以边充边戴,保证眼镜能够保证更长续航。

虽然这一设计略微诡异,但是对于目前智能眼镜的佩戴者而言,续航确实是一个绝对的痛点。

笔者自己佩戴「Ray-Ban Meta」智能眼镜时,基本上只要有在认真使用语音/拍照功能,续航只能维持半天左右。而对于近视程度比较深的用户而言,眼镜是时刻必须佩戴的必需品。极客公园之前采访 AI 眼镜的重度使用者时,曾发现有使用者为了全天保持佩戴 AI 眼镜,购买三幅 AI 眼镜轮换佩戴。

闪极还表示,未来增程环可能还将辅助增加眼镜的存储和算力。看起来增程环这一设计,可能将长期在闪极眼镜中存在。

其二是眼镜盖的设计。

闪极为眼镜增加了几种不同的磁吸眼镜盖设计。其中一些眼镜盖可以用来使眼镜一秒变墨镜,更具时尚感。闪极还专门设计了一个眼镜盖,用来遮挡摄像头。

不得不说这是一个很前瞻性的设计。当拍照眼镜迅速普及,偷拍者也在不停地试探硬件的边界,可能导致人们对于拍照眼镜本身,可能会越来越在意。磁吸变普通眼镜的功能,在现在似乎还不是一个对消费者很重要的功能,但确实能体现团队对于拍照眼镜,是有深入思考的。

第三,AI 功能的设计。相对于「Ray-Ban Meta」智能眼镜,闪极更强调」记忆「这个概念。除了一个拍照眼镜,它也想做一个录音笔,想做到之前 limitless.ai 类产品能做到的全天候记录的功能。

而目前,已经能尝试的功能是 AI 闪记功能。可以用语音告诉大模型一个车牌号之类的信息,之后可以直接问模型,我之前记录的车牌号是什么。

闪极还推出了 AI 云盘的功能。如果用户不选择云盘服务,则可以用机身储存存储视频,而选择 AI 云盘服务,则可以在线储存视频,未来有机会使用视频推理功能,真正从视频中,快速找到自己的回忆。

相对于拍照等硬件的设计,团队对 AI 功能的设计是有前瞻性的,不过在目前的版本,体感上 AI 目前真正能实现的功能还不多。

在短暂的现场测试中,笔者没有能够很好地测试到闪极的音频功能。不过有一点似乎有些遗憾,相比于「Ray-Ban Meta」智能眼镜,目前闪极的眼镜还不能蓝牙播放音乐,只能播放机内存储的音乐。

 

02

巨头为 AI 做眼镜,小厂为眼镜找 AI

 

在发布会后的群访中,闪极也回应了许多外界关心的问题。

作为第一个发布量产级别的 AI 眼镜的厂商,闪极 CEO 张波表示,目前虽然有不少 AI 眼镜厂商都在研制 AI 眼镜,但是做 AI 眼镜,其实卡点很多。

「AI 眼镜的生产难度的是非常高的,是无法复用手机过去的供应链的。它的精细程度,它的材料体系都完全不一样。每个环节都可能成为卡点。」张波表示,「很多产品对标「Ray-Ban Meta」智能眼镜,但你要 1:1 复制「Ray-Ban Meta」智能眼镜是不可能的,Meta 用的高通的芯片,我们都用不了。」

闪极在这点上实际上是选择与紫光展锐合作生产芯片,和索尼一起重构了整个摄像头的架构,保证了眼镜的摄像头能够低功耗运行,同时做到防抖。

闪极也回应了产品搭载大模型的问题。

在闪极产品发布之前,有很多猜测闪极的 AI 眼镜将搭载哪个大模型。闪极最后的选择是,不搭载某个单个的大模型,而是根据不同的功能选择不同的大模型来搭载。

张极直言这是一个商业化的问题,「现在大部分大模型都在倒贴我们用,我们为什么不用?」

搭载云端大模型,也暂时不会对产品本身的端侧调优造成影响。张波表示,目前端侧的双系统,无论主系统活跃还是休眠,端侧都可以做到拥有所有的唤醒词和功能指引词。张波表示,端侧的语音识别能力甚至比 Meta 更强,能识别更多的指令。

「什么时候自研模型?很明确,当我们用第三方模型没有自己自研模型便宜的时候。」张波表示。11 月刚刚有消息,零一万物联合创始人潘欣出任闪极科技合伙人。潘欣曾是 Google Brain 的首位研究软件工程师,后先后在百度、腾讯与字节跳动做 AI 模型的开发。

事实上,在 AI 眼镜这款硬件开始露出潜力后,曾有不少人判断这将是一个巨头的生意。

正如当年的 AI 音箱一样,对于巨头来说,硬件上能不能挣钱,并不是首要考虑的问题。能够占据下一个时代人们智能硬件的入口,能够获取人们的交互数据,才是巨头们更关注的问题。

如果 AI 眼镜真的能成为下一代智能硬件,其贴身性,always-on 的特征,注定会带来非常多个性化的数据,而且是全新的,互联网上没有的数据,这是对于巨头而言,最重要的。而相比之下,巨头可能愿意为了入口的重要性,为了能够让自己的 AI 获得最好的数据,不关注硬件本身的利润,甚至补贴硬件,低价获取市场占有。

在这样的逻辑下,一直推动 AI 眼镜前行的,也一直是 Google,Meta 这样的巨头企业。而一向不太涉及硬件的字节跳动,也在 AI 技术成熟之后,开始研发 AI 耳机,行业普遍认为字节跳动也在同时研发 AI 眼镜。

而此次闪极的发布,则让我们看到,行业的另一极也正在发力。目前团队只有一百多人的闪极,相比于巨头可以说是一个小厂。不过通过一年前的提前立项和对于供应链的熟悉,闪极成了中国第一批能够量产 AI 眼镜的品牌。

闪极背后不止是闪极。在会后采访中,张波表示,闪极在和供应链的合作中,得到了不少支持。甚至有些合作伙伴,做到后来可能并不会在这款产品上获得太大利润,但大家都认为这可能是一款增长的产品,是未来的发展方向,因此也愿意配合。

闪极表示,当时开始融资后,一个月就拿了一个亿的融资。对于投资人而言,也是一样。AI 眼镜承载着增长的希望,而不能投资大厂的投资人,如果仍然想投资这个方向,将资金汇聚起来,投资跑的快的小厂,似乎也可一博。

相对于巨头而言,这些站在闪极背后的人,更像是看到了 AI 眼镜所带来的机会,以硬件出发,想做出一款可用的产品。而 AI,只是产品的一环,能够采用拿来主义先让硬件跑起来,卖得动,不断迭代硬件才是更重要的。

拿到了速度优势的闪极,能否率先利用补贴和硬件设计,卖出足够多的 AI 眼镜,支撑硬件不断迭代,与大厂相抗衡呢?

目前,谁都还无法判断。闪极似乎也已经意识到了它所面对的未来,在发布会开始前,门口摆放了一个巨型的大卫雕像。这场战役,是大卫与巨人格利亚的对抗。是巨人获胜?还是弱小的大卫获胜?战役的序幕已经拉开。

*头图来 源:闪极

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

浏览量: 68

传 GPT-5 开发不顺;蔚来第三品牌新车首秀,预售价 14.88 万元;广电总局要求加强微短剧片名审核

OpenAI 开发其下一个主要模型 GPT-5 的努力正落后于计划

据《华尔街日报》最新报道,OpenAI 开发其下一个主要 AI 模型 GPT-5 的努力正落后于计划,其结果还不能证明巨大的成本是合理的。这与 The Information 早些时候的一篇报道相呼应,该报道称,由于 GPT-5 可能不像以前的模型那样代表着巨大的飞跃,OpenAI 正在寻求新的战略。

但《华尔街日报》的这篇报道包含了有关代号为 Orion 的 GPT-5 历时 18 个月的开发过程的更多细节。

据报道,OpenAI 已经完成了至少两次大型训练运行,其目的是通过对大量数据进行训练来改进模型。最初的训练运行比预期的要慢,这暗示着更大规模的运行既费时又费钱。据报道,虽然 GPT-5 的性能比前代产品更好,但它的进步还不足以证明维持模型运行的成本是合理的。

《华尔街日报》还报道说,OpenAI 不仅仅依赖公开数据和授权协议,还雇人通过编写代码或解决数学问题来创建新数据。此外,OpenAI 还使用其另一个模型 o1 创建的合成数据。

OpenAI 没有立即回应置评请求。该公司此前曾表示今年不会发布代号为 Orion 的模型。(来源:cnBeta)

业界首款面向全场景数智安全,华为等 15 家单位联合宣布 openHiTLS 密码套件开源

12 月 22 日消息,据「华为开源」官方消息,2024 开放原子开发者大会暨首届开源技术学术大会昨日(12 月 21 日)在武汉召开。

来自西安电子科技大学、山东大学以及华为等 15 家单位联合宣布 openHiTLS 密码套件开源。

据介绍,openHiTLS 是业界首款面向全场景数智安全、独立创新的开源密码套件,有以下特点:

  • 算法丰富:openHiTLS 提供丰富的算法原语、高性能商密算法、数字证书与安全协议能力,支持应用平滑迁移到后量子算法
  • 剪裁灵活:openHiTLS 打造开放架构,分层解耦,可灵活裁剪,支持应用快速迁移和算法演进
  • 性能卓越:openHiTLS 提供代数、指令集优化和硬件卸载能力,软件优化和硬件加速齐下
  • 安全可靠:全面的开发和测试活动及先进的形式化和侧信道验证技术,确保 openHiTLS 安全可靠
  • 全场景应用覆盖:openHiTLS 支持商密 / IETF / ISO 等国内外标准,通过灵活可裁剪架构,全面覆盖从云端到终端,从 IoT 到 5G 等各类应用场景,保护数据安全

会上同时发布了 openHiTLS 密码开源社区治理架构,正式成立社区技术委员会、用户与生态发展委员会。通过社区开源合作,促进密码技术的创新与共享,降低企业密码技术研发成本,加速密码技术的普及与应用,形成国际交流与合作。(来源:IT 之家)

 

库克在最新采访中谈及公司是否考虑过投资 OpenAI

苹果首席执行官蒂姆・库克在接受《连线》杂志采访时讨论了广泛的话题,包括 Apple Intelligence 的帮助有多大,以及他是否考虑过投资 OpenAI。

库克表示,苹果内部从未讨论过 AI 收费的问题。他认为,AI 如同多点触控技术一样,是推动技术革命的基础功能,而非盈利点。

该媒体报道称苹果公司将 AI 视为类似多点触控的基础技术,并非直接盈利工具,而是推动产品创新和提升用户体验。库克的这一表态也凸显了苹果与其他 AI 公司的差异化战略。

 当被问及苹果公司是否有意投资 OpenAI 时,库克表示,公司从未忽视过这家初创公司的存在,但如果做出了这样的决定,那将是一个罕见的举动。库克还提到了 ARM,暗示其在早年的重要性,最终帮助苹果达到了现在的高度。(来源:cnBeta)

极越公关负责人徐继业确认离职,微博发长文细数「业绩」

昨天上午,极越汽车公关负责人徐继业启用了个人微博,并通过首条博文宣布了自己从极越离职的消息。他在这篇长文中,细数自己加入极越以来所取得的「个人成就」。

12 月 20 日上午,有消息称极越公司发布内部邮件,宣布因「在其朋友圈发表分裂员工的不当言论」,解除公关负责人徐继业的劳动合同,并通报批评。

对此,徐继业回应表示在此邮件出现之前,并未接到任何通知,一直联系 HR 负责人和 CEO 夏一平,均处于联系不上状态,并称「不排除有人盗号散布不实言论」。

当日午间,徐继业再次在朋友圈发文称「基本搞清楚这是个假诏」,并表示「回头弄点好瓜给大家尝尝」。(来源:IT 之家)

 

小鹏汽车澳大利亚首家门店开业

12 月 21 日,小鹏汽车宣布其澳大利亚首家门店开业,现场主要展示了小鹏 G6 SUV 车型及小鹏飞行汽车。此前,小鹏汽车表示小鹏 G6 大规模发往澳洲。

为扩张海外市场的一部分,小鹏汽车近期除了在澳大利亚进行业务外,也正在推进亚太地区泰国、新加坡、马来西亚等市场的汽车销售计划。

TrueEV 公司首席执行官 Jason Clarke 表示,自己相信小鹏汽车的产品序列和设计特点都「非常适合」澳洲市场,此次合作也标志着当地智能电动汽车系列产品迎来「重大飞跃」,并将提供卓越的充电技术与配套功能提供支持。(来源:界面新闻)

 

广电总局要求加强微短剧片名审核:拒绝哗众取宠、低俗庸俗

12 月 21 日消息,据央视新闻今日报道,国家广播电视总局网络视听司发布管理提示(加强微短剧片名审核),其核心要义是对微短剧片名出现的不良倾向进行及时纠偏,并在导向、体例、艺术等方面提出新要求。

由平台负责自审的「其他微短剧」内容违规问题虽已大幅减少,但片名哗众取宠、低俗庸俗的顽疾严重拉低了微短剧行业整体形象,亟待治理。据了解,流量、利益成为部分微短剧制作和播出平台敢于在片名方面走偏、打擦边球的重要动因。

对此,管理提示提出,「小程序类微短剧为刻意追求投流效果,片名问题尤为严重,必须严加整治。」为及时纠正和扭转部分微短剧在片名上的跑偏倾向,管理提示就加强片名审核工作,分别在导向、体例和艺术上提出新要求。(来源:IT 之家)

新款 HomePod 配备 7 英寸显示屏、A18 芯片等,据称将于明年发布

据 DigiTimes 报道,苹果计划于 2025 年发布配备 7 英寸 LCD 显示屏、A18 芯片并支持 Apple Intelligence 系统的新款「HomePod」。

目前还不清楚配备屏幕的 HomePod 的价格,但苹果似乎正瞄准一个合理的价格。在本周的一篇付费报道中,供应链刊物称,苹果已选择中国制造商天马为该设备供应液晶面板,每块面板的价格为 10 美元,「极具竞争力」。

目前还不清楚苹果是否会为该家庭中枢使用 HomePod 品牌,还是会选择全新的命名。目前还不清楚当前的 HomePod 扬声器是否会在明年进行更新,但新的 HomePod mini 预计将在明年推出。(来源:cnBeta)

 

蔚来第三品牌 firefly 萤火虫全球首秀:预售 14.88 万,明年 4 月上市

在昨晚举行的 NIO Day 2024 活动中,蔚来带了旗下第三品牌 firefly 萤火虫全球首秀,首款车型正式亮相。新车预售 14.88 万元,将于 2025 年 4 月正式上市。

新车正面配备「三重奏」大灯,配备同级最大 92L 前备箱,后座翻折后连成超大纯平空间超 1250L。该车车身结构高强度钢与铝合金材料使用占比高达 83.4%,超宽双前防撞梁,超强双前门防撞梁,配备同级最多的 9 个安全气囊。

关于这款新车的配置信息,官方暂未透露太多,新车将于明年 4 月上市,预售价 14.88 万元,199 元预订金抵扣 2000 元购车款。此外,蔚来及乐道品牌用户提车后获赠 30000 积分,其中 ES8 创始版用户提车后获赠 50000 积分。(来源:IT 之家)

科学家正尝试利用 AI 开发世界上第一个虚拟人类细胞

斯坦福大学、基因泰克公司(Genentech)和扎克伯格基金会(Chan-Zuckerberg Initiative)的专家们共同努力,旨在利用人工智能开发世界上第一个虚拟人类细胞。这项开创性的工作将极大地提高我们对人类生物学的认识,促进硅学实验,加快医学研究,并为个性化医疗铺平道路。

研究人员正在探索世界上首个虚拟人类细胞,这是一个人工智能驱动的模型,旨在模拟人类生物分子、细胞和组织的复杂行为。这项创新可以为了解生物学的复杂性和推动医学研究开辟新的途径。(来源:cnBeta)

 

浏览量: 18

OpenAI发布高级推理模型o3;传雷军亲自重金招募大模型领军人才;小米 YU7 无伪装实车曝光

 

OpenAI 发布高级推理模型 o3

OpenAI 发布了下一代推理模型 o3,这是今年早些时候发布的 o1「推理」模型的最新版本。就像 o1 一样,o3 是一个模型家族,o3-mini 是一款更小的精简版模型,专门针对特定任务进行了微调。OpenAI 声称,至少在某些条件下,o3 可以接近实现 AGI。OpenAI 总裁 Greg Brockman 表示,最新的推理模型 o3 是一个突破,在最困难的基准上有了阶跃函数的改进。现在开始安全测试和红队演练。

OpenAI CEO Sam Altman 在直播中说:「我们认为这是 AI 下一阶段的开始。你可以使用这些模型来完成越来越复杂、需要大量推理的任务。」他还夸赞 o3 在编程方面的表现令人难以置信。

(来源:财联社、智东西)

 

意大利对 OpenAI 处以 1500 万欧元罚款

意大利隐私监管机构 Garante 周五表示,在结束对 ChatGPT 开发者 OpenAI 使用个人数据行为的调查后,决定对 OpenAI 处以 1500 万欧元(1558 万美元)的罚款。

Garante 是欧盟在评估 AI 平台是否符合欧盟数据隐私制度方面最积极的监管机构之一。Garante 表示,它发现 OpenAI 处理用户的个人数据「是为了在没有充分法律依据的前提下训练 ChatGPT,违反了透明度原则和对用户的相关信息义务」。对此,OpenAI 没有立即发表评论。他们此前曾表示,他们认为其做法符合欧盟的隐私法。

去年,意大利监管机构因涉嫌违反欧盟隐私规则而短暂禁止在意大利使用 ChatGPT。在微软支持的 OpenAI 解决了有关用户拒绝同意使用个人数据训练算法的权利等问题后,该服务被重新激活。(来源:新浪财经)

 

美国要求英伟达调查其芯片如何流入中国

据国外媒体报道称,美国商务部已经要求英伟达调查其芯片如何流入中国。

报道中提到,该芯片巨头已要求 Super Micro Computer (SMCI.O) 等大型分销商,以及戴尔科技(DELL.N)对东南亚客户进行抽查。AMD 和戴尔生产的服务器产品中嵌入了英伟达的人工智能芯片。英伟达发言人在电子邮件回复中表示。「我们坚持要求我们的客户和合作伙伴严格遵守所有出口管制限制。任何未经授权的二手产品转售,包括任何灰色市场转售,都会给我们的业务带来负担,而不是好处,」

对此,戴尔表示,公司要求其分销商和经销商遵守所有适用的法规和出口管制。

对于上述情况,有知情人士直言,在某些情况下,走私者甚至更改了服务器操作系统的序列号。(来源:快科技)

 

消息称雷军亲自重金招募大模型领军人才,DeepSeek 罗福莉将加入小米

据第一财经新皮层报道,DeepSeek 开源大模型 DeepSeek-V2 的关键开发者之一罗福莉将加入小米,或供职于小米 AI 实验室,领导小米大模型团队。

罗福莉硕士毕业于北京大学计算语言学研究所,毕业后加入阿里达摩院机器智能实验室。她主导开发的多语言预训练模型 VECO(同时支持多语言理解和生成的跨语言模型),被纳入阿里达摩院深度语言模型体系 AliceMind。

2022 年,罗福莉离开阿里,在 DeepSeek 担任深度学习研究员,参与了 DeepSeek 的 MoE 大模型 DeepSeek-V2 的开发。知情人士称,雷军认为小米在大模型领域发力太晚,于是亲自挖人,重金招募能够领军小米大模型的人才,支付的薪酬水平在千万元级别。

2023 年 4 月,小米 AI 实验室下设了专门的大模型团队,任命栾剑担任负责人,向小米技术委员会副主席、AI 实验室主任王斌汇报。栾剑曾任东芝(中国)研究院研究员、微软(中国)工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。(来源:IT 之家)

 

Grammarly 收购 AI 公司 Coda,将为企业推出大模型 LLM 助手 / 语法检查工具

根据 Grammarly 官方新闻稿,Grammarly 公司现已收购一家 AI 初创公司 Coda,将涉足 AI 生产力领域。在所有收购程序完成后,Coda 现任首席执行官 Shishir Mehrotra 将接任 Grammarly 的新首席执行官,而现任 CEO Rahul Roy-Chowdhury 将卸任,转任顾问角色,双方未公布具体收购金额。

据悉,Coda 由前微软与谷歌员工 Shishir Mehrotra 和 Alex DeNeui 于 2014 年创立,该公司的主要产品是一个云端多人文档编辑器,整合了电子表格、演示文稿、文字处理和应用程序功能,用户可在平台上创建百科、数据库或项目文档等多种内容。

Grammarly 表示,此次收购旨在整合双方的技术资源,该公司计划在内部通过结合 Coda 的 AI 工具和界面,转型为全面的「AI 生产力平台」,为企业提供生成式 AI 助手和各种生产力工具。(来源:IT 之家)

 

汤姆猫首款 AI 机器人产品今日发售,支持情绪识别、主动聊天等

汤姆猫发布投资者关系活动记录表,公司首款 AI 童伴机器人将于 2024 年 12 月 21 日对外发售,该产品针对 3-11 岁青少年儿童设计,具备情绪识别、主动聊天、双语互动、万物科普等功能。目前,公司研发的 AI 机器人、AI 讲故事等产品的主体功能均已初步完成研发工作,业务团队正推进相关产品的上线计划,待相关工作完成后,公司将尽快推进产品的发行与上市。(来源:财联社)

 

 

华为快充自动充电机器人亮相,适配超充联盟所有车型,明年上半年量产

据博主 @ 不是郑小康 今日晒出的图片,华为快充自动充电机器人亮相,并称「不是 Demo,明年上半年就会量产」。

他还表示,华为快充自动充电机器人适配了所有华为超充联盟的车型,覆盖品牌包括哪吒汽车、小鹏汽车、比亚迪汽车、极狐汽车、阿维塔汽车、赛力斯汽车、江汽集团、长城汽车、理想汽车、广汽集团和奇瑞汽车等。

从外观来看,该机器人采用银白色机械臂,搭配华为 600kW 液冷超充桩,旁边写着「一秒一公里」标语,目测还有摄像头以及雷达,可识别汽车充电口并自动进行充电。

华为超充联盟于今年 4 月正式成立,号称让有路的地方就有高质量充电。据悉,参与华为超充联盟的车企包含哪吒汽车、小鹏汽车、比亚迪、北汽极狐、阿维塔、赛力斯、江淮汽车集团、长城汽车、理想汽车、广汽集团、奇瑞汽车等。在智界 S7 及华为全场景发布会上,华为常务董事、终端 BG 董事长、智能汽车解决方案 BU 董事长余承东曾表示,到 2024 年底,华为将部署超 10 万个全液冷充电超级快充。(来源:IT 之家)

 

小米首款 SUV 汽车 YU7 无伪装实车曝光,雷军曾称已开启大规模路测

12 月 20 日上午,北京当地的车友会晒出了一组小米首款 SUV 汽车 YU7 的无伪装实车图,据称位于北京雁栖湖。

小米 YU7 的外观基本延续了小米 SU7 的设计风格。车头采用封闭式设计,大灯轮廓以及前包围造型基本不变。小米 YU7 车尾采用贯穿式风格,后包围造型风格同样保持不变。此外,该车在车顶设计有后扰流板。

申报数据显示,小米 YU7 长宽高分别为 4999/1996/1600 毫米,轴距为 3000 毫米,采用 5 座布局。小米 YU7 搭载双电机系统,前电机最大功率为 220 千瓦,后电机最大功率为 288 千瓦。同时,该车匹配三元锂电池组。雷军 12 月 10 日在微博表示,小米 YU7 SUV 目前正在进行大规模路测,预计明年六七月正式上市。「希望 YU7 测试车可以尽早拆除重伪装,有助于我们做更全面、更细致的长时间大规模测试,来确保产品质量,做出更好的产品。」(来源:IT 之家)

 

小红书大批封号引热议,客服称未说明处罚时间就是永封

12 月 20 日上午,「小红书封号」话题登顶微博热搜,多位用户反馈小红书昨晚集中封号。对此,小红书官方客服回应称,账号处罚情况只和账号违规程度有关,具体以收到的站内信通知为准。有说明处罚时间的,到时间会自动解除处罚,建议耐心等待,期间不要违规;如未说明处罚时间的,就是永久性。

用户晒出的图片显示,被封号的理由各不相同,比如「涉及批量发布成本较低、同质化并进行引流或牟利的内容、如薅羊毛、导流等」「在笔记或评论中频繁采用刻意夸大事实、编造故事、题文不符等低质量营销手法来推广商品或服务,以及在笔记或评论中频繁将其他用户引导至第三方平台」等。

12 月 19 日,小红书官方发布黑灰产账号治理阶段进展公告(四):

11 月 18 日-12 月 16 日,小红书「黑灰产账号」治理专项团队一共处置账号 1,259,709 个,其中 10 万粉以上账号 252 个,1 万粉以上账号 4941 个。

黑灰产矩阵账号主要操作方式是前期养号,后期转售账号,「换头」变现。黑灰产团伙首先通过常见手段养号,例如,批量发布同质化且低质的游戏或影视综二创视频,把矩阵账号养到高粉;随后,黑产团伙或高价售卖高粉账号,或删除或隐藏历史养号内容,「换头」发布水下软广等违规营销内容,进行变现。个人账号如采取类似手段养号,也会从严处置。

本期将展示平台近期重点打击的两类黑灰产团伙导流手法,他们利用影视剧资源和占卜预测的手段,以营销导流、养号涨粉为目的,薅取平台流量,危害平台生态。(来源:IT 之家)

 

浏览量: 23

内容创作的「Windows 时代」来了

 

整理 | 连冉
编辑 | 靖宇

大模型横空出世,大量 AI 产品迅速涌现,尤其在内容领域,诸多文生文、文生图、文生视频类产品备受关注。

但回到真实内容创作场景,用户仍然面临信息过载、工具繁杂、需求不明确等一系列问题。如何让 AI 产品「听懂」用户的真实表达,摆脱生成结果的「AI 味」,仍然是很多团队正在攻克的难题。
而目前,AI 创作工具的难点,仍然在用户如何能够高效、精准的创作出「直接可用」的内容,而不需要跨平台、多格式来回切换的繁复操作;在内容消费上,海量信息导致了用户的效率低下,在高质量内容的智能查找、筛选、整理等环节的难点尤为明显。
只有打破现有工具的局限,让智能化贯穿内容领域全流程,内容生产和消费的格局才能真正改变,用户的需求才能被更好地满足。
「自由画布」正是百度文库和百度网盘基于这样的用户需求而推出的,它并非单纯的创作工具,而是一个全新的操作系统,打造了大模型时代的全新交互方式,使得内容创作不再局限于单一的工具和格式,而是实现了多模态的融合和流畅的操作体验。
正如 Windows 操作系统对 DOS 的颠覆,改变了人们与计算机互动的方式,提升了系统的通用性和用户体验,「自由画布」则为内容创作领域带来了革命性的变化,它不只是工具的升级,更是对过去内容系统的一次深刻重构。
在极客公园 IF2025 创新大会上,百度副总裁,文库事业部、网盘事业部负责人王颖在《内容生产与消费,全域新变革》的主题演讲中分享了百度文库和百度网盘在大模型重构后的全面变革,展示了 AI 如何打破创作工具的限制,实现从「单点创意」到「全流程创作」的无缝连接。
百度文库和百度网盘通过 AI 技术的赋能,正成为「内容生产的起点」和「内容消费的终点」,成为内容产业全链路中的关键枢纽,对内容产业格局进行着深刻的重塑。
 

01

内容的未来是什么?
在过去一年,随着大模型横空出世,大家都在思考,关于内容的未来,到底应该是什么样的?
内容领域可以分为两个层面:一是内容生产,二是内容消费。
当前,在内容生产方面,痛点非常明显:创作工具特别多,上手门槛也特别高。制作一个好内容,不但周期长,而且成本很高,制作的过程中非常容易灵感枯竭。这极大地限制了内容生产力的发展,导致创作效率低,不会创作的又不会表达。AI 让内容生产彻底打破了工具的束缚,突破了能力的限制,用户只需要有想法就能创作,真正实现「创想即创作」。
在内容消费方面,信息过载一样是消费的痛点,因为信息过载带来的效率低,而消费形式单一又导致使用有限制。比如,大段的视频其实干货就 2 分钟,但又没办法迅速找到,找到了有用的信息,又因为不同形式的使用需要不同的操作,使用起来会变得很困难。

 

王颖在极客公园 IF2025 创新大会|极客公园
在内容消费的未来,如何打破模态的边界,不再被单一的模态限制,而是能迅速找到最有用有趣的内容,满足用户的需求?
带着对内容生产和消费的全新理解和希望,百度文库和百度网盘进行了全域的变革。
AI 重构后的百度文库和百度网盘,能让 AI 和用户共同创作、用 AI 辅助用户进行全模态的消费,成为内容生产的起点和内容消费的终点。
针对用户「创作、编辑、存储、管理、查找、观看、使用,分享」等旅程的每一个环节,百度文库和百度网盘基于百度文心大模型等系列大模型,百度文库公域的专业数据以及百度网盘私域的用户授权数据建立了数据层、算法层、基建层和能力层,在每一个生产和消费的环节服务用户。
 

02

内容创作更高效
在学习办公场景,PPT 制作一直是许多人面临的难题,想要制作一个专业的 PPT,门槛非常高。
百度文库去年在全行业率先推出智能 PPT,截止目前,百度文库是智能 PPT 领域市场占有率第一名,目前市占率达到 80%。
近一年多来,百度文库持续在 PPT 深耕,除了提供了一句话指令和多文档生成 PPT 以外,近期又推出智能 PPT 新能力——支持生成带有专业排版布局的 PPT。
在如今友商只能画简单 PPT 的时候,百度文库已经可以生成带有专业图表、专业逻辑图、专业数据的 PPT,效果就像专业的 PPT 设计师生产的内容。
此外,草稿 PPT 美化,也是百度文库新推出的能力。用户只需要将简单的 PPT 给到百度文库,几句话、几张图甚至几个文字,百度文库就可以基于用户上传的 PPT 草稿进行美化和创作,形成一个专业精美的 PPT。在百度文库,未来 PPT 全部的场景和需求,都不再成为任何人的创作痛点。
写报告和写论文一直是很多用户的刚需。百度文库已经推出了专业的长文生成能力,用户只需输入主题,AI 即可自动生成逻辑清晰、内容专业、带有专业图表数据的长篇文章。无论是论文、研究报告还是工作总结,百度文库都能够支持高效生成,并保证内容的专业性和时效性。
打开百度文库,只要输入想创作的主题,AI 便可以迅速生成逻辑清晰的专业大纲,并支持用户编辑。根据大纲,AI 可以迅速生成一个数万字的格式专业、内容丰富而严谨的论文,并带有专业的图表和数据。目前百度文库生成的 AI 长文,引用的图表和数据都有专业的数据源,完全保证专业度,正确性以及时效性都达到了行业的领先水平。
罗兰贝格全球合伙人李冰表示,百度文库的 AI 研报,已经像有一定经验的咨询顾问写出的东西。
在家庭教育场景,AI 有声画本是百度文库非常受欢迎的一项功能,有很多父母用百度文库 APP 制作画本。
譬如,孩子不认真写作业怎么办?AI 可以快速生成一个寓教于乐的画本大纲,基于大纲就能够生成一个画本故事,有配音,甚至还能生成英文版。同时,百度文库的 AI 画本还支持用户上传自定义头像,让每一个孩子都拥有自己的专属故事。这样有代入感的画本,让孩子会更容易接受,家庭教育也不再成为难题。而无论是表现力,一致性,以及人物写实性上面,百度文库智能画本上都达到了行业领先水平。
在教育领域,用户对专业课题不清楚时,希望通过搜索了解更全面的信息,百度文库可以提供资料详尽、内容专业和框架完整的 AI 搜索能力。即使再小众的名词也可以借势清楚。这背后,是文心大模型的领先能力和百度文库数十亿的专业内容。
譬如,如果想全面系统研究三星堆文化,其实非常复杂。而百度文库在一分钟内就实现了整合全网不同来源的信息,然后进行速览、详答、延展,同时给到树状表格和流程图进行结构化的表达,让用户获得信息的效率更高、内容更准确。
最近兼职,也成为许多人生活中的一个关键词,越来越多的人开始寻求在工作之余或课外时间,通过兼职来增加收入,写小说、画漫画也成了广泛的副业。
百度文库有个不完全调研,兼职行业人数和收入排名前三的行业,小说都位列其中。百度文库深耕兼职赚钱场景,智能小说能力可以帮用户快速生成节奏起伏、情节生动的小说,还可以一键转化为漫画,并提供多种画风选择,整个过程非常丝滑。
一位小说爱好者表示,没想到用百度文库辅助生成的 AI 小说,在第三方平台发布能够迅速收获了上万点赞,而他之前从来没有写过小说。还有一个用户在百度文库生成小说后,一个月挣了 2 万元。
这些,都是百度文库在大模型重构后带来的变革——大模型真正与人共创,彻底颠覆了内容生产领域,也让用户的内容创作效率得到了指数级提升。
 

03

内容消费更便捷
在内容消费领域,百度文库和百度网盘也推出了各种有趣、高效,帮助用户消费内容的 AI 工具。
比如,用户以往拿到纸质的内容,想要变成电子版的是一个痛点,现在大部分的扫描软件只是把纸质版的内容变成图像,而现在百度网盘的简单扫描,可以把纸质版内容直接扫描成数字文档版,同时可以对文档进行编辑和加工、对外文文档也能一键翻译,甚至还可以扫描纸质表格,形成 Excel,彻底帮用户实现了不同介质和语种的文件转化、存储和管理。
在工作场景中,会议纪要是一个高频任务。百度网盘推出了简单听记,可以快速帮助用户用 AI 整理音频格式的会议纪要,一键就可以转成文字版,并提供多种专业模板。简单听记还可以自动把会议纪要中关键的数据整理成表格,方便用户迅速吸收关键信息,并可以存储在网盘,或者进行一键链接分享。这个功能一经推出,受到了非常多金融行业从业者的好评,解决了他们在听财报问题上的痛点。
看视频也是日常消费内容的高频场景。以往用户在观看网课视频时,通常需要完整观看整个视频才能消化和吸收学习内容,如果要复习,还需要重新观看视频,既费时又费力。
但是如今,如今百度网盘已支持 AI 自动生成视频摘要和分段总结,能够快速定位并总结视频中的关键信息,还可以生成 AI 课件。用户还可以在观看视频的同时做笔记,大大提高了学习效率。
另外,百度网盘也提供了丰富的功能,帮助用户轻松实现内容分享。百度网盘的一刻相册,可以通过 AI 的图片理解能力,一键生成社交文案,无缝发布到社交媒体上,社交文案还会带有有趣的表情,图文并茂的迅速展示用户想要分享的内容。
AI 多图成片,也是百度文库推出的一项广受好评的功能,可以将多张照片转化为生动有趣的视频,同时实现风格化和个性化。用户可以选择多种风格,让每个人分享的内容都充满独特的个人风格,制作视频再也不是难题。
 

04

全新的内容操作系统
以上诸多能力,只是百度文库和百度网盘上百项 AI 能力的其中一小部分。而所有的功能都可以由三个环节构成:输入、处理、输出。用户只需输入想法,交由百度网盘和百度文库处理,最后输出所需要的内容。
百度文库和百度网盘的宗旨,就是希望帮助用户打破时间、空间、设备、模态的限制。无论何时何地使用何种设备,用户都可以通过任何形式输入需求。跨模态的 AI 处理能力,生成并输出各种形式的内容——无论是图片、文字、声音还是视频,用户可以轻松消费和分享,以最便捷的方式满足自己的需求。
「输入、处理、输出」,这实际上就是操作系统的核心功能。具备了完整的内容输入、输出能力以及多模态的处理能力,百度文库和百度网盘将成为全新的内容操作系统。2024 年 11 月的百度世界大会上,百度正式发布了这一操作系统的 beta 版产品——自由画布。
通过自由画布,用户可以将百度网盘、本地电脑及公域中的各种素材(如文本、音视频、PDF、URL 等)自由拖拽到画布中进行编辑,打破了不同平台、多重格式编辑的壁垒。
比如,《黑神话·悟空》带火了大同旅游业,让很多人开始了解这个城市的魅力。如果想去大同旅游,用户可以通过自由画布轻松生成旅游文案和景点推荐,甚至发起招募寻找同行伙伴。用户只需将大同的相关文本、图片、音频等素材上传,AI 便能一键生成完整的旅游攻略,并根据攻略创作社交文案。

百度文库和百度网盘,也正朝着成为内容生态中的关键枢纽的目标迈进,而在大模型重构下的「自由画布」不仅是创作工具的集合,更是一个强大的内容操作系统,承载着更加自由、灵活、多样的内容生态。

随着技术的不断演进,可以预见,未来的创作不仅仅是传统的「AI 输出内容」。在「自由画布」中,用户不再是单纯的「输入者」和「输出者」,而是与 AI 共同探索创意的伙伴。这种人类与 AI 深度协作、共创的关系,将催生出无数创意的火花,推动各行各业的内容创作迎来一个「自我进化」的时代。
浏览量: 40

大模型落地,苦「最强」久矣

没有刷不了的榜,只有还没 over-fitting 的数据集;

没有搞不定的第一,只有还没加够 XX 领域,XX 尺寸,XX 语言的限定词。

尽管自 2012 年深度学习复苏之日起,AI 打榜就成为了行业默认惯例,但历来如此,就是真的正确吗?

去年 9 月,一篇 LLM 味爆棚的反讽文章,在 arXiv 引起轩然大波《Pretraining on the Test Set Is All You Need》,(别搞大模型了),你只需要在测试集上预训练就够了。

吐槽了市面上层出不穷的各种大模型测试榜单之外,这篇论文,直白点名了 phi-1、TinyStories 和 phi-1.5 几个大模型在明目张胆搞榜单造假。

比如,使用测试集中数据提问 phi-1.5,模型会立刻给出一个精准的回复,但只要改变一个数字或者改变一下数据格式,回答立刻变得牛头不对马嘴幻觉频出。

原因很简单,为了刷榜,模型对 MMLU、GSM8K、Big-Bench、AGIEval 等公开数据集,做了针对性训练。

过拟合的 A 面,是让模型在打榜过程中取得了人人都是大模型第一的地位,B 面则是,模型的泛化能力被极大削弱,失去了大模型应有的创造与思考的能力。

大模型落地,苦「第一」久矣。尽管,这已经成为大模型产业心照不宣的秘密。

那么,「第一」真的代表更强的能力吗?所谓的最强大模型真的存在?行业落地,又到底需要怎样的标准?

或许,前赴后继的刷榜本质,是独属于大模型产业的强者傲慢。

 

01

最佳大模型的傲慢与偏见

 

一定程度上,基准测试失真,于大模型而言,表面上看是标准问题,实际上是宣传问题,本质上则是如何落地的商业模式难题。

Scaling law 的主导下,进入万亿参数时代的大模型强者恒强成为唯一的生存密码:根据公开信息披露,仅 GPT4 就有约 1.8 万亿参数,其训练过程,需要消耗约 2.15e25 FLOPS 算力,更直观来说,需要约 25,000 个 A100 GPU,马力全开,训练足足 100 天。以云上每个 A100 GPU 每小时 1 美元来算,理想情况下,一次训练的成本就需要花费至少 6000 万美元。

与此同时,头部大模型玩家,平均两个月左右,就会迎来一次技术或产品的迭代;而形成鲜明对比的是,国内的大模型六小龙,即使如今估值最高的智谱,算上最新一轮融资,其总融资额,也不过 55 亿。

一边是不断膨胀的参数,不断增加的成本;一边是盲盒黑箱式的技术原理,与用户之间的不断加深的认知壁垒。如何在这场强者恒强的生存竞赛中证明自己的价值,打榜自然也就成了最直观的捷径。

但这一切的前提是,大模型落地,真的存在所谓的最强大模型吗?

答案或许是否定的。

技术落地与研究不同,具体到场景之中,强如 Open AI、谷歌与 Anthropic 也不得不面临技术、时延和成本之间的不可能三角。因此面对不同需求,往往对应着不同的最优解法:其中 Anthropic 的 Claude 分为增强版 Sonnet 与轻量版 Haiku;GPT 4o 分为标准版与 mini 版;谷歌 Gemini 则分为增强的 Pro 版与尝鲜的 Flash 版。

而一个违背直觉的数据是,各大模型的增强版与 mini 版,在实际部署中,往往是拥有更低时延与低成本优势的 mini 版本,会更受欢迎。

即使单纯聚焦到技术的单一维度,「最强模型」也同样是个伪命题。在相对客观的物理、化学和生物学、数学、天文等科目中,各家大模型评分往往各有千秋;而一旦将视角转为写作、绘画、视频生成,那么如何评定最优大模型,1000 个读者有 1000 个哈姆莱特。

作为全球最大的云服务平台,亚马逊云科技,就曾注意到:在亚马逊云上,不同开发者往往会关注不同性能,比如,有人会关注更低的延迟、更低的成本,有人更关注模型是否具备微调能力、能更好地协调不同知识库以固定数据,还有团队更关注模型的多模态能力,或者知识扩散迁移能力。

也是因此,什么才是所谓的最强大模型,在一轮轮热潮中,这个话题被反复讨论、被热议、被反思,但从来未被解决。

但可以肯定的是,任何单一维度的「第一」「最强」叙事,都是对复杂场景的简单化。

 

02

Choice is All You Need

 

「最强」=无敌,只是技术至上者的傲慢,以及对用户真实需求的偏见,这一点已经在无数行业中被反复证实。

二十一世纪初期,许多经济学家、产业学家,在观察了日本一众历史优势产业的发展之后都发现了一个怪状:

无论电视机,亦或半导体,乃至汽车,日本无疑是「最强」叙事的顶级推崇者,以及最佳实践案例,但最终的解决却无一例外,集体走向没落。

比如,日本的电视,在显像管时期做到画质最高,却在短短几年被更轻薄的液晶打败;日本面向大型机时代研发的存储芯片,一度做到保质期 30 年,却在消费电子浪潮中被韩国三星质量参差不齐的低价「次品」打败;日本的汽车,在燃油车时代无疑是最耐用、最保值的代名词,甚至是新能源时代,也一步到位发展了最清洁的氢能源燃料电池,却唯独错过了近十年来最大的汽车产业变革热潮——电动化。

为什么「强者」最先被淘汰?生物学家给出了解答——日本产业,陷入了加拉帕戈斯陷阱,一个在如加拉帕戈斯群岛般单一的环境中进化出的「最佳」,往往在面对复杂的真实场景与需求会显得格格不入,乃至不堪一击。

相比「最佳」,行业更需要的是,需求被看见,过程有的选,结果更适合。

就像数据库领域,即使传统的 SQL 数据库已经常年占据统治地位,依然会有各种各样的 noSQL 数据库冒出,甚至在 noSQL 数据库还会区分出图数据库、文档数据库等不同类型。

AI 框架,也是个最好的例子,TensorFlow 之前,cafe 就足以满足市场的需求,但此后 TensorFlow 出现,一统天下,然而,没几年后,PyTorch 就横空出现,从学术领域出发逆袭,成为一代新的框架之王,但与此同时,TensorFlow 以及其他小众 AI 框架,依旧在工业领域占据相当的市场份额。

套用大模型 er 们的经典句式——Choice is All You Need。

亚马逊 CEO Andy Jassy 在不久前的举办的一年一度的云服务 re:Invent 大会上,就分享了这样一个观察:

「在亚马逊内部,所有开发者都有自主选择的权利,原本以为大家都会选用 Anthropic 的 Claude 模型,毕竟过去一年多它在全球属于性能顶尖的模型,确实有很多内部开发者在使用 Claude 模型,但他们也会采用 Llama 模型、Mistral 模型,还会运用自己开发的一些模型,甚至会使用自行研发的模型。」

比如,金融行业更需要内容生成的绝对准确性;大部分企业,则需要在性能与成本之间,做反复的平衡。甚至,同样是绘画,在诸如还原山海经之类场景中,大模型幻觉就是产生想象力的最佳礼物;而在绘制写实风漫画或人物建模,任何的幻觉都会带来最终结果的灾难性失控。

既然评判的标准五花八门,那么与其替用户选择,不如给足用户选择。

 

03

亚马逊云科技的 Choice matters

 

事实上,让客户有的选,是各大公有云厂商都在宣传的口号。但何谓有的选,选择的范围如何,背后的定义却往往各有千秋。亚马逊云科技无疑是其中,最开放、最激进的一个。

在亚马逊云科技,有的选,可以被解读出三重含义。

第一重,性能还是成本,用户有的选。

re:Invent 期间,亚马逊云科技推出全新发布的自研 Nova 基础模型,一共包括 Micro、Lite、Pro、Premier 四个版本。其中,可以做到 210 tokens/s 的 Amazon Nova Micro 是纯文本模型,主打高效级;其余三大多模态大模型中,Lite 主打轻量级,Pro 主打平衡,旗舰模型 Amazon Nova Premier,则主要用于应对复杂任务。

第二重,亚马逊云科技 or 其他,用户有的选是最高原则。

相比自研的 Nova 基础模型,如何支持更多的模型上架亚马逊云科技,才是这场大会真正的主角。

通过将电商中的货架概念用在了云服务与大模型,亚马逊云科技的大模型货架 Amazon Bedrock 不仅上架自家的 Nova 系列,同时还上线了亚马逊投资的 Anthropic 的 Claude 系列。

此外,Amazon Bedrock 提供 Meta 的 Llama、AI21 Labs 的 Jurassic、Mistral AI、Technology Innovation Institute 的 Falcon RW 1B 和英伟达 NIM 微服务等 100 多种业内一流的大模型。

不仅是通用大模型,金融领域的 Palmyra-Fin,翻译明星 Solar Pro,多模态方向的 Stable Diffusion 、音频生成方向的 Camb.ai,生物学方向的 ESM3 生成式生物学模型,也全部在 Amazon Bedrock 上架。

主打一个从自研到第三方,从文本到多模态,从通用到垂直,只要用户需要,Amazon Bedrock 应上尽上。

当然,不只是有的选,最重要的也就是第三层,亚马逊云科技不仅要让客户有的选,更能低成本的选。

如果只是上架第三方模型,那么行业内大部分公有云企业都能做到。

但如何避免云服务企业又做选手又做裁判还当发令员,能够真正做到不偏心自研产品,以用户需求为导向,还需要观察云服务公司究竟如何设计用户选择的门槛。

首先是定价,如何在亚马逊云科技销售模型,定价由模型提供商自行设置。

与此同时,为了降低用户使用大模型的成本以及选择难度,Amazon Bedrock 还提供了自定义微调和 模型蒸馏 (Model Distillation)功能以及多智能体协作工具(Multi-agent collaboration)、自动推理检查(Automated Reasoning checks)等功能。

一方面,帮助企业更好的选择合适的模型,另一方面,加速不同的模型与智能体之间的高效协同。

当然,这种有的选,不止体现在模型侧,在算力、数据库领域同样如此。

比如,在算力上,亚马逊云科技会提供不同层级的 EC2 实例,用户可以根据自身的计算需求选择标准服务器或者更强大的 UltraServer,不必受限于单一芯片平台或算力方案。

数据库方向,亚马逊云科技打破 CAP「困境」,推出无服务器分布式 SQL 的数据库 Amazon Aurora DSQL 以及完全托管的无服务器 NoSQL 数据库 Amazon DynamoDB global tables,尊重客户真正的需求。

从模型到算力再到数据库,一切决策的最高原则都是「Choice matters」,让用户去自由决策。

 

04

尾声

 

在经济学中,有一个有趣的悖论叫古德哈特定律。

其提出背景是,一旦我们过度关注乃至管理一个经济指标时,往往会为了达成这一指标而扭曲真实目的,以至于牺牲其他方面的利益,以至于指标本身失效。

AI 领域同理,当参数与性能变成唯一指标,其强大的扭曲力场会让真实的用户需求被忽略。

尽管,用 AI 替代客服所以更关注成本,用 AI 帮助手残画出想要的画面所以更关注多模态能力,用 AI 帮助企业完成质检优化所以更关注效率这样无数的细小变革,才是 AI 改变世界的真正组成。

而在这一过程中,用户的真实需求被看见,被尊重,有选择,正是一切进步发生的基础。

浏览量: 27

苹果就 AI 与腾讯字节谈判;百度、吉利垫付,极越员工获「N+1」赔偿;余承东称智界要打造年轻人 DreamCar|极客早知道

智界 R7 上市,余承东:智界打造最懂年轻人的 Dream Car

12 月 19 日消息,鸿蒙智行智界 R7 今日正式上市,新车提供 Pro 及 MAX 两款配置(IT 之家注:前者无激光雷达,后者有),售价分别为 24.98 万元和 28.98 万元。

华为常务董事、终端 BG 董事长、智能汽车解决方案 BU 董事长余承东今日在直播中谈到了新车的设计,他称「智界系列的设计团队很多都是 90 后、00 后,用他们的渴望,打造最懂年轻人的 Dream Car」。

据 IT 之家今日早些时候报道,鸿蒙智行智界 R7 增程版汽车尺寸为 4956/1981/1634mm、轴距为 2950mm,该车全系配备座椅通风、加热和按摩功能,副驾配备零重力座椅,支持 18 向调节、10 点按摩,带有长度为 340mm 的可加热式腿托。其全系标配电动遮阳帘,前、后排均含双层隔音隔热玻璃,后排配有隐私玻璃。

新车搭载型号为 SQRH4J15 的 1.5T 发动机,最大功率 115kW,匹配 36.019kWh(官方海报数据为 37kWh)磷酸铁锂电池组,最高车速 200km/h,CLTC 纯电续航为 251km、综合续航 1570km,WLTC 百公里油耗 5.68L。(来源:IT 之家)

消息称苹果与腾讯、字节跳动谈判,希望在中国推出 AI 功能

12 月 19 日,据路透社报道,三位知情人士称,苹果公司正在与腾讯、字节跳动谈判,希望将这两家公司的人工智能 (AI) 模型整合到在中国市场销售的 iPhone 中。

作为 AI 系统 Apple Intelligence 的一部分,苹果从本月开始在其 iPhone 中整合 ChatGPT 聊天机器人。但是在中国市场,苹果的 AI 功能需要与本土公司合作。

知情人士称,苹果与腾讯、字节跳动的谈判涉及使用后两家公司的 AI 模型,这一讨论尚处于非常早期的阶段。科技网站 The Information 在本月报道称,苹果也曾与百度进行谈判,希望在 iPhone 中整合百度的 AI 模型,但是谈判遇到了挫折,原因是技术问题,其中包括双方在使用 iPhone 用户数据训练 AI 模型方面的争执。

截至发稿,字节跳动不予置评。苹果和腾讯尚未回复置评请求。(来源:凤凰网科技)

消息称极越员工获「N+1」赔偿,垫付资金由百度、吉利打入

12 月 19 日消息,据 21 财经今日报道,在有关部门的协调下,极越将按照「N+1」的标准为员工提供经济补偿。

其中,N 为司龄起算日至 2024 年 12 月 20 日的服务期限折算,「1」为上个月的基础月薪和津贴(餐补及话补)。截止到离职日尚未享有的年假及调休予以折算。

1、经济补偿:将按照「N+1」的标准提供经济补偿。其中,N 为司龄起算日至 2024 年 12 月 20 日的服务期限折算,「1」为上个月的基础月薪和津贴(餐补及话补)。截止到离职日尚未享有的年假及调休予以折算。

2、工资与社保、公积金:工资结算至 2024 年 12 月 20 日。将为员工缴纳社会保险和公积金至 2024 年 12 月,并在人社部门要求的办理时间前办理缴纳完成。

3、特殊安置:对于处于「三期」(孕期、产期、哺乳期)、工伤、医疗期的员工,原则上保留工作岗位直至相应情形结束,如个人有协商意愿,可联系 jidu@jiduauto.com。

4、履行方式与时间:在相关政府部门的指导和见证下,建立监管共管账户,代集度公司于 2025 年 1 月 20 日之前支付工资及经济补偿,垫付资金由百度、吉利打入。

此前,百度与吉利发表联合声明,表示将以高度负责任的态度,积极协助极越管理层处理员工社保缴纳、离职员工善后问题,以及维护用户车辆正常使用、售后和维修保养。据媒体报道,12 月 12 日,百度与吉利内部已经发起内部转账流程,为极越员工缴纳了 11 月社保。(来源:21 财经)

印尼批准苹果公司 10 亿美元投资计划,将取消 iPhone 16 销售禁令

12 月 19 日消息,彭博社援引知情人士的话透露,印度尼西亚已批准接受苹果 10 亿美元(IT 之家备注:当前约 73 亿元人民币)10 亿的投资,政府将解除对其 iPhone 16 的销售禁令。

知情人士表示,印尼总统普拉博沃在周末的一次会议上听取了有关政府与苹果公司之间拉锯战的简报,批准政府接受苹果的提议印尼,并敦促其内阁在未来吸引更多投资。

他表示,苹果供应商将在巴淡岛开设一家 AirTag 工厂,该工厂预计初期将雇用约 1000 名工人。据称,巴淡岛距新加坡仅有约 45 分钟渡轮航程,这也将使公司免于缴纳增值税和奢侈品税以及进口关税。消息人士表示,该工厂最终预计将占据 AirTag 全球产量的 20%。

除这家工厂外,10 亿美元投资案中另一部分计划用于在万隆建立一家新工厂,以生产其他类型的配件,并资助该国的苹果学院。

消息人士表示,普拉博沃已指示经济事务协调部带头完成交易,但印尼政府尚未就何时恢复 iPhone 16 销售许可提供时间安排,鉴于印尼此前曾撤回过类似决定,这项计划也可能会出现意外。(来源:CnBeta)

OpenAI ChatGPT 变身桌面助手:支持 Xcode、Notion 等 30+ 应用,AGI 彩蛋曝光

12 月 20 日消息,「12 days of OpenAI」活动进入倒数第 2 天,OpenAI 公司主要演示了桌面版 ChatGPT 的功能改进,强调 ChatGPT 正从聊天机器人向 AI 智能体工具进化,让其在桌面环境中高效执行任务并实现无缝协作。

第 11 天活动的主题名为「Work with apps」,宣布 ChatGPT 新增支持 Apple Notes、Notion、Warp、Xcode 等 30 多个应用程序,在视频中还演示了 ChatGPT 如何与 Notion 应用程序协同,提取文档选定部分的内容并生成相关内容。

还展示了 ChatGPT 如何分析 Warp 中的 Git 评论,并以假日主题条形图呈现结果;以及演示了 ChatGPT 在 Xcode 中使用 macOS 辅助功能 API 的能力。

结合此前曝光过的「Super Secret AGI」日历活动,这些迹象都指向 OpenAI 积极布局通用人工智能(AGI)。(来源 IT 之家)

谷歌让 12 个 AI 大模型攒局玩「大富翁」:Claude3.5 爱合作,GPT-4o 最「自私」

给大模型智能体组一桌「大富翁」,他们会选择合作还是相互拆台?实验表明,不同的模型在这件事上喜好也不一样,比如基于 Claude 3.5 Sonnet 的智能体,就会表现出极强的合作意识。

而 GPT-4o 则是主打一个「自私」,只考虑自己的短期利益。

这个结果来自 Google DeepMind 和一位独立研究者的最新合作。参加游戏的智能体背后的模型分别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。

每个模型各产生 12 个智能体,这 12 个智能体坐在一桌上进行博弈。游戏看上去大富翁有一点相似,但相对简单,玩家只需要对手中的「资源」做出处置。这当中,虽然每个玩家心里都有各自的小九九,但作者关注的目标,是让总体资源变得更多。

测试下来,作者发现基于 Claude 的智能体种群的平均资源量每一代都稳步增长,总体合作水平越来越高。

相比之下,基于 GPT 的智能体种群合作水平总体呈现下降趋势,看上去非常「自私」。

基于 Gemini 的种群表现则介于二者之间,它们的合作水平有所提高,但和 Claude 比差距还是很大,并且表现不太稳定。(来源:量子位)

TrendForce:2024 年 VR、MR 头戴产品出货量预计约 960 万台,同比增长 8.8%

12 月 19 日消息,根据 TrendForce 今天发布的最新调查报告,2024 年 VR 与 MR 头戴设备的出货量预计将达到约 960 万台,同比增长 8.8%。

在这一市场中,Meta 的 Quest 系列产品将继续占据主导地位,以 73% 的市场份额稳居第一,而 Quest 3S 将成为推动该系列产品出货的主要动力,预计年增长率将达到 11%。

此外,索尼 PS VR2 则以 9% 的市占率位列第二,但由于功能支持不够完善和应用场景受限,今年的出货量预计将下降 25%。

苹果 Vision Pro 虽然产品价格高昂且应用资源有限,但仍以 5% 的市占率成功拿下出货量第三名。

TrendForce 预估,苹果最快将于 2026 年推出新一代的 VR 与 MR 产品,可能包括高端与主流两款设计。这将为 VR / MR 市场带来新的竞争格局和更多的选择机会,预计将进一步推动市场的发展。

分析师表示,全年出货情况反映出市场三个主要趋势:一是低价产品成主流;二是应用从娱乐扩展至多元生产力工具;三是 OLEDoS 成为高端近眼显示产品技术首选。未来几年这三大趋势将持续影响全球 VR 与 MR 产业生态发展。(来源:IT 之家)

消息称一位三星员工因曝光 Galaxy S25+ 手机实拍图遭解雇

近来关于三星 Galaxy S25 系列手机的各种爆料消息不断,这也促使三星对内部进行一系列整肃行为,消息源 Max Jambor 透露,目前有一位三星员工因为在曝光 Galaxy S25 系列手机工程机实拍图时,忘记遮挡工程机序列号,遭三星查处并解雇。

据悉,这是一款 Galaxy S25+ 机型,照片主要展示了该机的底部「下巴」,并带有相关工程机序列号内容,不过并未展示其他有价值信息。

12 月 18 日报道,爆料人 Evleaks 今日放出了三星 Galaxy S25 系列手机发布会邀请函,最新的 Galaxy Unpacked 活动将于当地时间 2025 年 1 月 22 日在美国举行。(来源:IT 之家)。

闪极 AI「拍拍镜」智能眼镜发布:接入数十家大模型,售 999 元起

12 月 19 日消息,闪极今晚正式发布新款 AI 智能眼镜——闪极 AI「拍拍镜」,零售价 1499 元,共创版售价 999 元(春节前限量 5 万台),打卡返全款代金券、90 天无理由退货,今晚 10 点开启定金预售。

从官方介绍获悉,这款新品采用更符合亚洲脸型的人机设计「佩戴舒适」;配备弹簧镜腿,贴合不同头型,适合不夹脸,镜腿超高自由度翻折;配备「无感」气垫鼻托,多种尺寸、不压鼻梁。新品采用经典风格,可搭配各式各样的磁吸镜片。

这款新品搭载全球第一款 AI 记忆系统「录眸 OS」,支持 AI 云盘、AI 闪记、Al Agent Store 等功能,云端 AI 中心接入数十家大模型,支持接入私有 Al 模型。其中,AI 云盘支持云端全量存储每天所拍所录,实现全链路端云一体加密。(来源:IT 之家)

微信灰度测试“送礼物”功能 :商品限价 1 万元,不支持珠宝及教培小店

 12 月 19 日消息,微信小店近日灰度测试“送礼物”功能,并于 12 月 17 日发布了相关使用指南。

据了解,除了珠宝首饰、教育培训类目外,其余微信小店商品将默认支持“送礼物”功能,且商品款式原价不得高于 1 万元。

具体来看,满足规则的商品和店铺将自动开通“送礼物”功能,用户轻触“送给朋友”拉起“确认礼物”页面,选择款式、浏览金额、选择朋友并完成支付后,礼物即自动送出。收货地址由接收方填写,在收下礼物前,接收方还可以选择更换该商品下价格相同的其他款式。(来源:IT 之家)

人类首份月背古磁场信息:中国科学院嫦娥六号月球样品最新研究成果登上《自然》

12 月 20 日消息,中国科学院宣布通过分析嫦娥六号月球样品获得了人类首份月背古磁场信息,相关成果于北京时间 12 月 20 日凌晨在线发表于国际学术期刊《自然》上。

论文摘要:

月球发电机(即月球磁场)的演化对于解读月球深部内部结构、热历史和表面环境至关重要。先前对月球正面采集的样本进行的古地磁研究已经确定了月球磁场的大致变化。然而,有限的时空古地磁约束使月球发电机的演化变得模糊不清。

嫦娥六号任务带回了首批距今约 28 亿年(Ga)的月球背面玄武岩,为研究全球月球发电机演化中一个关键的时空间隙提供了一个独特的机会。

在此,我们报告了从嫦娥六号玄武岩中获得的古强度(约 5–21 μT),提供了来自月球背面的第一个磁场约束,以及 3 到 2 Ga 之间漫长间隔内的关键锚点。

新结果记录了磁场强度在之前 3.1 Ga 左右急剧下降后出现的反弹,这证明了中期偏早期阶段(约 2.8 Ga)存在活跃的月球发电机,并反驳了月球发电机可能在 3 Ga 后一直处于低能状态直至消亡的说法。

该结果表明,月球发电机最有可能由底部岩浆洋和 / 或岁差驱动,可能还辅以其他机制,例如地核结晶。

新华社指出,这项成果填补了月球磁场中晚期演化的数据空白,为研究月球磁场演化、探秘「月球磁场发电机」提供重要依据。(来源:新华社)

 

浏览量: 31

买了 3 副 AI 眼镜的人,心里到底在想什么?

站在 2024 年年底,国内「百镜大战」已经正式打响的当下,再谈论 Ray-Ban Meta 似乎已经有点「过版本」,甚至在科技圈,已经很少有人会对「佩戴着 Ray-Ban Meta」这件事感到奇怪。

 

但当你身边十个人中有超过四个人都在佩戴 Ray-Ban Meta 时,还是会产生一种强烈的陌生感。这就是近期我在深圳出差时的感受。

这种场景在手机等消费电子产品的发布会上更为明显:甚至有几个瞬间,我都明显感到身边的 Ray-Ban 的数量,甚至比这款 AI 眼镜在美国湾区的出现频率还要更高。

从观察来看,虽然当前 Ray-Ban Meta 的用户还先主要聚集在科技行业相关从业者之间,但从自媒体博主,到深圳硬件公司的创业者,都分布着 Ray-Ban Meta 的拥趸。

这样的现象之所以「诡异」,并不只是因为 Ray-Ban Meta 是首款做到如此高频率出现的智能眼镜,还有这款产品从未在中国正式开售的事实。甚至 Ray-Ban Meta 也没有在紧邻深圳的香港发售,这意味着购买一副 Ray-Ban Meta 实际上还有相对更高的学习成本。

甚至,笔者碰到有的同行,一次携带两套 AI 眼镜,以满足全天使用的需求。

AI 眼镜确实要火了吗?以 Meta AI 为代表的 AI 眼镜,又是如何让消费者乖乖掏钱的?

 

01

 

「四眼」,有了新意义

 

首先需要明确的是,以 Ray-Ban Meta 为首的智能眼镜,其实并不能与以往带有显示功能的 AR 眼镜混为一谈,不然就很容易忽视它们的核心竞争力——在智能功能之外,首先是一副有着高可用性的正常眼镜。

在 Ray-Ban Meta 二代发售的初期,海外博主对于 Ray-Ban 的推荐还普遍存在着一种「刻板印象」:你必须先是一个「太阳镜爱好者」,你才有可能是 Ray-Ban Meta 眼镜的目标用户,反之则很难将它作为日常佩戴产品每天使用。

但这个刻板规则在中国就迅速被改变,原因也很简单,中国有着近七亿的庞大近视人群。在高校学生以及互联网行业近视人群的比例更是能突破 80%。

这一「社会问题」,在遇到智能眼镜的普及时,反而变成了一种奇特的「市场特色」:由于对近视用户,佩戴一副眼镜本身已经是属于日常生活必不可少的习惯动作,因此以往 AR 眼镜做梦都在不断追求的「让用户每天佩戴超过四个小时」目标,在遇到中国用户之后瞬间变成了「基本操作」。

除了眼镜这一载体本身所赋予的属性,2024 下半年快速降低的购买成本,也在助推着 Ray-Ban Meta 在中国内地的用户数量爆发。由于国内用户大多还是依靠包括闲鱼在内的国内代购来入手 Ray-Ban Meta,所以在人群中最常见到的,其实还是黑色经典款——百搭配色意味着适合大多数用户,也意味着在大批量进货的代购商眼里最受欢迎,因此售价往往也是最低的版本。

据一位闲鱼卖家介绍,仅闲鱼一个平台,近期每周就能出货超过三百副,他还引入了为用户提供第三方配件以及配镜服务的支持,让更多新手用户降低学习成本与使用门槛。

在这样的大规模出货支持下,当前二手平台一副全新 Ray-Ban Meta 售价仅有 1900 元人民币左右——这个价格已经与售价 1899 元的 AirPods Pro 几乎相同——这更给了一些用户「用智能眼镜去替换耳机」的一个迈出第一步的尝鲜动机。

但这其实还并非当前购入 Ray-Ban Meta 的「史低价」:在黑五或圣诞期间叠加电商平台的返代金券折扣,实际价格甚至能到 1400 元。这让黑色星期五期间,出现不少外媒打出了「买 AirPods 不如买 Ray-Ban Meta」的标题「带货」。

Ray-Ban Meta 降价之后更香了|图片来源:ZDNET

在全天佩戴眼镜成为硬性需求之后,续航成为了明显的短板。Ray-Ban Meta 实际使用续航只有四个小时,因此对于一部分爱好者,购买两副 Ray-Ban 同时使用才是常态。在其中一副眼镜的电量耗尽后,可以从充电盒中拿出另一副「无缝」切换使用。

对于绝大多数普通用户,这样的组合已经足以满足全天的正常使用,但仍然有极少数用户会为了实现真正的多日续航,会再多购买一副,组成两个充电盒三副眼镜的「超级组合」。

一位深圳自媒体博主在向笔者介绍他的这种搭配时,表示如此极致的搭配,目的就是为了在重度录制视频以及通话需求面前,能做到「永远戴着一副眼镜」。

对这些重度用户来讲,目前限制他们的因素只有软件。目前 Meta 限制同一部手机最多只能配对两副眼镜,而大部分用户每天日常生活最常用来接收通知/短信等消息的设备,往往也集中在一部手机上。

他也承认 Ray-Ban Meta 在音质上其实完全不能与 AirPods 相提并论,但已经足够满足电话会议或是微信语音这样的日常通话需求。但他此前在使用 AirPods 时,却从未动过「全天都佩戴着 AirPods」的想法。

「毕竟戴着眼镜对别人来讲不会很奇怪,戴着耳机的话多少还是会有些不方便的」。这里他指的当然是以 AirPods 为代表的 TWS 耳机戴在耳朵上,经常会被别人误认为处于一种「勿扰模式」,对方会因此难以判断是否方便沟通,从而很大程度上影响日常生活沟通的情况。

开放式设计的骨传导耳机倒能避免这个问题,但这类产品往往在与眼镜搭配时容易出现干涉问题,这一点对于眼镜用户来讲并不算特别友好,因此整合了耳机属性的智能眼镜,在满足上述需求的同时,也真正让用户觉得「全天佩戴是一件很自然的事」。

这个产品逻辑其实与近两年华为、小米推出的「音频眼镜」有很强的相似之处——这些音频眼镜并没有过多强调 AI 或拍照相关功能,但同样快速收获了一批用户,并成为智能眼镜市场中销量最高的品类。

国产智能眼镜市场占有率分布图|图片来源:洛图科技

但在 Ray-Ban Meta 之前,鲜有产品在市场上呈现出这种爆发性的增长趋势:这些产品往往难以摆脱小众的标签,即使已经做到细分赛道出货冠军,我们在日常生活中仍然很少能见到佩戴着这些眼镜的用户。

对 Ray-Ban Meta 而言,破解这一困境的另一个重要因素,是它那做到前无古人的「时尚」属性。

 

02

 

人人都爱时尚

 

显然,仅仅是「取代 AirPods」,还并不足以让 Ray-Ban Meta 成为这样一款受到众多用户喜爱的智能眼镜。

大部分中国用户,并没有使用 Instagram 或是 WhatsApp 的习惯,也就意味眼镜支持的各种 Meta 软件增强功能,其实也并非这些中国用户购买的首要需求——在笔者接触到的数名 Ray-Ban Meta 重度用户中,甚至有几位在日常完全不会使用 Meta AI 的相关对话辅助功能。

Meta 手机端配对 App 中提供第一方 App 的功能适配|图片来源:极客公园

对不少普通用户来讲,自己是否喜欢眼镜外观这件事,显然优先级要比「智能功能是否完善」要更高——这往往是此前众多智能眼镜品牌忽视的一点。

而 Meta 在这一点上展现出了远超硬件厂商的前瞻视野,一直通过与行业内顶级的眼镜配件品牌合作,通过强化 Ray-Ban Meta 的时尚属性来拓展更多的用户群。

在 Ray-Ban Meta 二代发布后,Meta 没有像一般传统硬件一样开始聚焦于软件更新,而是仍然持续投入资源,拓展着眼镜的外观设计,仅今年就发布了三个新镜架款式,并在官网提供了超过两百种的款式搭配组合,让 Ray-Ban Meta 拥有了超过 Apple Watch 的时尚属性。普通用户也更愿意将它作为 EDC(日常随身物品,Everyday Carry)穿搭出街,不会有电子产品自带的浓重「电子产品」标签。

「这是除 iPhone 之外,第一次我买数码产品让她很喜欢」,一位深圳的 Ray-Ban Meta 用户,同时也是硬件创业公司员工向笔者介绍到给他最近的女朋友买的新款 Skyler 镜框版本——这就是 Meta 在今年十月刚刚推出的镜架版本,相比男士更加偏爱的经典 Wayfarer 飞行员款以及 Headliner 版本,这款凭借着更加时尚的外观上市后受到了不少女性用户的喜爱。

Meta 于十月推出的新款 Skyler 镜框,受到不少女性用户青睐|图片来源:Meta

除了眼镜镜架款式,Meta 还在一直探索着 Ray-Ban Meta 作为眼镜的时尚属性,例如更有科技感的限量全透明款,如今同样受到中国用户热捧,甚至实际销售价格被炒至 8000 元以上;还有以及根据外部紫外线程度极速变色,在普通镜片与墨镜之间切换的镜片定制选项。

这些都是完全不同于此前智能眼镜的「新套路」,已经随着 Ray-Ban Meta 在世界各地,甚至是从未真正上市的市场大获成功,证明了这是一条可行之路。

在国内市场被炒到超过八千元的透明款 Ray-Ban Meta|图片来源:Meta

 

03

 

已经开启的「百镜大战」

 

从这些实际用户的体验中,其实不难看出,Ray-Ban Meta 在深圳的高频出现,既有用户的快速增长,也离不开用户愿意全天佩戴这一点的加持,大幅提升了它的「出镜率」。

在同时解决了「全天佩戴」与「时尚」这两个关键需求之后,Ray-Ban Meta 快速收获了用户之间的自发认同,并取代了原本 AirPods 的生态位——「毕竟眼镜大部分时候都戴在脸上,自然不容易像 AirPods 一样乱丢」。

毫无疑问的是,在有着众多 Ray-Ban Meta 狂热用户、「人杰地灵」的深圳,同样也在孕育着众多 Ray-Ban Meta 的竞品:据不完全统计,仅 2024 年下半年,就已经有各行各业的硬件厂商涌入这条赛道,希望分一杯羹。

其中不仅有雷鸟、魅族这样的传统 AR 眼镜大厂,也有众多类似谷东科技、影目科技这样的创业公司,乃至像闪极这样此前完全没有 AI 眼镜制造经验的硬件品牌。

回车科技(LookTech)发布的 AI 眼镜,外观设计与 Ray-Ban Meta 高度接近 | 图片来源:回车科技官网

Ray-Ban Meta 的成功与目前 AR 眼镜行业中的一个声音「AR 眼镜将会取代手机」相反,Ray-Ban Meta 能快速收获大量普通用户的一个重要因素,恰恰是因为它完全不能取代智能手机,并且无论是与手机还是手表等设备搭配使用,都能获得不错的体验。最重要的或许还是:它是一款真正能够解放双手的智能硬件。

目前 Ray-Ban Meta 在实用与时尚之间的探索,恰恰说明了智能眼镜正处于从小众的「极客玩具」,真正走向大众消费品的阶段。Apple Watch 早期在宣传上同样将时尚属性作为其主要卖点,但后来随着健康监测传感器的快速小型化与完善,迅速找到「健康/专业健身监测工具」的新定位,并在 2022 年年销量已经突破了 5000 万。

比起新品发布时的轰轰烈烈,或许这种用户之间自发的「安利」,更能提升产品在普通用户之间的知名度,也意味着智能眼镜在「实用」+「时尚」这一组合拳下,真正找到了能够俘获用户的一条捷径。

 

浏览量: 53

AI 教育的「iPhone 时刻」,就是现在?

因材施教,是从有教育这个概念开始,人类就一直有的教育梦想。

然而受限于现实因素,在过去,将教育普及到所有人身边,已经十分困难,因材施教更是一个梦想。

在过去十年间,通过互联网尤其是移动互联网的普及,教育普及,已经有了极大的进步。而目前的AI时代,我们第一次看到了因材施教的曙光。

成立于 2014 年的高途集团,就是教育普及浪潮下的先行者。通过独创”在线、直播、双师、大班课”的模式,高途将优质的教育体系带向了 9000 万学生,让他们的人生通过教育得到了改变。

步入 2024 年,已经有十年教育经验的高途集团,对于 AI+ 教育,也有了新的思考。

高途教育科技集团联合创始人罗斌,在 12 月 14 日,来到极客公园 IF2025 创新大会,分享了他对AI教育的观念。

他表示,在过去,教育即使经历了很多变化,而真人老师教学,学生自己吸收内化的结构并没有变化。而今天,这样的结构很可能会发生新的改变。AI能够助力教育走向个性化、导航化、集成化、专业化。下一个时代的智慧教育,一定会从以老师为中心,转换到以学生为中心。

以下为罗斌在极客公园 IF2025 创新大会上的演讲实录,由极客公园整理。

 

AI+教育,什么变了,什么没变?

大家好,我是高途教育科技集团联合创始人罗斌。

高途是一家成立于 2014 年的科技教育公司,今年刚好是我们创立的第 10 周年。

在过去的10年时间里面,高途已经累计服务了 9000 万的学员。从去年开始,我们正在开拓线下业务,包括中国国家跳水队的运动员,今天也是高途的学员。高途今天面向从幼儿到小学、初中、高中、大学和成人,比较广泛的人群,提供了丰富的教育产品。

高途集团经历过十年时间,完整经历了互联网和科技对于教育这样一个传统行业带来的一些变化和变革。

在最早期,计算机更多地是作为教学过程的辅助系统存在。

有了互联网以后,它打破了时空的限制。

而有了移动互联网,短视频+直播这样的技术带来了更多的变化和变革。

但是在过去这么多年里,有两个基本的变量是没有发生变化的:

第一,教育的构成是通过真人老师和学生的教学互动过程来完成的。

第二,知识的掌握和吸收内化是靠学员自己来完成的。

这就会导致不同学生,在同样老师、同样课程的安排下,取得的效果会有巨大的方差。

而今天,到了 ChatGPT 大模型时代,我们发现,这两个变量正在发生一些新的变化。

教育这个行业的本质,是为我们的学员带来变化。这个变化可能有不同层次,可能是认知层面的变化、可能是技能的变化、可能是考试结果的变化,也有可能是从底层的人格层面上带来的根本性的变化,这一点是没有变化的。

高途教育科技集团联合创始人、高级副总裁罗斌 AI 给教育带来的改变|图片来源:极客公园

在传统上,要帮助不同的人,实现他自己的改变目标,其实挑战难度是比较大的。

大家都比较熟悉互联网网课。在网课这种模式下,大家会发现虽然我们的老师很优秀,课程很优质,但学员的完成度非常低。所以在很多年的时间里面,虽然很多企业、很多学校在尝试通过互联网的方法来传播知识、传播课程,但并没有取得非常好的效果。

在高途过去 10 年创业的过程中,我们对这样的 MOOC 网课产品模式,进行了创新和升级,形成了「在线、直播、双师、大班课」的模式。

通过在线,实现了优质老师资源的更大覆盖;通过直播,实现了学员更好的沉浸感和互动感;通过双师,也就是一个主讲老师+一个辅导老师,我们可以帮助一个学员形成更好的学习习惯,帮助他坚持学习,在他需要帮助的时候提供相应的陪伴和答疑的服务;通过大班的模式,我们可以发挥整个互联网规模化的效应,在商业上是一个更加高效的方式。

在互联网时代,我们通过这样一种产品和业务形态的创新,帮助学员带来比较好的效果。

不过今天,我们走到了AI大模型时代,大家开始更关心另一个问题:AI 和教育的结合会带来什么样的重要变革?

我们看到了很多教育企业和AI的合作,包括可汗学院、Duolingo 这样的企业,都在和 AI 进行深度融合,一些科技大厂的一些中高层也在积极的投入到教育赛道的创业过程中来。很多行业的从业者,都会有开始担心,我的商业模式、我的产品业态会不会被颠覆,我的企业的发展和生存会不会面临巨大的挑战?

AI+教育,下一个阶段怎么走,我也没有确定性的答案。但综合 AI 时代的变与未变和我在高途的十年经验,我认为,下一个时代的智慧教育变革,关键可能在几点发生变化:个性化、导航化、集成化、专业化。

个性化、导航化、集成化、专业化

我们可以展开来看。

首先就是个性化。我们刚才提到,在传统教育中,要帮助不同的人,实现他自己的改变目标,其实挑战难度是比较大的。

而我相信,下一个时代的智慧教育,一定有一个非常重大的变化,就是从以老师为中心或者以学校为中心,转换到以学生为中心。

我们刚才也提到,同样的老师、同样的课程安排下,有的同学可以考上清华北大,有的考上二本。这是因为每个学生学习能力、学习状态、学习节奏存在非常大的差异。

在AI时代之前,我们的教育重点,可能地在将教育普及到更多人这个方向——也就是解决更多有没有或者好不好的问题。但是下一个阶段,我们可能真正要解决问题是怎样能让每个人都取得很好的学习效果。

这可以分为四个层次:学习效率、学习体验、学习习惯、学习动力。理想的学习效果,是能够让学生愿意主动坚持学习,同时有好的学习效率,最终才能获得好的学习效果。

理想的学习效果所对应的理想的教学状态,是有一个非常优秀的导师根据学生的实时学习状态,给他提供非常个性化的教学和引导。这个老师需要全知、全能、全心。这个老师知识水平没有任何问题,教学技巧没有任何问题,投入度和教学状态也是保持在一个非常理想的状态。

这样的老师本身在现实中,很难寻找。

这样还不够,我们还需要从课程的研发,到学员的诊断,到规划,到学习,到练习,到测试,完成一个完整的 PDCA(计划/执行/检查/行动)的循环。

这个过程本身也非常复杂,我们常常很难对一个学生真正学习状态和当前他的知识水平掌握的程度有非常深入的了解。

这两者都是AI未来可以在教育中起作用的地方。

我们现在就有一个非常重要的基础设施—— CDP(客户数据平台)。可以收集学生简单的特征,比如说年龄、性别、兴趣爱好,偏好等等,而如果我们在CDP中收集到每个学生在知识点上的掌握程度和水平,未来更有可能提供一个真正意义上的个性化的教学服务,

第二个可能的关键要素是什么?是导航化。

我们想要帮助学生,从目前状态,走到到学生需要的状态。以自动驾驶为类比的话,我认为教育本身,未来应该能够通过建模和规划策略,做到高确定性的稳定交付,这就是导航的概念。

举个例子,我们的学员想去考雅思,我们现在观察到学员的听说读写四门加在一起是 5 分的水平,但是想要申请海外的一所优秀院校,需要雅思 7.5 分,怎么能够让听说读写这四个科目上都提升到一个理想状态?

我们对考试本身进行建模。假如说每个科目里面都有 100 个知识点需要进行考试,我们去了解道每个知识点重要度是什么,考试中得分点是多少,权重是多少。同时我们去了解,每个知识点难度是多少,如果从 0 到10分的话,应该打几分。

当知道重要度和难度之后,我们将其转变为一个规划问题。

我们根据学生的能力,尽量把学生有限的时间花在得分点比较高,同时难度比较低的知识点上,这样就能在有限的学习时间里面取得好的效果。

接下来是集成化的概念。

要完成真正意义从A状态到B状态的过程,只靠老师和学员自己来去完成的话很难的。

拿我们看病作比方。比如说今天我们身体不舒服,我们希望能够改善自己的状态,我们会去医院。但医院并不只有医生。我们可以回想一下整个旅程是什么样的。我们先去挂号,然后去到门诊跟医生进行交流,他会给你开一个单子,我们接下来需要去做验血或者拍X光,拿到结果之后,医生再给你做进一步确认,最后给你开一个药方,然后领药,回到家吃药,过一段时间再来复检。如果比较严重的问题的话还需要动手术。所以在医院是非常多角色来去协同,为你提供服务的过程。

教学场景也是,除了直接教学服务的老师以外,还有两个非常重要的东西是督学体系和辅助体系。

督学体系就是帮助学员做目标的管理、诊断的规划、过程管理、激励反馈等等这一套东西看似并没有提供直接的教学服务,但是他在外围这一套配套的东西能够让学生保持良好的学习习惯和效率非常重要的一套内容。

另外为了让过程变得更加高效和体验更好,需要有一些辅助手段完成这个过程。比如说个性化的工作,一些游戏化、互动化的设计,都是让整个过程变得更加高效和有效。

为了实现这样一个过程的话,我们需要能够去提供多场景的解决方案的融合,上课课堂上应该怎么跟他进行一个互动,在课前、课后应该提供什么样的配套服务,在线上到线下怎么提供配套的融合。

为了解决这个问题,我们也提出了一个解决方案,我们称之为名师系统力,这是一个名师的角色,但是名师背后有教员老师,还有 AI 大模型、系统化配套的内容,通过完整的解决方案,我们才有可能为学员提供端到端的能够有效达成这样一个结果的逻辑。

所以这里面我们必须要考虑在整个的教学互动的整个过程中,我们如何能够把每个环节都能够变得更加高效和有效。AI的能力在这个里面是能够起到非常重要的作用。

最后,是专业化。

优秀的老师是稀缺的,想要实现理想状态上的个性化教学,我们很难去解决优质的老师的供给问题,而且哪怕是优秀老师它的状态、它的时间,它在每一个专业的维度和知识点上表现也会存在差异。所以为了解决专业化问题以外,除了专业化老师以外,需要通过 AI 和真人相结合的方法来去混合的提供教学服务。

我们如何跟 AI 相结合?不同的AI能力调用方式带来效果差异是很大的。

以地图导航举例子,有三种不同的模式:一、AI by Human Loop,AI作为工具辅助人完成驾驶。二、把 AI 能力设计到链路中,就像开车过程中打开导航,当需要右转弯时就提示你,这个过程是由人和AI共同协同完成。终极状态就是类似于智能驾驶,绝大部分的情况下都是由 AI 来去完成驾驶过程,真人只需要在必要时做一些介入和干预就可以了。

今天很多人把注意力放到大模型的一些底层的能力上,但是对绝大部分的从业者而言,大家可能需要更多去思考,假设我们今天有了非常强大的AI能力之后,如何把它集成到整个产品和业务链路中,能够为客户真正创造价值,能够为业务创造价值,这是比较重要的问题。

今天大家讲 Agent 概念比较多,我对 AI Agent 的理解是,端到端完成特定任务专业化的、数字化的劳动力。

还是以医疗行业做类比,比如说今天身体不舒服,进到一家药店,如果今天得的感冒,他给你感冒药,你服用身体就会变得更好。如果你是支气管炎,你就吃支气管炎的药,每个药品解决针对性问题不一样。

今天,有了 AI 的能力,有了 Agent 这样一个模式,我们未来有无数的能够完成特定任务的数字化的劳动力,这种劳动力如何能够集成到你的业务链路里面,能够在组织里面合力的调用,带来效果存在巨大差异。

教育场景也是类似的逻辑,在不同的节点上,在不同任务中,我们都可以尝试用AI能力来去帮助我们去解决不同类型的问题。有些类型的问题比较简单,它可能提供的只是简单辅助逻辑,有些问题比较复杂,需要人和AI更加复杂的协同,才能取得预想的效果。

很多人都在关心教育这样一个赛道,因为这个赛道的规模很大,而且是一个相对刚需的市场,但是不同的企业在这个生态中可能选择的生态位存在区别,今天提供的是保健品还是药品,还是开一家药房,还是开一家医院,还是开一家医疗集团,还是做一个面向这样一个行业的供应商,采用不同的商业模式,你在这个行业里面取得的效果是不一样的。

已经在教育行业中的或者对教育行业有兴趣的一些从业者、创业者,都应该仔细思考一下,我们该如何选择,如何结合好AI能力和商业模式定位。

高途使命是让学习更美好,点燃兴趣 + 培养习惯 + 塑造人格。

我们希望借助AI的力量,能够不仅帮助学员掌握知识、取得很好的结果,还能真正从底层去改变一个人的认知模式,去改变一个人的大脑结构和认知模型,让这个人在底层算法维度和模型维度成为一个不一样的人。这个对教育而言更重要和更有挑战性的命题。

借助AI的力量,高途集团希望在接下来 10 年里,帮助学员们都成为更好的自己。

浏览量: 22

具身智能出不来「 ChatGPT」,为什么?

2024 年,具身智能无疑是 AI 领域里最火热的新赛道之一。

相较于目前大语言模型在数字世界里带来的技术变革,具身智能描绘了通往未来世界的另一条路径:大量具有智慧的机器人出现在真实的物理空间中,通过参与到人类生产、生活的各个环节,改变人类的生活方式。

但和大语言模型可以利用海量互联网文本、图像资源进行快速学习不同,在具身智能领域里,机器人缺少低成本、高效率、多样性、可泛化的学习数据。

如果只基于 Transformer 架构的大语言模型(如 ChatGPT),人类无法实现具身智能。海量物理正确的训练数据如何快速获取,是迈向具身智能前的世界级难题。

13 年前,黄晓煌回国创业。回国前,他在美国伊利诺伊大学学习 GPU 计算,也在英伟达做过云计算。他一开始的创业方式,是希望用 GPU、云计算来做物理仿真,但在当时,极少有人可以理解 GPU 通用计算的价值。于是,黄晓煌用 GPU 进行光学仿真,并应用对家装场景里,把过往需要几十分钟的渲染提速到了 10 余秒,自此开始了群核科技的创业之路。

多年后,凭借着在家装渲染、工业 4.0 生产对接中积累的海量数据,在具身智能的技术巨浪袭来时,群核科技终于脱下「家装公司」的外壳,浮出水面。他们希望可以在数字世界和物理世界中间,搭起一道桥梁,通过海量可交互的、物理正确的三维数据,推动具身智能的发展。

以下是群核科技联合创始人兼董事长黄晓煌在 IF 2025 主舞台的演讲全文。在演讲中,黄晓煌分享了群核科技的创业故事,以及他们对具身智能时代的思考。由极客公园整理。

 

ChatGPT 解决不了的 「叠被子困境」

大家好,我是极客公园的老朋友,来自群核科技的黄晓煌。今天我介绍的主题是:如何让 AI 从数字世界走向物理世界。

大模型到来之后,所有人都想知道它能为我们做什么。我们的下一代已经成为了「AI 原生娃」。我女儿刚学会认字,但她已经能很自然地对着各种镜子和屏幕喊「小度小度」或者「小爱同学」了。

但他们目前还只能跟虚拟人物进行沟通,我们更希望孩子们跟物理世界有更多互动,有真实的陪伴。可惜即便 AI 现在已经可以吟诗作画,但就算叠被子这么简单的家务,机器人都实现不了。

当我们谈到具身智能或者机器人的时候,「叠被子困境」是一个非常典型的场景。

目前的 ChatGPT 大语言模型,可以很容易地让机器人理解人类的指令,「给我叠一个被子」,它也可以通过视觉判断哪床被子是叠好的、哪床被子没叠好,但它很难执行。或者当它学会叠一床被子后,换个形状可能就又不会了。

机器人的大脑在数字世界里,但身体却在物理世界中。解决这类问题,最关键的是在物理世界和数字世界里面建立一个桥梁。而 ChatGPT 一类的大语言模型是无法实现的,我们需要一个全新的大模型。

让机器人正确理解物理世界,关键是要有海量可交互的三维数据。很多大语言模型都是根据互联网上的语料信息、图片或视频训练出来的,但这些内容只是一堆静态的记忆,训练出来的东西跟物理世界是相违背的。

这里有一个简单的例子,左边是由 Stable Diffusion 大模型生成的卧室场景,右边是由我们的矩阵 CAD 引擎生成的。乍一看都挺漂亮的,但左边这张存在多处物理不正确的地方:比如有的床头柜悬空、有的柜门无法打开。我们需要在大模型脑海里呈现右边这种内容,来指导真实的生产制造。

Diffusion 模型生成的图片和视频,目前还存在和许多物理 bug | 图片来源:群核科技

 

群核的创业之路:家装公司收到硅谷来信

说说我的个人经历吧。我一开始在美国伊利诺伊大学香槟分校学习 GPU 高性能计算;后来去英伟达做了 CUDA;回国后成立群核科技,做了 3D 云设计平台;现在又在关注具身智能。

经常有朋友问我,为什么你选择这样的创业路线?我想说,在中国创业没办法太阳春白雪,要脚踏实地跟着时代走。

刚开始创业的时候,我想用 GPU、云计算来做物理仿真。但是回国一看,发现当时投资圈热门的都是移动互联网、O2O,我所想做的项目根本融不到钱。跟投资人讲 GPU 通用计算,在那个年代几乎就是对牛弹琴,更不要提物理仿真了。

后来,我们想到了用 GPU 来做光学仿真,把原来需要几十分钟、一个小时的效果图渲染提速到了 10 秒钟,为家装设计师提速。这个「家装 OTO」的概念,很快成为了资本最推崇的项目,帮我们融到了很多资金,让酷家乐成功上线并成为了设计师首选的设计工具。

下一步,我们抓住了工业 4.0 改革里,传统工厂打造柔性生产线的需求,用我们的数据帮助工厂进行升级。我们用物理仿真、数字孪生,把每一件商品拆解成一个个零件,通过流水线机器人以及传送带实现柔性生产。

但这依然不够,因为这些工厂里所有的机械臂都是没有智慧的。你告诉它往左就往左、往右就往右,机械臂是没有智能的。一旦进行微小的改动,所有一切都要重来。所以,现在的无人工厂实际上还不是真正的无人工厂。

那段时间我非常苦恼,但我们已经见识到了物理正确数据的价值。直到有一天,我看到马斯克提出用人形机器人在工厂生产汽车,就觉得工业 4.0 的下一步是把流水线机器人变成人形机器人。我觉得这是未来,而群核科技就是这些所有机器人训练的「道场」。

 

群核科技的空间智能探索之路 | 图片来源:极客公园

这些年我们做 3D 云设计平台,尽管路径一些曲折,但也积累了海量的三维数据:3.2 亿个 3D 模型、不计其数的物理正确的三维场景、月活接近 8000 万,服务了 200 多个国家和地区。我们在这个过程中始终相信,物理正确的空间数据是可以用来训练大模型的,我们的科研人员也一直在训练,在等待一个机会。

2018 年,我们的科研人员跟帝国理工、南加州大学共同发布了一个室内智能数据集方案。这是当时全球最大的室内场景认知深度学习数据集,一下子在学术界很热。

有一天,我们收到了一封硅谷最大公司的邮件,希望跟我们进行空间智能的合作。当然我们甚至怀疑是骗子。几万亿美元的大公司,怎么会找一家创业公司合作空间智能。但这的确是真的。在合作的过程中,我们发现了这些大公司在解决了算力、算法问题之后,他们面临的问题是,缺少海量的、可交互的、物理正确的三维数据。

我们跟目前全球这个领域最靠前的公司基本都达成了合作。这两年,中国的空间智能、具身智能也爆发式地增长,我们也跟国内头部公司达成了合作。这个时候,我觉得技术奇点到来了,我们的机会也来了。

 

具身智能的世界级难题:数据

我们发现,现在不管是空间智能还是具身智能,有四个最关键的问题需要解决:算法、算力、数据、机器人硬件。

算法层面,目前是百花争鸣的状态,有非常多算法。

算力层面,国外以英伟达为代表,国内也有地平线等公司在快速地解决这个问题。我觉得算力已经过了技术的奇点,可以支撑人造的智慧了。

机器人硬件层面,中国更是独霸全球。

而目前世界级难题的是:如何给机器人提供用来训练的可交互的数据?这就是我们要去解决的。

群核科技联合创始人兼董事长黄晓煌 | 图片来源:极客公园

目前用来训练具身智能的方式,主要有两种:

第一种,以斯坦福大学的 Moblile Aloha 为代表,它通过用设备来采集人在物理空间中的动作,来训练机器人。但是它的采集成本非常高,而且空间非常受限。

第二种,也是目前学术界比较火热的,通过仿真数据来做机器人的训练。目前新一代的算法论文都是基于这个逻辑,李飞飞的文章也都是这个逻辑。因为它才真正可以实现在海量的空间里面做物理训练,让机器人能够拥有足够多的适应性。

相比真实的训练环境,仿真训练主要有以下四个巨大的优势:

第一,低成本。假如用一个真实的空间训练一个机器人,那么每训练一个场景都要盖一个真实的房间,那这个成本实在太高了。

第二,高效率。在物理世界里,时空是确定的。如果训练一个机器人需要 1 天,那么训练 1 万次就得 1 万天,时间没有办法压缩。但在数字世界里,时间是可以被压缩的,物理世界里要用 1 万天跑完的数据,数字世界里也许 1 天就可以跑完。

第三,多样性。在现实世界里面,要找到各种各样不同场景是非常困难的。如果我们想训练一个机器人去火星上帮人类干活,但没有办法先把一堆设备送到火星上去提前训练。合成数据解决了多样性问题。

第四,可泛化性。李飞飞发表的文章里提到了「数字表亲」的概念,可以生产类似的场景进行训练,从而实现举一反三。否则我们训练出来的机器人只能在一模一样的房间里干活,离开了那个房间,还是啥都不会。

相比真实场景,仿真数据用于具身智能训练拥有诸多优势 | 图片来源:极客公园

那么,群核科技的核心优势是什么?我们为什么能一起参与这个有意思的征程呢?

我们通过多年的 3D 云设计平台,积累了海量数据,用这些数据训练了自己 CAD 的大模型。这些大模型可以阅读人类的 CAD 文件、图片、手绘等,然后把这些内容再转换成物理正确的空间场景。我们也自建了 1 万多台高性能计算服务器,专门用来训练、推理、渲染。我们希望用物理正确的合成数据,来帮助所有具身智能的机器实现训练。

今年,我们推出了新版本的 SpatialVerse 来赋能 AI 空间智能。因为传统的三维数据太「干净」了,没有办法直接用来训练机器人。我们需要 AI 对这些原始的数据进行物理增强:告诉机器人哪里是抽屉可以打开,可以打开多少程度;物体的重力是多少;哪里是门可以打开,是往里开还是往外开等等。

其次,在机器人训练的时候需要有各种语义信息在里面,过去都是人工标注,现在要用 AI 给它自动标注好。

另外,环境加强也很重要。我们平常人生活的环境不是像 3D 世界里面那么纯净的,包括你的房间里面有纸巾、有动物的毛发等,但是在数字世界里没有,你要把它以某种方式加回去,让一个空间不是一个纯净的空间,它需要更接近于真实的空间。

最后是隐私问题。前阵子全球最著名的公司之一被曝出在采集物理数据的时候,不小心拍到了房屋主人上厕所的视频。合成数据就没有这个问题,它不会涉及到人类隐私的问题。

我们今年和上海人工智能实验室一起发布了具身智能训练的新范式,多模态的 3D 数据解决方案,就是大规模的动态场景生成,渲染+物理真实感以及高分辨率的场景分割。这里面的空间场景都是基于我们 SpatialVerse 的解决方案。

具身智能未来将进入更多场景中 | 图片来源:极客公园

我以上展示的这些肯定不是空间智能、具身智能的全部,它只是开始。具身智能还会进入到我们更多的场景,除了在我们工厂里面工作,还会进入到我们的商业空间里、办公室里,家庭里。未来,我们的生活场景里面会充满了空间智能、具身智能的机器人。

当然,所有的使用场景都需要丰富的物理正确的三维数据给它们训练,因为大家不希望一个没有训练过的机器人在你家里面。一个 300 公斤重的机器人,万一发起疯来,谁都受不了,所以我们得确保它在足够多的空间里训练过,才能够进入到我们工作生活的环境里,这是非常重要的。

我相信未来肯定是具身智能、空间智能的时代,我相信从生产制造再到商业空间再到我们家庭场景,它会充斥到我们每一个角落,就像叠被子那一刻被机器人完美地解决了之后,机器人就会解决我们日常生活中各种各样所需要的问题,我也希望群核科技能够成为中间重要的推力之一。

欢迎各位小伙伴跟群核一起走向技术的彼岸。

浏览量: 40

文章分页

上一页 1 … 54 55 56 … 86 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间