Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

分类: 科技

WPeMatico Campaign中添加的类别

AI 是如何利用语言技巧「操纵」人类的?

作者|Moonshot
编辑|靖宇
 
AI 说话没有情感的论调,已经是过去式了。
曾几何时,语言被认为是我们智人特有的能力,人类通过语言传递信息和情绪,表达抽象和具体的概念。
正如同许多畅销书致力于教人「说话之道」,「口才」也常被视作一项人类特有的技能,这都证明了人类语言中蕴含着某种技巧,这类技巧或许可以让交流更顺畅,信息传递更高效,交流对象情绪上也更满意。

当下最火的综艺《再见爱人》中,嘉宾麦琳就因「不会说话」产生许多争议|图片来源:《再见爱人》

 
今年上半年,OpenAI 推出了 GPT-4o 就可以让聊天机器人展现出类似人类的「个性」同时,说话主动、友好且富有同理心。
它说出的话自然又流畅,语音生动又自然,分分钟通过图灵测试,不仅会聊还会撩,能当私人助手也能当网络男/女友,从答疑解惑到提供情绪价值,这类聊天机器人在逐渐成为一个智商、情商双高的形象。
聊天机器人口才技能点已经点得比许多人类还高,早已深谙「说话之道」,甚至引发了赛博网恋的热潮。
但 AI 的说话之道,拆解完也只是算法的套路罢了。
 

AI 说话之道

AI 说话之道第一个技巧,是善用人称。
人类语言最显著的特征之一是主观性,主观性最典型的特征就是使用第一人称:「我」、「我们」。
第一人称在表达里最大的优势,是能让听者进入叙述者的内心世界,体验他们的情感、思想和感受,了解叙述者的主观观点,进而产生共鸣和亲密感。
就像同样的句子,换一个人称,给读者带来的「距离」感就不同,比如:
「我今天很开心」对比「某人今天很开心」;
「我觉得张三有错」对比「有些人觉得张三有错」;
除了自说自话,在对话里,有第一人称就会有第二人称,即「你」,第一和第二人称在对话里建立了联系,这在语言学上叫做「相互主观性」。
聊天机器人的技巧正在于此,无论我是否用第一人称和它对话,它都倾向于用第二人称回应我,比如我问 ChatGPT:
「如何快速缓解骑行后的大腿酸痛?」
这句话里并没有「我」,但 ChatGPT 会在罗列出一堆方法后说「通过这些方法,你可以更有效地缓解骑行后的大腿酸痛,促进肌肉的快速恢复。」

客观地提问,但会被主观地回应|图片来源:ChatGPT

 
聊天机器人通过在回答里加入人称,和用户建立了「相互主观性」,营造出一对一对谈的感觉。所以,同样是提问,传统搜索引擎像是给出「结果」,而 AI 机器人则像是给予「回答」。

传统的搜索引擎就不会在结果里带有任何人称|图片来源:作者自制

 
AI 说话之道第二个技巧,是表达肯定。
聊天机器人往往会在回答前,先肯定用户的提问或困境,比如「提高做事效率对于拖延症患者来说确实是一个挑战,但通过一些有效的策略和工具以显著改善你的生产力和组织能力。」
尤其是对许多没有标准答案的问题,聊天机器人都会先认可用户,并表示理解「这种情况可能让人不知所措/的确是个挑战/是一种很常见的状态,这些方法或许可以帮助到你……」

ChatGPT 不会批判,只会理解|图片来源:ChatGPT

 
聊天机器人不会评判甚至批判用户,只会理解后给出回答,它在承认用户的情绪后,创造出了一种同理心的错觉。
之所以是错觉,因为它不是心理治疗师,它只是聊天机器人,这些回复也只是程序员制定的「拟人话术」。
 

温柔水煮青蛙

AI 通过在回答里用第二人称,给了用户「被认真对待」的感觉,建立了私密感,也强化了亲密感。
从不批判,反而是理解包容用户所有困惑的态度,又给予用户心理上的安全感,何况聊天机器人只倾听,不传播,这又会进一步诱发用户的倾诉欲。
正如研究类媒体 The Conversation 所担心的:「随着人工智能越来越擅长模仿人类情绪和行为,用户形成深刻情感依恋的风险也在增加。这可能会导致过度依赖、操纵甚至伤害。」
这种用户对聊天机器人产生的某种情感,在心理学上被叫做「ELIZA 效应」。
20 世纪 60 年代,MIT 计算机科学家 Joseph Weizenbaum 发明的聊天机器人 ELIZA,通过对话引导,重复强调人类对话者用语的方式,这个只有 200 行代码的聊天机器人,在测试里就让人产生被机器聆听和理解的错觉,ELIZA 回复的一大特点就是:每一句都会带上「You」。

六十多年前的聊天机器人 ELIZA|图片来源:维基百科

 
此前,无论是极客公园报道过的「擦边 AI 女友」,还是 2023 年爆火,如今在欧盟已被管控的 Replika,都产生了用户和聊天机器人建立深刻情感后,因服务变更、数据丢失、版本升级等问题,导致许多用户心理健康恶化,甚至产生过几例自伤案件。
因为在用户习惯了快速回应、无微不至、绝不冲突的交流方式后,他们对人际关系的期望会发生改变,当脱离开聊天机器人,来到现实生活中和真人打交道时,可能会沮丧和失望。
而他们能在聊天机器人那里寻求到心理抚慰的原因,也可能源于现实社交中的受阻。与真人打交道后受阻,既而倾注情感到聊天机器人上,反而提高了对真实交流的预期,这才是更可怕的回音室。
那些主打陪伴型的聊天机器人,无一例外都会在和用户的交流里,用上「我认为」、「我感觉」等措辞,强调它的主体性,以混淆它本质上是一个 AI 聊天机器人。
这种拟人化的倾向,也早已渗入到了日常交流的浅层连接。
从电话背后难以分辨的人工还是人工智能客服,到如今手机系统自带的 AI 助手「帮我回电话」,在浅层连接上,我们从回应 AI 到判断 AI,再到让 AI 回应 AI,用魔法打败魔法的背后,是人与人之间对话的逐渐断联。

被称作社恐人救星的「小爱帮我回」|图片来源:3Dashan

 
无论是人称还是肯定,这些都是构建人工情感的语言技巧,是数据堆砌的同理心,是包裹在算法里的糖精,糖纸拨开后,只有 0 和 1。
AI 能和你产生情感连接,但它并不能真正理解你——碳基生物发自本能的落花有意,终究错付硅基算力的「流水无情」。
浏览量: 43

OpenAI 或考虑开发人形机器人;小米辟谣「年底大裁员」:缺乏基本常识;宁德时代发「智能底盘」,阿维塔首搭|极客早知道

OpenAI 已讨论开发一款人形机器人

12 月 25 日,据 The Information 报道,在过去的一年里,OpenAI 对机器人重新产生了兴趣:投资于开发机器人硬件和软件的初创公司,如 Figure 和 Physical Intelligence,并重启了四年前解散的内部机器人软件团队。

现在,OpenAI 可能会将这种兴趣提升到一个新层次。根据两名直接了解讨论的人士的说法,该公司最近考虑开发一种类人机器人。

例如,OpenAI 投资的三家实体机器人 Figure AI、1X、Physical Intelligence 使用的高级视觉、智能语音以及图形神经网络系统由 OpenAI 的 GPT 系列模型提供,足以看出其在技术方面的优势。(来源:财联社)

苹果新战略曝光:放弃造车转战智能家居造门锁

12 月 24 日,据马克·古尔曼的最新爆料,在 2024 年遭遇一些挫折后,苹果在新的一年里着眼于三大增长机会:人工智能、机器人和智能家居。

古尔曼写道,苹果在今年取消了汽车项目,头显 Vision Pro 也反响平平。展望明年,苹果的两大机会也面临着各自的挑战,人工智能项目仍在追赶科技同行,而机器人方面的努力需要数年时间才能取得成果。

他补充道,在这种环境下,智能家居将成为苹果 2025 年可能产生最大影响的领域,「在亚马逊和谷歌主导市场多年之后,苹果希望能通过一款融合人工智能的智能家居控制中心引起轰动。」

根据古尔曼的说法,由于长期以来一直致力于保护隐私,因此,苹果认为自己在这一领域具有优势,公司研发的家用设备中包含一款具有先进面部识别功能的智能门铃,可无线连接到门锁。

古尔曼称,这款门铃系统很可能与市场上现有的支持 Apple HomeKit 协议的许多第三方门锁兼容,苹果也有可能与指定的门锁制造商合作,在发布的第一天就能提供完整的系统。(来源:快科技)

 

AMD AI 芯片被指软件有缺陷,难以挑战 NVIDIA

12 月 24 日,据报道,芯片顾问机构 Semianalysis 经过 5 个月的调查后指出,AMD 最新「MI300X」AI 芯片因软件缺陷和性能未达预期,若未经过大量调试,训练 AI 模型几乎不可能,导致 AMD 在品质和易用性方面陷入挣扎,而 NVIDIA 则持续推出新功能和工具库,保持领先。

该机构进行了包括 GEMM 基准测试和单节点训练在内的大量测试,发现 AMD 难以突破 NVIDIA 的「CUDA 护城河」。SemiAnalysis 指出,分析团队必须与 AMD 工程师合作修正无数软件缺陷,才能达到可用的基准测试结果,而 NVIDIA 系统则能即开即用。

Semianalysis 首席分析师 Dylan Patel 在 23 日表示,他与苏姿丰进行了 1.5 小时的会议,逐一讨论了这些问题。苏姿丰承认 AMD 在软件方面的不足,并认真考虑了 Semianalysis 的建议,同时向 AMD 团队和 Semianalysis 提出了许多问题。(来源:快科技)

 

谷歌就反垄断案提出新方案:苹果 iPhone 与 iPad 可采用不同默认搜索引擎

12 月 25 日,谷歌在一份提交给法庭的文件中称,iPhone 和 iPad 可以有不同的默认搜索引擎,试图捍卫其与苹果公司每年高达 200 亿美元的合作协议。这项合作正面临被法院禁止的风险,谷歌正积极提出一系列反制方案。

谷歌每年向苹果支付巨额费用,以换取 Safari 浏览器中的默认搜索引擎地位。用户在 Safari 地址栏中进行搜索时,默认情况下会使用谷歌搜索(除非用户手动更改设置)。这笔交易的具体金额从未对外公布,苹果将其隐藏在服务收入中。但在针对谷歌的反垄断诉讼中,2022 年的交易金额被意外披露,高达 200 亿美元(当前约 1460.66 亿元人民币)。

美国司法部(DOJ)认为,这项交易是非法的,因为这使谷歌相对于规模较小的搜索引擎获得了不公平的优势。今年夏天,一家法院也认同了这一观点。司法部已要求法官禁止这项交易,禁令期为 10 年。(来源:IT之家)

 

美股三大指数集体收涨,特斯拉涨超 7%

12 月 24 日收盘,美股三大指数集体收涨,道指涨 0.91%,纳指涨 1.35%,标普 500 指数涨 1.1%。大型科技股全线走强,特斯拉涨超 7%,Arm 涨超 3%,奈飞涨超 2%,苹果、亚马逊、Meta 涨超 1%,微软、谷歌、英伟达小幅上涨。热门中概股涨跌不一,蔚来涨超 3%,理想汽车、小鹏汽车涨超 1%;拼多多、百度、网易、B 站小幅下跌。(来源:36Kr)

王化辟谣「小米年底大规模裁员」传闻:造谣者缺乏起码的常识

12 月 24 日,小米集团公关部总经理王化今晚发文,否认了「小米年底大规模裁员」的相关传闻。

王化发微博称:「每到年底就会有造谣裁员的内容,这一篇算是我看到比较离谱的。6 千人规模、3500 人、10% 不到、整体 20% 这种规模的不得先行报备有关部门?是不是缺乏起码的常识?最搞笑的是,『还有一个月就发年终奖了』这一定不知道什么是财年!匿名的职场软件平台,其实并不能隐藏身份的,要不咱赶紧攒点钱?」(来源:新浪微博)

 

X 平台上调 Premium Plus 订阅费至每月 22 美元

12 月 24 日,社交媒体网站 X(前身为 Twitter)发布消息称,在新的一年里,该公司将 Premium Plus 的订阅费率从每月 16 美元上调至 22 美元,这是自马斯克 2022 年收购该平台以来的最大涨幅。

美国市场率先生效,价格调整于 12 月 21 日起实施,现有用户可维持原价格至 2025 年 1 月 20 日。国际市场同步涨价,欧盟地区月费从 16 欧元升至 21 欧元,加拿大从 20 加元升至 29 加元。基本和高级计划的月费率保持不变,分别为 3 美元和 8 美元。

据了解,Premium Plus 允许无广告内容、访问更长的内容、分享广告收入、使用监控工具以及更多地访问平台的 Grok AI 模型。上调 Premium Plus 订阅费率有望提高创作者的收入分成计划支出。(来源:新浪科技)

 

周鸿祎:人类命运已被改变 AI 某些方面已超越 99% 人类

12 月 24 日,360 公司创始人周鸿祎在微博分享了他对 AI 的最新见解。

他提醒公众,在过去的十二天里,人类及全球的命运或许已悄然发生了变化,但许多人尚未意识到这一点。在这短短的十二天内,几家国际科技巨头在人工智能领域展开了一场激烈的竞争。据周鸿祎观察,人工智能正以前所未有的速度接近甚至超越人类的某些能力极限。

它在逻辑推理、问题解决以及模仿抽象思维等方面展现出了惊人的进步,并且在特定领域内已经超过了 99% 的人类表现。他认为,我们正处于一个历史性的转折点上。(来源:新浪微博)

 

中国邮政成立无人机公司:注册资本 1 亿元,经营范围含智能无人飞行器制造等

12 月 24 日,国家企业信用信息公示系统显示,中邮无人机(北京)有限公司于 2024 年 12 月 18 日成立,法定代表人为许宁,注册资本 1 亿元。

该公司由中国邮政速递物流股份有限公司全资持股,经营范围包含智能无人飞行器制造、智能机器人的研发、智能机器人销售、人工智能硬件销售、人工智能通用应用系统、人工智能行业应用系统集成服务等。(来源:IT之家)

宁德时代发布磐石底盘:120km/h 正面碰撞不起火不爆炸,阿维塔宣布首发

12 月 24 日,宁德时代在上海举办底盘新品发布会,发布磐石底盘。宁德时代(上海)智能科技董事总经理杨汉兵表示,宁德时代磐石底盘是 CIIC 超高安全旗舰版本底盘,带电情况下可达到 120km/h 正面碰撞不起火不爆炸的超高安全。

磐石底盘是一套以电为中心的 CIIC 一体化智能底盘,主打智能和安全,定位高效安全底座。宁德时代介绍称,基于该底盘打造的车辆,上车身吸收碰撞能量 15%,而更坚固的 CIIC 底盘碰撞吸收能量 85%。在中汽研的实测中,配备了该底盘的试装车,在 120km/h 的车速下正面 100% 撞击,可以做到不起火不爆炸。

阿维塔今年 3 月就曾和宁德时代共同宣布,阿维塔将成为全球首家采用宁德时代磐石底盘的新能源品牌。(来源:IT之家)

 

影驰泄露 GeForce RTX 5080「Blackwell」包装盒图,或透露神经渲染功能

12 月 24 日,NGA 论坛网友@御坂御坂御坂酱 分享了一张疑似对应影驰 GALAX 品牌 GeForce RTX 5080 显卡包装盒的印刷设计图片。外媒 VideoCardz 从其信息渠道确认该设计属实。

包装盒上,人脸的一半由流向人脸的三角形组成,而另一半则由蓝色的流光组成,似乎在表示它是用-种与「三角形」根本不同的方法绘制的。这两种渲染技术都应用于同一帧画面,因此神经渲染技术与 DLSS 3 帧生成技术有着本质区别,后者是一种利用光流、运动矢量和人工智能绘制交替帧画面的技长。

英伟达 GeForce RTX 5080 显卡预计于 CES 2025 发布,并有望成为 RTX 50 系列游戏显卡中的首发型号。从目前信息来看,该显卡将基于 GB203 GPU,拥有 10752 CUDA 核心,配备 256bit 的 16GB GDDR7 显存。(来源:IT之家)

行业呼吁特朗普就职首日发布支持加密货币的行政命令作为路线图

12 月 24 日,据美国加密行业预计,候任总统特朗普将在就职第一天发布支持加密的行政命令,作为路线图。

Polygon Labs 首席法律和政策官 Rebecca Rettig 表示:「考虑到竞选的气氛,行政命令必须真正阐明第一天的实际优先事项,并提供某种路线图。」

特朗普最近提名支持加密货币的 Stephen Miran 和 Bo Hines 进入经济和数字资产委员会。此外,特朗普还选择了另一位支持加密货币的人士 Paul Atkins 担任美国 SEC 的新任主席。

加密货币行业已经概述了希望特朗普通过行政命令解决的关键优先事项,首先是建立价值高达 210 亿美元的比特币国家战略储备。(来源:ODaily)

浏览量: 44

影石刘靖康:在「AI 硬件」的战场上,大 Boss 是手机厂商,不是互联网公司

2024 上半年,影石 Insta360 超越了老牌厂商 GoPro,成为了运动相机品类的全球第一。

但影石这家公司的创新故事,并非是从一开始就被设计好的。

实际上,九年前,当毕业于南京大学软件工程专业的刘靖康踏出创业第一步的时候,他只是想做一款用于手机直播的软件。2016 年,当 Insta360 的第一款产品 Nano 在 CES 展会上成为明星产品的时候,他还没意识到户外运动人群会在此后很长一段时间里,成为这家公司主要的用户群体。

Nano 在爆火后陷入低谷,刘靖康这才重新思考了产品、技术和商业之间的关系。「先摸钉子,再造锤子」是他和公司在此后很多年里重要的产品方法论,即:

先找到一个被市场应证过的领域,然后挖掘用户尚未被满足的需求和痛点,造出更好用的产品,并把推向市场。

同时,作为一个从大学生创业团队成长起来的商业组织,影石 Insta360 也乘上了两股技术浪潮:手机机器小型化,让智能影像的计算和工程化变得更可实现;而 AI 1.0 时代储备的资源,则为日后 AI 剪辑、一键成片等功能奠定了技术基础。

站在 AI 2.0 时代的路口,刘靖康希望能用技术,在运动之外的更多领域里,找到更垂直的场景。同时,在新一轮「AI 硬件」浪潮开始前,刘靖康有着和行业内大多数人不同的判断:他认为手机厂会是比互联网厂商更大的「BOSS」,因为他们同时掌握了更个人向的数据,以及执行具体操作的「位置」优势。

以下是影石 Insta360 创始人刘靖康在极客公园 IF 2025 创新大会 和极客公园创始人 & 总裁张鹏的对谈实录,由极客公园编辑部整理。

 

做硬件,是为了更好地服务软件

 

张鹏:我最早认识 Insta360 的时候,你们的第一代产品还是个手机配件。很好奇为什么一开始从这个产品角度开始构建一家创业公司?背后有什么故事?

 

刘靖康:Insta360 一开始是个大学生创业团队。在学校的时候有很多音乐节或者讲座,我们做了个手机直播 App,让不能来现场的同学也能看到。一直以来,对帮助人们把最珍贵的回忆更好地记录和分享,都是我们的想法和初衷。

一开始,我和一帮学弟做手机直播 App。一次偶然的机会,看到了一段由好多个相机通过很复杂的电脑软件处理,生成的一段 360° 视频,觉得非常震撼。我们认为这种 360° 的内容就是影像的未来,可以把所有的细节完整记录下来。

但这种创作这种视频的门槛非常高,所以我们的目标就是通过我们的产品,让用户一键生成这样的内容。因此,这个相机要「即拍即得」,这是创造 Insta360 的初衷,「Insta」代表着「即时的」。

 

张鹏:所以那个时候选择做一个单独的配件,跟手机要连起来做这件事,这是因为自己做一个完整的闭环产品算力不太够?

 

刘靖康:对。手机本身不能拍到 360° 的画面和视频,需要好多相机手动拼装在一起,还要加上一堆电脑软件。但这样没法很好实现我们的想法,让客户即拍即得。所以我们最后选择了一条软硬结合的创业路线。当时硬件层面,光靠市场上芯片是不足以实时计算和拼接这样的内容,所以我们做了巧妙的设计,利用了手机内的计算资源。

Insta360 的第一代产品 Nano | 图片来源:影石 Insta360

张鹏:你是学软件的,怎么走上了硬件的路呢?这中间经历了哪些困难?

 

刘靖康:有很大不同。做软件的时候,写完代码马上就可以跑,测试完就可以上线,我们叫敏捷迭代。但当年刚开始做硬件还是非常痛苦的。好不容易把 DEMO 做出来了,进一步往下走的时候,在南京根本招不到人,而且很多材料也得从深圳买。所以我们做一个大胆决定,把公司搬到深圳去重新开始。

到深圳之后又面临新的问题。以为从 DEMO 到量产是一个很自然的过程,其实中间还包含着结构设计是否有可制造性、工艺是否稳定、成本、可靠性……很多东西都是不懂的。就凭着一腔热情和对硬件世界的朴素理解,硬是搞了几百个东西出来,但是这种产品质量是不过关的,发出去之后也召回。经历了非常痛苦的过程。

从软件转移到硬件,有一个重要的点:我们在计算机世界里复制一个东西是很简单的,但是硬件世界里,把一个东西从 1 复制到 10,和 1 复制到几万、几十万对应的是不一样的问题。在物理世界里,你的物料稳定性、工艺稳定性、结构设计、硬件设计很多东西都是决定了复制事情的效率、成本、质量。

 

张鹏:在软件里两行废代码,问题不大。在硬件里面多了三个零件,整个链条都会有改变,成本也会有改变。

 

刘靖康:对,这是非常痛苦的过程,但是我们认为做硬件还是必须的。做硬件目的是为了更好地支撑我们的软件。我们大部分的工程师也是做软件的,因为如果你知道软件怎么工作,才能设计最好的硬件,分配好高效的计算资源,让软件更好地运行,实现最佳的体验。

 

张鹏:你的创业的起点是大学生创业+硬件创业,算得上传说中两个「地狱级」创业成功的难度双重叠加。如果让你回想这个历程,有几个关键决策是什么?

 

刘靖康:我们学习一个陌生的领域有一个关键的切入点,就是如何掌握评价一个事情的好和坏,评价标准是什么样的?然后就是学会整个东西的设计、生产、制造流程。

这些是高效方式的。我们认为面试公司的关键人员,是理解和学习最快的方式。面试过程中,你会快速掌握要做好这个事需要哪些岗位和角色。如果一切都顺利的话,可能刚好面试者也会被你感召,加入到你的团队,这是一举多得的方式。

 

张鹏:没有创业经验的人,最大的成本就是不知道自己不知道的那个成本,那部分成本越少越好。

 

从小众到垂直,如何挖掘产品的PMF

 

张鹏:从 Nano 到后来的全景相机,看起来需要有新的 PMF(Product Market Fit),怎么变成更多人群在更多场景里可用。我感兴趣这个 PMF 是怎么做的呢?

 

刘靖康:这是当初付出过很大的代价学习到的问题。我们作为技术出身的创业者,起点是想解决一个问题,甚至就是你的需求。但经常犯的错误是,我们认为自身的需求也是别人的需求。我们一开始插到手机上的 360°配件非常火爆,第一个月就卖了 2000 万,买那些产品的都是科技爱好者,觉得很酷。但是其实没有定义过那个产品的应用场景。所以很快就面临销量断崖式下降。

比较幸运的是,我们当时在社交媒体上找到了一个非常关键的线索。虽然我们的相机是设计成插到手机上的,但是有人通过「魔改」,把相机固定在自拍杆上。这个产品不是为那个场景设计的,所以其实很难用,但是依然有用户在用,这个线索把我们的目光转移到一个非常成熟的场景,就是运动相机行业前辈 GoPro 定义的场景。

我们发现,在 GoPro 定义的场景里面,其实除了骑行、滑雪,还有很多的运动场景,包括旅行场景,全景相机或者全景技术都可以很好地解决传统运动相机所不能解决的问题。比如取景的难度跟角度大小,还有其他一些问题。所以我们当时做了一个非常重要的决定,也是做产品非常重要的方法:自己不去定义场景,不去验证需求,直接就看哪些场景和需求是现成的。同时看这些客户有哪些痛点和问题。

我们后面全景相机转型变成全景运动相机过程里,我们调研了很多 GoPro 用户,即使那个时候 GoPro 用户规模已经很大了,但是他们对于产品在场景里的使用体验还是有诸多不满意的地方。我们收集了这些信息,通过全景技术重新定义了很多新的形态,对 GoPro 形成了有效的渗透。虽然听上去有点反直觉,但也是捷径,就是直接看哪些场景已经被验证过,去做更好的解决方案。

刘靖康分享影石 Insta360 产品 PMF 方法论 | 图片来源:极客公园

张鹏:就是不要猜或者假设哪些需求,而是在呈现出来的需求里挑一个。

 

刘靖康:这种方法也有个很明显的问题,你不会创造出一个更大的市场,只是在成熟市场里面把别人替换掉了而已。

还有一个方法,我们把「锤子」(产品)扔到市场上,看「鱼」(用户)上不上钩。如果鱼上钩,这是重要的线索,接下来很重要的判断依据就是客户的留存。如果买了之后继续用的话,就等同于那些「魔改」用户,用自己的时间和实际行动给这个需求投了票,他们真的有这个需求。就要紧紧抓住这些线索。

在未被验证的场景里,把锤子扔到市场上,如果客户留存高的话,这个事情可以做成;如果客户留存不高的话,就要分析为什么不高。是伪需求还是解决方案不够优秀,在整个过程中不断地造出新的 PMF。有了 PMF 之后把上面这个反复验证一遍,继续研究这些场景哪些需求没有被解决,再迭代产品。

 

张鹏:在一个新的品类出来之前,大家会说我们造锤子还是摸钉子。光造锤子也不对,光摸钉子也不对。你的做法是大概摸摸钉子,造个锤子,看哪个用户捡起来,然后再把它迭代。

 

刘靖康:对,扔锤子,看看谁捡起来。科技爱好者一般是最先捡起来的,但是也是会最先扔掉产品的人,还是要关注真正留存的客户。

 

张鹏:不是看有多少人捡,也要关注捡完了是否在持续用。

 

年轻创业者的「顺势而为」

 

张鹏:还有一个话题,其实搞硬件创业是挺难的,投入也大,真正开辟一个新赛道更加不容易。2015 年,那个时候智能手机如日中天,竞争非常激烈。手机上也有摄像头,也可以记录生活,它们很多能力跟你们是同技术栈的东西。为什么你们作为一个年轻的创业公司,真的能在这个赛道里做出一个优秀的新品类,而不是被手机厂商覆盖了?

 

刘靖康:首先公司本身要赚钱,要尊重底层的商业价值。再往下挖一层是客户价值链条,所有公司离不开一个问题就是客户为什么选择你。今天 AI 眼镜很火,这不一定是客户选择你的理由;手机如日中天,也不一定是用户不会选择你的理由。

我们想法是比较简单,如果客户选择你,第一,你能解决竞争对手不为目标客户解决的问题;第二,你相比于市场上其他方案没有明显的短板;第三,你的目标客户知道前面两件事,你要营销、渗透和传播。

刚才那三句话有个关键词,叫「目标客户」。手机可以解决大部分人对影像需求的最大公约数,但在最大公约数以外,有很多需求是未被解决的,这些人其实就是我们的目标客户。

刘靖康讲述硬件领域创业过程中的关键决策 | 图片来源:极客公园

张鹏:手机通用能力其实反而留下了一些专用能力的短板。那作为一家年轻的创业公司,去做这样一个细分的品类,你也没有融大非常多的钱,可以像苹果一样全链条的重新打造。是不是需要借点产业溢出的势头?能不能总结一下,你们借了哪几个势?

 

刘靖康:首先是借助智能手机发展所带来各种器件小型化。让工艺成熟、成本降低,可以把垂类产品进行优化。因为做一个垂直领域的东西,必然面临着你所需要的东西、技术等很多东西成本比较高,一定程度要借助流行的产业链。

然后是包括 2017-2018 年,AI1.0 兴起。我们当时觉得,很多人涌进了这个行业,但商业还是由场景决定的,如果场景没有那么快得到验证,这个泡沫一定会被刺破,就会有很多 AI 公司裁员或者倒闭。我们在产业高峰后半年到一年的时间进场抄底,也利用了 AI1.0 的技术,帮助很多客户完成了在全景或者视频编辑里面的自动化。

 

张鹏:你刚才说了两个产业发展红利。一个是正向的,就是器件小型化、能力不断提升,顺着手机的能力溢出;另一个是反向,看空,就是当时泡沫太大了,你没有在当时第一时间冲上去抢人,而是等倒下了再去。你赶上了两波技术浪潮,手机的高速发展和 AI1.0 的起步,某种程度上你冲了两波浪,比较难得的是没有被浪淹。

 

AI硬件:手机厂商比互联网大厂更有优势

 

张鹏:你们今年的产品其实在本质上顺着AI的 2.0 的维度上做了一些动作。是否可以圈点一下今年产品更新的核心亮点?

 

刘靖康:以前大家拍完了全景视频,还要花很多精力最剪辑。但客户买一个相机的真正理由不是操作这个相机,而是希望拍的时候不用管怎么拍,拍完之后就立即成片了。我们从 AI1.0 到现在都致力于怎么帮助客户自动裁剪和编辑。这一波 AI 能力在手机上能够运行,也在通过云的方式,通过 AI 大模型的能力,帮客户做更加精心的剪辑。

 

张鹏:主要的思路就在于,不要让大家操控相机,买这个相机是为了最后的交付,交付一个可以发到朋友圈,可以留在相册里的东西。那用户出门玩的时候,可以用一个设备覆盖不同的场景和风格吗?

 

刘靖康:全景相机位于记录和自动剪辑上有自己的优势,从影像设备角度来看,它可能还是多种设备组合在一起,因为从它的拍摄原理上来看,拍摄不同的题材需要不同镜头,现在拍专业人像会用 50 或者 85 的镜头,就像大光圈拍出来的质感,跟手机不一样,还是有差异。正如在手机这么主流的品类里面发展出这么多品类,影像还是分不同的场景,产品形态不一样,所以比较难统一,场景会扩大,但是很难用一个东西解决。

刘靖康介绍影石 Insta360 全新产品背后的设计理念 | 图片来源:极客公园

张鹏:对,即便看起来可以,这就跟当时说手机那个问题是类似的,它有通用的,但是还是会买那个场景里更适配的设备。

 

刘靖康:我们认为,无论是用 AI 也好,还是用新技术也好,还是全景相机,我们想应用很多场景,替换旧场景,甚至把很多场景都归一化成一个东西,这是挺危险的。从原理上来讲,客户是否购买你的东西,在于你是否比别人的解决方案更快、更高效。客户选择商品的逻辑跟我们想把一个技术推广到所有场景里的逻辑没有相关性,你公司收入更多跟客户的选购逻辑相关。我们对于技术应用更多还是会陷入在客户决策链条里,到底解决哪个环节问题,在那个环节里充分利用好的技术和未来技术去把它更高效的解决好,这样的话整个在商业闭环上会更加的高效一点。

 

张鹏:你在做这种事时是思考原则的人,你很多东西都会回归到几条基本的东西,它不会被某个东西轻易的带跑。那么问个大家都感兴趣的话题:AI硬件是最近资本和创业者都很兴奋的东西,对 AI 硬件你有什么跟大家嘱咐一下的?因为又是硬件,又是 AI,这个难度又在提升。

 

刘靖康:今天 AI+硬件,跟我们当年软件出身去做硬件有相似的地方。AI 可能是很多人擅长的地方,就像我们当年软件出身很擅长软件,但的确硬件有绕不过去的地方。

 

张鹏:硬件是九九八十一难的第一难。

 

刘靖康:对,而且硬件是客户最先能感知到的东西,硬件也是直接决定着产品的可制造性、成本、毛利、可靠性的载体。所以,今天 AI+硬件的公司:

第一是千万要敬畏硬件,扎扎实实通过构建好的团队把它做出来,你的 AI 可能是个很长的长板,但不能让硬件变成你的短板。

第二是刚才提到的 PMF,它还是要基于真实的客户场景,这是很重要的,不是说这个产品加上了 AI。给大家举个例子,像我们传统的那几样东西,冰箱、洗衣机、空调,给这些产业加上 AI,到底能不能 work 呢?有可能,但我还是偏悲观一点,因为在选择品类的时候有很多品类的核心需求已经被满足的差不多了。

所以 AI+硬件,要看 AI 对这个事情是不是个关键要素,是不是满足客户需求的那个关键要素,以及 AI 组合成的硬件所面向的场景是否真实存在。

第三是要考虑以终为始的看这个事情。比如说当年像操作系统这波,也有很多公司会做操作系统,但最后操作系统变成了一个基础设施,今天没人再去研究操作系统,在操作系统上面再去构建各种各样的东西。所以我们到底是在产业链上的哪一环,在未来也是重要思考的点。

刘靖康分享对「AI硬件」创业的观察 | 图片来源:极客公园

刘靖康:另外,我们做 AI+硬件、消费电子,也要考虑将来的一些玩家。无论是眼镜,还是佩戴身上的硬件,我个人有个观点:在这一波里面,我觉得从顺位排序上,手机厂是最优的,其次是互联网公司,然后是我们各种创业公司。

它的点不在于谁的钱多,或者说谁的品牌厉害,以及谁的渠道厉害,这都是很显性能看出来的差异,我觉得通过时间也是可以填补的。但我觉得有个事情填补不了。今天,靠公开的数据跟信息训练 AI 模型,可能就是互联网公司最擅长干的事情。但是你要做一个服务好个人的 AI,它还需要个人的数据,今天互联网公司也不见得有很多个人的数据,而就算有个人的数据,但互联网公司没办法给你的外卖下个单,没办法操作你手机上的东西,没办法访问你的手机日历,输出某个 action,从位置上来说,手机厂会更有优势。

 

张鹏:如果让你去挑选今天的AI创业者在未来前进路上要过关的 Boss,互联网公司、手机公司,听你的概念是觉得手机公司是个更大的 Boss。

 

刘靖康:对,手机是最大的 Boss。

 

张鹏:昨天我们聊AI比较多,虽然没有字节的人来,但所有人都在说字节,比如说它的 AI 能力就是非常强的,创业公司很难比拼的,你认为反而 AI+硬件的体系里面倒不是它们,而是手机厂商更值得关注。

 

刘靖康:对,我的观点也会比较片面,但我觉得有一个事实是很清晰的,只有手机才有那个「特权」。比如今天我跟我的眼镜说,给张鹏老师约今晚的饭,给他发个消息,通过字节的体系并不能做到这个事情,通过微信或许可以,但微信没办法影响你的日历。再比如,我明天有个行程,帮我订个航班,通过微信绕不到这一点,但是手机厂可以做到这件事情,手机厂商在输出指令上是有特权的。如果我们今天做这个创业方向,就必须考虑这条赛道上会不会存在一些东西,对一些公司来讲是不是有特权的。

 

张鹏:最后一个问题,你当年是被乔布斯感召的一代,在创业过程中肯定是乔老爷子很多东西对你们有很多影响,但经过这 9 年,如果再过 10 年,你更希望 Insta360 是个什么样的公司?

 

刘靖康:我觉得苹果和索尼有一类特质是我们非常向往的,也希望在非常长远的未来可以一直保持的,就是自己去原创一个东西、原创一个品类。

 

张鹏:苹果,我们肯定可以理解,甚至这是我可以预料的答案。你帮我解读一下索尼,你要像索尼的什么呢?

 

刘靖康:索尼是家挺可爱的公司,他们经常做一些很新奇,但是又没有人买的东西(笑)。

这个事情跟我刚才讲的拿锤子找钉子的事情是相悖的,但它是一体的。虽然说拿锤子找钉子对创业公司来说是件危险的事,但是我觉得保持做一把锤子去找钉子的心和不断去尝试是非常重要的。我们看到,索尼历史上创造的数码相机,包括苹果创造的 iPhone,这些都是历史上别人没有创造过的东西。

我们比较遗憾的是,今天当一个公司长大之后会更多把自己定位成一个追随者,等一个新东西长到差不多之后再入场,大家都知道互联网公司和手机公司都属于这类公司。海外也是这样。

事实上我们认为,智能硬件领域在 2020 年之后的四五年,相比于 2015-2020 年,全新品类的诞生明显少了很多,这还是挺遗憾的一件事情。我们希望可以保持初心,虽然我们不得不找现成的钉子,但我们还是希望可以一直保持一颗造一把锤子再去找钉子的心。

 

张鹏:可能所有人都会追求向苹果进发,但是用什么样的方法、用什么样的路径到那儿,你最终想要追求的东西是什么,规模只是结果的映射,但你真正想要走的那条路和去实践和创造的东西更接近索尼。你说话很平静,刚才给我们讲了很多原则,最后一个问题问出了你的心里话。

 

刘靖康:把之前的原则推翻了。

 

张鹏:很开心今天终于有机会把你的源代码分享给极客公园的朋友们。希望未来有机会多来到公园,也祝愿 Insta360 不断创造更好的产品。

浏览量: 48

相机公司瞄上了线上会议这块大蛋糕

谈到影石Insta360 的时候,你们最先想到的是什么?

也许是从雪坡上疾驰而下的身影;也许是在海底与珊瑚和浮游共舞;又或者,是那支在B站播放量已经突破千万的视频——跟随着卫星,用全景相机在太空俯瞰地球全貌。

全景、户外、运动、年轻、酷炫……虽然大多数人的印象还停留在这些标签,但影石其实已经悄悄布局会议线市场三年。从 2022 年推出首个针对在线会议和直播场景的 Link 后,2024 年影石在办公场景全面发力,不仅在 9 月推出第二代 Link 摄像头,更在近日推出了新一代 AI 双摄视频会议一体机产品 Connect。

影石全新的企业级会议线产品 Connect | 来源:影石Insta360 

对任何一家硬件企业而言,从 ToC 的运动拍摄切入到在线会议这样的 B 端场景都是一个非常有挑战的选择,但如果了解影石这家公司的话其实就不会觉得奇怪。

正如几天前影石创始人刘靖康在极客公园创新大会上讲过的那样,在他看来,开辟一个新市场的关键在于目标客户能否选择你的产品,而这取决于企业能否做到三点:

第一,你能解决竞争对手不为目标客户解决的问题;

第二,你相比于市场上其他方案没有明显的短板;

第三,你的目标客户知道前面两件事,也就是能否做好营销、渗透和传播。

以这样的标准审视影石此次发布的新品 Connect。先不说第三点营销,以前两点的标准来看,这其实是一款符合影石经营哲学的典型新品。不仅洞察了线上会议场景的用户痛点,影石创业九年来积累的软硬件技术能力,让其具备解决用户痛点的能力的同时,又保证其产品相较于传统在线会议解决方案没有明显的短板。

 

线上会议进入智能 4K 时代

疫情期间,线上会议时长以惊人的速度的增长。今天线上会议已经从一部分科技和跨国公司的专属,变成了绝大多数现代企业的标配。

海外的 Zoom、微软、苹果,国内的腾讯会议、飞书、钉钉等都在加快这一板块的布局,功能也在不断丰富。但软件的表现毕竟要依靠于硬件的硬实力,所以依然会有很多现有解决方案搞不定的棘手状况。

举个例子,现在绝大多数的多人线上会议,都是通过电脑+线上会议软件+有线投屏的方式进行的。人一多,收音首先就会一个大问题。如果用电脑本身的麦克风,那隔得远的同事讲话就基本只能靠喊;如果外接一个有线麦克风,人数少一点的时候,就可以像桌游发牌那样,谁说话把麦克风传到谁面前。但如果桌子一大,线也不够长的时候,可能还是会回到最原始的方法:换位置。

「我现在换了个位置,能听清了吗?」一场线上会的智能速记,打开一看「能听清吗」都成为了高频词。

再举个例子,如果是团队内部正在举行一场脑暴,需要用到会议室里的白板手搓一张思维导图,那线上的同事基本就没啥参与感了。即使把会议切到手机端,调用像素更高的手机后置镜头,也很难解决这个问题。

你想看具体某个细节的时候,可能镜头太「广」了;你想看整个导图的时候,可能镜头又太「特写」了,只局限在了会议室的某个角落里。

这种时候,你甚至希望这种线上会议有一个幕后的导播团队来调度现场的各种音视频表现,给线上会议这个效率工具本身提提效。

软件公司也在不断推出新功能来优化这些不佳的线上会议体验,比如各种文档的线上投屏等,改变信息传递的方式。但影石的思路却是革新远程会议的「眼睛」和「耳朵」,让远程参与者能够看清、听清会议室,真正意义上身临其境的参与会议。

同时,由于 Connect 提前与会议软件进行了高度集成设计,所以不再单独连接设备,甚至不需要把电脑带进会议上,也可以「一键入会」,再也不担心开会时电脑没电了。

Insta360 Connect 解决了过往线上会议的诸多痛点,也和飞书、钉钉、腾讯会议等软件进行了深度合作 | 来源:影石Insta360

Insta360 Connect 搭载了两颗 4K 摄像头,一广角一长焦的搭配,这样就可以满足不同视角的取景需求;音频方面则采用了 14 颗麦克风阵列的分布,可以做到 10 米范围内超远距离的无差别拾音。

两颗 4K 摄像头,广角特写视角智能切换 | 来源:影石Insta360

一广角一长焦的双 4K 摄像头配置,搭配影石自研的 AI 算法,可以做到多模态的发言人跟踪,即自动识别发言人并切换镜头。另外,Connect 还支持在遥控器或者平板上选择「智能白板模式」,开启后系统就会调用合适的镜头,自动识别会议室里的白板并给出清晰的画像。

Connect 上的智能白板模式 | 来源:影石Insta360

在音频方面,Connect 可以实现「智能降噪」和「回声消除」两个声音方面的优化,以往线上会议时经常出现的炸麦现象可以得到很好的处理。

而以上的影像能力,其实都来自影石过去累计的智能全景影像技术——也就是一边拍摄一边计算的并行处理模式。同时,在影石还把影像和音频、AI 能力进行了融合,用在了类似于实时直播的线上会议里,几乎起到了和广播电视导播一样的能力。

智能画廊模式,可在多人同屏时实现屏幕等分 | 来源:影石Insta360

以后,当年轻人们周一再走进公司时候,可能会看到前两天周末自己去户外时用来拍照的品牌,就这样出现在了会议室里,显得班里班气的。除了一肚子疑惑之外, 4K 摄像头带来的仪式感,可能也会让他们下周开会前额外再补个妆。

 

影石如何从户外走进办公室?

对于影石而言,从户外到室内不只产品应用场景的变化只是表现,背后代表着公司正在深入对 ToB 端业务的探索。毕竟,无数商业故事都证明,造办公用品比只做相机赚钱多了。

影石创始人刘靖康近期在极客公园创新大会上描述过影石寻找 PMF(Product Market Fit)的思路,其中很重要的一条即是:「在该场景里,市场上目前的产品并不能满足用户完整且核心的需求」。

所以,进入线上会议这个场景完全就是顺理成章。

目前尽管线上办公赛道火热,但核心玩家飞书、腾讯会议、Zoom 等基本都是软件服务商;而针对这一细分场景的硬件产品,要不就是不够智能,要不就是价格太贵。总之,目标客户的需求的的确确没有得到完全满足。

这种寻找 PMF 的经营思路,可以说贯穿了影石这家年轻公司从创立到现在的每一步。7、8 年前,影石团队也是照此思路,把成熟的全景影像技术应用在了运动相机上,成为了众多户外玩家的心头好。

作为一位从软件工程专业毕业的学生,刘靖康说过:要实现最好的软件功能,就需要非常 customize 的硬件提供计算平台。如果没有的时候,他的团队可能就会考虑自己造一台。

因此,尽管影石的不同产品线可能对应着不同的使用场景,但我们依然可以在软件能力或是技术栈上找到同源的线索。

在企业级会议产品 Connect 推出前,影石还推出了针对个人用户的会议线产品 Link2。前文介绍的基于 AI 能力的面部识别、人脸追踪、自动对焦等功能,Link2 上都有。

Insta360 Link2 的人脸追踪功能 | 来源:差评X.PIN

而且在实际的观察里,我们发现除了会议场景以外,其实已经有很多用户把 Link2 发展成了「创作型的生产力工具」。

例如,对于知识类博主来说,它可以替代手机成为一个视频博主的拍摄主力机:支持手势操控,可以直接切换到板书特写,让教学流程的拍摄的演示更思维。

又如,它甚至可以参与到直播带货的场景下。单反级的画质为直播保底,而自动快速对焦的能力,让手里的商品/食物可以得到更好的展现。

Insta360 Link2 的快速对焦功能 | 来源:影石Insta360

在 AI 时代,个体价值被逐渐放大的当下,Link 2 为个体创作者降低了生产制作的门槛和成本,成为了全新的生产利器。在京东、天猫等购物平台上,Link 2 已经超越了罗技、海康威视等,成为了销量最高的高端智能摄像头产品。

 

走近影石:进化是如何发生的?

最后,让我们回到影石这家公司本身。

从前文的描述里,我们不难看出,在为新技术寻找商业落地场景的时候,他们有着球场上最高效前锋那样把握机会的敏锐嗅觉。但问题是,这些技术又在从哪里来的呢?

近期,我们正好借助体验 Connect 和 Link2 两款产品的机会,和影石团队进行了一次深度沟通,似乎找到了一些答案。

一个很核心的关键词便是:借「势」。

也就是说,作为一家年轻的创业公司,在成长过程中,需要拿出和寻找 PMF 一样的敏锐度,捕捉到宏观产业变化里可能为自己所用的溢出效应。

影石Insta360 创始人刘靖康(左)介绍产品背后的创新理念 | 来源:极客公园

第一轮的溢出效应便是随着智能手机行业发展带来的器件小型化趋势。

2016 年,影石推出第一款产品 Insta 360 Nano,当时之所以能实现边拍边算的全景影像能力,主要依赖于让 Nano 以一个扩展件的方式物理连接在 iPhone 上,以调用内置在 iPhone 里的计算能力。

而随着智能手机的发展,计算单元能力越来越强、越来越小、功耗也越来越低,智能相机的画质、计算甚至 AI 等能力也就因此可以以独立设备的形式得到释放。

第二轮的溢出效应来源于 AI 行业,准确来说是起源于 2018 年前后的「AI 1.0」时代。在那波技术浪潮里,人脸追踪等技术逐渐成熟,大量人才和算法能力都得到增强。影石也受惠于此,积累了自己的 AI 人才团队。

所以,当下我们看到的影石在产品层面的新品动作,实际是这家年轻的公司多年来技术+市场判断的一次阶段性集中汇报展示,底层的愿景依然没有发生变化:

「希望用最好的智能影像技术,让更多人更好且更容易地记录和分享生活。」

在生活中如此,在工作中也如此。

在这个无比强调出片和分享的时代,也许再过几年你会发现这家年轻公司的产品,还会出现在你生活里的更多角落。

浏览量: 32

传罗永浩转战 AI 硬件,产品「不便宜」;滴滴正式发文治理「冬天臭车」;Meta AI 眼镜将加屏幕

滴滴开展「异味车」治理,拉黑功能上线

12 月 23 日晚,滴滴出行发文称,非常抱歉和惭愧,没能为大家提供一个相对清新的出行环境,影响了大家的用车体验。滴滴表示正开展「异味车」治理专项,通过上线拉黑异味车功能、对车内空气差评率较高的司机暂停服务培训学习、对司机服务开展正向激励考核等方法,争取改善大家的用车体验。

为响应用户需求,滴滴已在全国上线「拉黑异味车」功能,如用户在乘车过程中遇到不好的体验,可通过滴滴 App 行程中页面操作未来 12 个月内「不乘坐该车辆」。除此之外,用户投票选出的女乘客可选女司机、宠物快车、滴滴包车、6 座快车等功能已陆续在多个城市上线试行。 滴滴已在全国上线司机宣教和播报,提醒司机单单开窗通风、注意保持车内卫生。同时,平台邀请用户对车内气味情况进行评价,通过行程中的弹窗问卷,向平台反馈车内是否清新。 针对车内异味差评率较高的司机,平台将依照规则采取服务管理动作,包括通知司机改善车内卫生和空气问题、降低服务分、情节严重将被暂停服务,后续通过服务培训和考试可恢复接单,平台将持续关注乘客反馈,对服务质量进行考核。

 

菜鸟 CFO 刘政加入蚂蚁集团,将接替韩歆毅出任 CFO

目前韩歆毅除了担任蚂蚁集团总裁,还兼任首席财务官(CFO)一职。近期,菜鸟集团 CFO 刘政加入蚂蚁集团,将接替韩歆毅,担任蚂蚁集团 CFO。

2024 年 7 月,即传出刘政将加入蚂蚁集团的消息,但直至近期这一消息才落地。

公开资料显示,刘政于 2010 年 6 月加入阿里巴巴,担任阿里高级财务总监,负责天猫、淘宝及阿里国际站的财务运营,并于 2016 年出任菜鸟集团 CFO。此外,刘政还先后担任了中通快递、阿里影业以及 AGTech Holdings Limited 的非执行董事。加入阿里前,刘政曾于天骏传媒及华友世纪担任企业财务管理高级职位,且曾在普华永道审计部工作。(来源:财新获悉)

 

马斯克旗下 xAI 公布 60 亿美元融资部分投资者名单,含贝莱德、英伟达等

当地时间 12 月 23 日,埃隆·马斯克旗下的人工智能初创公司 xAI 在社交平台 X 上公布 60 亿美元融资部分投资者名单,a16z、贝莱德和英伟达参与了公司 C 轮融资。其它投资者包括富达、Kingdom Holdings 和摩根士丹利。(来源:界面)

 

Meta 计划最早在明年为其 Ray-Ban 智能眼镜添加显示器

Meta 计划为其 Ray-Ban 智能眼镜添加显示器,机构预计 Meta Ray-Ban 年化销量将达 200 万台。

据报道,显示屏将用于显示通知和 Meta 虚拟助手的回复,该款和眼镜集团 EssilorLuxottica 合作开发的升级版 Ray-Ban 智能眼镜最早可能于 2025 年下半年发布。在苹果、谷歌和 Snap 等竞争对手竞相发力之际,Meta 也在加速开拓可穿戴设备领域。公司 CEO 扎克伯格此前曾表示,希望将智能眼镜打造为下一代计算平台。(来源: 英国金融时报)

 

百川智能发布金融大模型 Baichuan4-Finance,准确率领先 GPT-4o 近 20%

12 月 23 日下午消息,百川智能宣布发布全链路领域增强大模型 Baichuan4-Finance。据悉,在高质量金融数据的基础上,Baichuan4-Finance 实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。其金融专业能力和场景应用能力均领先 GPT-4o。

在中国人民大学财政金融学院新近发布的评测体系 FLAME 评测中,该模型登上榜首。具体来看,FLAME 由两个方向的评测基准组成:一,FLAME-Cer 主要面向模型的专业金融能力评测,覆盖了 CPA、CFA、FRM 等 14 类权威金融资格认证;二,FLAME-Sce 则侧重模型的场景应用能力,包含 10 个一级核心金融业务场景,21 个二级细分金融业务场景,近百个三级金融应用任务。

此外,为让模型在提升专业能力的同时不损失通用能力,该模型还打造了一套全链路领域增强方案,覆盖高质量数据集构建、模型预训练、微调、强化学习等从模型研发到场景应用的全流程,实现了模型专项能力和通用能力同步提升,提升了模型多元场景可用性。(来源:新浪科技)

 

小鹏汽车宣布完成欧洲第 1 万辆交付

12 月 23 日午间消息,小鹏汽车宣布在德国埃伯斯贝格完成了欧洲第 10000 辆的交付。小鹏汽车董事长、CEO 何小鹏在朋友圈表示,小鹏汽车是新势力中第一家完成欧洲万台交付的企业,也是欧洲 4 万欧元以上中国所有车企的交付冠军。

资料显示,小鹏汽车在 2020 年开启了海外拓展,出海首站选择了欧洲。以挪威为起点,2021 年开始销售以来,已先后进入德国、法国、英国、西班牙、葡萄牙等国家。(来源:新浪科技)

 

远景回应,特斯拉上海工厂原厂长宋钢已入职

12 月 23 日,就特斯拉上海超级工厂负责人宋钢加入远景传闻,远景能源对媒体回应称,宋钢今天已经入职,职位为此前曝出的集成供应链高级副总裁,但其具体负责哪些业务暂时还没有消息。(来源:界面)

 

OPPO A5 Pro 防水抗冻,零下 35 度冰冻也能正常用

OPPO 官宣,将于 2024 年 12 月 24 日推出全新一代「耐用战神」OPPO A5 Pro,整机通过 14 项国家军用标准测试,极端温度扛得住,特殊环境扛得住;异常侵蚀扛得住,猛烈冲击扛得住。

OPPO A5 Pro 支持 IP66+IP68+IP69 的满级防水,据 OPPO 介绍总共可以对十八种水进行防护,无论是清水,还是咖啡、可乐、茶水等饮料,这些液体的泼溅无法对 OPPO A5 Pro 造成实质性伤害。且 OPPO A5 Pro 具备对猛烈冲击的防护能力,堪称是防水防摔的典范。

此外,OPPO A5 Pro 可以在极端的低温环境正常使用。从 OPPO 公布的实机测试来看,将 OPPO A5 Pro 放在零下 35 度的低温环境中,不断喷水凝结成冰,并在此环境中放置 6 小时,此时的 OPPO A5 Pro 已经被冻结在冰块内。

在这种严苛环境下,向这部被冻结的 OPPO A5 Pro 拨打电话,屏幕成功亮起显示接听界面。使用锤子将冰块砸开,滑动屏幕后成功接到来电。

外形方面,OPPO A5 Pro 采用超轻薄四曲柔边直屏设计,并拥有「砂岩紫」「石英白」「磐石黑」等全新配色。(来源:PChome)

 

联想 YOGA 新机曝光,采用屏下摄像头屏

12 月 23 日,X 用户 WalkingCat 就曝光了联想一款 YOGA 系列新品轻薄本的外观造型,除了轻薄的蓝色机身以及 A 面的凸起之外,最吸引人的就是 B 面屏幕上的疑似打孔屏设计。但结合微博博主金猪升级包的暗示,该款 YOGA 新品笔记本实际上是采用了屏下摄像头设计。

 
 

WalkingCat 一共放出了四张图片,其中两张亮屏的图片一张带有明显的挖孔,而另一张却是完整的屏幕,引发了不少遐想。而结合金猪升级包的最新微博来看,该款笔记本可以确认是采用了与红魔游戏手机相同的屏下摄像头技术,A 面的突起也是为了放下屏下摄像头模组进行的设计。

 
 

除此之外,该款笔记本预计为 14 英寸大小,将会搭载英特尔酷睿 Ultra 200V「Lunar Lake」系列处理器,采用 OLED 屏幕。该款笔记本预计将会在 CES 2025 展会上亮相。(来源:PChome)

 

罗永浩「最后一次创业」最新进展:暂别 AR,迎来 AI Jarvis

细红线是罗永浩在两年前宣布创办的 AR 公司,也被称作罗永浩的最后一次创业。2024 年 4 月,罗永浩在直播中首次预告,将发布一款神秘产品,并形容其「具有颠覆性、破坏式的创新」。

据媒体报道,这款新品的主菜是一个 AI 软件方案,并搭配了一款硬件,硬件初步预估有两个版本。

「最终定价还没出来,但内部预期不会太便宜。」

一位细红线的早期员工透露,这次新品的研发也是路线几经更改,起初大家的共识还是 AR OS,但 2024 年初,方向彻底改变,「由于新的 AI 软件探索项目优先级很高,占用所有的软件开发资源,再加上本来 AR 底层系统开发经验就不足,需要持续攻坚,AR 项目的开发就停滞了。」

近日以来,为了冲刺研发,细红线的封闭组员工也已经连续多天高强度作业,「每天只睡 5、6 个小时」。(来源:《新视界》)

 

浏览量: 33

未来十年,谁将主宰科技巅峰?

12 月 14 日至 15 日,由极客公园主办、798 文化科技联合主办的「极客公园创新大会 2025」(GeekPark Innovation Festival,以下简称「IF」),在北京 798·751 园区 传导空间成功举办。自 2011 年首届大会以来,IF 已走过十五年的风雨历程,成为科技圈的重要盛会。

在过去的一年里,AI 和其他新技术深刻改变了全球的产业格局。作为新的技术增量,AI 不仅推动了平台与产品的创新,也带来了创业环境和定义的变革。尤其是在「超级个体」崛起的今天,AI 正引领一场前所未有的「造梦潮流」。这一年,极客公园携手行业精英、创业者以及技术领袖,共同探讨 AI 如何重新塑造未来商业与社会生态。

极客公园创始人 & 总裁张鹏致辞

这样的背景下,本届大会的主题定为「敢想,敢干!Imagineering」。正如极客公园创始人 & 总裁张鹏所言,「不管时代怎么样,科技和生活都不会自己越变越好,需要一群人站出来,需要一群人在非共识的条件下去创造新的共识。」

十五年来,极客公园创新大会见证了很多人的洞察与预言。在过去的 IF 舞台上,雷军曾预言手机将取代 PC,王兴看好团购成为本地服务的新趋势,马斯克预测智能电动车将成为未来出行的主流,李飞飞和黄峥分别表达了对 AI 和拼多多创新模式的深刻理解……每一次洞察都在时代的浪潮中兑现,推动了一个又一个「非共识」向「共识」的转变。

极客公园创新大会 2025 现场

今年的大会,极客公园邀请了 20 多位看见了未来的领军者,围绕大模型、自动驾驶、机器人及其对企业、社会和个人的深远影响展开了深度对话。参会嘉宾深入交流了大模型如何为创业者带来新的时代机遇,以及如何在这个科技变革的浪潮中把握未来。

此外,大会现场还发布了 2024 年度「InnoForce 50」和 2024 年度极客最爱好物,旨在发现在过去一年中,在人工智能及其交叉领域取得创新突破的产品、技术、组织、项目和个人开发者,进一步推动行业内的创新风潮。

 

01

预见未来:2025 年

我们应该期待那些技术突破

 

在这片充满无限可能的科技浪潮中,AI 不仅突破了技术边界,更在思维与应用层面掀起了前所未有的深刻变革。其中有一群人,他们不仅获得了最多的资源支持,也投入了最多的心力。他们的思想和实践,正推动着这一波浪潮不断前行。

今天,我们应当关注这些领军者的身影:他们正在做什么?他们推动了哪些颠覆性进展?未来,他们的每一步,将如何重塑我们周围的世界?

Google DeepMind Senior Staff Research Scientist Nenad Tomašev

Google DeepMind 的 Senior Staff Research Scientist Nenad Tomašev 便是其中之一。Nenad 分享了 AlphaZero 的突破性创新,「AlphaZero 的独特之处在于通过自我对弈生成数据,摆脱了对人类知识的依赖。这一能力使得 AlphaZero 超越了传统的局限,开辟了新的可能性。」他认为,这是 AlphaZero 的重要贡献之一。

Nenad 表示,目前我们几乎在每种模态上都有基础模型,「下一步的发展将是整合这些独立管道,朝着智能体化的方向迈进。从单一模型到能够整合多个子模型的智能系统,这是未来的趋势」。Nenad 强调,智能体系统的关键在于如何将这些子组件有效连接,确保整个系统能够按预期协同运行。

Kaggle CEO D.Sculley

与 Nenad Tomašev 的思考不谋而合,Kaggle CEO D. Sculley 也提出了 AI 领域的深刻转变:「从数据集的收集,到寻求最大、最复杂的模型应用,AI 的范式已发生根本性变化。」他强调,「AI 原生应用案例」将成为未来探索的重要一环,并认为「自主性 AI」(agentic AI)将逐步成为核心议题。随着 AI 技术的不断进步,智能体将不再是简单的工具,而是能提出建议并为人们提供洞察的系统。

百川智能创始人、CEO 王小川

此外,在聚焦未来科技与医疗的深度对话中,百川智能创始人、CEO 王小川与极客公园创始人 & 总裁张鹏探讨了「AI 医生如何牵引 AGI 的发展与落地」。王小川明确表示,当前改变医疗供给是最具确定性价值的突破口。他认为,AI 不仅将在医疗领域带来技术革新,更将在个性化医疗服务中展现巨大的潜力。

王小川对于 AGI 的定义,是能创造出真正意义上的「AI 医生」——一个既能进行专业问诊、开具处方,又能提供个性化、持续的日常健康陪伴的智能体。他预测,这一技术将在未来五年迎来突破,并逐步落地。

在这一波创新与变革的浪潮中,我们不仅见证了技术的极速进步,更感受到了行业内部深邃的洞察与战略眼光。自动驾驶、机器人、无人机,以及日新月异的 AI 原生应用,这些新兴赛道早已超越了技术圈的边界,迅速成为公众讨论的核心话题。那么,它们又将如何通过跨界创新与协同,点燃一连串深刻的行业变革,引领未来的发展格局?

地平线创始人 & CEO 余凯

在另一场深度对话中,地平线创始人 & CEO 余凯围绕智能驾驶的用户价值进行了深入的探讨。余凯表示,现阶段智能驾驶的用户体验还远未达到应有的水准,未来需要在多个领域进行迭代与技术突破。目前的中阶智能驾驶技术只能达到「可用」标准,而距离「好用」仍有较大差距,而高阶产品更是远未达到「可用」的标准。

对于未来的自动驾驶,余凯预测,在未来三到五年内,自动驾驶将迎来一场「大战」。这是技术突破和应用落地的关键时刻,整个行业将进入一个激烈竞争的时代。然而,他也表示,相较于自动驾驶技术,人形机器人仍处于发展初期阶段,至少需要五到十年才能达到实用的标准。

宇树科技创始人 & CEO 王兴兴

与此同时,宇树科技创始人 & CEO 王兴兴也在活动中分享了他对人形机器人发展历程中如何跨越「窄门」的见解。王兴兴认为,虽然当前人形机器人领域正迎来热潮,且 AI 技术的应用已得到广泛认可,但机器人 AI 技术仍处于创新阶段,全球尚未找到最优的技术发展路线。他特别提到,当前最大挑战不在于数据问题,而在于机器人通用模型的 AI 架构问题。

王兴兴预测,人形机器人将在五年内将成本降至 2 万元。但他强调,行业的发展不应单纯依赖价格战。「如果行业内开展持续的价格战,这将对整个行业造成严重的负面影响。」他认为,行业的真正突破应当在于技术创新与模型架构的进步,而非通过压低价格来竞争市场份额。

除了上述几位科技领袖,百度副总裁、文库事业部、网盘事业部负责人王颖,脑虎科技创始人 & CEO 彭雷、无界方舟 AutoArk 创始人 & CEO 曾晓东,高途教育科技集团联合创始人罗斌,Soul App CTO 陶明等国内优秀的产品和应用开发者,就 AI 时代新应用的探索等问题,分享了他们的观点。

 

02

成为超级个体的「秘诀」

 

在这个瞬息万变的时代,只有那些不断追求创新、敢于挑战自我的人,才能把握住属于自己的机遇。而这种机遇的背后,正是技术的力量、平台的助推和创造的无限可能。无论是在人工智能的浪潮中,还是在内容创作的蓝海里,真正的价值永远来自于那些敢于用心创造的「超级个体」。

如果你是一个人或者只有一个小团队,如何利用技术红利和平台助推,成为「超级个体」?

360 集团创始人周鸿祎

在活动现场,360 集团创始人周鸿祎围绕「大模型时代,年轻人值得做什么?」这一主题展开了讨论,并分享了他对 AI 时代的独到见解。他表示,很多互联网从业者可能认为,AI 与互联网相似,行业格局已经初定。但他强调,AI 将是一个比互联网更大的机会,互联网的游戏规则和思维方式并不完全适用 AI 时代。因为 AI 不仅仅是一个连接工具,它更是一种直接提升生产力的手段,具有深刻改变生产力的潜力。

他还提醒道,天天用大模型做一些屠龙之技,并非长久之计。OpenAI 明天发布一个新功能,可能就能迅速覆盖你的技术领域。因此,周鸿祎建议,创业公司应专注于垂直行业的解决方案,通过低调且高效的市场深耕,找准自己的独特竞争力。

小宇宙 App CEO Kyth

在另一场深度对话中,小宇宙 App CEO Kyth 与乱翻书主理人潘乱,就播客的发展和内容生态展开了探讨。Kyth 表示,播客的成功并非依赖内容的数量,而是建立在「稀缺价值」之上。他认为,未来的播客仍将在这一框架下发展——在内容丰富的世界中,提供独特且有价值的声音。

随着技术的进步,Kyth 提到,像 Notebook LM 这样的工具已能够迅速生成内容创作,从简短文档到 5 至 10 分钟的对话,甚至是 50 分钟的综艺节目。然而,他强调,「相比 AI 生成的播客,我坚定支持真人播客。」尽管 AI 能生成无数个 50 分钟的播客,但在信息过载的时代,时间变得愈发稀缺。「我们会选择那些真正用心创作的内容,因为真实和用心是无法被取代的。」

在这个瞬息万变的时代,优秀的产品不仅是对技术的深刻理解,更是对社会需求的敏锐洞察。当创新与需求深度共鸣,时代的车轮便开始滚滚向前。那要如何拿到与时代共振的新产品方法论?

怒喵科技创始人 & CEO 李楠

在大会现场,怒喵科技创始人 & CEO 李楠提出了一个深具启发性的问题:「下一个三年,增长 100 倍的赛道为何不会重复历史?」他大胆预测,AI 眼镜将成为未来的万亿级市场,并预计在未来 12 个月内实现 10 倍增长,三年内有可能增长 100 倍。李楠对这一预测充满信心,认为这一领域的爆发性增长已是「定局」,并将成为下一个颠覆性的技术赛道。

影石 Insta360 创始人 刘靖康

与此同时,影石 Insta360 创始人刘靖康分享了他对硬件创业的见解。刘靖康表示,做硬件创业,必须明确三点关键要素:首先,你需要解决竞争对手无法解决的问题;其次,你的方案必须在现有市场中没有明显的短板;最后,你要做好营销,让目标客户清楚了解前两点。

在这场充满创新与变革的大会上,我们见证了一个更加智能、更加个性化的未来正在悄然成型。从大模型到自动驾驶到,从 AI 医生到人形机器人、AI 眼镜……每一项突破都指向一个更广阔的世界。而在这片光芒背后,是那些敢于探索、敢于梦想的创新者们,他们通过独到的视角和深刻的洞察,在这片波涛汹涌的技术海洋中,找到了属于自己的航道。

当 IF 2025 大会落下帷幕,它并非终结,而是新篇章的开始。展望未来,AI 与其他前沿技术将在更多领域引发深刻变革,行业的边界将愈加模糊,创新的机会也将更加广阔。未来的道路,充满挑战,也充满机遇。每一次的技术突破,背后都有无数的探索与付出,每一步的前行,都需要我们怀揣梦想,敢于打破常规,迎接未知的可能性。

这一切,才刚刚开始。

浏览量: 29

从OpenAI 12 天发布会里,我们看到了行业的四个关键问题

 

文|黎诗韵

编辑|郑玄

 

历史上第一次有公司会连续开 12 天的产品发布会——当 OpenAI 宣布这个决定之后,全球科技圈的期待值被拉满了。但直到发布会接近尾声,「就这?就这?」一位 AI 从业者如此表达他的观感。

这似乎代表了某种主流看法:此次 OpenAI 发布会,亮点不大、低于预期。

前十一天,OpenAI 的发布会涉及技术、产品形态、商业模式和产业生态等多个重要更新,包括完整的推理模型 o1、强化微调、文生视频 Sora、更强的写作和编程工具 Canvas、与 Apple 生态系统的深度整合、语音和视觉功能、Projects 功能、ChatGPT 搜索、给 ChatGPT 打电话和 WhatsApp 聊天等等。

但正如上述 AI 从业者感到失望的原因,「还以为会发 GPT-5。」在发布会结束第二天,据外媒报道,OpenAI 的 GPT-5 研发受阻。

不过,最后一天发布的 o3 是个例外。它是 o1 的下一代推理模型,在数学、代码、物理等多项测试中表现惊人——一位国内大模型公司的技术人士谈及 o3 给他带来的震撼,「AGI 已来。」他说。技术人士对 o3 都评价颇高。

回顾这 12 天的发布会,OpenAI 一边秀出了技术「肌肉」,另一边不断优化产品形态、扩大落地应用的空间。有人打趣道,就像一场「直播带货」,OpenAI 希望吸引更多用户、开发者使用 ChatGPT。在新的一年,OpenAI 在日活、营收等数据上或许会迎来飞跃。

 

发布会最后一天,OpenA 推出了 o3 模型 | 图片来源:OpenAI

 

但这个过程不一定会顺利。尽管模型能力变强,但由于数据掣肘、封装能力、模型成本过高等原因,强大模型和应用落地之间仍有较大距离。

OpenAI 此次发布会似乎透露出这样一种趋势:目前大模型行业的竞争焦点不仅在于模型参数和技术上限,也在于用户体验和市场规模。需要两者齐头并进,才能保持领先。

在梳理了 OpenAI 这 12 场发布会的主要信息、以及与国内大模型行业人士交流后,极客公园总结出了以下几个关键看点。

 

o3 的智能深度已经够了,但能否称之为 AGI 要看智能广度

「疯狂,太疯狂了。」这是国内某模型负责人看到 o3 之后的第一反应。

在数学、编码、博士级科学问答等复杂问题上,o3 表现出了超越部分人类专家的水平。比如,在涉及生物学、物理学和化学的博士级科学考试 GPQA Diamond 中,o3 的准确率达到 87.7%,而这些领域的博士专家只能达到 70%;在美国 AIME 数学竞赛中,o3 取得 96.7 分、只错了一道题,相当于顶级数学家的水平。

被广为讨论的是其代码能力。在目前全世界最大的算法练习和竞赛平台 Codeforces 上,o3 得分为 2727 分、相较 o1 提升了 800 多分,相当于位列 175 名的人类选手。甚至,它超过了 OpenAI 的研究高级副总裁 Mark Chen(得分 2500 分)。

 

o1-preview、o1、o3 的代码能力对比 | 图片来源:OpenAI

 

自 9 月推出 o1-preview 版本以来,短短三个月时间内,o1 系列模型在推理能力上完成了超强进化。在发布会第一天推出的 o1 完整版,其思考速度较 o1-preview 提高了约 50%、针对困难现实问题的重大错误减少了 34%、同时还支持多模态输入(可识别图像)。而今天的 o3 在复杂问题上则已超越部分人类专家水平。

「从 o1 到 o3 是通过增加推理计算量实现对模型能力的提升,随着国内外 Deepseek-R1、Gemini 2.0 Flash Thinking 等发布,表明大模型开始从预训练 Scaling Law 转向推理的 Scaling Law。」清华大学长聘副教授、面壁智能发起人刘知远对极客公园表示。

自 OpenAI 发布 o1-preview,大模型浪潮的技术范式从最初的预训练 Scaling Law(缩放定律),即不断扩大模型训练参数、提升其智能上限,切换到了新一轮的、升级的技术范式,即在推理阶段注入强化学习、提高复杂推理能力。

在前一种范式下,模型主要是通过 next token prediction(下一个词预测)给出答案,更偏向「快思考」。就像「读了万卷书」,但「学而不思则罔」,没法完成数学、编程等更复杂的推理任务。

而在后一种范式下,模型不会马上给出答案,而是会「慢思考」,先引入 CoT(思维链),把复杂的问题规划、分解为更简单的步骤,最后得到结果。而当方法不起作用时、它会尝试另一种方法,在强化学习中提升复杂推理能力——随着模型不断进行「慢思考」和强化学习,其推理能力会指数级上升,这就是推理的 Scaling Law。

对于 o3 超出人类专家的超强研究推理能力——在刘知远看来,这表明 o3 正在朝「超高智能的超级计算机」方向前进。

不少行业人士认为,这会对前沿科学领域影响深远。从积极的角度来看,o3 极强的研究推理能力,能够帮助推动人类在数学、物理学、生物学、化学等学科的基础科学研究。不过,也有人担心它会冲击科研人员的工作。

此次 o3 带来的惊人的智能深度,似乎让人看到了 AGI 的曙光。但在刘知远看来,正如信息革命的标志并非大型计算机、而是个人计算机(PC)的普及,只有实现 AGI 的大众化、普惠化,即让每个人拥有自己的大模型、解决好自己日常的问题,才意味着真正的智能革命。

「毕竟我们并不需要让陶哲轩、Hinton(均为顶尖科学家)来为我们解决日常问题。」他说。

这背后涉及的关键问题是,o3 模型的智能深度能否泛化到其他各种领域、具有足够的智能广度——在上述某国内大模型公司的技术人士看来,只有同时突破智能的深度、广度,才能称之为 AGI。他对此感到乐观,「就像你们班来了一个转校生,你没跟他接触过,但他考试数学和编程都考了全班第一。你觉得他语文和英语会很差吗?」

对于国内的大模型公司来说,核心的问题还是如何追赶 o3。从训练架构、数据、训练方法和评价数据集等关键要素来看,这似乎是工程化能解决的问题。

「你认为距离我们拥有一个 o3 水平的开源模型还有多远?」

「一年之后。」上述模型负责人回答。

 

模型只是发动机,关键是帮助开发者用起来

尽管 o3 的模型能力很强,但在一些应用层人士看来,模型和落地应用之间还有很大距离。「今天 OpenAI 训练了爱因斯坦,但如果想变成上市公司的首席科学家,依然是有距离的。」澜码科技创始人兼 CEO 周健对极客公园表示。

作为大模型中间层,澜码科技是国内较早探索将大模型应用落地、打造 AI Agent 的公司。在周健看来,大模型只是一个基础设施,需要结合场景去做很多工作才能用起来,而目前主要的掣肘是数据。

在很多场景里,拿到完整数据是很难的,有很多数据甚至是没有数字化的。比如猎头可能需要简历数据,但很多简历数据并没有被数字化。

而成本是影响 o 系列模型落地的最关键因素。根据 ARC-AGI 测试标准,o3-low(低计算量模式)每个任务耗费 20 美金,o3-high(高计算量模式)每个任务耗费数千美金——哪怕问一个最简单的问题,也要花费近两万元。收益和成本根本不能打平,o3 的落地可能还需要漫长一段时间。

 

o 系列模型的成本测算 | 图片来源:ARC-AGI 测试标准

 

在帮助模型应用落地的问题上,OpenAI 在发布会上也发布了相应的功能方案。比如第二天,OpenAI 专为开发者发布了 AI 强化微调(AI Reinforcement Fine-Tuning)功能,这是周健最关心的功能。它指的是,模型能通过少量数据,优化推理能力、提升性能。

这尤其适用于精细化领域的应用。OpenAI 技术人士称,它能帮助任何需要在 AI 模型方面拥有深厚专业知识的领域,比如法律、金融、工程、保险。一个例子是,最近汤森路透使用强化微调来微调 o1-mini,得到了好用的 AI 法律助理,帮助他们的法律专业人员完成了一些「最具分析性的工作流程」。

比如第九天,o1 模型终于向开发者开放使用。它支持函数调用和视觉能力;引入了 WebRTC,实现实时语音应用开发;推出了偏好微调功能,帮助开发者定制模型;发布了 Go 和 Java SDK,让开发者可快速上手集成。

同时,它带来了更低成本、更高质量的 4o 语音模型。其中,4o 音频价格下调 60%,降至输入 $40/百万 tokens、输出 $80/百万 tokens,缓存音频价格降低 87.5%、至 $2.50/百万 tokens;对于预算有限的开发者,OpenAI 推出 GPT-4o mini,音频费用仅为 4o 的四分之一。

这个新功能也是周健关注的。他认为,更新的实时语音、视觉识别等功能,将能更好地帮助营销、电话客服和销售外呼等场景应用。按他的经验,当 OpenAI 推出某些领先技术,一般国内 6-12 个月就可以追上。这让他对新一年的应用业务充满信心。

 

Sora 的视频生成低于预期,但产品开放会提升其物理模拟能力

年初 OpenAI 发布 Sora 的 demo 时,引发了全球科技圈的震撼。但这一整年,国内各大模型公司纷纷竞逐文生视频赛道——等到 OpenAI 第三天正式发布 Sora 时,国内的文生视频公司松了一口气。

「基本没有什么超出预期的内容,真实感、物理特性等方面相比于 2 月份的发布并没有显著变化,从基础模型能力的层面来说算是低于预期的。」生数科技联合创始人兼 CEO 唐家渝对极客公园表示。

目前,字节、快手、MiniMax、智谱、生数、爱诗等公司均推出了自己的文生视频产品。「Sora 的效果和实力综合来看并无明显领先优势,我们看到自己与OpenAI确实还是齐头并进的。」唐家渝表示。

在他看来,Sora 稍微有亮点的部分是在基础的文生视频、图生视频以外,提供了一些提升视频创作体验的编辑功能,说明 OpenAI 确实更关注产品体验了。

比如故事板功能,它相当于按时间轴的方式,把一段故事(视频)切成了多个不同的故事卡(视频帧)。用户只需要设计和调整每张故事卡(视频帧),Sora 会自动把它们补成一段流畅的故事(视频)——这很像电影里的分镜、动画的手稿,当导演画好分镜、漫画师写好手稿、一个动画、片子就做好了。它能让创作者更好地表达自己。

此外,它还推出了文字直接修改视频、无缝融合两段不同的视频、给视频改变画风等功能,相当于是直接给视频加「特效」了。而一般的文生视频产品,无法直接修改原视频,只能不断调整 prompt(提示词)、生成新视频。

 

Sora 的故事板功能 | 图片来源:OpenAI

 

在唐家渝看来,这些功能设计确实都是为了给创作者更大的创作自由度,类似的功能已经在 Vidu(生数科技的文生视频产品)迭代的计划中。「Sora 这些功能的实现对于我们来说并没有难度,实现路径也已经非常明确了。」他说。

在发布会上,Sam Altman 阐释了做 Sora 的原因:一是工具性价值,为创意人员提供创作工具;二是交互价值,大模型不应只通过文本交互,也应扩展多模态;三是最重要的——它和 AGI 技术愿景是一致的,Sora 在学习更多关于世界的规律,最终有可能建立理解物理规律的「世界模型」。

在唐家渝看来,目前 Sora 生成的视频中,依然有不少明显违背物理定律的地方,跟 2 月的 demo 相比进步不大。在他看来,Sora 发布后、会有更多人来尝试和探索它的物理模拟能力,这些测试样本或许对提升它的物理模拟起到一定的指导作用。

 

内加功能、外接生态,ChatGPT 能变成 Super App 吗?

在 o 系列模型、Sora、以及开发者服务之外,OpenAI 在发布会上的主要动作,一方面还是在产品侧持续增加新功能,优化用户体验。另一方面是积极推动与苹果等企业的深度合作,探索 AI 融入终端设备和操作系统。

从前者可以看到,ChatGPT 的演进方向,似乎是要成为一个「无所不能、无所不在、人人可得」的超级 AI 助理。据极客公园了解,OpenAI 创立之初的愿景就是打造一个「无所不能」的 Agent,它能理解人类的指令、自动调用不同的工具、满足人类的需要。看起来,终点即起点。

比如第六天,ChatGPT 增加了支持屏幕共享的视频通话和圣诞老人语音模式。前者让用户能与 AI 实时视频通话,分享屏幕或展示周围环境,进行多模态互动,复现了电影《Her》的场景。

比如第八天,ChatGPT 向全体用户开放了其搜索功能。在基础搜索外,它还增加了语音搜索;同时,它集成了手机设备的地图服务,能调取苹果、谷歌地图展示搜索结果列表;它还与多家顶级新闻和数据提供商建立了合作关系,支持用户查看股票行情、体育赛事得分、天气预报等信息。

又比如第十一天,ChatGPT 宣布扩展了与桌面软件的集成。它能接入更多编码应用程序,如 BBEdit、MatLab、Nova、Script Editor 等;它能和 Warp(文件共享应用)、XCode 编辑器等应用一起使用;它还能在语音模式下与其他应用程序协同工作,包括 Notion、Apple Notes 等;

现场演示有这样一个例子,当用户在 Apple Notes 中设定「节日派对歌单」,并语音征询 ChatGPT 对候选歌曲的意见。ChatGPT 能指出用户的错误,如将圣诞歌曲《Frosty the Snowman》误写为了《Freezy the Snowman》。

 

ChatGPT 指出了 Apple Notes 的错误 | 图片来源:OpenAI

 

「ChatGPT 会从单纯的会话助手向更为强大的代理工具转变。」OpenAI 首席产品官凯文·韦尔(Kevin Weil)称。

而另一方面,OpenAI 也在积极扩张生态,通过融入人们最常用的终端设备、操作系统、上层软件等,触达更广泛人群。

比如第五天,ChatGPT 宣布集成苹果智能生态,融入 iOS、MacOS 和 iPadOS,支持用户跨平台、跨应用调用 AI 能力,包括 Siri 交互、写作工具(Writing Tools)、以及视觉功能智能识别场景内容(Visual Intelligence)等。通过这次合作,ChatGPT 触达了全球数十亿苹果用户。它也开启了大模型与端侧、操作系统合作的先例。

比如第十天,ChatGPT 公布了自己的电话联系方式(1-800-242-8478),美国用户每月可拨打该号码享受 15 分钟的免费通话。同时上线的还有 WhatsApp 联系人(1-800-242-8478),全球任何用户均可通过 WhatsApp 向该号码发送消息,目前只限文字信息。

 

ChatGPT 公布了自己的电话联系方式 | 图片来源:OpenAI

 

全球部分国家、地区的智能手机和移动互联网渗透率还远远不足,通过电话这种最基础的通讯工具,ChatGPT 触达了这些人群。同时它也通过 WhatsApp,触达了其近 30 亿用户。

无论是内加功能、还是外接生态,ChatGPT 核心是希望产品触达更广泛人群,变成真正的 Super APP。

不过,也有人并不看好它这种不断内加功能、将业务线拉得无尽长的做法,甚至将其形容为「铺了一个大饼,但每一块饼都有点薄,深入不下去」。因为很多业务都需要足够深才能发挥价值、也有对应的公司在深耕。这或许会是 OpenAI 要面临的挑战。

尽管 o3 模型让外界看到了 OpenAI 惊人的技术实力,但关于推理的 Scaling Law 能达到怎样的智能上限、以及 GPT-5 的难产问题,依然让外界对这家公司的技术发展充满疑虑。这次发布会上,OpenAI 将关注点转而放在产品形态、合作生态和落地建设上,也未尝不是一种思路。这两者的结合,可能决定了行业接下来的走向。

 

 

(李源对此文亦有贡献)

 

浏览量: 44

看看产业里 AI 应用的进展吧,它治愈了我的 AI 价值焦虑

每到年底总要复盘,我复盘了下自己过去 2 年的注意力,2023 年主要放在大模型的新进展,2024 年开始比较多地关注应用的发展。超简单地总结下,那就是 2023 年被技术的跳跃弄得眼花缭乱,2024 年被很少看到 PMF 弄得抓耳挠腮。

你会发现,当把目光放在消费级应用时,无论是软件还是硬件,面对的问题其实很复杂。除了 AI 技术本身的能力够不够,还有产品和工程上的可实现性,交付用户价值的成本和收益的设计,躲开必然的巨头的阴影和同行的内卷竞争……当然,这一切还有个大前提,还要基于需求有创新性的洞察。

必须面对这么多复杂要素的组合,可能就是今年全球 AI 应用的投融资项目数量基本与去年持平,而且大头还在 ToB 端,并没有迎来想象中的 AI 应用爆发的原因。

前段时间接到了「创原会」的邀请,说可以来看看在工业和科研领域的一些 AI 应用进展,我就以「世界观旅行」的心态昨天去学习了下,突然感觉,果然看看更大的世界总会有收获,这次甚至治愈了不少内心对 AI 价值的焦虑。

在这次的「2024 创原会年度技术峰会」里,简单说最大的感受是,过去一年 AI 实体产业里中带来的正反馈是超预期的。核心的原因是,这里值得用「锤子」去敲的「钉子」太多了,技术的供给只要改变,价值就会被立即释放。

所以趁着热乎劲,我也在第一时间把我「世界观旅行」里的一些感受,记录下来分享给大家。

 

实验室、田间地头、生产车间,AI 改变了什么

1,「AI+水泥」比「鼠标+水泥」更厉害

我从国内这领域的巨头海螺水泥那里增加了不少「奇怪的知识」,比如在水泥行业的生产管线上,至少有 15 类 200 多个场景,正在因为 AI 的到来,让水泥的天花板再次打开,其中涵盖了从矿山开采到水泥发运再到商品混凝土所有工序。

举个例子,就在质量预测这一个场景,AI 通过分析不同的生产条件、不同的原料对于质量的影响,可以实现熟料 3 天、28 天两个强度的预测,这样就可以减少生产过程中的冗余调整,更精准地提升水泥混合掺比、来降低生产的成本。

海螺水泥觉得从设备、安全、质量、园区、决策等各个场景,水泥生产的效率都有大量的改进空间。人家满眼都是看到 AI 带来的技术能力新供给后,想要做事的兴奋。你会发现在这样长流程管线、真实的制造业环境里,AI 带来的价值非常确定。「钉子就在那里」,你不用去想象它是否存在。

2,AI 就是药神!

再拿人们都深有体感的医疗健康痛点来说,AI 正在里面「大杀四方」,在药物研发的整个流程中大幅加速研发周期和成功率、降低成本,那些冷门、偏门的病也有机会被看见、被治愈。

以疾病药物研发为例,传统药物研发往往在 10 年以上,成本高到可能超过 20 亿美元,研发过程中统计上的失败率在 90% 以上。那也就不难理解,为什么冷门偏门的疾病不被投入资源和精力了,并且一个有效的药物出来后往往会经过很长的价值回收周期才能变成「普通人能负担的药」。

但随着以 Alphafold 系列模型在蛋白质结构预测和设计领域的效率提升和效果改进,药物研发彻底变天了。比如这次就在「创原会」上,听到了针对一种过去无人问津的利什曼病(黑热病),AI 发现了世界上首个具有预防效果的小分子药物。

叠了 AI buff 后的生命科学正在迎来它的时代。Alphafold2 已经充分论证了 AI 在蛋白质结构预测上的「无敌」,过往用实验的方法花费几十万、数年的工作量,现在只需要几十秒,而且预测准确率也比过往高几十个百分点。蛋白质结构的精确预测对于疾病治疗和药物研发至关重要。

总体感觉,现在 AI 模型通过加速靶点发现、药物筛选和药物结构设计,传染病靶向药物的研发周期便可以从 10 年缩短到 3 年或更短,同时也降低了研发成本,让小型制药公司和学术机构也能参与原创药物研发,当然也会让病人也越来越负担得起。

谁都不是药神,但 AI 就是药神,这确实令人期待。

3,领域专有数据的魅力,谁用谁知道。

基础大模型的通用能力加上领域专有数据的训练,在很多领域的价值是超预期的。

比如,这次学到了一个我们平时很难接触的油气开采领域的进展——地球物理大模型,已经应用在深层复杂构造形油气田的勘探、安全监测等各个方面,提高了油气发现的效率和勘探空间。这背后主要是通过把过去行业数据和经验积累「喂」进大模型,带来了场景特有的理解能力,使解决方案的改进效率与效果都立竿见影,哪怕在构造复杂、深地信号弱、干扰大的环境中,也可以进一步勘探。

再比如卫星遥感领域,我们都知道火箭发射成本未来会越来越低,卫星获得的太空视角的空间数据会越来越充分和实时,那么获得数据以后需要用 AI 对于数据进行有效的处理,就是非常关键的问题。

现在遥感影像大模型的运用可以让原先人工用鼠标标注一个月的数据,在 10 分钟内完成完整的解析过程。这样数据处理效率的提升,就可以给卫星遥感的应用拓展新的市场,因为显然 AI 技术的应用也会使遥感卫星能够更好地识别和理解更多有意义的信息,比如像天气、农作物收成、道路规划、路运海运交通等等。

把各种空间数据信息,通过 AI「从看见到看懂」,这是正在被解锁的新资源,我相信这个资源对很多产业都会带来效率提升的连锁反应。

 

另一种 AI 世界观

4,工业领域的 AI 变革不是一次「冲锋」,是一场「冲浪」

「创原会」里我这次认识的人,其实有很多来自工业领域,他们的风格和思考的问题角度和互联网圈子的 AI 创新思路还挺不一样的。听他们分享和与他们交流,我感觉人家最不缺的就是进取心和用 AI 的决心,也没有什么特别的焦虑,因为现在就可以摘的果实(AI 确实可以解决的问题)太多了。

如果说有什么共性问题:那就是 AI 技术还在迅速地变化,很多对产业技术链条的重塑,没有办法一次冲锋就一步到位,在这个觉悟下,要从哪开始到哪去?该练的「核心力量」到底是什么是他们思考和我讨论最多的。

以往的信息化和数字化时代,大家可以通过上套系统,用一次冲锋来实现跨时代,但 AI 时代是一场「动态冲浪」,这个情况下,把基本功做好,实践上稳扎稳打,技术上与时俱进,才会让生产力再上一个又一个台阶。

当年从蒸汽机时代进化到电气时代,所有率先跨时代的工厂,第一个重要动作就是「改厂区格局」,把围绕着蒸汽机和各种管道,齿轮形成的「动力链条」来设计的厂区,变成通过电线就能赋能,但对于生产流程更合理的新生产线结构。

我听了华为云 CTO 张宇昕的分享,感觉他说的也是这个问题。大模型这个变量正在改变云、也正在改变云的使用。以 AI Native 的视角重塑算力、云和模型,在业务里形成「以知识为中心」的数据飞轮,才能带来源源不断的 AI 原生应用的竞争力。这就是从数字化向智能化跨越,在「冲浪运动」里最会被用到的那个「基本功」吧。

5,算力!算力!

听华为云讲,预计今年年底,企业对 AI 算力的需求就会超过对通用算力的需求。当以 CPU 为中心的主从架构跟不上千亿、万亿模型的训练和推理,数据中心逐渐演进到以 AI 算力为主的多元算力对等全互联的架构。其实这波 AI 的突破就是算力带来的,Scaling Law 首先是算力能 Scaling。

过去短短 2 年,从万卡集群这个世界上只有几个人有能力搭建,到现在没有 10 万卡集群能力在基础大模型上就不能上牌桌,再到最近马斯克号称要迈向百万卡集群的搭建,真是令人感慨。

显然华为云在这方面在做很多工作,而且可能不只是单纯堆算力的问题。其实单在算力这一个点上,门道还很多,我印象比较深的还有一点是华为云提到的现在影响大模型训练和推理效率的一大瓶颈——内存,「没有先进存力、算力也无法充分发挥作用」,因为模型放不进去算不过来。这也是不断能看到不同算力厂商抗衡英伟达的突围点,比如 AMD。

6,Agent 能不能把金字塔倒过来

会上看到这样一张图,很体现像如今的 AI 价值焦虑问题。

整体看,现在 AI 产业呈现出一个金字塔的分布,最上层所有应用加起来可能都敌不过芯片层年入千亿美金的英伟达。但是相对成熟的云这个产业,已经是一个倒金字塔的分布了,这意味着应用已经非常丰富,获得了充分的商业回报,享受到云的红利,形成正循环。

AI 很明显还没有走到这个状态。但今年全球所有大公司在基础设施上的巨额砸下 Capex(资本支出),拼命做芯片、扩算力背后,其实是对上层的应用爆发有非常大的期望。

现场看到的 AI 落地实践,也让我感觉 AI 应用开始爬坡了,相应地,更广普的应用也值得期待。现在也觉得共识是,Agent 这种形态,在被领域和场景数据加强的「行业模型」支持下,是核心的突破口。

2025 年的看点,应该就在这里。

7,用 AI,改变供给

有一位嘉宾分享的时候提到要充分应用数据和 AI 的能力「从满足需求,到激发需求」,他当时举的例子是就像字节跳动一样充分利用数据和 AI,激发了新需求,引领了短视频。以及他也认为 SHEIN 也是一个例子,在服装、零售这么卷的行业,它能够把它几年之间做到去年 300 多亿还在百分之三四十的增长,充分应用了数据和 AI 能力。

大方向我觉得说的没错,但是我稍有不同的观点是,改变需求是一件非常难的事情,或者说激发需求就是需要从满足需求开始的,只有对满足需求的「供给」足够充分,才有机会谈到「激发」的问题。

字节和 SHEIN 在「改变供给」上是怎么解决的,是「激发需求」的前序问题。还是要顺着明确的存在的需求去通过 AI 改变供给,能改变供给就能改变需求,最终供给和需求的双向丰富,也一定可以重塑连接,这是 AI 商业创新的「本垒打」。

把 AI 生产力组织好,改变供给,就是第一垒。

8,2025 可以预期的 AI 场景:合成数据、ASIC 芯片、编程、具身智能、AI 搜索和智能体。

这个基本上是共识,只结合最近的新闻两个点:

这两天 Databricks,以 690 亿美金的估值融资 100 亿美金,比 OpenAI 最高的一笔融资(66 亿美元)还多,这就是在用真金白银印证:AI 是基于数据的,所以在做 AI 应用的过程中,数据是最值得思考的管线和资产。

另一个新闻是上周五博通的股票在一天之内上升了 24%,因为微软、Meta 和谷歌跟博通谈了定制 AI 芯片,定制的 ASIC 能够做到在特定场景下的性价比和功耗最低。

英伟达是通用之王,但是在特定场景下就会出专项冠军,博通享受了这个红利,这是「模型定义芯片」的现在进行时,也是做 AI 落地应用要考虑的一个要素。

9,「求解器」和「行业 AI」,可能是中国最强烈的 AI 需求

会上记了一组数据,

「在中国,制造业仍是经济核心,在联合国所定义的 666 个小的产业中,中国是全球唯一一个各种产业门类齐全的国家,并且其中有 220 多个行业是全球第一的,中国制造业的规模连续 14 年全球第一。」

这串数据翻译一下就是,制造业领域的经验积累正是在中国做 AI 应用时的比较优势——knowhow 和场景数据。以服务业为核心的美国更需要「NLP」(自然语言处理),中国则更需要「求解器」和「行业 AI」,在制造业发挥作用,符合中国国情,当然我理解这可能也确实是华为云在努力深耕的方向。

理解环境的特点和需求,也是一个创新者要重点思考的问题。华为云对这个问题的观察,提供了一个新的视角。

 

浏览量: 25

FlipGo 双屏折叠便携屏:开启自由办公新时代

后疫情时代,人们对工作方式有了全新的思考。效率不再与固定的办公室划等号,取而代之的是对灵活办公、随时随地提升生产力的追求。无论是追求远程办公自由的数字游民,还是经常出差的商务人士,都代表着一个显著的趋势——现代职场人渴望打破空间限制,在任何场景下都能保持高效工作状态。

FlipGo 双屏折叠便携屏在这样的背景下应运而生。作为新一代便携显示解决方案,它采用创新的磁吸支架设计,实现了 3 秒快速展开和自由角度调节,让多屏办公环境的部署前所未有地便捷。

FlipGo 提供两种尺寸选择:16 英寸版本配备 2.5K 高清屏幕,采用 16:10 宽屏比例,整机重量为 1.6kg,适合需要更大视野的专业用户;13.5 英寸版本则采用生产力优先的 3:2 黄金比例,配备 2.2K 清晰分辨率,重量仅为 1.1kg,为追求灵活便携的用户提供理想选择。两款产品均支持 100% sRGB 广色域,搭配 9mm 的超薄折叠设计,轻松放入常见的笔记本内胆包,让高效办公随身可得。

FlipGo 的创新设计已获得国际认可——斩获 2024 年 iF 设计奖和红点设计大奖双项殊荣,并在 Kickstarter 平台收获超 100 万美元众筹金额的傲人成绩。这些来自全球市场的肯定,印证了 FlipGo 在效率办公领域的开创性价值。

在移动办公已成为新常态的今天,FlipGo 为现代职场人带来了全新的工作体验。数字游民可以在咖啡馆轻松部署双屏工作站,让多任务处理更加从容;开发者能够同时查看代码和调试界面,显著提升开发效率;设计师则可以在主屏创作的同时,在副屏实时预览效果,让创意工作流更加顺畅。

而在商务出差场景中,FlipGo 的价值更加凸显。它能让酒店房间瞬间变身专业工作站,也能在商务洽谈中快速搭建多屏协作环境。创新的 Type-C 一线通技术支持供电与信号传输,无需额外电源适配器,真正实现了即插即用。这不仅减轻了随身携带的负担,更为不同场景间的切换提供了极致便利。

为适应高强度的工作需求,FlipGo 在功能设计上追求极致便利。内置的多功能扩展 HUB,支持外接 U 盘、移动硬盘、键鼠等各类外设,让这款便携显示器不仅仅是显示设备,更是移动办公的效率中心。配合双屏无缝协同的优势,为用户打造出真正的移动工作站体验。

FlipGo 的诞生,源于对后疫情时代工作方式的深度思考:每个人都应该拥有不受限制的理想办公环境。通过创新的双屏设计和便携解决方案,我们让高效办公不再局限于固定场所,而是成为随身可得的生产力工具。

在这个追求工作自由与效率并重的时代,FlipGo 正以其突破性的设计和卓越的使用体验,重新定义移动办公的可能性。无论是在联合办公空间挥洒创意,在咖啡馆专注工作,还是在商务旅程中保持生产力,FlipGo 都能让您随时随地部署理想的多屏办公环境,让效率始终伴随左右。

浏览量: 60

传苹果研发「智能门铃」;美总统赞成 TikTok 继续运营;汤姆猫推 AI 陪伴机器人,1499 元

特朗普表示赞成 TikTok 继续在美国运营

当地时间 12 月 22 日,美国当选总统特朗普在亚利桑那州首府菲尼克斯发表讲话时表示,他赞成 TikTok 在美国继续运营一段时间。这是特朗普迄今为止反对 TikTok 退出美国市场最强烈的信号之一。(来源:央视新闻)

传苹果将推出带 Face ID 等功能的智能家居门铃

据彭博社的 Mark Gurman 报道,苹果正处于开发带有 Face ID 的智能家居门铃和门锁系统的早期阶段。他在今天的 Power On 时事通讯中表示,这款门铃将无线连接到兼容的锁,允许用户使用 Face ID 自动开锁。他说,这款门铃可能会与第三方 HomeKit 锁配合使用,但苹果也可以与其他品牌合作,提供一体化解决方案。

苹果的门铃将与亚马逊的 Ring 系列门铃竞争,但古尔曼没有透露苹果的解决方案是否会采集视频,苹果需要体现其智能家居门铃在隐私和安全方面的优势。如果该产品发布,Gurman 预计它将配备自行开发的 Wi-Fi 芯片,据说该芯片拥有一个安全飞地(Secure Enclave)来保护用户数据。(来源:cnBeta)

 

谷歌「新技能」陆续推送:Gemini 帮你快速总结 PDF 内容

12 月 22 日消息,谷歌正在不断为自家的 AI 助手 Gemini 解锁新技能,并将其集成在搭载 Android 15 且把 Gemini 设置为默认助手的手机中。

其中,「询问此 PDF」是最新发布的 Files by Google(谷歌官方文件管理器,也称「文件极客」)更新的一部分。根据 Android Police 今日报道,这项功能起初在 Play 商店上的描述是「即将推出」,但目前已经陆续开始推送。

该媒体的记者、同时也是 Android 有关信息爆料人的 Mishaal Rahman 表示,这一功能已开始推送,但并非所有 Gemini 用户都能使用。(来源:IT 之家)

香港中文大学开发新型基础 AI 模型,多种眼科疾病诊断能力优于人类医生

12 月 22 日消息,据《南华早报》报道,香港中文大学(CUHK)的研究人员开发了一种新的基础人工智能模型,能够帮助解决眼科临床任务,特别是在疾病筛查和诊断方面。随着生成式 AI 在医学领域的应用逐步增多,这一技术有望带来更广泛的影响。

这一名为「VisionFM」的新模型在诊断和预测多种眼科疾病方面表现出色,研究人员称,随着数据量的增加,这一模型可能会被广泛应用于更多的临床场景。相关研究已于上个月刊登在《NEJM AI》期刊上。

研究表明,VisionFM 在诊断 12 种眼科疾病时的表现与中级眼科医生相当,甚至更为精确。尤其在预测青光眼的进展方面,该模型的表现超过了眼科领域的第一个基础模型——RETFound。

VisionFM 的推出恰逢医学界对生成式人工智能的关注与日俱增,当前越来越多的研究人员和医疗专家开始探索生成式 AI 在改善医疗服务中的潜力。(来源:IT 之家)

 

Steam 数据显示:今年用户仅花了 15% 时间玩本年度发布的游戏

12 月 22 日消息,Steam 年终回顾数据显示,Steam 用户在今年仅花了 15% 的时间来玩今年最新发布的游戏。相对应地,有 47% 的时间花在过去一至七年间推出的游戏上,另有 37% 的时间则集中在那些已经发布超过八年的经典游戏上。

据 PC Gamer 于 20 日报道,今年 15% 的比例相比 2023 年 9% 的人均新游戏时间已有了显著增加(但相比 2022 年的 17% 有所下降)。因此看来,2024 年实际上呈现了一定程度的回升,预计由《绝地潜兵》《三角洲行动》等在线游戏带动。单机游戏方面,《黑神话:悟空》凭借其惊人的同时在线人数,在 Steamcharts 上成为焦点。

Steam 目前已拥有超过 20 万款游戏,而 2024 年发布的游戏数量相对较少,仅为 18000 款。报道称,造成这一趋势的原因包括老游戏价格较低、Steam Deck 适配程度、老牌在线游戏常年占据「最畅玩」排行榜等,较新的游戏面临极大挑战。(来源:IT 之家)

 

《黑神话:悟空》获 IGN 2024 社区投票奖「年度最佳游戏」奖

12 月 22 日消息,IGN 揭晓了社区投票奖的获奖名单,年度最佳游戏由《黑神话:悟空》摘得,取得 17.4% 的得票率。

在 12 月 20 日晚间播送的《新闻联播》节目中,游戏科学未来规划 PPT 得到曝光:将《黑神话:悟空》做成历史销量最高的单机动作角色扮演游戏。《黑神话:悟空》已陆续拿下 2024 金摇杆奖年度游戏大奖及「最佳视觉设计」奖、2024 拉美游戏奖「年度游戏」「最佳 PC 游戏」奖、TGA 2024 最佳动作游戏奖及「玩家之声」奖。(来源:中关村在线)

 

蔚来李斌:蔚来 ET9 订单超预期,首发 999 辆全卖完

12 月 22 日,蔚来创始人、董事长李斌对外表示,蔚来 ET9 首发限量版已卖完,订单量超预期。在 12 月 21 日举行的 NIO Day2024 上,蔚来旗下智能电动行政旗舰车型——ET9 正式上市,整车购买方案起售价为 78.8 万元,电池租用方案起售价为 66 万元。

蔚来推出了 999 辆 ET9 首发限量版车型,售价为 81.8 万元。据李斌透露,蔚来 ET9 将于明年 3 月正式开启交付,优先交付首发限量版。(来源:证券时报)

领克 Z20 纯电 SUV 上市,新能源车型销量超六成明年推插混 SUV

12 月 22 日,领克汽车宣布其全新纯电紧凑型 SUV——领克 Z20 正式上市。这款新车基于 SEA 浩瀚架构打造,采用了领克家族最新的 The Next Day 设计语言,预售价格区间为 14.6 万元至 16.1 万元。

领克汽车在领克 Z20 上市后的媒体群访活动中透露,该品牌新能源车型销量占比已超过 61%,总体均价超过 17 万元,未来 A 级、A0 级、A00 级车型将是领克纯电的「主场」,并计划明年推出一款大型插混 SUV。(来源:第一电动)

 

汤姆猫推出 AI 童伴机器人:支持主动聊天、情绪识别,1499 元起

12 月 22 日消息,汤姆猫在京东等平台推出 AI 童伴机器人,共有经典款、豪华款、尊享款三个版本,售价分别为 1499 元、1699 元、1999 元。

 

商品页面显示,这款产品配备「灵动双眼」,支持情绪识别、趣味打断、主动聊天等功能。无需触发按键,一声「汤姆猫」即可切换对话场景。此外,该产品还支持一次唤醒,连续对话。功能上,新品支持中英文双语交互、万物百科等,产品外观为肤感硅胶材质。

汤姆猫此前介绍称,AI 语音情感陪伴机器人的头部设有传动装置,可以自动根据听到的声音辨别位置与方向,120° 自由转头,面向用户进行语音对话。此外,该产品支持耳朵和嘴巴自然活动,设计了 20 多款灵动表情;3000 毫安时容量电池,产品采用肤感硅胶材质,可自由摆动的手臂。(来源:IT 之家)

「AI 教师」上岗,美国亚利桑那州推出完全由 AI 教授学术课程的学校

12 月 22 日消息,据 TechCrunch 报道,美国亚利桑那州特许学校委员会批准了一所新的在线学校——Unbound Academy,但这所学校有一个独特之处:学术课程全面由 AI 授课。

在美国,特许学校通常具有比传统公立学校更多的自主权,尤其是在课程设计和教学方法方面。

Unbound Academy 提出的申请则是首次尝试用「AI 驱动的自适应学习技术」将课程压缩到两个小时以内。其教学模式依赖于在线教育平台,学生通过「互动、智能化」的平台进行学习,这些平台会根据每个学生的学习速度和风格进行动态调整。虽然学校会有一些工作人员,但这些人可能并不是经过认证的教师,而是「熟练的指导员」,负责监控学生的学习进度,并为学生提供个性化的干预和辅导。

学术授课的时间仅为两个小时,剩下的时间将用于各种「生活技能工作坊」,内容包括批判性思维、创造性解决问题、财务管理、公共演讲、目标设定以及创业等。该学校将面向四到八年级的学生,完全通过在线方式授课。(来源:IT 之家)

 

浏览量: 34

文章分页

上一页 1 … 53 54 55 … 86 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间