Skip to content
  • 元宇宙社交空间入口
51蛙吖蛙元宇宙 – 3D社交空间

51蛙吖蛙元宇宙 – 3D社交空间

51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

标签: 科技

OpenAI 首席技术官突然辞职;Meta 曝光最强 AR 眼镜;铁腕治理,X 半年封禁 500 万账号

OpenAI 首席技术官突然辞职,非营利董事会或被「夺权」

美东时间 9 月 25 日周三,OpenAI 的首席技术官 Mira Murati 突然在社交媒体 X 发帖宣布辞职。她在发给 OpenAI 团队的辞职信中写道,她为在 OpenAI 团队工作六年半感到荣幸,她离开 OpenAI 是因为,希望腾出时间和空间做自己的研究。

Murati 的离职显示,OpenAI 的高级管理层动荡还在持续。创始团队的 11 人中,只剩下两人还留在 OpenAI。

OpenAI CTO Mira Murati|图片来源:CNBC

而在 Murati 宣布离职后,OpenAI 被爆出向营利公司转型的消息。据外媒,OpenAI 正在制定一项计划,要将其核心业务重组为一家营利性的公司,不再由 OpenAI 非营利性董事会控制,此举将让公司对投资者更具吸引力。

更早之前,OpenAI 被爆正在进行最新一轮 65 亿美元的融资,新融资吸引了三家科技巨头微软、苹果、英伟达参与,它可能帮助 OpenAI 的估值在融资前达到 1500 亿美元。(来源:华尔街见闻)

谷歌向欧盟提起诉讼,指控微软在云计算市场存在反竞争行为 

9 月 25 日消息,谷歌于当地时间 9 月 25 日向欧盟委员会正式提起诉讼,指控微软在云计算市场存在反竞争行为。

谷歌称,微软利用不公平的许可条款,通过其占主导地位的 Windows Server 和 Microsoft Office 产品,让大量客户难以使用除 Azure 云基础设施产品以外的任何产品。

比如,微软要求客户在其他云平台上继续使用 Windows Server 时,需支付高达 400% 的溢价,而如果选择微软自家的 Azure 云平台,则无需支付额外费用。此外,微软还对使用其他云平台的客户提供较晚且功能有限的安全更新。

微软还将其协作应用程序 Teams 与云平台捆绑,限制了用户选择。谷歌敦促欧盟委员会进行干预,声称需要采取监管行动结束微软的市场主导地位并恢复竞争平衡。(来源:IT 之家)

 

苹果 Vision Pro 未带飞头显产业后,三星被曝推迟 6 个月生产和销售其 XR 头显 

9 月 25 日消息,韩媒 ETNews 于 9 月 23 日发布博文,报道称鉴于苹果 Vision Pro 头显销量不佳,三星已经决定延后约 6 个月推出自家 XR 头显设备。

三星原本计划在今年年底开始生产,明年年初发售上架,而目前计划已延后到明年第二季度生产和发布。

消息源表示三星推迟 XR 头显上市的一个重要原因,是苹果推出的 Vision Pro 头显遇冷,并未带动 AR / VR 头显市场蓬勃发展,因此三星采取了观望的态度,调整了生产和发布计划。(来源:IT 之家)

 

文远知行与 Uber 达成战略合作,首批自动驾驶车将在阿联酋上线 Uber 

2024 年 9 月 25 日,全球领先的自动驾驶科技公司文远知行 WeRide 和全球最大的移动出行及配送科技公司优步 Uber Technologies, Inc. 宣布建立战略合作伙伴关系,将共同推进文远知行自动驾驶车辆上线 Uber 平台,并将首先在阿联酋启动运营。

双方的合作将于今年年底首先在阿联酋首都阿布扎比正式落地。一批文远知行自动驾驶车辆将上线 Uber App,面向消费者提供服务。合作落地后,当地乘客在使用 Uber App 打车时,可以多一个新的出行选项,即选择乘坐文远知行的自动驾驶车辆来完成行程。双方的合作不涉及美国和中国市场。(来源:节点财经)

阿里妈妈树羊:9 月底淘宝会全面接通微信支付 

鞭牛士 9 月 25 日消息,2024 阿里妈妈双 11 发布会今日举行,会上,阿里妈妈商业化运营中心总经理树羊透露,9 月底淘宝会全面接通微信支付,为今年双 11 的 10 月份预售阶段做准备。

据现场介绍,今年双 11,淘宝会投入 300 亿消费券和红包。(来源:鞭牛士)

 

微信辟谣:刷掌支付无加盟无代理,别被误导 

9 月 25 日消息,微信支付智慧生活官方近日发出严正警告,揭露了一种新型诈骗手段。

据悉,有不法分子冒充「微信支付刷掌加盟」和「微信支付刷掌独家代理」等名义,向公众收取代理及加盟费用。对此,微信支付方面明确表示,此类行为均为诈骗行为。(来源:ITBEAR)

 

百度智能云升级两大 AI 基础设施,文心大模型日调用量超 7 亿次 

9 月 25 日,在 2024 百度云智大会上,百度智能云全面升级百舸 AI 异构计算平台 4.0、千帆大模型平台 3.0 两大 AI 基础设施,并升级代码助手、智能客服、数字人三大 AI 原生应用产品,帮助企业更快、更好、更省地使用大模型。

百度集团执行副总裁、百度智能云事业群总裁沈抖表示,大模型以及配套的算力管理平台、模型和应用开发平台,正在迅速成为新一基础设施。

他表示,「2024 年大模型的产业落地正在加速,目前在千帆大模型平台上,文心大模型日均调用量超过 7 亿次,累计帮助用户精调了 3 万个大模型,开发出 70 多万个企业级应用。过去一年,文心旗舰大模型降价幅度超过 90%,主力模型全面免费,最大限度降低了企业创新试错的成本。」(来源:极客公园)

 

追赶「腾优芒」?爱奇艺将推出微短剧剧场

9 月 25 日,在 2024 爱奇艺 iJOY 秋季悦享会上,爱奇艺创始人、首席执行官龚宇宣布,爱奇艺将推出「微剧场」「短剧场」两个剧场。

现场演示资料显示,「微剧场」内容单集时长在 1-5 分钟左右,以竖屏为主,内容类型包括女频、男频、银发等;「短剧场」的单集时长在 5-20 分钟左右,横屏,内容类型包括古言、现偶、悬疑、其他。两个剧场都支持会员免费看。

爱奇艺首席内容官王晓晖认为,短剧产生了长短视频的第二次融合。「还是由专业的创作者去讲故事,不过把讲故事的方式改变了。第一次融合大家都知道是切片和宣发,但这次大家真正在创作上做了融合。」(来源:贝壳财经)

 

马斯克接管后首份报告出炉:X 平台半年封禁账号超 500 万

9 月 25 日消息,社交媒体巨头 X 平台近日公布了埃隆·马斯克接管后的首份全面透明度报告,深入揭示了该平台在内容管理方面的举措与成效。此份报告为外界提供了 X 在应对不良内容挑战、留住广告商方面的新视角。

报告显示,2024 年上半年,X 平台封禁的账号数量激增,达到近 530 万个,相较于 2022 年同期的 160 万个,增长幅度超过两倍。这一显著举措反映了 X 在维护平台健康环境方面的决心。(来源:ITBEAR)

Meta 发布重磅新品:299 美元的 Quest 3S 头显、AR 眼镜原型、多模态 AI 模型

当地时间 9 月 25 日,在年度开发者大会 Meta Connect 上,Meta 发布了最新款虚拟现实(VR)头显设备 Quest 3S,起售价为 299 美元。这款头显设备将于 10 月 15 日上市,可以用来看电影,也可以运行 VR 健身应用和游戏。

此外,Meta 还发布了多模态大语言模型和 AR 眼镜原型。在消息公布后,Meta 股价短线走高,并创下历史新高。

据介绍,增强现实(AR)眼镜 Orion,暂时只是一款原型产品,短时间内不会出售给消费者,但 Meta 表示,随着公司继续努力,Orion 终会与消费者见面。

扎克伯格还介绍了 Meta 在 AI 方面的进展,该公司最新发布的多模态 AI 模型 LLAMA 3.2,将允许人们通过语音而不止是书面文本进行互动。(来源:财联社)

 

星纪魅族推出新系列品牌「STAR」

9 月 25 日,在星纪魅族 AI 生态发布会上,星纪魅族对其品牌旗下矩阵进行了重新规划,全新品牌矩阵形成,正式推出全新产品系列「STAR」。

根据星纪魅族的规划,以「Flyme AIOS」为技术底座,打造全球化的智能生态产品。分别用 AI 赋能「智能手机」、「XR 智能眼镜」和「汽车」。并把主品牌一分为二即:「星纪 STAR」和「魅族」。

「星纪 STAR」品牌主管智能眼镜和智能汽车;而「魅族」品牌则主管熟悉的 AI 手机和 AI Device。(来源:鲸闻)

苹果获根据用户专注度调整内容头显新专利 以缓解伤痛和其他不适 

近日,美国商标和专利局 (USPTO) 公示了苹果公司获得的一项涉及 Vision Pro(MR) 头显的新专利。专利内容显示,Vision Pro 头显旨在利用混合现实技术帮助用户缓解伤痛和其他不适感,这一技术为医疗健康领域带来了全新的应用前景。(来源:太平洋科技)

扎克伯格财富突破 2000 亿美元,仅位居马斯克和贝索斯之后 

9 月 25 日消息,社交媒体巨头 Meta 首席执行官马克・扎克伯格近日成为全球仅三名身价超过 2000 亿美元(当前约 1.4 万亿元人民币)的富豪之一,与特斯拉首席执行官伊隆・马斯克和亚马逊创始人杰夫・贝索斯并肩。

图片来源:视觉中国

根据彭博亿万富翁指数,今年扎克伯格的财富增长了惊人的 722 亿美元,使其总净资产达到了 2000 亿美元。英伟达首席执行官黄仁勋今年的财富增长排名第二,增加了 580 亿美元马斯克仍以 2680 亿美元的净资产位居榜首,贝索斯紧随其后,拥有 2160 亿美元的财富。(来源:IT 之家)

 

展示量: 104

火山引擎丢出视频大模型「王炸」,云厂商从「价格战」回归「卷性能」

自今年 2 月 Sora 面世以来,很多人都期待字节的动作。拥有抖音和剪映这两个最强的视频 App 在手,字节的视频生成大模型,被寄予厚望。

这就来了。

9 月 24 日,字节跳动旗下火山引擎在深圳举办 AI 创新巡展,一举发布了包括「豆包视频生成大模型」「音乐生成大模型」在内的多款模型。

在此之前,海内外不少现象级的同类模型产品相继发布,包括字节跳动相继发布的即梦、海绵音乐,和剪映(含 CapCut)中的新功能。秘而不宣的海绵音乐 App 更是被视为最适合中文的音乐生成 App、国内当之无愧的「Suno」。

字节为什么选择在多少有些「AI 产品看麻了」的 9 月,推出这几款 AI App 背后的大模型引擎?

对此,火山引擎总裁谭待向极客公园表示,不是按照某个固定计划精心设计什么节点发布,AI 模型进展日新月异,什么时候做好、适合对外就尽快发布。

这背后的逻辑是,火山引擎的定位是字节跳动的 ToB 云平台,模型对企业的开放由火山引擎来做,但推出产品前,需要先在内部使用,打磨到一定程度、做到企业级可用,才会向外推出。此前发布的豆包也是如此,先有字节内部推出的产品豆包 App,再有今年 5 月由火山引擎推出企业级可用的豆包大模型。

他补充说:「不一定要抢第一,要推出成熟的产品,因为模型对未来 10 – 20 年影响长远,做好积累后发先至也是好事。」

而火山引擎未来十年要驶向的远方,并不是一个、两个模型比如视频生成模型的领先,而是「成为全球领先的云和 AI 服务商」。

 

01 抖音和剪映加持,字节视频生成大模型更关注使用场景

视频生成大模型,成为整场发布会最大的亮点。

谭待表示,「因为视频特别难,我们一次性推出两个,充分解决视频里面的各种问题」。豆包家族新成员——豆包视频生成-PixelDance、豆包视频生成-Seaweed,正式面向企业市场开启邀测。

从现场展示来看,豆包视频模型可以根据文字和图片的输入,生成相应的视频。值得注意的是,字节跳动并没有公布其模型生成视频的最大时长,尽管后者被认为是体现技术能力的一大表现。

豆包视频生成大模型,更强调其在实际应用中、各种生活和商业场景所需的三个核心功能点。

首先是模型对复杂指令的理解遵循。以下图的视频为例,输入「特写⼀个⼥⼈的面部,有些⽣⽓,戴上了⼀副墨镜;这时⼀个男⼈从画⾯右侧⾛进来抱住了她」。

在这个相对复杂的描述下,豆包模型生成的视频呈现出了一个人情绪的变化、动作前后时间的变化,还出现了一个新的人物,这个新的人物跟原来的人物也有交互。换言之,豆包视频大模型能够根据指令实现时序性上有连续的动作指令,并且可以生成多个主体,并且让多个主体间进行交互。

豆包视频模型的第二个特点在于运镜,⾖包视频模型让视频在主体的⼤动态与镜头中进行切换,拥有变焦、环绕、平摇、缩放、⽬标跟随等多镜头语⾔的实现。

生成的视频可以灵活控制视⻆,更接近真实世界的体验|视频来源:字节跳动

第三个特点则是⼀致性多镜头。在 AI 生成的视频中,如何保证多镜头来回切时,不同主体在来回切换中的镜头是一致的,这也是当前行业的共性难点。

豆包在一个 prompt 下生成的视频,可以实现多个镜头切换,同时保持主体、⻛格、氛围的⼀致性。|来源:字节跳动

在谈及豆包视频生成大模型的特点时,谭待表示,豆包视频大模型背后有两方面优势,一是技术突破和全栈能力等优势,在技术上,字节在这两款视频模型上做了大量技术创新,比如通过⾼效的 DiT 融合计算单元、全新设计的扩散模型训练⽅法和深度优化后的 Transformer 结构,让整个⽣成视频的动作更灵动、镜头更多样、细节更丰满。

同时抖音、剪映对视频的理解也是优势。「剪映对视频的理解、对豆包视频生成模型有帮助,指令遵循做得好也离不开语言模型,豆包是全体系模型,底层有基座模型有助于更好地理解指令。」

在深入到视频场景的解决方案上,豆包视频模型支持不同题材类型,⽀持包括⿊⽩、3d 动画、2d 动画、国画、⽔彩、⽔粉等多种⻛格,包含支持 1:1,3:4,4:3,16:9,9:16,21:9 等多个比例,对应于电影、电视、电脑、手机等多个商业场景。

⾖包视频⽣成模型通过整个模型能把商品快速 3D,而且动态多⻆度展⽰,还能配合不同的节日,比如中秋、七夕、春节等节点快速替换背景和⻛格,⽣成不同尺⼨的内容发布到不同平台上,最终适合整体营销的战略完成。

在更聚焦的场景上,豆包视频模型也推出了更适配的解决方案,⽐如电商营销场景,可以让用户根据商品生成大量的配合营销节点的视频素材,并且适配不同媒体平台的不同尺⼨发布。

在视频发布环节,还有一个彩蛋,火山引擎带来了内部——剪映和即梦如何使用视频⽣成模型的实践案例。从抖音转战剪映 CapCut 的张楠(Kelly)通过数字分身 Kelly 的形式亮相。

在该数字人视频中,Kelly 数字分身的动作像真人一样自然,口型也可以与各国的不同语言完全适配。

这个案例也向外界展示了豆包视频大模型在场景上带来的新可能,比如自媒体、口播、营销、带货、企业培训等,不必亲自上阵进行拍摄,内容制作成本也可以大幅降低。

据悉,豆包视频模型不是期货,最新模型会在国庆节后上线到火山引擎方舟平台,即梦最新内测版已经使用了豆包视频生成模型-Seawe。

至于定价问题,谭待表示还没确定。他称「视频模型和语言模型应用场景不同,定价逻辑也不同。要考虑新体验 – 老体验 – 迁移成本,最终能否广泛应用取决于是否比以前生产力 ROI 提升很多。」

 

02 从「卷」价格,回到「卷」性能

与视频大模型一同发布的,还有音乐大模型、同声传译大模型,和豆包主力模型的新升级。就像豆包视频模型的效果让人眼前一亮,上述模型产品也均有亮眼的性能提升。

这一系列新升级也反应了,火山引擎开始从「卷价格」到「卷性能」的转变,后者将会成为其下一阶段的战略重点。会后接受采访时,火山引擎总裁谭待重申了这一立场,他表示:「大模型的应用成本已经得到很好解决。大模型要从卷价格走向卷性能、卷更好的模型能力和服务」。

早在今年 5 月,火山引擎推出的豆包大模型把价格降至最低每千 token 低于一厘钱,引发了大模型厂商的价格战。从那以来,模型厂商的整体模型调用量均出现了大幅提升。

据火山引擎披露,截至 9 月,豆包语言模型的日均 tokens 使用量超过 1.3 万亿,相比 5 月首次发布时增长超十倍,多模态数据处理量也分别达到每天 5000 万张图片和 85 万小时语音。

尽管如此,模型性能掣肘成为了模型调用量进一步提升的瓶颈,同时也是机会。谭待举例称,业内多家大模型目前最高仅支持 300K 甚至 100K 的 TPM(每分钟 token 数),难以承载企业生产环境流量。例如某科研机构的文献翻译场景,TPM 峰值为 360K,某汽车智能座舱的 TPM 峰值为 420K,某 AI 教育公司的 TPM 峰值更是达到 630K。为此,豆包大模型默认支持 800K 的初始 TPM,超行业平均水平,客户还可根据需求灵活扩容。

此前 MiniMax 创始人闫俊杰向极客公园表示,从技术发展的角度看,模型推理成本 10 倍、百倍的降低是必然,只是时间问题,难的是通用模型的性能提升。

在看到从 ChatGPT 到 GPT-4,性能出现了大幅提升时,大模型领域也沿着 OpenAI 在模型预训练上做 Scaling Law,旨在用更多的数据、加更多的算力、提升模型参数量的做法来提升模型性能。随着这一路径的效率降低、优质数据耗尽的担忧,通过这一方法提升性能的路径陷入瓶颈。

现在,随着 o1 的出现,大模型在推理阶段引入强化学习的路径,带来了进一步提升模型性能的明确路径。

同时,随着更多企业在 AI 应用上的探索,也为模型性能的定向提升带来了很多工程调优手段。更好的模型性能、更好用的模型服务,才能在产品上打开更多场景,而这也将成为包括火山引擎在内的 AI 基础设施服务商们下一阶段的重点。

 

展示量: 81

OpenAI 突然推送推送高级语音模式「Her」,又抢了谷歌风头

9 月 25 日早,Google 发布两款新模型 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。

在谷歌的系列模型中,Gemini Pro 属于中号模型,付费用户可以使用。而 Gemini Flash 则由 Gemini Pro 蒸馏而来,在今年 5 月的 Google I/O 上第一次亮相,目前用户可以免费在 Gemini 中使用,开发者也有一定免费的 api 使用配额。

模型升级的重点主要为 1.5 Pro 价格降低 >50%、1.5 Flash 的速率限制提高了 2 倍,1.5 Pro 的速率限制提高了约 3 倍、输出速度提高 2 倍,延迟降低 3 倍;过滤器切换为选择加入。

不过,似乎 Google 今天的宣传节点再一次被 OpenAI 提前知晓。OpenAI 同日宣布,OpenAI 的高级语音模式,将在本周对 Plus 和 Team 用户推出。

5 月,Google 发布 Gemini 模型的大更新前,OpenAI 就曾提前抢开发布会,宣布很快会带来高级语音模式,登上媒体头条「个人助理 Her 就要来了吗?」

接下来半年,高级语音模式的发布一再推迟,直至今日 Google 更新模型,OpenAI 立刻表示,本周内将推出语音模型。

除了之前已经剧透过的语音模式与人类在对话中的反应时间相近,会变换语调之外,还增加了个性化指令功能——可以直接指令模型说话说慢点,或者用一个特定的口音,同时可以记住你的名字和提前提供的信息给出更个性化的回复。

X 上有用户不禁感叹,OpenAI 已经养成了一个新爱好。等着 Google 发布一个什么东西,几个小时后马上发布一个新东西。

Google Gemini Pro 价格下降一半

从 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 的名字也可以看出,此次 Google Gemini 的更新,不是一个大版本的更新,更多的是一次整体模型的升级。

降低价格是一个重要的更新重点。

Gemini 1.5 Pro 的输入 token 价格降低 64%,输出 token 价格降低 52%,增量缓存 token 价格降低 64%,适用于小于 128K token 的提示语,自 2024 年 10 月 1 日起生效。再加上上下文缓存,这将继续降低使用 Gemini 构建应用的成本。

此外,1.5 Flash 的速率限制从 1000 RPM 提高到 2000 RPM,1.5 Pro 的速率限制从 360 RPM 提高到 1000 RPM。在接下来的几周内生效。

Google 1.5 Flash 得到了 2 倍输出速度和 3 倍更低延迟。

同时,Google 表示,发布的 Gemini 模型,默认不会应用过滤器,开发者可以根据其用例自行决定最佳的配置。Gemini 将继续提供一系列安全过滤器,开发者可以根据需要为 Google 的模型应用这些过滤器。

Google 还表示,此次模型在数学、长上下文窗口和视觉方面取得了一定的进步。

在更具挑战性的 MMLU-Pro 基准测试中,看到大约 7% 的性能提升。而在数学和 HiddenMath(一个内部保留的数学竞赛问题集)基准测试中,两个模型都取得了约 20% 的显著进步。对于视觉和代码使用场景,两个模型在评估视觉理解和 Python 代码生成的测试中表现也更好,提升范围在约 2-7% 之间。

8 月份发布的 Gemini-1.5-Flash-8B 实验模型也得到了新的更新。

Gemini 模型本身的亮点包括长上下文和多模态功能。由于 Gemini Flash 对开发者有部分免费额度,新更新可能对于开发某些应用有着很好的效果。

X 上的 AshutoshSrivastava 就表示,他使用 Google Flash 构建了一个应用,能够在 1 分钟内转写 13 分钟的长音频,且准确度很高(且免费)。在另一个应用中,他表示目标探测功能的表现也很不错。

OpenAI 高级语音功能今日起推出

转头看 OpenAI 这边。

凌晨两点,OpenAI 宣布高级语音模式今日起开始向订阅用户推出,周内会全量进行推送。

根据 OpenAI 的宣传片,与标准语音模式进行区分(黑色旋转球),高级语音将以蓝色旋转球表示,并增加 5 个新语音。

此次发布的一个重要亮点是,OpenAI 表示,高级语音模式可以提供个性化定义。

在视频中,OpenAI的研究员表示,用户可以自定义指令,以让模型以某种口音发音、记住事件以及用户想要如何被称呼等。

「你可以让模型用特定的语速说话,也许是非常清晰地发音,慢慢地说话,定期用你的名字或你喜欢的称呼来称呼你。」研究员表示。

另一位研究员提供了一个例子,对模型输入名字和所在城市,在向模型寻求周末的计划时,模型会根据所在城市,进行更个性化的规划。

高级语音对话目前仅适用于 ChatGPT Plus 和 Team 帐户的用户。免费用户仍然可以访问标准语音模式。

不过,Plus 和 Team 用户每天仍然有高级语音的使用限制,并且每日限制可能会发生变化。当一天的高级语音还剩 15 分钟时,OpenAI 会向用户发出通知。

同时,使用高级语音模式无法使用 GPTs,即用户设计的 OpenAI 的智能体。

高级语音模式因为对语音反应时间更敏感,在某些嘈杂的场景下,也更容易被打断。

最后,OpenAI 还用高级语音模式搞了一个活,表示 ChatGPT 目前可以用五十多种语言表示「对不起,我迟到了,我不是故意让你等这么久的。」

一个很有趣的点是,此次 Gemini 的发布,是由 Google 的 Logan Kilpatrick 主要负责对外沟通交流。

而 Logan Kilpatrick,正是 OpenAI 前开发者关系负责人。2024 年跳槽 Google。

而转头,此次 Google 发布新模型,OpenAI 就卡点发布高级语音模式。

OpenAI 此次宣布的时间点或许还有另外一个意义——此前外媒报道称,Meta 公司本周将在 Meta AI 中推出名人语调的音频对话功能。

在硅谷,AI 的战争还在热火朝天的继续。

 

 

展示量: 100

华为三折叠手机「黄牛价」雪崩;OpenAI「Her」语音模式推出;日本政府推 AI 相亲系统 | 极客早知道

Google 发布新模型,OpenAI 再抢风头:高级语音模式正式推出

9 月 25 日早,Google 发布两款新模型 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。

在谷歌的系列模型中,Gemini Pro 属于中号模型,付费用户可以使用。而 Gemini Flash 则由 Gemini Pro 蒸馏而来,在今年 5 月的 Google I/O 上第一次亮相,目前用户可以免费在 Gemini 中使用,开发者也有一定免费的 api 使用配额。

模型升级的重点主要为 1.5 Pro 价格降低 >50%、1.5 Flash 的速率限制提高了 2 倍,1.5 Pro 的速率限制提高了约 3 倍、输出速度提高 2 倍,延迟降低 3 倍;过滤器切换为选择加入。

不过,似乎 Google 今天的宣传节点再一次被 OpenAI 提前知晓。OpenAI 同日宣布,OpenAI 的高级语音模式,将今日起开始对 Plus 和 Team 用户推出。

5 月,Google 发布 Gemini 模型的大更新前,OpenAI 就曾提前抢开发布会,宣布很快会带来高级语音模式,登上媒体头条「个人助理 Her 就要来了吗?」(来源:极客公园)

华为三折叠溢价暴跌:从加价近 10 万到仅加 4000

近日,有很多数码博主发布视频称,华为三折叠手机 Mate XT 溢价暴跌,从加价六七万甚至十万,跌至加价四千、两千。

在社交平台,还有黄牛发文称,第一次当黄牛砸手里了,一天掉 4-5k,甚至到了「每小时一个价」、「你要买我肯定有货,但你要卖我打死不收」的地步。

24 日早间,「华为三折叠黄牛价雪崩」登上热搜榜。根据网友的反馈,华为三折叠手机 Mate XT 黄牛价雪崩主要有以下几个原因:一是市场需求不足。二是价格「不亲民」,作为华为高端产品,即使按照官方原价,2 万元起的售价也非很多普通消费者承担得起的。

此外,市场供需关系的变化也是导致黄牛价雪崩的重要原因。此前,天风国际分析师郭明錤发文称,按最新供应链调查数据,上调华为三折手机 Mate XT 今年出货量预测,由 50 万部调高至 100 万部。(来源:TechWeb)

 

字节跳动将在全球范围内关闭 TikTok Music

9 月 24 日消息,TikTok Music 将于 2024 年 11 月 28 日关闭,在此日期之后,对 TikTok Music 的访问,包括登录、订阅和所有其他功能,将不再可用。用户的账户信息和个人数据将在 TikTok Music 关闭后自动删除。(来源:界面)

 

Snap 将在其 AI 聊天机器人中集成谷歌的 Gemini AI

据彭博消息,Snap 与谷歌建立合作伙伴关系,Snap 将把谷歌的 Gemini AI 整合到 Snapchat AI 聊天机器人中。(来源:界面)

豆包视频生成大模型正式发布,首次突破多主体互动难关

字节跳动正式宣告进军 AI 视频生成。9 月 24 日,字节跳动旗下火山引擎在深圳举办 AI 创新巡展,一举发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed 两款大模型,面向企业市场开启邀测。据介绍,豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。(来源:36 氪)

 

腾讯机器人实验室推出其第五代机器人

9 月 24 日午间消息,腾讯 Robotics X 实验室最新研发成果人居环境机器人「5 号」(The Five,小五)正式亮相,官方表示,小五具备一系列创新技术和能力,目标是成为可以与人居环境和谐相处的通用机器人。

据悉,作为腾讯 Robotics X 实验室最新一代机器人,小五集合了此前多代机器人研发的核心能力,融合了四腿轮足复合设计、大面积触觉皮肤、多指灵巧手以及安全人机物理交互等多项自研技术,实验表明,小五可在真实人居环境中完成行走、搬运物体等动作,处理复杂任务,与人进行交互。(来源:新浪科技)

 

卓驭(原大疆车载)将基于英伟达 DRIVE Thor 开发智能驾驶解决方案

9 月 24 日消息,卓驭(zhuó yù)科技与英伟达于 2024 年 9 月 20 日举行合作握手仪式,宣布将基于英伟达的下一代集中式车载计算平台 NVIDIA DRIVE Thor 打造旗舰级智能驾驶解决方案。

大疆车载于今年 6 月宣布启用「卓驭」作为业务品牌名称,定位于智能驾驶供应商及服务商,目前包括大众汽车、上汽通用五菱、奇瑞汽车、中国一汽、东风汽车等品牌车型搭载了卓驭智驾技术。(来源:IT 之家)

 

中国将在月球上建无线网

9 月 24 日,国家航天局宣布,在完成嫦娥六号任务后,中国探月工程还将通过 2 次发射任务,为国际月球科研站打基础。按计划,我国在 2026 年将发射嫦娥七号,2028 年前后将发射嫦娥八号。

国家航天局副局长卞志刚表示,嫦娥七号是对月球南极的环境和资源进行勘测,嫦娥八号是要验证月球资源的就地利用技术,也要为后面的月球科研站的建设奠定一个基础。在 2035 年前后,要建设月球科研站的基本型。

那么,在月球上可以上网吗?可以生活吗?国家航天局探月与航天工程中心主任关锋指出,嫦娥八号要考虑通信的能力,在月球上肯定会有无线网、能源,至于能不能种菜,科学家们还在研究,嫦娥八号有可能会搞这方面的科学研究。(来源:央视新闻)

华为发布了 26 万的智界 R7,和即将铺开的「纯血鸿蒙」

9 月 24 日下午,华为秋季全场景新品发布会如期启动。

当天的大会上,万众期待的三折叠之后的主力机型 Mate 70 并未如期而至,在华为智慧屏、华为 WatchGT 一系列新品之外,25.9 万元起的智界 R7,成为正常发布会最硬的菜。

智界 R7 之外,已经内测了有一段时间的 HarmonyOS NEXT 系统,再次成为发布会的主角。对于这套系统,一贯以「大嘴」著称的华为终端 BG 董事长、智能汽车解决方案 BU 董事长余承东再次爆金句:「我们用一年时间,走过了国外操作系统十多年的路」。

长假回来后的 10 月 8 日,「纯血鸿蒙」HarmonyOS NEXT 即将迎来公测,而智界 R7 也将和「界」字辈的产品一起,加入到车企金九银十的激烈竞争中。(来源:极客公园)

 

星纪魅族 AR 智能眼镜 StarV View 开售,首发 2399 元

9 月 24 日消息,星纪魅族 AR 智能眼镜 StarV View 今日开售,该款眼镜拥有 700nit 峰值亮度,支持 120Hz 高刷,定价 2799 元,预售价 2499 元,早鸟定金 1 元抵 101 元,首发最低 2399 元。

据介绍,星纪魅族 AR 智能眼镜 StarV View 提供星纪灰、曙光橙 2 种配色,此次开售的为星际灰配色。该眼镜采用 1.6:1.2:1 的比例,辅以弹性转轴 + 软性镜腿,重约 74g。

星纪魅族 AR 智能眼镜 StarV View 采用了视网膜级显像(PPD 51),拥有 700nits 峰值亮度、120Hz 刷新率,支持 50:1 虚实显示对比度,10 万:1 的图像对比度,可投 188 英寸画面。

该眼镜可提供 85mm / lp 清晰度,支持 10 档亮度调节,支持三档色彩模式,覆盖 108% sRGB 色域,预装 Flyme XR 2.0 空间操作系统,支持 0-600 度近视调节。(来源:IT 之家)

AI 牵线搭桥:日本东京政府推出人工智能相亲系统

9 月 24 日消息,不少人想通过互联网寻找伴侣,但又怕遭遇个人隐私泄露或诈骗。为此,日本东京都政府出手,推出官方背书的人工智能相亲系统,旨在帮助东京居民找到合适的伴侣。

据东京政府 2021 年的一项调查显示,3267 名东京居民中有 67% 希望有一天结婚,但其中 69.3% 尚未迈出寻找潜在伴侣的第一步。

这一系统名为「东京结缘」,于 9 月 20 日正式推出,面向在东京生活、学习或工作的 18 岁以上未婚人士。用户必须支付 1.1 万日元(约 540 元)购买两年使用资格,还需要多种认证并提供收入证明,接受系统工作人员的面试。实施收费措施是为了驱逐那些可能出于休闲目的使用该应用的人,从而服务于真正对寻找稳定关系、安顿下来有认真态度的人群。

成功登入系统后,用户需要接受价值观评估,以便人工智能系统为其匹配相容性较高的人选。接下来,他们可以获得全方位专业咨询服务,以解决从约会开始到婚后的整个过程中可能遇到的问题。(来源:IT 之家)

展示量: 81

爆火的华为「三折叠」背后,到底隐藏了多少黑科技

作为众所周知的红海市场,智能手机的销量「触顶」已经是被验证多年的事实,正是在这样的时代背景下,还未开售就已经大放异彩的华为 Mate XT 非凡大师,自然收获了更多的好奇与关注。

销量触顶的智能手机市场,需要更多新鲜空气。而最近大火的华为 Mate XT 非凡大师,凭借着独有的三折叠概念,以及极致科技带来的极致使用体验,走出了一条与让智能手机市场耳目一新的曲线。

即使这是一台起售价 19999 元的超高端旗舰手机 、但在尚未发布前预售量就超过 600 万、9 月 20 日正式开售后更是瞬间售罄。

 

三折叠的现象级爆火,背后反映出的是华为 Mate XT 非凡大师作为三折叠手机这一「科技新物种」给用户带来的新鲜感。用户在日复一日的常规形态智能手机迭代中逐渐丧失了换机的兴趣,华为 Mate XT 非凡大师最终呈现出的硬件高水准,让更多用户愿意相信,无论是从功能还是从形态上,都有潜力颠覆现有的智能手机体验。

在华为首发,将三折叠手机从概念带到用户手中背后,其实这个概念也已经伴随折叠屏技术出现多年:每年以 CES 为代表的消费电子科技展会中,都能看到不少三折叠概念机的出现。其中除了以上游屏幕厂商「炫技」为目的的概念机演示,也时有手机厂商参与其中,向外界展示自家在智能手机研发领域的技术积累。

但最终这些都没能真正推向市场,最先拔得头筹的,是华为 Mate XT 非凡大师。

究其原因,从概念机到真正成为量产产品,两者之间的难度有着天壤之别:概念机为了追求极致的震撼效果,往往在其他体验部分有着明显的短板——这些对于概念机来讲无伤大雅,但对量产手机而言,出现任何的细微问题对产品而言都足以致命。

换言之,华为最终成为真正意义上首发三折叠手机的厂商,本身就证明华为在三折叠技术有着深厚的积累,这是比「每年一款概念机」强有力的多的证据。

这幅关于「智能手机的下一次革命」的蓝图,正由华为一点点变成现实。

长期投资「终点再见」

在 9 月 10 日的华为见非凡品牌盛典中,华为消费者业务 CEO、终端 BG 董事长余承东提到华为 Mate XT 非凡大师是华为「五年集大成之作」。

 

这里所指的,显然是华为从 2019 年 Mate X 开始,迄今已经发布的、覆盖了外折、内折多种形态的十余款折叠屏手机。

作为在现有智能手机技术之上,对下一代智能手机概念的探索,三折叠从概念到最终量产,显然并非网络上传播的梗图「两个折叠屏拼起来」那样简单,其难度相比传统折叠屏手机来讲甚至可以用「几何倍增加」来形容。

极客公园了解到,在过去五年,三折叠的探索中,屏幕材质仍然是难点最为集中的硬件领域——三折叠在屏幕材质上存在的一大难题,就是柔性屏幕需要做到双向弯折。

在设计屏幕外折结构时,屏幕弯折后位于整机外部,铰链设计需要重点考虑抗拉伸性能;而内折结构时,则需重点考虑抗挤压性能。这两种机械结构在传统折叠屏时代都有数款对应的材料,但却没有一款材料能够同时胜任这两种需求。

面对这种屏幕材料新需求,华为在华为 Mate XT 非凡大师的屏幕上启用了一种采用链状分子结构的多向弯折柔性材料。整体屏幕耐弯折能力提升了 25%,同时也是折叠屏屏幕量产材质首次实现从 -180° 到 +180° 的全向弯折。

三折叠的另一个难点在于铰链。

铰链直接决定了折叠屏的开合手感与使用寿命,在三折叠上,由于加入了屏轴联动设计,为了保证铰链有足以支撑机身的强度,过去三折叠概念机全部采用了厚重的结构,让三折叠概念机难以满足日常使用需求。

而华为则是业内唯一一家、过去五年连续在外折叠转轴技术上坚持投资的厂商,最早可以追溯到华为首款折叠屏手机华为 Mate X。

 

在折叠屏技术刚起步的 2019 年,外折相比当时市面上更多手机品牌选择的内折方案,在厚度与重量上都有着明显的优势。但华为最终选择了「技术转向」——华为 Mate X 系列在延续三代后,从华为 Mate X3 开始,变为了当时行业主流的内折设计,外折叠旗舰从此在行业中销声匿迹。

在华为 Mate XT 非凡大师上,华为凭借着在外折与内折两种完全不同的铰链结构上的技术积累「两条腿走路」,最终实现了三折叠展开厚度仅为 3.6 毫米的惊艳表现,同时攻克了屏轴联动的匹配难题,实现了三折叠上内外开合一致的手感。

原本曾被外界普遍认定是,以及行业内独一份的外折叠鹰翼铰链技术,最终在华为 Mate XT 非凡大师上,以这种方式在终点实现了「再会」。

三折叠,不止于「大」

几乎每一个新物种诞生时,现有用户会下意识将其套入现有的产品使用逻辑中,用现有的习惯去臆想未来;也很容易忽视已经近在眼前、存在巨大潜力的契机。

2007 年,初代 iPhone 发布之后,时任微软总裁史蒂夫·鲍尔默嘲笑「智能手机没有未来」的论据是「它都没有键盘,你甚至不能用它来发邮件」。

就是在这样的嘲讽与质疑广为流传中,智能手机的时代悄然揭开帷幕,十七年转瞬即逝,如今世界上再也没有「带键盘的手机」。

智能手机这一产品形态,本身就是以「变革」立身,随着以全触控操作、应用商店、软件服务优先这些超前于时代的设计,在吸引全球无数用户成为忠实拥趸的同时,也在悄无声息地构建着下一个时代的「基础设施」。

到华为 Mate XT 非凡大师的开售,我们仍不自觉地陷入了「缺乏想象力」的窘境中:想象力匮乏是平庸的开始,众多围绕「三折叠有什么用」为主题的激烈争论,很大程度上是这种深层原因的折射。但也确实说明了华为 Mate XT 非凡大师在抢占先机的同时,也承担着解答这一问题的重要使命。

这个问题的解法,或许可以从五年前找到答案:如今的「三折叠有什么用」在具体解法上,与「折叠屏有什么用」并无太大不同,这一问题随着折叠屏技术被整个智能手机行业携手推动,针对折叠屏探索更多使用场景、开发更多专属功能,最终其「智能手机旗舰产品线」的地位也得到了稳固。

折叠屏在高端旗舰领域所取得的成功,很可能只是折叠屏技术真正大规模给智能手机形态带来改变的前哨战:目前折叠屏的杀手锏功能——应用多开、跨应用全局交互,以及应用多层级窗口同时展示这些操作,很大程度是在将原本 PC 端成熟的软件操作逻辑以更大的屏幕作为平台带到手机上。

在华为 Mate XT 非凡大师发布会中,余承东也展示了为其定制的配套折叠键盘配件,并提出了「将电脑装进口袋」的口号引爆全场,这又是另一次「打破智能终端形态边界」的尝试,把 PC/Pad 装进口袋。

而华为也已经不是第一次「走入无人区」:作为最早布局折叠屏、也是迄今为止唯一量产三种形态折叠屏手机的厂商,华为在折叠屏市场份额已经高达 67%。

在硬件的基础上,华为还拥有能基于硬件深度定制的鸿蒙 OS 操作系统生态:支撑华为以及开发者在华为 Mate XT 非凡大师这一平台上,探索更多独属于三折叠的未来应用场景。

随着三折叠的量产,毫无疑问,如今的华为已经成为了行业内最有资格对「三折叠有什么用」这一问题给出正确答案并将其变为现实的手机品牌之一。

智能手机的未来

诚然,华为 Mate XT 非凡大师在社交媒体的爆火,其核心是超前其他所有手机厂商的三折叠形态。

但在大部分人的注意力都还停留在「三折叠有什么用」这个问题时,我们更不能忽视问题的本质,其实是来自用户的提问「智能手机还会怎样进化」?

比起三折叠在发售后引发的全民讨论,通过三折叠的硬件与软件的持续探索回答好这个问题,或许才是华为 Mate XT 非凡大师对于智能手机接下来注定会到来的形态变革,所能起到的最重要的意义。

智能手机时代即将迈入第三个十年,折叠屏手机作为一个曾被寄予厚望的概念,如今也随着五年的发展,随着三折叠的走向下一个转折点;谁先拿出并量产新形态智能手机,就能享受到最多的先手优势。

 

如今,关于智能手机的探索再一次走到了十字路口,三折叠所承载的不仅是「门票」,更像是在搭建舞台本身,以及对外展示华为推动行业变革的决心。

对于行业而言,华为从折叠屏探索高端化之路到三折叠的历程,既代表着智能手机形态的变革,也代表着以华为为首的中国品牌,从竞争者到引领者的变迁。

在这样的时代背景下,华为 Mate XT 非凡大师的登场,率先给出了回答;在智能手机进化的探索之路上,华为已经率先「踏入无人之境」。

 

展示量: 143

这款 AI 相机,让你「读懂」自己毛孩子的心

近两年,一个职业悄悄火了起来,它就是宠物沟通师。
在现代家庭中,宠物已成为许多人生活中的重要成员,为了更好地了解和照顾他们的宠物,主人会请有「特异功能」的宠物沟通师,来和自己的宠物进行跨物种沟通,以了解自己可能会忽略的宠物的需求。
在某短视频平台上,一位名叫「庭至巫女」的博主曾表示,自己做宠物沟通师,月入三五万元。还有不少机构将宠物沟通师培训做成了一门生意,收费 5000 元-15000 元不等。
宠物沟通师爆火的同时,也引起很大质疑——花钱请所谓的「宠物沟通师」是不是在交「智商税」?
之所以引起争议,根本原因还是所谓「与动物沟通」并没有经过科学验证,并且经过「沟通」传达给主人的结论也无法证实或证伪。
可以想见,如果宠物翻译机真的被发明出来,铲屎官们一定会迫不及待的入手。可惜我们的技术还没有做到这一步。
有没有其他方式,能让主人更好地了解自己「毛孩子」的所思所想?

AI「宠物沟通师」 

 

SiiPet 宠物行为分析相机,可能是目前最接近宠物翻译机的产品了。
这款智能宠物相机不仅能够自动、快速地识别家中的每只猫狗及其行为,还能将它们的日常活动划分为常规行为、异常行为和可爱瞬间,从而为宠物主人提供全面而深入的行为分析。

SiiPet 智能相机|图片来源:SiiPet 官网

 

有人也许会说,宠物摄像头,这个很简单,大部分人家里都有类似的产品。
不过 SiiPet 和之前那些摄像头最大的不同,就是它加入了现在最火热的 AI 功能。
SiiPet 的核心功能之一就是其先进的 AI 算法,能够精确区分家中的每一只宠物,让主人能够准确识别出家中是哪个宠物在「搞破坏」。
用户拉克兰·科尔曼在体验产品后在 YouTube 上表示:「我有 2 只猫和 3 只狗——它能完美地识别和区分它们,我终于能弄清楚是谁把一切都搞砸了。现在卡斯珀正在咬我的新鞋。」
无论是总喜欢抓沙发的猫,还是爱翻垃圾桶的狗,SiiPet 都能帮助主人轻松找到真正的「罪魁祸首」,让宠物主对家里的情况了如指掌。
不仅仅是行为识别,SiiPet 还特别关注宠物的健康状况。
通过精准的算法,这款产品可以识别包括抓耳朵、癫痫发作、跛脚等在内的八种异常行为。

小猫的异常行为被相机记录并发送给主人|图片来源:SiiPet 官网

 

凭借 95% 的识别率,SiiPet 能够在检测到这些异常行为后,迅速向主人发出警报,帮助他们提前发现并处理潜在的健康问题。
家中有老年宠物的用户康纳·谢泼德对这点尤为感激,他说:「我的「儿子」14 岁了,我很担心他会随时离开我,我想有东西可以随时照看他,感谢 SiiPet 帮助我做到了这一点!」
SiiPet 采用了 4K 高清技术,能够清晰地捕捉宠物的每一个动作和表情。此外,SiiPet 的智能摄像头在高速运动跟踪方面表现出色,即使在宠物快速移动的情况下,摄像头也能准确捕捉每一个细节,为主人提供高质量的视频和图像记录,不会出现掉帧现象。
同时,应用程序会自动生成分类相册,根据年份、月份和日期整理宠物的活动记录。主人可以随时查看宠物当天的行为统计数据,包括声音、常规行为和特殊活动,以全面了解宠物的日常生活。这一功能让主人即便不在宠物身边,也能时刻关注到宠物的状态。
经常外出的哈里森对此深有体会:「我们花了很多时间在户外,我实际上不喜欢把我的「女儿们」独自留在这里,所以有这样的东西让我感觉好多了!」
安装和使用 SiiPet 也非常简单。用户只需下载应用,将宠物信息添加进去,并为每只宠物拍摄一个 360 度的视频,以便 SiiPet 能够识别它们。这尤其适用于多猫或多狗的家庭,让主人可以为每只宠物建立档案,相机便可精准识别每只宠物。

宠物产品,正被 AI 重塑 

 

事实上,不止是 AI 相机,智能设备已经深入到养宠生活的方方面面。智能猫砂盆、智能项圈、智能宠物门等产品,宠物赛道正如其它所有行业一样,正在被 AI 重做一遍。日新月异的宠物产品正在用智能化功能,照料宠物的饮食起居,满足主人与宠物实现沟通的愿望。
同时,宠物智能设备赛道可以说已经充满了创业者:

ORo AI 宠物陪伴机器人

来自印度的 ORo AI 宠物陪伴机器人,这款智能设备集玩耍、喂食、健康监测、看守和训练于一身,成为宠物的全方位生活伴侣。
ORo 机器人配备了自动喂食器,能够在主人不在家时,自动为宠物提供食物和零食,确保喂食时间表的正常维持。同时,ORo 具备健康日志功能,能够记录宠物的饮食习惯和其他生命体征,帮助主人及早发现宠物潜在的健康问题。
此外,ORo 机器人还可以捕捉宠物的行为信号,自动尝试安抚或分散其注意力,如陪伴独自在家的狗狗玩捡球游戏,避免了在主人上班的时间里,宠物因为缺乏陪伴导致产生无聊或孤独情绪。

主人不在家,ORo AI 宠物陪伴机器人启动「守护模式」|来源:官方视频截图

 

Little Robot 4 智能猫砂盆

Whisker 的 Little Robot 4 是一款专为猫咪设计的智能猫砂盆。
这款产品通过连接 WiFi,可以在猫咪使用猫砂盒后几分钟内自动进行清洁,并且每次都会用新鲜的猫砂替换。

Little Robot 4 智能猫砂盆|来源:官方视频截图

 

Little Robot 4 还配备了安静的循环模式,非常适合夜间使用,尤其适合对声音敏感的猫咪。通过应用程序,主人可以随时追踪猫咪的如厕习惯和体重,及时发现异常情况,实时关注猫咪的健康状况。

 

Minitailz 智慧项圈

Invoxia 推出的 Minitailz 智慧项圈,内置了 GPS 和 医疗级健康追踪器,能够实时追踪宠物的行踪、食欲、心脏健康。通过随附的应用程序,宠物主可以密切监控宠物的整体健康状况,特别是呼吸和心率等关键指标,为及时的健康干预提供了依据。
只在小小项圈上动心思,却能起到对宠物行动与健康监控的作用,实在是很难不让家有爱宠的主人们动心。

Invoxia 智慧项圈定期追踪宠物的健康状况|图片来源:产品官网

 

SmartDoor 智慧宠物门

PetSafe 的 SmartDoor 智慧宠物门则通过识别功能的加持,为自家宠物灵活出入家门提供了安全与便利。
这款宠物门可以与宠物的项圈相连,当宠物接近门时,门会自动感应并开启,为宠物提供自由进出的便利,也自然挡住了其它小动物穿行的可能。
PetSafe 的应用程序使得主人能够为多只宠物设定符合其习惯的出入时间表,并收到宠物进出情况的实时通知。
该产品还具有防风雨密封功能,能够在恶劣天气下保护宠物,确保室内环境的舒适。

SmartDoor 智慧宠物门|图片来源:产品官网

 

让宠物机器人先进入家庭 

 

在 AI 技术与宠物产品的结合下,传感器能够收集宠物的行为数据并进行深入分析,为主人提供关键的反馈信息。在动物语言翻译技术尚未普及之前,这种对宠物行为的数据化解读已经成为主人和宠物之间沟通的桥梁。
正如 SiiPet 智能相机每一帧画面中的每一个比特,都帮助主人更深入地了解家中毛孩子的需求与情绪。这种技术不仅提升了宠物主的养宠体验,更是 AI 宠物产品的核心需求所在,将成为许多宠物主选择购买这类产品的重要原因。
当消费者被如此多的智能宠物产品吸引,迫不及待地把它们买回家时,也从另一个角度打开了机器人进入家庭场景的思路。
近两年,与 AI 技术飞速发展形成鲜明对比的,是 AI 技术急需落地场景而不得,比如家用机器人。原因之一就是家庭环境太过复杂,机器人在没有互动反馈训练的前提下,无法应对和处理复杂的物理环境。
而机器人不进入家庭环境,就没有机会和现实的物理环境进行互动,也就无法学习如何适应环境,达不到进入家庭环境的投放标准,似乎成为了一个死循环。
宠物赛道提供了另一种思路——或许我们不必先从服务人开始,可以先从服务宠物开始。
家用机器人价格贵、实现门槛太高,相比之下简简单单一个宠物陪伴机器人的性价比一下子就出来了。而且,一个发展仍处在「幼龄」阶段的机器人,陪伴与服务一个相当于幼龄儿童智商的宠物,简直再完美不过。
另一方面,智能宠物产品这一赛道的市场空间还远没有打开。
《2023-2024 年中国宠物行业白皮书(消费报告)》显示,2023 年,我国城镇宠物消费市场规模已达 2793 亿元,预计到 2026 年将跃升至 3613 亿元。
小红书 2024 宠物行业洞察报告显示,相较过去 1 年宠物花费,88% 的人在消费结构方面有明显提升,其中主要几项支出就是智能产品。
为了毛孩子的健康快乐,越来越多宠物「父母」愿意为他们的毛孩子购买更贵的新型高科技产品,以改善宠物们的生活品质。

数据来源:小红书 2024 宠物行业洞察报告

 

AI 技术的加入,无疑让宠物智能设备的进化速度提升了一大截,也让未来宠物硬件市场充满了可能性。
*头图来源:SiiPet官网
展示量: 113

这个「微博」,几万个 AI 和你互动,成就你的「大 V 梦」

这个「微博」,几万个 AI 和你互动,成就你的「大 V 梦」

 

作者 | 汤一涛
编辑 | 靖宇
还记得你上一次在社交网络上字斟句酌地发表一个观点,但是却没有任何回应的失落吗;还记得你辛苦在微博发了一张精心拍摄的图片,最后留言只有帮忙「办证」的骗子吗?
如果你依然对于自己没能成为「大 V」而耿耿于怀,那么现在,你的福报来了。
近日,一款刚刚上线的叫 SocialAI 的 App,将解决你无法走红的烦恼。
乍看之下,Social AI 又是一个类似于 Twitter 的社交网络,你可以在这里发布推文、关注别人,或者被人关注。但不同之处在于,在这个 App 里只有你一个真人,所有与你互动的用户都是 AI 机器人。
如果你想,你可以定制多大 32 种人格,成千上万的机器人,为你的每一条推文点赞、评论;如果你像罗老师一样特别有战斗精神,甚至还可以顺手定制几千个「喷子」,满足你网络杠精的人格需求。
那么,SocialAI 这个 AI 微博到底怎么玩?而这些 AI 网友,又能不能治好你的网络孤独症?
01 手搓 AI 粉丝……和喷子
过去一段时间,我们已经见识过了只有 AI 的社交网络 Chirper、人类与 AI 混杂的社交网络 Butterflies。现在,SocialAI 号召了所有机器人,只为你一个人服务。
和其它社交媒体一样,你需要为自己设置个人资料,包括用户名、昵称、简历和头像。这些资料只会由你自己看到,因为没有其他人会链接到这个平台,跟你交互的只有机器人。
所以你还需要选择你的机器人粉丝。开发者设置了 32 种追随者类型,从积极的支持者、粉丝、啦啦队长,到更多元的保守派、自由派、占星家,或者是更体现人类黑暗面的巨魔、批评者和仇恨者,你至少要选择其中的 3 种。
不过,当你选择超过 10 种类型时,App 就要求你必须转发给 5 位好友才解锁更多类型。
你看,即使是只有你一个真人的社交网络,也存在社交裂变的需求。

用户可以自己定制「AI 网友」|图片来源:SocialAI

 

然后你就可以开始发推了。我好奇机器人对新发布的 iPhone 有什么看法:「有人打算购入 iPhone 16 吗?」
接下来是激动人心的时刻,在短短几十秒内,推文就收到了 26 条回复,每条回复都顶着一个真人名字。
Philipa Muse 显然是个思考者,她发出了灵魂拷问:「iPhone 16 真的能为我们的日常生活提供这么多意义吗?我有时觉得我们只是盲目地追逐新鲜事物罢了。」
Lila Starstuck 应该是 Philipa Muse 批判的对象,她已经迫不及待地要购入新 iPhone 了:「我的天啊,当然!你能想象那些新功能吗?会超级棒!我喜欢最新的科技。」
点进 Lila Starstuck 的回复,底下也有其它机器人的留言,就像真实的 Twitter 一样。但大体都是围绕「我爱 iPhone」和「我们应该思考我们需要什么」反反复复的片汤话。
接着,我又发了条推文,询问:「『Strawberry』这个单词里有几个『r』?」这是一个陷阱,也是人工之间「幻觉」的一部分——人工智能可以告诉原子弹的制造原理,但数不出「Strawberry」里有几个「r」。
果然,在我收到的回复中,「一半人」一本正经地告诉我有两个「r」,Sage Ather 甚至教育我「学会感知词汇可以让我们有更深刻的理解」。
「另一半人」则认为「Strawberry」里只有一个「r」。Maya Thorn 就是其中的一员:「『Strawberry』里只有一个『r』,但是谁在乎呢?这只是一个单词,而这个世界已经有很多问题了。我们为什么要在这数字母呢?」从她的回答不难看出,她的人设应该是个嬉皮士。

SocialAI 主打你是网络主角|图片来源:SocialAI

 

02 每个人的大 V「体验服」

SocialAI 的确给我带来了一些乐子,但是我很难确定我要拿这个 App 干什么,它看起来更像是一场社会实验,一个当代的洞穴印象。
开发 App 的 Michael Sayman 是一位神童,在 13 岁时就在 App Store 发布了第一个应用程序。18 岁时,他应扎克伯格邀请加入了 Facebook,此后在谷歌、Roblox 都担任过职务。
他的公司 Friendly Apps 在 2022 年 5 月就筹集了 300 万美元的种子轮融资,SocialAI 已经是 Friendly Apps 发布的第三款应用。
实际上,在创办 Friendly Apps 之前,Sayman 的最后一份工作是在 Twitter。
2022 年 3 月,Sayman 受邀加入 Twitter 一个名为「0-1」的产品组,专注面向年轻用户的新功能。然后在当年的 4 月,马斯克就宣布要收购 Twitter。此后工作组的开发工作就被放缓了,这使得 Sayman 开始思考做一些自己的事情。

SocialAI 的制造者 Michael Sayman|图片来源:Michael Sayman

 

SocialAI 是 Friendly 的第 3 款 App,在 Twitter 的工作经历和马斯克的个人行为也许促使了 Sayman 开发这款 App。他认为许多社交媒体公司的留存策略、设计方式都在鼓励用户做出错误的行为,从而使得他们对社交网络上瘾,他告诉 TechCrunch:
「许多这些社交媒体公司的结构和激励措施的建立方式并没有鼓励对使用产品的人的福祉进行长期思考……如果有人在平台上表现不佳…… 如果他们感到焦虑、沮丧或不安全,随着时间的推移,他们会停止使用该产品。他们会尝试寻找其他途径或其他方式,通过其他方式与他们关心的人进行交流或联系。」
多年来,Sayman 一直在思考开发一款消费者应用,不仅可以展示技术的可能性,还可以以真实、切实的方式帮助人们。长期以来这都不太可能,但是技术进步帮助 Sayman 实现了他的愿景。眼下 SocialAI 的团队只有 Sayman 一个人,主要依靠 OpanAI 的 API 提供技术支持。
他在 Twitter 上发布的长文中写道:「SocialAI 旨在帮助人们感受到被倾听,并为他们提供一个像一个紧密社区一样进行反思、支持和反馈的空间。」
从 SocialAI 和创始人 Sayman 的言论来看,其实他并没有将这款 App 打造成一个 AI 推特的野心。而与其说 SocialAI 像推特,倒不如说它更像是 Replika 或者 Character.AI 这样心理陪伴类应用的「微博」版本。
那些来自 AI 机器人的点赞和留言所带来的提示音和红色的数字,毫无疑问会让用户的多巴胺飙上一阵,但用户最终还是会认清这个游乐场「楚门秀」的本质。不过,说不定扮演着粉丝或者喷子的机器人的留言,会刺激用户对于某个问题的不同思考。
Sayman 对此显然也有认知——用户也许很难觉得 SocialAI「有用」,但起码有一点用:「现在我们不必花 440 亿美元,就知道伊隆·马斯克以 440 亿美元收购推特后的感受,」Sayman 在 Threads 上说道。
展示量: 45

价格战,让中国车市损失 1380 亿;今年全球机器人出货超 4700 万;Telegram 创始人「服软」:向政府提供更多数据

报道称美国将「升级」打压中国汽车

路透社援引两名知情人士的消息称,出于对「国家安全」的考虑,美国商务部预计将于本周一提议,禁止美国道路上行驶的网联汽车和自动驾驶汽车使用中国的软件和硬件。报道称,这一举动是美国对中国汽车及软件和零部件持续限制的「重大升级」。接受《环球时报》记者采访的专家认为,这是美国继续滥用「国家安全」概念,对中国电动汽车进行全方位打压,推动在高科技领域进一步「脱钩断链」。

​路透社称,拜登政府对「中国公司收集有关美国司机和基础设施的数据,以及外国可能操纵连接到互联网和导航系统的车辆」表达严重关切。美国上述新规源于今年 2 月,拜登下令调查中国汽车进口是否在联网技术方面构成「国家安全风险」,以及是否应该禁止在美国道路上行驶的所有车辆使用中国这类技术软件或硬件。美国商务部长雷蒙多 5 月曾声称,美国联网汽车中的中国软件或硬件存在「显著风险」。(来源:环球网)

谷歌 CEO 皮查伊:AI 不会取代程序员,反而会让更多人成为程序员

9 月 23 日消息,近年来,人工智能(AI)的飞速发展引发了广泛讨论,人们担心 AI 是否会取代人类的工作。艺术家和程序员尤其担心,因为 AI 似乎能够胜任这两项工作。然而,谷歌及其母公司 Alphabet 的 CEO 桑达尔・皮查伊(Sundar Pichai)认为,AI 不会取代程序员,相反,其将帮助更多人成为程序员。

皮查伊在卡内基梅隆大学的演讲中谈到了 AI 对编程工作的影响,他表示,AI 最有可能帮助人们,而不是取代他们。它可以帮助现有程序员专注于更高级的任务,而不是重复解决同样的问题。此外,皮查伊认为 AI 将降低编程的门槛,使更多人能够通过自然语言的方式进行编程,就像使用一种创意工具一样。(来源:cnBeta)

 

AMD 首席执行官:AI 日趋成熟,芯片行业不能只盯着 GPU

9 月 23 日消息,AMD 首席执行官苏姿丰表示,「目前,GPU 是大语言模型的首选架构,因为 GPU 在并行处理方面非常高效,但在可编程性方面有所欠缺,」

苏姿丰说。「五年多后它还会是首选架构吗?我认为情况会发生变化。」苏姿丰预计,五年或七年时间内 GPU 还不会失势,但会出现 GPU 以外的新势力。

苏姿丰表示,未来的 AI 模型将使用不同类型芯片的组合,包括当今占主导地位的 GPU 以及仍有待开发的更专门化的芯片,以实现各种功能。(来源:华尔街日报)

 

OpenAI 劲敌 Anthropic 正考虑以 300~400 亿美元估值进行融资

9 月 24 日消息,The Information 报道称,美国 AI 初创公司 Anthropic 已经开始与投资者洽谈新一轮融资事宜。

一位现有投资者透露,Anthropic 新一轮融资后估值可能达到 300~400 亿美元(备注:当前约 2116.03 ~ 2821.37 亿元人民币),大约是今年初完成一轮融资后估值的两倍。

Anthropic 主要依赖于旗下生成式 AI 聊天机器人 Claude 获得收入,被视为 OpenAI 最大的初创企业竞争对手。在此之前,OpenAI 还被曝出将以 1500 亿美元的估值筹集 50 亿至 70 亿美元资金,几乎是今年第一季度的两倍之高。(来源:IT 之家)

 

中国汽车流通协会:今年 1—8 月「价格战」已致使新车市场整体零售累计损失 1380 亿元

9 月 23 日消息,据中国汽车流通协会公众号,近日,中国汽车流通协会向政府有关部门正式递交了《关于当前汽车经销商面临资金困境和关停风险相关情况的紧急报告》,《报告》指出:当前汽车经销商的新车销售出现大面积亏损,普遍存在现金流赤字经营和资金链断裂风险加剧的情况,已难以摆脱生存的困境。

据协会「市场脉搏」监测数据,截至今年 8 月,经销商进销倒挂数据最高已达-22.8%,较去年同期进一步扩大了 10.7 个百分点。据协会专家相关数据分析,8 月,新车市场的整体折扣率为 17.4%,今年 1—8 月,「价格战」已致使新车市场整体零售累计损失 1380 亿元,对行业健康发展产生较大影响。(来源:证券时报网)

Telegram 创始人「服软」:将向政府提供更多数据

当地时间周一(9 月 23 日),「电报」(Telegram)创始人兼 CEO 杜罗夫表示,Telegram 将根据有效的法律要求向政府提供用户的 IP 地址和手机号码。

杜罗夫周一在「电报」上发文称,「电报」修改了服务条款,以防该平台被犯罪分子滥用。据杜罗夫介绍,通过人工智能和审核团队,「电报」已开始在其搜索结果中隐藏有问题的内容,此举是防止该平台被滥用的措施之一。(来源:财联社)

 

机构:预计 2024 年全球机器人出货规模约 4700 万台,未来 5 年维持 20% 以上复合增长率

群智咨询数据显示,长期考虑人口老龄化趋势及 AI 推动普及,全球机器人总体需求呈现持续增长趋势,预计 2024 年全球机器人出货规模约 4700 万台,未来 5 年维持 20% 以上复合增长率。同时预计 2029 年其营收规模近 1280 亿美金。

从出货量角度,群智咨询(Sigmaintell)数据显示,2023 年全球消费类机器人占市场出货约 81%,长期占据机器人市场主导地位;工业机器人占市场总体出货约 17%。(来源:36 氪)

 

名创优品收购永辉超市 29.4% 股权,将成永辉超市第一大股东

9 月 23 日消息,名创优品公告,以 63 亿人民币收购永辉超市 29.4% 的股权,其中包括牛奶公司持有的 21.1% 及京东持有的 8.3% 的永辉超市股份。

公告显示,该交易完成后名创优品预计将成为永辉超市第一大股东,进一步扩大其线下零售版图。(来源:36 氪)

蔚来「萤火虫」首车内饰谍照曝光,定位精品小车

9 月 23 日消息,网络上曝光了蔚来第三品牌内部代号为「萤火虫」的首款车型内饰谍照。

蔚来汽车创始人、董事长兼 CEO 李斌此前透露,「萤火虫」将于 2025 年上半年交付,并将在国内与蔚来品牌共享销售网络。李斌表示,「萤火虫」类似于 MINI 与宝马的关系,但价格不会比 MINI 贵,定位为精品小车,售价在十几万元人民币。这款轿车按照非常高的安全和质量标准设计。

​从曝光的内饰谍照来看,「萤火虫」配备了两块屏幕,包括液晶仪表盘和悬浮式中控屏。方向盘采用蔚来家族经典的双色设计,粗壮且类似方形,两侧功能按键区尺寸较大。新车预计仍然采用怀挡设计,挡把设计粗壮。前风挡倾角较大,后视镜部分还有一个三角窗。外观方面,新车车头较短但整体厚实,车尾饱满动感。C 柱宽大,设计有宽大的后扰流板,整体造型颇具 ID.3 的感觉。(来源:cnBeta)

 

小米生态链企业蜂巢科技与宝岛眼镜母公司达成战略合作,年底推出首款联名 AI 音频眼镜

9 月 23 日消息,蜂巢科技 9 月 22 日宣布与星创视界达成战略合作。

蜂巢科技旗下界环 AI 音频眼镜系列产品将分阶段进驻星创视界旗下宝岛眼镜的全国门店,首批于北京、上海、深圳、杭州、南京、武汉、重庆等 16 个城市 40 家宝岛眼镜门店率先上线,界环和宝岛用户可在合作店铺体验从产品试戴,眼健康筛查,到专业验配一站式服务。双方还将开展联名产品共研的深度合作,预计 12 月将推出界环与星创视界自主品牌 SAP 联名的 AI 音频眼镜产品。

蜂巢科技成立于 2020 年 10 月,是一家专注于头戴智能硬件研发的科技创新公司,成立之初即为小米生态链企业,并于 2022 年推出首款产品 MIJIA 眼镜相机,2023 年推出第二款产品 MIJIA 智能音频眼镜。据悉,1 月 18 日,小米与蜂巢科技达成战略合作,聚焦于智能音频眼镜品类。(来源:IT 之家)

大众在欧洲停产 Polo,为更小、更实惠纯电汽车让路

​9 月 23 日消息,据《欧洲汽车新闻》和 Carscoops 报道,在经历了 40 年的漫长岁月后,大众汽车结束了旗下经典小车 Polo 在欧洲的生产。该车曾在位于西班牙的潘普洛纳工厂生产,而欧洲的工厂停产之后,该车将完全在南非卡里加的工厂生产。

与此同时,原西班牙工厂将进行改造,重点转向两款全新的小型纯电汽车的装配工作。近年来,Polo 在欧洲的销量有所下降,但仍是大众品牌的重要车型。该车今年前八个月的销量略高于 90000 辆,在欧洲最畅销汽车中排名第八。(来源:IT 之家)

 

展示量: 91

政企向大模型转身,阿里云十年打磨一把「锤」

今年 4 月,大模型能力第一次扎实的嵌进了陕煤建新煤矿等十余座矿山里。

 

矿山重大风险辨识、告警预警及处置,对安全生产与管理至关重要。在过去很多年里,虽然通过对图像数据的标注、训练,基于机器视觉模型的风险辨识在业内已相对成熟,但告警、处置环节仍高度依赖人工。

在煤矿调度指挥中心,调度员需时刻关注十余块监控屏幕,发现风险问题后手动创建处置文档、填写问题描述、查阅处置依据,并最终给出处置办法。

处置依据多且庞杂,以 2022 年 1 月第二次修订的国家级煤矿安全规范为例,共有 719 条。各座矿山会依据各自地质、施工条件,对规范再做增补。在人工处置期间,还可能遗漏重点区域发生的其它风险。「因此,缺了告警处置这一环,就无法实现自动化真正的闭环,也无法保证真正的安全。对矿业来说,这一直是个非常棘手的问题。

直到今年一套矿山重大风险辨识处置新系统应运而生。实时采集的矿山图像数据、环境数据和相关业务场景知识库「喂」给大模型后,大模型对矿山场景、区域、安全风险内容、管理规范、处置措施等信息进行抽取、训练、学习后,具备了实时推理、实时处置的能力。

现在这套系统可以自动处置常规风险,调度员只需要把精力放在少数复杂场景上。

矿业所在的能源行业是大模型发挥作用的经典场景之一。

据中央网信办今年 8 月透露,截至目前,我国完成备案并上线、能为公众提供服务的生成式人工智能服务大模型已达 190 多个,遍布在交通、教育、制造、医疗这七大行业,注册用户数超过 6 亿。

2023 年之前国内企业数字化转型建设内部不成体系、烟囱林立的情况在大模型出现后迎来了转机,到现在,政企正在成为大模型最积极的拥抱者之一。

 

01 两轮技术浪潮的杂糅

 

政企数字化转型是中国企业数字化转型中最复杂而艰涩的样本。

以阿里云智能集团副总裁、产品解决方案部总经理霍嘉的话来说,「坦白讲,今天在中国发生的数字化转型,只能说大部分才刚刚开始,离结束还早得很,而且有两轮技术的叠加」。

最初的政企数字化转型,是从以流程驱动为核心的信息化开始的——说的更简单一点,即业务的在线化。但国内政企普遍规模庞大,业务线广而复杂,每个业务都有自己独立的系统,这导致了政企数字化中「烟囱林立」的现象。

由于政企部门业务的敏感性,这种数字化需要高度的定制化,这也导致 IT 建设负担沉重。

而当数字化转型从信息化时代进入数据驱动时代,政企围绕「数据」进行核心业务的「再造」。这个过程,大量数据中台先后出现。但数据驱动本质上并未解决数据在各个业务烟囱之间相互隔离的矛盾,数据中台与业务并没有紧密结合。

眼下的大模型则是数字化转型迎来的第三轮技术浪潮,与上一轮「数据驱动」浪潮并行。大模型让人可以直接与数据、机器互动,天然带有靠近业务的特征,其最大的价值之一就在于和业务场景的融合,以颠覆旧的业务形态,而这也更接近数字化转型本身所追逐的本质。

对大模型价值的审视或许是中国企业在多年数字化转型的过程中第一次集体性的回过头来认真度量和理解自己的业务——数字化转型不是结果,而是解决业务问题的手段。

「最终目的还是业务场景。我们跟很多客户谈的时候,会发现有的时候大家会把手段跟目的给弄混掉」,阿里云智能集团副总裁、解决方案研发部总经理曾震宇表示,「先明确要解决的问题,再看用什么方式解决。这个解决的过程可能就叫数字化转型的过程。如果说业务场景不想清楚就要做数字化转型,往往这种项目做到后面大家都会很吃力,因为不知道到底要解决一个什么问题」。

阿里云智能集团副总裁、解决方案研发部总经理曾震宇

大模型的巨大潜力,让政企看到了对自身业务甚至重新梳理整个企业组织结构的价值。这也让大模型技术能够成为政企数字化转型得以跳出一场场为数据所困的小范围局部战争的契机。

但政企在有了充分借助大模型来实现自身数字化转型的需求之后,面临的仍然是一个严峻的局面。

 

02 模型与算力的双重困境

 

摆在眼前的事模型本身的选择和塑造方向。换句话说,政企需要怎样的大模型?

首要的是,大模型需要能够支撑海量非结构化数据的查询分析。

政企业务规模庞大,数据量往往远超一般企业,这对大模型的处理能力提出了极高要求。例如,城市政务需要实时处理来自交通、安防、环保等多个部门的海量数据;金融机构需要对复杂交易数据进行风险分析和预测。而这些数据往往是非结构化的,比如图表、公式,甚至一些纸质合同等。这需要大模型用 RAG 等技术进行知识管理,以高效地处理、分析海量数据。

而与一般企业不同,政企业务需要维持全年 365 天每时每刻的稳定可用,政企业务系统往往对稳定性和可靠性要求极高,深入政企业务的大模型需要在长期持续运行中保持稳定,避免出现性能波动或意外中断。

而由于政企业务的特殊性,其对大模型有着极高的数据安全需求。私有化部署是政企在引入大模型时处于保障数据安全的重要手段,政企的数据得以不离开政企内部,并通过严格的访问控制机制防止数据泄露。

这要求大模型提供灵活的部署方式,支持私有化部署、混合部署等多种模式。同时,还需要采用数据加密、脱敏等技术手段,全方位保障数据安全。此外,还需要关注大模型自身的安全问题,例如模型窃取、对抗攻击等,并采取相应的防护措施。

而大模型能在政企的数字化转型过程中着力的最重要一点——大模型需要懂业务,并且能动态的跟上业务的变化。

「懂业务」意味着大模型不能仅仅停留在通用能力上,而要深入理解政企所处行业的专业术语、业务流程和监管要求。这要求大模型在预训练阶段就要引入大量的行业数据进行训练形成 Knowhow。

但业务永远在变化,这意味着大模型另有在实际应用中结合具体业务场景不断进行调整的需求。但懂业务的企业内部人员不一定懂模型,这意味着大模型需要在训练层面简单易懂,并且为业务人员构建便捷的知识注入和更新机制,让后者能够参与到模型的训练和优化过程中,把专业知识和经验融入到大模型里。

解决了「什么样的大模型适合自己「的问题之后,政企还有另一道题要解,即「如何训练适合自己业务的大模型」。

政企对大模型严苛的需求,进一步凸显出大模型训练背后绕不开的算力问题,这是政企将大模型顺利引入自身业务之前所面对的另一个问题。

中国并不缺智算中心,但缺的是可用的算力。现在大模型的训练需要的是规模化的算力。以基础模型训练来说,万卡集群的规模已经是底线,要保证一定质量的话则需要两万张卡以上。哪怕退而求其次的垂直模型,也需要千卡级别的算力集群支撑,这种集群规模对于政企来说是非常大的挑战。

政企在当下数字化转型中遇到的大模型与算力难,看似存在于两端,但实际有非常紧密的联系,将两者联系起来的是承担着将大模型引入政企业务中的云厂商。

阿里云智能集团研究员、阿里云智能集团副总裁、专有云总经理刘国华在拜访了包括很多客户后,得到了政企客户一个朴素而普遍的观点。现在的中国政企客户关心的是两件事情,第一个是安全稳定的问题,第二个是成本。随着大语言模型的发展,AI 给政企客户的业务带来了新的突破点,但与此同时他们又要兼顾整个安全和成本的问题。」

阿里云智能集团研究员、阿里云智能集团副总裁、专有云总经理刘国华

「基于此,政企客户更加期望云平台是满足云+AI 协同发展的要求,而不是单一各自去做各自的事情,来最大化提升整体的成本效率。」刘国华表示。

「下矿」近半年之后,阿里云从算力层和模型层,为政企客户带来了更优解。

 

03 云+AI 一体化的技术体系

 

「今天谈到大模型算力基础设施的时候,它绝对不是单单数机器和数卡,不是把一堆硬件隔在一起,而是通过云计算的平台把芯片、服务器、网络、存储这些东西有机的调动起来,才能集成模型的训练。」阿里云智能集团副总裁、产品解决方案部总经理霍嘉在云栖大会上表示。

阿里云智能集团副总裁、产品解决方案部总经理霍嘉

对于政企所看重的安全问题,阿里云在底层算力层的飞天企业版上实现了「智算升级」。

首先是在计算性能上的变化。

在异构算力池化方面,针对政企中 GPU 的异构现状,现在整个平台支持多芯的 GPU 融合管理。目前飞天企业版支持 23 款的 GPU 接入跟管理,支持单一集群 1.5 万卡的建设,并且实现通用算力、超算、智算的一网调度。

目前飞天企业版的 GPU 虚拟化和容器调度算力切分粒度达到 1%,资源利用率提升 100%;基于训推资源调度一体化平台,通过训推任务和资源调度策略结合,飞天企业版将算力资源碎片减少 30%。

而在在推理场景性能方面,通过 GPU 推理调度算法优化,飞天企业版在单机多卡并行式训练中可自动选择最优通信链路,通信带宽最大可提升 100%。在资源调度上,模型吞吐量提升 23%;通过对 GPU 深度调优,飞天企业版 GPU 性能较社区版提升 10%。

在端到端系统稳定性方面,飞天企业版提供从训练任务到底层基础设施的一体化监控和分析诊断能力,针对故障节点和受影响的作业路径可实现分钟级定位和诊断,整体故障监控覆盖率达到 80%。

兼容性方面的提升则不止在与多种 GPU 融合的方面有所体现。

阿里云提供的一站式 AI 大模型开发平台——百炼专属版。在 AI 的服务层提供了从开发、训练、推理到智能体搭建的服务,兼容整个主流的开源模型。

这意味着未来很多客户可以直接基于阿里云的平台去构建他的模型生态,让更多的模型可以更靠近它想要服务的客户。

在此之前,阿里云于 2023 年 10 月首次推出了百炼平台。该平台集成了国内外主流优质大模型,提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。

而针对政企市场面临一系列大模型落地「难题」,阿里云在 2024 年推出的百炼专属版。此次百炼专属版 2.0 在底层算力上,进一步兼容了「公共云 VPC」和「专有云」环境,并已嵌入阿里云「飞天企业版」云平台;支持多芯异构的算力调度,支持多租户模式下的算力、模型、数据隔离与共享。

在大模型训推方面,百炼专属版 2.0 支持高性能分布式训练,训练吞吐率提升 20%;基于软硬协同的推理加速,将精度无损量化提升至 0.5%,推理速度提升 3 倍以上。

在模型方面,百炼专属版 2.0 预置了通义 7B 到 72B 多尺寸大语言基础模型及多模态大模型,同时兼容主流模型框架、支持三方大模型自定义接入。

在模型服务方面,百炼专属版 2.0 支持图表、公式、图片、音视频,以及大文件和巨量文件的解析;基于平台丰富的工具和插件,开发者可通过「拖拉拽」快速搭建智能体。

数字化转型方兴未艾,智能化时代的浪潮已至。云计算与大模型的微妙关系耦合成一条新的政企数字化转型道路,而飞天企业版和百炼专属版则构成了一套完整的智能化时代云计算技术体系。

 

04 敏锐来自十年深耕

 

2023 年 4 月末,第六届数字中国建设峰会在福建福州举办的时间点,正是大模型第一波浪起的时候,彼时一场并不起眼的分论坛上,阿里云智能的副总裁霍嘉、阿里云智能副总裁、解决方案研发部总经理曾震宇等人少见的有一次同台。

在那次集体亮相之前,阿里云启动了一项「通义千问伙伴计划」,合作的伙伴覆盖油气、电力、交通、金融、酒旅、企服、通信行业。

阿里云在去年 4 月就把企业云服务因为大模型而发生变革放在非常重要的位置,现在来看,这像是非常有预见性的一枚石子,在投出将近一年半之后,水晕才真正荡开。

这种敏锐并不是来自个人判断,而是受益于阿里云多年在政企业务所下的苦功。

2014 年,阿里云陆续开始与中国气象总局合作,海量气象数据涌入通过阿里云计算平台;同年,阿里云与药监局合作,药品监管网数据从甲骨文转移到了阿里云;2015 年阿里云成为海关总署的云计算和大数据服务服务商;2021 年之后,国家医疗保障局医保信息平台开始跑在阿里云商。

到目前为止,阿里云已服务超 1000 家政企客户,覆盖 90% 的央国企(央企及省级国企)。6 大国有商业银行、2 大电网、中石化、中国邮政等都已跑在阿里云上。

所有的企业类型中,政企中有中国企业数字化里最复杂的难题,而对于一家中国云厂商来说,要想服务好政企市场,就必须在政企业务中扎根。

阿里云陪伴了中国政企数字化最汹涌的十年,这也让阿里云在眼下大模型重新定义企业数字化的时候,显得更清醒。

「数字化转型本质上是业务转型,组织升级,最后是技术助力。在数字化转型的过程中,上云只是个技术手段」,霍嘉表示,「不要过度高估数字化对业务转型带来的直接效果,数字化更多是一个加速器」。

而在这个从信息化到数字化的转型过程中,大模型的价值是让人类在技术上第一次可以去大规模的降低和软件——或者说数据——交流的门槛。这也让企业有机会重新审视内部积累起来的数据,结合新的业务场景,基于大模型的能力去进一步挖掘价值。

但这件事才刚刚开始。

而阿里云想要做的,是把大模型这把「锤子」的原料和锻造经验,直接交到政企手上。

 

*头图来源:阿里云云栖大会

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

 

展示量: 114

对话地瓜机器人CEO王丛:500元的机器人“心脏”,是怎么炼成的?

行业公认,AI的下一波热点,将出现在机器人领域。

回顾2022年年底开启的AI热,凭借为AI提供算力的优势,“卖铲子的”英伟达成为最大赢家之一。那么,在未来的机器人时代,谁又会成为新的赢家呢?

英伟达自己仍然是一个强劲的选项。

在2024年的GTC大会上,英伟达展示了其在机器人方面的全面布局,许多机器人公司目前也已在使用英伟达的Jetson系列芯片,放在机器人的端侧提供算力。

看中这一领域的公司,还有国内的地瓜机器人。

9月20日,地瓜机器人发布了RDK X5和RDK S100,为普通的机器人开发者和要求更高的具身智能机器人公司提供自己的算力平台解决方案。

定价549元起,地瓜机器人希望以优秀的性价比、为开发者打造的便捷开发平台和与开发者社区的紧密连接,在未来的机器人算力市场占据一席之地。

极客公园参加了9月20日地瓜机器人的发布会,并对地瓜机器人CEO王丛进行了专访,聊聊他们如何提前卡位,准备在下一个科技风口到来时,成为下一个淘金热中“卖铲子的人”。

 

源于地平线,专注做机器人市场的团队

 

相较于已经成为中国最大的自动驾驶公司的地平线公司,地瓜机器人的名字对许多人来说尚有些陌生。

地瓜机器人在2024年初成立,主要研发机器人的底层计算平台。其前身,是地平线的AIoT团队。

目前地瓜机器人的CEO王丛,从2018年就在地平线负责AIoT业务了。“我们原本就是一个很独立的事业部,有自己完整的研发、销售、市场、社区。”王丛介绍到。

“AIoT市场很零碎,不过,这倒不是决定收缩业务最重要的原因。”王丛讲到,“更严重的问题是,在AIoT场景中,很多情况下其实对AI的需求很低,没有不断增长的算力需求。从长远来看,这和我们的人员结构和风格并不匹配。”

而在重新思考业务领域中,地瓜机器人团队逐渐开始找到了机器人这块新的领地。

“当时,做机器人芯片,并不是很多公司首选的领域。”王丛表示,“退回2019年,去做机器人这件事情面临很大的一个问题——出货量。没有足够的出货量,一家芯片公司没法养活自己,所以很多公司会选择更大的市场,但同时就会面临非常激烈的竞争。”

2019年的世界机器人大会 当时物流车是大会的重点展示对象 | 图片来源:视觉中国

一直以来,地平线的商业哲学更偏向于提前布局,避免激烈竞争。而地瓜机器人团队,看中了机器人市场的增长潜力。

“我们当时看到,不管是哪个品类的机器人,对AI和算力的要求都在逐渐的往上走。这个市场很适合我们。市场不大,大公司看不上,但市场也不小,对算力的要求高,小公司做不了,且我们有直觉这个市场未来将不断增长。”王丛表示,“创业的核心就是找到一个不大不小的市场,且这个市场未来有很好的增长。”

地瓜机器人最初的模式主要延续AIoT的服务模式,服务于机器人的B端企业,为客户提供算力和服务。

不过,很快,团队意识到机器人市场与AIoT市场并不相同。在机器人市场中,还有大量的零散的开发团队和小客户,团队很难一一对其进行服务。

2023年,地瓜机器人开始发力建设社区和生态,这也成了地瓜机器人希望在未来的竞争中,能够发挥重要价值的秘密武器。

“我们意识到,首先,五年后的机器人行业,你该服务的用户并不是现在公司现有的开发者。5年后你服务的用户很可能现在还是学生,应该提前让他们去习惯你提供的东西。”王丛表示。

“另外,机器人作为未来的市场,远远没有达到手机市场的集中度。在手机市场中,把头部厂商服务好了就可以了。而在机器人市场中,我们服务上万个开发者,不可能给上万个开发者有一对一的技术支持,所以倒推回来,必须要把基本功,包括工具、软件、易用性、文档写得足够的清楚,社区上也要有足够支撑。”王丛表示。

目前,地瓜机器人不但提供芯片,还组建了整个RDK的机器人开发者套件,方便开发者能够使用合作伙伴的产品搭建产品。不仅如此,地瓜机器人还组建了一套自己的机器人操作系统,提供了机器人算法中心,甚至提供了一套包括数据标注到仿真验证的数据解决方案。

地瓜机器人目前社区有五万多人,活跃度很高。“比如社区里面有很多提问现在都不是我们回答,就是第三方看到了就回答。我们希望能够陪伴机器人开发者共同成长。”王丛讲到。

 

五百块的 10 TOPS AI机器人开发入场券

 

2023年5月,在地瓜机器人团队独立之前,曾经发布过RDK X3模组。

而此次9月20日的发布会上,地瓜机器人团队推出了新品RDK X5和RDK S100。

搭载旭日5智能计算芯片,新品RDK X5具有10 TOPs算力和先进大模型及视觉算法加持,主要面向普通机器人开发者。

算力是这次产品发布的一个重要亮点。

“目前在10 TOPs 算力下能够真正的支持机器人各类算法,同时保持功耗最低,没有别的选择。”王丛表示。

RDK X5 4G版本549元,8G版本699元。价格公布时,发布会现场一片惊呼。

RDK X5 |图片来源:地瓜机器人

“我们这款产品面向的人群是最广泛的创客、学生,包括做智能电子的创客,整个定价的性价比非常高。过去如果玩英伟达的卡,至少需要2000元,而使用树莓派,还要搭载一个外围的算力棒,加在一起也要1000多,所以我们性价比非常高。除此之外,我们又把软件那套体系做得很好,这样大家玩起来上手也都很简单。”王丛介绍道。

比起前一代产品,RDK X5 算力、CPU都是翻倍的提高。

在原来小算力的情况下,开发者已经可以使用算力平台做基本的物体识别、分割。提升算力后,开发者可以集成小尺寸文本的LLM,进行本地部署——比如在RDK X5上,已经可以部署RWKV的1.5B的版本,有基本的对话能力。

RDK X5 端侧可部署的模型 | 图片来源:地瓜机器人

同时提升算力后,一些偏视觉的大模型,也可以进行应用了,能做到一些检测、分割、抓取。“比如家庭环境,一桌子上东西太多了,怎么去解决泛化,就是要用一些视觉大模型的方式去做剪裁,让它能够去识别各种各样的物品。还有一些从自动驾驶迁移过来的算法,双目的深度、Occupancy占据网络,一些V-SLAM的算法我们现在也可以去跑。”王丛介绍道。

为了让更广泛的开发者能更好地使用这一平台,地瓜也做了不少开发者友好的适配。

比如地瓜机器人推出了自己的Copilot,结合自己的软件、程序库,让开发者在编程的时候能够得到AI提示。同时RDK的Studio中也集成了不少可视化的交互方式,开发者直接拖、拉、拽,就能方便地生成代码。

通过写注释直接生成代码 | 图片来源:地瓜机器人

王丛讲到自己未来的愿景:“我刚创业的时候,是移动互联网的初期。最开始做的时候自己搭集群,然后自己搭各种各样的设施,后来亚马逊、阿里云各种工具套件出来后发现自己什么都不用搞,只要专注自己的APP开发就好,后来创业的时候可能十几个人我就可以做一个非常牛的东西。我觉得机器人未来也应该形成类似的模式,可能未来真的四五十个人就能搞出各种各样的机器人。“

而RDK S100,则是地瓜机器人今年新推出的一款产品,更针对于有前沿需求的具身智能、人形机器人公司,到今年年底公开发售。

“RDK X5也能做一些视觉的检测,和大模型的应用,但如果能把它的种类再泛化,精度再提升,跑一些更大尺寸的模型,就得需要RDK S100。”王丛介绍道。

 

地瓜机器人发布RDK S100 | 图片来源:地瓜机器人

RDK S100采用全新BPU纳什架构,专为大参数Transformer优化,拥有百TOPs级算力和全链路开发支持,目前能跑7B、13B的模型。地瓜机器人表示,星动纪元、逐际动力、求之科技、清华大学AIR智能产业研究院、睿尔曼、国讯芯微等数家行业顶级合作伙伴将率先搭载RDK S100。

“从去年开始我们就开始筹划这款产品。”王丛讲到,“像现在大家市场上看到的这些人形机器人的demo,这些能力RDK S100都能满足。”

地瓜机器人表示,明年地瓜机器人还会推出数百TOPs的大算力产品,来支持机器人企业的更前沿的需求。

 

从提前布局智能驾驶,到提前布局机器人

 

2023年,机器人市场开始转热。机器人本质上和汽车的市场不一样,打法不同,客户不同。地瓜机器人2024年成立,希望能在热起来的市场上,跑的更快。

虽然对机器人市场十分乐观,地瓜机器人对目前的机器人市场发展的判断仍然很冷静。

“我觉得机器人的发展还处在初级阶段吧。”王丛表示。“一个判断的方式是,当你发现行业里有特别多同质化的东西,同时又没什么实际用途,基本上这个行业还处在初期。每一波科技热潮都这样,像在2023 年我们见到了百模大战、千模大战,过了这个阶段,等这个大家都看清一些之后会更务实一些。”

“不过,虽然行业没有真的爆发,但我们做准备、做投入,一定是在爆发之前。我们感觉现在的时间点,很像地平线2016~2017年开始加大投入自动驾驶的时间点。”王丛表示。

“对于一个即将爆发的行业,常见的情况是有很多种技术路线,未来都有可能。我们目前更关注这些机器人探索者中,有哪些共性的基础的需求,我们能够先去满足。比如说这个在芯片上,无论企业怎么做,对Transformer一些大模型更高效的吞吐的支持,无论如何都要做,那我们就先做这些东西。”王丛表示。

目前,在具身智能领域,许多公司会选择云端算力和端侧算力结合的布局。

在云端中,机器人主要做一些任务拆解——让大模型理解用户提出的需求等于导航去来一个房间,观察哪个是要抓取的物品,规划抓取路径。不过在子任务中,如果每个环节都使用云端算力,则最后的产品实时性会很差。因此仍然需要端侧算力。

使用OpenAI模型的Figure机器人的技术架构 | 图片来源:X

目前,地瓜机器人在这个领域,面临着来自英伟达等巨头的竞争。

而作为开发者嘴里的“国货之光”,地瓜机器人希望通过切入有价格竞争力的产品,做出更好的机器人生态,在未来的机器人热到来之时,在机器人领域成为行业内强有力的竞争者。

不过,地瓜机器人表示,目前的产品虽然价格上很有竞争力,但硬件领域的企业,绝不会做亏本的买卖。同时,地瓜机器人在对产品定价的时候,关注的也不仅是板卡的盈利,还有未来生态中上下游的盈利。

同时,在国内人形机器人发展大热之下,作为国内的机器人软硬件通用底座提供商,地瓜机器人或许也将在与国内企业的合作中,拥有很强的优势。

“过去几年中,我们每年都有上百万的出货量。无论是扫地机、割草机、陪伴机器人、机械臂,我们都已经和国内最头部的玩家合作,已经量产或者即将量产。”王丛介绍道。在人形机器人领域,地瓜也已经与星动纪元、逐际动力等国内的头部人形机器人公司合作。

王丛表示,未来,对于地瓜机器人,持续的推出性价比更高的产品是本职工作,未来更希望的是让开发者的开发更容易。“希望大家不要重复造轮子,共性的部分我们能解决的都会直接提供。”

“地瓜是在各种土壤,各种条件下都能生存的物种,在饥荒年代,地瓜曾经养活了无数的人。”王丛在发布会上解释为什么要以“地瓜”命名新公司:“我们希望这家公司非常接地气,能给大家带来更多实用的工具。”

展示量: 120

文章分页

上一页 1 … 104 105 106 … 116 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间