Skip to content
  • 51蛙吖蛙元宇宙电脑版入口
  • 51蛙吖蛙官网
51蛙吖蛙 – 3D社交空间

51蛙吖蛙 – 3D社交空间

投稿、社交、聊天就来51蛙吖蛙元宇宙

  • 首页
  • Toggle search form

标签: 科技

对话阿里国际站总裁张阔:AI 时代的电商应该怎么做?

 

面对 AI 的汹涌浪潮,所有中小外贸企业都在关心一个问题:「AI+外贸」最终会形成的最大变体是什么?

十月底,阿里巴巴国际站全新升级了全流程 AI,发布了 4 款 AI Agent,核心是围绕外贸生意中,商家最关心的发品、接待、营销、风控四个外贸环节做了改进,实现了外贸经营的托管。

这反映了阿里国际数字商业集团在 AI 布局和落地上的迅速。在大模型浪潮之后,阿里海外迅速拉起一支 AI 队伍,分为 ToB 和 ToC 两个方向,分别由阿里巴巴国际站总裁张阔和阿里海外 ai business 负责人张凯夫负责。

对于阿里 B 端海外电商要怎么做 AI、以及如何做到一款真正能帮人做生意的 AI,阿里巴巴国际站总裁张阔对极客公园分享了他的思考。

在他看来,当前市面上大部分的 AI 产品,还只是一系列提效的小工具,停留在帮人做一些重复性的琐碎工作、提升某个单点环节的效率。而阿里国际站此次则将 AI 升级为了助手,它能够实现更一站式的托管和提效。

阿里国际站成立于 1999 年,是阿里巴巴集团的第一个业务板块。它伴随着中国外贸需求的崛起,早期产品就像「365 天不落幕的广交会」,核心是在信息层面,将中国外贸商家连接给全球采购客户。2017 年开始,阿里国际站开始深入交易层面,推出全球金流、物流等履约服务,向一个交易平台转变。

张阔正是在此时加入国际站、并推动了这次业务转型。在此之前,他在淘宝负责开放平台,也参与了淘宝从线上网站向交易平台的转变。国际站在转型之后,业务价值大增,目前平台交易额较当时有 100 倍以上增长。

在张阔看来,AI 会是一次更大的增长机会。除了线上交易外,目前外贸交易的线下环节,比如交钱易货、寻找供应商等,都能通过 AI 继续线上化。他认为,阿里国际只实现了 AI 时代 B2B 生意形态的 10%。这个 25 年历史的业务,正加速扑进新的技术浪潮中。

在与极客公园录制的一期播客中,张阔聊到了 AI 时代电商的布局和打法、国际站的历史和关键转型、海外政策变化和结构性机会、以及中国外贸商家的新机遇等。以下是访谈实录:

 

阿里国际站总裁张阔|图片来源:阿里国际站

 

B2B电商痛点更多,用AI来改造的意愿更急迫

极客公园:2022 年底大模型浪潮出现的时候,你当时感受怎么样?你怎么思考AI对电商业务的改变?

张阔:我们思考 AI 大模型本身,它像是一个搜索的生意、还是更像是个云的生意?

搜索本身就是一种应用,只需要一家就足够了、占据 90% 以上的市场份额,剩下都是长尾的。而云就不会只有一家,会非常多,且各自提供的服务不一样、成本会越来越低。我们去看大模型,可能更像是云的生意。

随着成本的不断降低,云服务本身不是终点,云上应用提供的价值才是终点。如果没有上面的应用,其实云本身也没有意义。所以我们结合自身特点,肯定是要开发应用。

AI 应用与传统应用相比,有哪些差别?我们觉得有三个方面,第一是对数据本身的理解和使用。第二是交互模式,与以往不同、更加简单。第三是商业模式本身,AI 会极大地影响未来的商业模式。

极客公园:对于数据的理解和使用,具体是指什么?

张阔:可以从买卖两端来看。买家侧,最早所有的平台,其实本质上都是搜索引擎。从一个标题开始,在标题下罗列一堆商品或店铺列表,然后将用户需求分发给各个商品和商家,最后在私域中完成交易。这是互联网购物最初的范式。

现在至少有一个变化是买家的需求。很多买家进入平台时,其实并不清楚自己的需求是什么。比如一个 B2B 的买家,它可能是一家创业公司,有一个创业的想法,但并不确定要做什么。他可能想买一台机械自己用、或专门售卖跟圣诞相关的商品,接着它有预算和利润的考虑等,用原有的搜索引擎模式,至少没法在一个平台里完成这些。

现在,我们基于对买家信息的进一步理解,以及对全网数据的整理、蒸馏和重新训练,可以帮助它找到真正的灵感是什么,以及对应的供应商和履约方式。

另外商家侧,机器了解所有外部每时每刻的供需,基于这些供需写的商品描述,肯定比买家自己写的长篇大论要强。最终能提高整体的搜索、推荐效率。所以这是基于对数据的理解、以及新的交互范式提供的新产品。

极客公园:电商的核心是搜推广,所以你们改的第一步是搜索?AI 最能解决这件事?

张阔:肯定先改变它,因为这是平台的起点。只不过不同的搜索引擎,切入点或解决问题的方向不同。原来的搜索引擎是快速给用户一个反馈,把全网信息整合,然后基于 PageRank(页面排名)给出 2 万个回复。

但今天,比如你要搜 Forklift(叉车),不再是立刻给你一串商品的模式了。它可能先给你一些商品推荐,然后进一步问你的实际需求,比如你需要的叉车容量是多少?需要几吨的?什么能源类型?是站着操作还是坐着操作?你的大概预算是多少?想在什么时间拿到这个产品?基于所有这些需求,它会为你生成一份推荐的产品和商家列表。

你在这个列表上选出几个感兴趣的对象,我们会帮你把比较这件事做完,直接生成 RFQ(询价单)、跟商家沟通。到这一步,商家拿到的信息,就已经是层层过滤的、接近真实的买家需求。这对双方都是一个效率更大的事情。

极客公园:在匹配效率、搜索效率上,AI能提升多少?

张阔:首先,我们根据平台的搜索数据和买家需求,为商家重写商品详情,流量就会好一些。目前优化了 700 多万件商品,支付转化率提升了 50%。

其次,我们把搜索功能推全到整个海外用户,从搜索到询盘回复的转化率提升了 30%~40%。这也是一个显性的、肉眼可见的变化。

极客公园:在搜索这件事情上,为什么我们现在看到的国内电商平台改得不多?

张阔: B2C 跟 B2B 也不一样,B2C 也许现在这个体验,就是最好的体验。

如果让你多轮交互找到一个最好的商品,这件事本身你也要花一些精力,但如果关键词一堆,你挨个逛,这也是一种体验。因为你的商品足够丰富,而且消费者大概想要什么东西,它自己就能想象出来。

B2B 的考虑的因素会更多,它下一个决策的金额更大、商品更复杂。如果有一种新的交互方式,能够把它原来需要下沉到跟各个商家去聊的问题,在前期就解决了,这对它来讲就是一个好的体验。那如果是一堆现货放在一起,你就是把它做一个排序,你去体验购买、然后结束了,也许那就是一个更好的选择。

我觉得不一定说有了 AI,所有范式都要改写。我觉得这也是不对的。

极客公园:B2B 可能比 B2C,在搜索上改变的意愿更大?

张阔:因为它的痛点更明显,这个事就是必须要解决的问题。

极客公园:你谈了很多搜索的改变,那广告和推荐有什么改变?

张阔:推荐跟搜索差不太多。广告侧,就是要改变商家从选关键词开始、进行互联网广告的投放过程,因为那确实是过去范式,没有什么道理。你让销售找到客户说,要买这一页 A4 纸的关键词,可能不是双方想要的。而且人群差异非常大,不同的人的关键词都不同。最终一定是商家在投放时定好预算、ROI,剩下的都由机器完成。

极客公园:它会比专业的投手要做得更好吗?

张阔:第一,它至少让新投手们更加接近专业的投手。第二,它会简化大量的人来操作盯盘。今天看到的所有数据,它的转化、ROI 都比人好。因为不同的行业之间差异比较大,所以不是一个统一数字。

极客公园:你们在商家侧拎的AI场景有四个,发品、广告、沟通、风控,后两者怎么做?

张阔:沟通上可以用 Copilot 润色你所有沟通内容,或者你晚上打开 Autopilot 自动巡航,早上起来你就看见有很多东西已经聊完了。这个产品帮助买卖询盘的总量至少是 2000 万以上。

风控上,每年各个国家都有不同的规则,你发布商品的时候显示侵权,其实是你对规则不知情、经常有商家抱怨和投诉(店铺)分被扣完了,这些信息其实可以通过大模型更早给你预警。

极客公园:总体上是用AI简化商家操作门槛、提高效率,之前跨境电商流行的半托管和全托管模式也是这样。最终AI会不会变成一站式托管,形成全新的商业模式?

张阔:因为我们今天讲的是上半程,就是你要定义发布和营销的产品、让买家来了接好这个询盘,更多的是通过数字化完成的。但下半程,会涉及到跟很多外部金融机构、物流承运商等等打交道,才能完成物理世界的最终履约。我们也有半托管的服务,帮助商家解决这些问题。最终上下半程合在一起,才能帮卖家降低门槛。

在 B2B 领域,我觉得我们不可能帮助商家去代操所有这些事情。尤其涉及到订单贸易,因为卖家这个产品可能在做的时候是不存在的,不是一个现货放在仓库里面、我就把你运出去这个状态。所以商家最重要的是要掌握经营主动权。

极客公园:在海外电商公司里,你们在 AI 的布局跑得比较快,为什么可以这么快?AI 会成为海外电商业务竞争的关键吗?

张阔:快慢从时间上讲,不是最核心的问题。最核心还是你找的这个问题对不对,以及用这个产品、技术是不是能解决这个问题。如果你能解决这个问题、PMF 找对了,市场推进的速度就很快。接着客户可以给你更多的反馈,让你产品迭代速度进一步加强。

我觉得对于核心问题是什么,我们想的比较清楚。比如我自己可能一年见上百个客户,很了解大家深恶痛绝的问题。另外,我们本来就是全球化生意,我自己可能一半时间在国外,跟硅谷有很多交流。我见过大家怎么解决业务问题、最好的产品和体验是什么样的,它们已经在市场上验证过了,所以我们也不用走很多弯路。

 

国际站的转型:让全球贸易也能变得跟网购一样简单

极客公园:国际站诞生于1999 年、是阿里的第一个业务,那时候中国的外贸需求是怎样的?为什么会诞生国际站?

张阔:外贸存在非常多年了,1999 年现在看来是一个关键拐点。那一年,民营企业出口占中国出口总额的 1%。而今年民营企业出口占中国出口的 64%,过去这些年间有很多东西在驱动变化。

比如数字化,1999 年互联网方兴未艾,你想找到中国的东西几乎就没有。马老师最早创业,从中国黄页开始,后面一步一步做到 alibaba.com,解决了当时信息不对称问题。

比如 WTO,整个中国供给、基建快速蓬勃发展,整个制度侧的改造和迭代,有企业家精神和愿意参与到全球贸易里的人越来越多。从结构上来讲,他们也更能满足全球多元化的需求。

但如果你在 80 年代,可能一屋子人里边能总结出大概三种需求,但今天没有两个人穿的是一模一样,从里到外,这就是差别。为什么是这样?因为全世界需求越来越多元化、碎片化。这种变化它也只有民营企业能够敏锐的、第一个把握住,也只有中国多元化的供给,才能满足全球企业、个人日益多元化的需求。

我们就是在这个宏观变化中间的一个环节,既享受这个时代红利,也通过平台推动更多人加入到这个大市场。

极客公园:有人说你们是「365天不落幕的广交会」,核心是在信息层面,将海外买家和外贸商家连接起来?

张阔:最早当你要提到阿里巴巴国际站这个生意,你可能想到的第一支队伍就是中供铁军,去地面做地推。因为那时候 alibaba.com、互联网,让那些工厂的老板相信数字化经济可以做外贸这个事情,本来对他们的理解难度就很大,平台又没有这么大的影响力跟知名度。

很多销售进去可能最早的体验都是,工厂养一条狗、先要跟狗周旋,怎么能进到工厂里见到老板,去讲这个数字化这件事。

极客公园:似乎到了2017 年,你们才开始从信息层面深入到交易层面,为什么当时会有这个转变?

张阔:信息不对称是基础,在此之上还要去解决效率、信任、安全的问题,所有这些问题放在一起,是我们平台演进的一个原始动力。

另外产品本身,打磨和找到 PMF 是要有一个过程的。你要同时搭建一个团队、组织,真正把这事做出来,然后让市场上更多的人去接受这件事,本身也需要花时间的。

2017 年的这个节点,第一就是阿里国际站这个组织,大家所有知识和认知的储备是足够的。第二我们对于技术本身的理解、该怎么去打造这个产品、怎么设计更符合全球重要企业的需求,也准备好了。外加整个中国商家 B2B 出海需求,也是日趋迫切。

原来都通过线下方式走,日子也过得下去,因为你自己面对面到银行去能解决问题。后来越来越多的中小企业参与,那种解决方式对他们来说就成本、门槛过高了。整个这个世界肯定是从低效率的地方迁移到高效率的地方,那我们有个更高效的方式去牵引,整个事情就是水到渠成了。

极客公园:一些外贸商家会说货款是比较大的问题,对方下了订单、但是没有打钱,你们是不是看到了很多这样的痛点?

张阔:当然。做这个生意的第一个难点就是我要把大量的钱,给一个远在天边的、你也不太认识的人,那我怎么保证这个这笔交易的安全性?这是第一性原理。

以往解决这个问题也有方案,就是买家、卖家到银行开个信用证,到什么条款的情况下,银行就可以拨款。但为了做这个信用证,买卖双方的体量都需要大一些、金额规模也会比较大,这意味着可能服务的订单和客户群体有限。

国际站服务的客户是以中小企业为主,让他们每一笔订单跑到线下银行开一个信用证,难度很大。我们相当于是把所有线下信用证的这些事情进一步的简化,让外贸像网购一样简单。今年一年,所有银行开的信用证加在一起,也没有我们平台的 B2B 订单规模大。因为它更普惠、有更多人可以使用。

极客公园:你2017年加入国际站,正是转型发生的时候,你怎么推动这个进程?

张阔:我最开始在淘宝负责开放平台。2010、2011 年左右,淘宝主要的思路也是怎么从原来一个网站、升级成一个平台,让更多的合作伙伴进来、商家有更多的工具等等。我进来后一路上帮助淘宝做平台,建立服务商家的生态体系,最后当上整个商家事业部的总经理。

所以对于要怎么把一个网站变成平台,我是有点经验的。2017 年我加入阿里巴巴国际站,切到 ToB、海外商业,基本是一个大的对角线。虽然 ToB 跟 ToC 差异非常大,但中间也有非常多可以复用的部分。比如交易系统里谁先交钱、谁先发货,这跟淘系其实碰到的问题是一样的。

我们把整个平台从一个像黄页的网站,变成一个真正现代化的 B2B 交易平台,这是我们过去 7 年花精力比较多的一件事。

极客公园:这个从信息走到交易的过程,给国际站带来的影响如何?交易额出现了怎样的增长?

张阔:今年 9 月份,跟 2017 年 9 月份比,交易额肯定是 100 倍以上增长。因为我们是一个 25 年的业务,如果看过去五年的增长,每年大概年化 20% 以上。最近这 7 年的成绩,肯定是未来过去这 17 年加在一起的很多倍。

因为你原来的价值非常薄,那你本身的收益也很小。而你提供的价值越多,你本身的收益也越大。这是相辅相成的。

极客公园:过去一段时间国际站增长比较好,跟数字化转型有怎样的关系吗?

张阔:过去一段时间(2021-2022 左右)比较特殊,很多供应链受到影响,买家跟卖家之间的关系断掉了。而中国是恢复生产时间最早的,所以那个时间节点对中国民营企业是很大的机会。

在全球整个供应链在重组期间,国际站是全球买家的第一心智,所以平台就会跟着一起增长。我觉得更重要的是过完之后,整个中国和整个阿里巴巴国际站都是踩上一个新台阶,而不是红利结束、回到原点。

它核心的机会可能还是三点:第一是打造更简单的交易平台,让买家跟卖家两边越来越普惠、更多的人可以参与。第二是随着人工智能技术的新一轮迭代,里面有巨大的新机会。第三是供给侧变得更多元,慢慢从一个中国卖全球的平台、变成一个全球买全球卖的平台。这是我们一直不停推进的三件事。

 

国际环境在变化,更多新外贸机遇在涌现

极客公园:你在国外考察过程中,有没有什么值得分享的发现?

张阔:我觉得首先是对整个国际贸易大方向的判断和理解。现在新闻看到的是脱钩了、贸易战了、有关税了等等,这个到底对我们意味着什么?以及面向未来,到底什么东西是不变的趋势?

我们 9 月份,刚在美国做了一个 CoCreate 活动,请了 2400 多个海外中小企业到现场。每个中小企业过来,车票、住宿、门票等成本至少在 1200 美金以上。但尽管成本这么高,我们刚开始卖票瞬间就没了,我们带过去的所有样品也是一扫而光。

这说明,海外客户对中国比较有创新的、高性价比产品的需求量是非常大的。2400 个企业就是 2400 个不一样的需求,B2B 的需求天生比较多元化、长尾,所以整个中国丰富、长尾供应链,在全球范围内的竞争力非常广阔。

如果讲其他的国家跟区域就更是了。比如欧洲、拉美、亚太,每个区域对于整个商品需求的结构还是有很大差别的。

极客公园:不同海外区域对于整个商品需求的结构有什么不同?

张阔:美国和欧洲一大类的需求就是消费类需求,中国所有这些新奇特的、有创造力的、智能化的新产品,比如 3C 等等相关的产品,需求量很大。它没有太多非消费类的,比如跟汽配、机械相关的需求。

对于发展中国家地区,比如像拉美、东南亚,可能是反过来。所有这些建造类的、五金类的、 MRO 类的,它们的需求量可能要大过消费类。

所以从国际站上来讲,我们其实也是一半消费类的,一半非消类,整体的成交额都在增长。但是每一种结构都有一些迭代和变化,其实每个时间节点可能答案都不一样。

极客公园:你们重视哪些市场?

张阔:我们对买家所在国的选择标准有三个:第一是 GDP,这是 B2B 生意的一个上限,如果 GDP 不大,就没有什么太大意义。第二个是政策的相对稳定性,这个可预测性对于 B2B 也很重要。第三才会去看增速,墨西哥或者整个拉美区域,这三点满足得还可以。

极客公园:对于中国的外贸商家来说,它们可以怎么抓住新机遇?比如可以去做哪块更有增长的市场?

张阔:国际站的外贸商家供给有三类;一类就是原来传统贸易转线上的;一类是内贸转外贸;一类就是创业者,觉得出海这个方向想象空间非常大,作为创业第一站就来干这件事。

比如一个 60 后商家让人记忆深刻。他做气体压缩机,是一个相对比较专注的领域。我们基于大模型、从国际站上的需求出发给他提供建议。比如可以做新能源相关的压缩,这在海外是一个新兴需求,他后来找到了更多的客户群体。

还有一位 90 后商家,在国际站上开店,只用半年时间,就冲进了这个品类里的 TOP50。他原来做过一点外贸,但基本是出来自己创业,基于整个国际站选品、重新去打造自己店铺和生产线。我们看到它对 AI 的应用非常充分,在平台上属于成长的商家。

通过 AI,不同类型和种类的商家,都可以快速找到一个新增的路径跟赛道。原来的拦路虎,至少可以很快被智能化方式解决。核心还是要找到自己的供应链能力,对于产品、市场的理解,定义好自己的机会,这是最重要的事情。

极客公园:AI能对国际站上的数据形成一种消费洞察,反过来影响商家、工厂的供给端吗?

张阔:这些数据都可以给商家作为一个参考。我们也可以基于它店铺、商品,以及买卖双方的沟通带来洞察,对于商家肯定是一个增量机会。但现在技术更多还是一个助手作用,做决策的还是这个老板本身。

极客公园:怎么看么国际宏观环境的变化?它会怎么影响中国外贸商家、国际站自身业务?

张阔:放在全球 30 万亿美金的庞大贸易商业体量下,任何一个经济体都是个位数的影响。从海外买家的视角来讲,核心还是看你产品的不可替代性、你的创新力、你的服务力是否足够高。这样无论你有什么样的成本,比如关税成本,也没有太多可以担心的。

我觉得国内最引以为豪的、这些年沉淀下来的大护城河,就是产业能力非常强。任何一个国家和地区想要复制,不是一个年的单位,至少是十几年、一代人的时间。

比如墨西哥这十年,生产制造 GDP 在全球范围内从 1.4 到 1.6,本质变化不大。它的核心瓶颈也是没有足够大的产业工人群体去承载。北美也是一样,比如要在底特律重新开始生产制造,那边产业结构、工人能力可能还需要更长时间。与其要担心很多未来不确定性的事,还不如关注当下、把自己核心能力做好。

极客公园:怎么理解B2B 生意未来的增长空间?

张阔:B2B 全球贸易肯定是一个 30 万亿美金的市场。如果从这个视角来看,它的数字化渗透肯定还在一个很早期。今天在平台交易侧、AI 这一侧,我们可能只进展了 10% ~ 20%,未来还有很大空间。

极客公园:怎么推动一个25 年历史的业务不断生长?创新的源动力是什么?

张阔:我们最近在讨论文化的迭代,就是我们这波人平时应该怎么样做事,怎么样思考问题。我们希望大家能达成共识的八个字,一是求真务实,二是自我超越。

求真务实就是当前我们解决了一些问题,有一些知道怎么解,但还有更多问题需要进一步的探索和定义。因为跨境 B2B 就是很复杂,上千年前就一直有贸易,数字化是最近这 20 来年的事、智能化是最近这一两年的事,怎么把已有技术应用到这个最有历史感的大业务赛道上,还有很多需要探索的地方。

自我超越就是每一个决定,至少能带来一个肉眼可见的变化。比如现在我们做的事情,如果带来 30% 以上的增长,才可能算解决对了问题。从最开始 PC 到无线化、后来从黄页到交易、现在从数字化走向智能化,叠加到足够长的时间长度、就会发生质变。

极客公园:你对国际站的期待是什么?

张阔:我觉得还是求真务实和自我超越。不是向外求,而是向内求。如果能做到这 8 个字,过一段时间再回来看,应该都是不小的变化。

 

浏览量: 44

好产品与时代共振|2024 年度极客最爱好物

 

 

 

 

 

 

浏览量: 26

字节发布豆包视觉理解、3D生成等新模型;OpenAI 员工迎最多1000万美元套现机会;黑悟空获 Steam 年度最佳游戏提名

OpenAI 推出互动新方式,用户可与 ChatGPT 通电话、发短信

OpenAI 当地时间 12 月 18 日宣布,美国和加拿大用户可通过拨打 1-800-ChatGPT(1-800-242-8478)与 ChatGPT 进行交谈,每月有 15 分钟的语音通话额度,其他国家的用户也可通过发送 WhatsApp 消息到同一号码,与 ChatGPT 进行对话。OpenAI 表示,这个新选项旨在让人工智能在全球范围内普及。它还有望进一步扩大其旗舰产品的覆盖范围。目前该产品的周活跃用户数已达 3 亿。(来源:界面新闻)

消息称小红书迎来新战略负责人,同时筹建战投团队

​12 月 18 日消息,据晚点 LatePost 报道,今日资本原合伙人戴丽丹近期已加入小红书,负责战略,向小红书核心管理层汇报。

报道称,在戴丽丹加入前,小红书不同战略方向各有负责人,现在统一向戴丽丹汇报;小红书同时计划组建战略投资团队,由戴丽丹负责,主要投资硬科技赛道,尤其是 AI 应用;小红书原投资团队不变,继续做财务投资。戴丽丹毕业于北京大学,后加入百度任百度地图产品经理;2013 年-2015 年,她在哈佛商学院攻读 MBA,此后,戴丽丹加入由「风投女王」徐新创办的今日资本,于 2022 年升任今日资本合伙人。

报道还称,小红书近年已在频繁出手投资,主要方向是投消费品牌,覆盖食品、潮玩、美妆和母婴等领域。2023 年之后,小红书对 AI 和科技投资出手增多。小红书在 2023 年首次实现盈利。今年 7 月,小红书被曝完成一轮新融资,估值 170 亿美元(当前约 1238.65 亿元人民币)。本月有消息称,小红书有望在 2024 年将利润翻一番,达到 10 亿美元(约 72.86 亿元人民币)以上,然后可能进行 IPO。

小红书由毛文超和瞿芳于 2013 年在上海创立,官网信息显示,小红书获得了阿里巴巴、腾讯、纪源资本和红杉资本等大牌企业机构投资。2019 年 10 月小红书月活跃用户数就已经过亿,其中 70% 用户是 90 后。(来源:晚点 LatePost)

 

「通义」应用团队将从阿里云分拆,知情人士:阿里云仍保留通义 B 端业务

12 月 18 日,记者从知情人士处了解到,「通义」应用团队或将从阿里云分拆,并入阿里智能信息事业群。知情人士表示,通义 to C 的客户端以及团队等将并入阿里集团内部,而通义 to B 以及开源部分仍在阿里云的体系内。

据此前媒体报道,调整后,通义 PC 及 App 团队与智能搜索产品「夸克」平级,原有的通义实验室仍然留在阿里云体系内。这一举措可以看作是阿里梳理内部 AI to C 应用的一步。(来源:每经)

 

Netflix 被荷兰监管机构罚款 475 万欧元:未适当告知客户个人数据使用情况

12 月 18 日,荷兰数据保护局(DPA)在一份声明中表示,对 Netflix 处以 475 万欧元的罚款,原因是该公司在 2018 年至 2020 年间未适当告知客户其个人数据的使用情况。DPA 称,这项始于 2019 年的调查显示,该公司在其隐私声明中没有足够明确地告知客户其对这些数据的具体处理方式。

Netflix 已更新其隐私声明,并改进信息条款,但对罚款决定表示反对。(来源:路透)

 

极越员工赔偿方案要出炉?内部员工:吉利已确认,但百度还未审批

12 月 18 日,极越汽车解散风波继续发酵,主要矛盾集中在员工赔偿方案上。目前方案已修订至第九版,吉利确认后仍在等待百度最终审批。

极越汽车 CEO 夏一平的管理能力遭到质疑,员工代表微信群已解散,维权活动减少。不少员工通过直播等方式等待解决方案,同时供应商欠款问题也悬而未决,多家供应商前往百度总部寻求答复。(来源:界面新闻)

 

特斯拉或将推出自己的邮箱服务 X Mail

​近日,知名博主 DogeDesigner 在某社交媒体平台爆料了 X Mail 电子邮箱服务的消息。据悉,该博主称 X Mail 的账号格式为用户名 @x.com。

随后,特斯拉 CEO 伊隆·马斯克转发并确认了这一消息,并表示「Yeah. On the list of things to do.」(是的,在待办事项清单上)。然而,他并未透露 X Mail 的具体上线时间。

关于 X Mail 是否免费,目前仍是一大悬念。值得注意的是,使用单字母顶级域名 @X.com 注册邮箱有些独特。

此外,在去年 10 月,马斯克以 440 亿美元收购了 Twitter,并将其更名为「X」。同时,原 Twitter 的小蓝鸟 Logo 也被替换为了「X」。至于为何选择「X」,马斯克解释道,「不太清楚其中有什么微妙的联系或象征,但我喜欢字母 X。」(来源:中关村在线)

 

OpenAI 约 400 名员工迎股票套现机会,每人最多 1000 万美元

12 月 18 日消息,约 400 名 OpenAI 现任和前任员工将获得数百万美元的现金,这要归功于这家旧金山公司与日本软银集团安排的一笔特别股票出售。

据知情人士透露,收购要约允许部分 OpenAI 员工和前员工以每股 210 美元的价格将所持的股票出售给软银。消息人士称,软银计划从符合条件的 OpenAI 股东手中收购至多 16 亿美元的股票,后者须在两年多前获得限制性股票方能参与。符合条件的 OpenAI 股东须在 12 月 24 日之前作出决定。每个参与者将被允许出售价值 1000 万美元的既得股票。(来源:界面新闻)

苹果文档泄密:visionOS 3 和 2.4 开发工作进行中

​12 月 18 日消息,苹果公司周一发布了 visionOS 2.3 开发者测试版,意外泄露了其正在开发下一代 Apple Vision Pro 操作系统的重要信息。

visionOS 是苹果首款空间计算设备 Apple Vision Pro 的专属操作系统,这款产品被苹果 CEO 蒂姆・库克定义为「早期尝鲜者产品」。继 visionOS 1.0 正式发布后,visionOS 2 于 2024 年 9 月 16 日面向公众推出。

据了解,目前 Apple Vision Pro 操作系统最新的公开可用版本是 visionOS 2.3 开发者测试版。然而据 AppleInsider 报道,苹果在其官网提供的示例项目文档中意外地提到了尚未发布的操作系统版本,包括 visionOS 3 和 visionOS 2.4,暗示该公司正在积极开发新系统更新。

目前,关于这两个尚未发布的操作系统版本的内容或功能细节尚不清楚,但可以肯定的是其中将包含各种错误修复和用户体验改进。值得注意的是,尽管 Apple Vision Pro 搭载了苹果 M2 芯片,但目前尚不支持 Apple Intelligence 功能。

苹果在开发 visionOS 3.0 和其他未来版本的操作系统是毋庸置疑的,此次的意外泄露只是苹果首次对外展示未来版本号的迹象。(来源:IT 之家)

 

字节发布豆包视觉理解、3D 生成等新模型,豆包音乐模型可生成 3 分钟作品

12 月 18 日消息,从字节跳动官方获悉,在今日的火山引擎 Force 大会上,字节跳动正式发布豆包视觉理解模型,为企业提供多模态大模型能力。豆包视觉理解模型千 tokens 输入价格仅为 3 厘,一元钱就可处理 284 张 720P 的图片,官方宣称比行业价格便宜 85%。

豆包 3D 生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台 veOmniverse 结合使用,可完成智能训练、数据合成和数字资产制作,官方称之为「一套支持 AIGC 创作的物理世界仿真模拟器」。

豆包大模型旗下多款产品也迎来了更新:豆包通用模型 pro:全面对齐 GPT-4o,使用价格仅为后者的 1/8;音乐模型:可生成 3 分钟的完整作品;文生图模型 2.1 版本:精准生成汉字、一句话 P 图,已接入即梦 AI 和豆包 App。

此外,豆包将于明年春季推出具备更长视频生成能力的豆包视频生成模型 1.5 版,豆包端到端实时语音模型也将很快上线,从而解锁多角色演绎、方言转换等新能力。(来源:IT 之家)

 

小猿学练机彩墨版上市 进军儿童启蒙市场

12 月 18 日,专为低龄儿童设计的小猿学练机彩墨版发布。这是小猿学练机发布一年半以来,首次扩充产品线。

在硬件方面,小猿学练机彩墨版采用 10.3 英寸彩色墨水屏。该屏幕是目前教育行业唯一通过 TÜV 莱茵「类纸显示认证」的屏幕。同时,小猿学练机彩墨版还设计了低龄儿童专属的手写智能笔,为低龄儿童带来顺畅、舒适的书写体验。

在内容方面,依托斑马教研体系,以及百亿儿童互动大数据与防挫折算法,小猿学练机搭建了专属彩色墨水屏的大语文、英语、思维情景互动启蒙环境,覆盖 19 个启蒙教育场景。同时,小猿学练机彩墨版引进牛津树、红火箭、迪士尼、汪汪队等 3000+经典 IP 绘本和丰富的熏听资源,这些学习资源终身免费提供,并将持续更新。

在大模型方面,小猿学练机已经形成了多参数和多形态的模型矩阵,适配不同的教育场景,能够做到自主诊断学情、理解教学目标、实现能力迁移。(来源:北京商报)

黑神话悟空获 Steam 年度最佳游戏提名

12 月 18 日,从 Steam 获悉,2024 年 Steam 大奖入围名单现已正式出炉,将于北京时间 12 月 20 日凌晨 2 时开放投票,2025 年 1 月 1 日凌晨 2 时结束投票并揭晓获奖名单。用户可为 11 个奖项中的每个奖项投一票,在截止之前也可更改投票选项。其中,《黑神话:悟空》获年度最佳游戏提名。(来源:IT 之家)

 

浏览量: 31

潘乱对谈小宇宙CEO Kyth:播客是在饱和时代,提供稀缺价值

 

整理|黎诗韵、Jesse

编辑|靖宇

 

过去两年,中文播客呈现一种加速破圈的趋势。从人群的角度来说,越来越多明星、喜剧演员、品牌机构、知名企业家投资人等纷纷做播客。从内容的角度来说,它渗透到影视、科技、商业、品牌、消费等众多圈层,触达更多听户。

针对播客的发展趋势、国内外播客生态差异、如何设计播客产品等问题,在极客公园 IF2025 创新大会上,国内最大播客 App 小宇宙的 CEO Kyth、以及头部播客栏目「乱翻书」主理人潘乱进行了一场对谈。

「播客整体上成为了一个更加为人所知的媒介形态。」Kyth 说。

2020 年初,小宇宙产品上线,逐渐成为中文播客 APP 的第一名。谈到为什么能脱颖而出,Kyth 提到当初设计产品时就试图找到重大创新决策上的最优解。比如针对当时播客产品两个未被满足好的痛点,一是内容的发现,二是同好之间的交流,对此小宇宙推出了单集推荐内容、评论区、个性化情感化设计等功能。

当下,美国的播客市场极为繁荣,如马斯克、扎克伯格等社会名流都在录制播客,且大多以视频播客形式。在 Kyth 看来,美国视频播客繁荣背后,一是它代替了部分用户看电视的需求,播客甚至比一些电视内容更接地气;二是随着美国短视频发展,视频播客的切片可以带来更多传播和收益。

但中国可能有所不同。从内容角度,大众要的未必是政治、文化内容。从媒体形态角度,中国的视频、直播生态发展得更为成熟,可能不需要视频播客来传播。

在他看来,目前中国播客发展还在相对小众阶段,还有太多的内容和领域没有被覆盖到。这也正是新的播客创作者的机会。他们可以是某个领域比较高认知的人,也可以是身边的普通人——如果他们能够给观众 30 度角仰望的感受,也是有内容价值的。

而这一切的前提、以及小宇宙未来最重要的目标,还是吸引更多听众进来。「这个是飞轮的起点,听众是引领一切的东西。」他说。

 

Kyth 和潘乱在极客公园 IF2025 创新大会上|图片来源:极客公园

 

做一个「突出重围」的播客产品

潘乱:如果回到小宇宙 4 年前创业的起点,当时国内对于播客的接受度,我觉得可以用「陌生」来形容,大家知道播客在中国最早是 2005 年土豆那会儿,还是视频 App 上传的概念,怎么就走到了今天,大家相对更熟悉、更普适的状态?播客在中国的用户规模跟市场认知有什么样的变化?

Kyth:我觉得其实从大盘的角度上来讲,(播客)还是小众。小宇宙播客从上线到现在四年半以来,我会觉得播客在很多人群圈层中的渗透是不断增加的,它整体上成为了一个更加为人所知的媒介形态,也成了一种我们获取信息,包括获得一些快乐、慰藉的一个非常重要的渠道。

但从大众的角度上来讲,我觉得它还处在从小众往外拓一点点的位置。我觉得它处在一个我们 5 年前预想的节奏里面,我们觉得播客的成长大概就是这么一个节奏。

潘乱:「旧时王谢堂前燕,正在飞入寻常百姓家」,播客听众的画像应该怎么形容?科技?先锋?我感觉播客有点像早年杂志的那种感觉。

Kyth:对,就是对各种各样的事都会有一些好奇心的人。我以前也是一个杂志迷,中学的时候会买各种各样的杂志,其实都是对某一块垂直领域的事有好奇心,所以会想找一个集中的渠道来了解更多。

潘乱:其实播客这个事情不只是小宇宙做,中国有非常多的音频平台也都曾试图做过播客,比如喜马拉雅、荔枝、网易云、QQ 音乐等等,包括字节和快手也都上线过独立的播客类的音频产品,为什么今天小宇宙生存下来了?你怎么思考这个市场以及小宇宙是怎么做差异化,走到今天的?

Kyth:分两个话题来讲。第一,我觉得现在还远远没有到最后,所以也不能说只有小宇宙生存下来了,可能后面还会有更多的大厂对播客进行这样那样的一些尝试。但我觉得创业公司,很难以竞争为核心的思考维度去想我该干什么,这相当于一直在应对不确定性,但我们应该用确定性去应对不确定性。

2021 年的时候有一些大厂做了播客产品,但我们从一开始就预想到会有这样的情况,我们立项的时候就想过,如果大厂来做这个东西,我还剩下什么。所以我们从一开始就想得比较清楚,首先我到底什么东西要跟别人做的不一样,我们认为会有人来听播客,播客有得做的原因是什么,什么东西原先市场上的解决方案做的不够好?

我们在 2019 年底、2020 年初的时候调研下来,有两件事是当时市面上一些解决方案不够好的,一个是内容的发现,另一个是同好之间的交流。

对我们来说,我们在上线的时候就把内容发现做了一个比较大的改动,我们和当时的播客产品比较大的区别,就是我们用单集的形式来推内容,而且我们非常强调编辑推荐。这可能和市场上其他的解决方案都不一样,这是根据当时播客受众的一些特点和播客创作者的特点做的阶段性决策。

第二是评论区。当时很多其他产品都告诉我们,对于窄众的兴趣类内容,对于引发强烈个人情感的内容,评论、社区氛围是非常重要的,能做出一些差异化。所以我们把这个东西用在播客上。当时的一些小创新,包括评论区的时间戳,点击之后可以直接跳到对应时间的评论,这也是一些针对内容消费提效的点。

第三是设计,个性化、情感化的设计,大家会看到自己收听节目的收听时长有个排名,我们还会给这个排名赋予一个诗句,这些东西都是我们在第一年的时候想做的差异化的点,这些差异化的点到现在,对我们都依然是重要的创新。

潘乱:我八年前是在创业做最右,当时我跟投资人讲的故事,说中国像网易云音乐、像哔哩哔哩,它们最初在内容本身上没有独占优势,之后都是靠评论构建了社区氛围,靠用户的参与度,让这个社区变的不一样。我觉得今天最能体现这一点的产品就是小宇宙了,小宇宙的评论区让我感觉就像网易云音乐、哔哩哔哩。

Kyth:我觉得你说的很准确,(网易云音乐和哔哩哔哩)这两个产品给了我们一些启示。

潘乱:你第一点说的是你们更重视单集,而非节目。为什么在小宇宙主播的个人页面里面,封面不是显示我每一集单集的封面,而是统一显示节目的封面图像呢?

Kyth:我澄清一下,单集是指在推荐的时候用单集推荐出来,让用户在发现一个节目的时候,首先发现的是它其中的某一集,而不是一整个节目,这样他的决策成本会低一些。

第二个问题,我前段时间正好跟一个朋友聊过这个话题。

第一,我们非常重视节目的品牌感,我们要在 App 里合适的位置更多地露出它的 LOGO,如果我们在节目详情页的单集列表里面,每一个小图都展示它的单集封面,节目 LOGO 的品牌感就会减弱,这是其中的一个考虑。

第二,当我们做生态的时候会考虑界面上,产品形态上的每一个改动,这些改动会在生态里面向创作者传递什么样的信息,因为他可能会理解成我要去「卷」这个东西(单集封面),我觉得现在对于播客主播来说,可能我不希望他把时间精力过多地花在单集封面这件事上,所以对我们来说,这里有很多取舍。

第三,现在我们的设计里面,这个图比较小,单集封面也展示不全,我也看到在另外一些产品里面,这个图展示的面积更大一点的时候会更好看一点,所以这也是阶段性的产品决策。

潘乱:小宇宙还有另外一个非常细节的产品设计。如果你是一个主播的话,你会发现你的个人页面就是你的主题色,不是小宇宙默认的蓝色,好像你为每一个主播专门设置了他的主题,当然可能是由产品完成的,我的意思是,这些种种差异化是基于当时的一种推理,还是基于你的审美?

Kyth:我觉得更多还是科学上的推理。我们把做产品当成是一种探索,比如我们在 2020 年这个时间段要做一个播客产品,要活下来,要赢过原来大家手机里默认会装的一些产品,我们这几年还想要好好发展下去的话,就要在任何决策上,都想办法追求一个相对最优解。

所以,比起千篇一律,我们就会选择主题色,我们就会选择让创作者感觉更好,让一个创作者更了解小宇宙,更认同小宇宙是一个更懂播客的平台,我们不只需要比其他方案好两倍,可能需要好很多倍,可能我们就需要在各种各样的场景想得更多一点。

潘乱:回到播客本身,相较于文字、视频等各种内容形态,播客更独特的价值是什么?似乎它能够带来慰藉,给大家提供情绪价值,这会使我们越来越需要播客吗?

Kyth:我觉得肯定是。声音,包括播客这种长音频的内容,它首先就具备老生常谈的几个特征:亲密感、信任感、陪伴感。我觉得这种魅力顺应了这个时代(背景),大家可能会有更多人生的困惑,比起上一代人会觉得更难一点的时候,播客从内容上让大家睁眼看世界,了解不同的人,不同的世界、不同的职业、行业。

以及我们听喜剧节目,可以获得一些欢笑、放松,又或者还有倾诉型的,一些更加安静的节目,让我们晚上睡前获得一些慰藉、宽慰,发现原来这个世界上还有比我更苦的人。我觉得这些东西都可能是这个时代非常需要的,在过去的两到三年里,也在印证这样的趋势。

越来越多的人了解小宇宙、了解播客,未必是几年前最火的那些节目,有很多可能就是比自己大一两岁的哥哥姐姐在声音的世界里阐述一些他的困顿、他的难处,这就足以让一个大学生,一个刚步入职场的新人,去获得很多价值。

潘乱:我记得你之前在演讲里面提过,互联网可能让更多人变的越来越不开心了,你们做过哪些让用户觉得更开心的产品设计?

Kyth:开心更多靠内容创作者,我们做产品,就是尽可能把这个生态塑造成让人有家的感觉,让人来了小宇宙之后感觉会变得更好。

比如刚才提到的收听时长排名的设计,收听某个节目 100 小时以上的听众会有一个标志,显示在评论区里面。包括语音评论,主播可以向单个用户回复语音评论,这些设计都是想把这个产品做成一个,你能够每天都想要打开一次,有「回家」感觉的产品。

互联网上很多产品已经不再提供这种感觉了,它在这个时代可能是稀缺的。你说快乐也好,或者让不开心变少也好,总之就是希望我们的产品、内容,能给用户带来稍微好过一点的感觉。

 

Kyth 和潘乱在极客公园 IF2025 创新大会上|图片来源:极客公园

 

播客内容,还有更多蓝海

潘乱:很多创作者关注一个问题,好内容怎么被发现,小宇宙怎么持续发现好内容,平台怎么平衡人工跟算法的推荐?现在的榜单似乎是一种有效的手段,我看很多主播都期待着有没有上榜?

Kyth:一个是容器,一个是算法。容器就是产品功能,还是会进行更多迭代,包括明年有更多变化。在推荐分发上,则主要是内容与人的匹配、标签设置,我们更加了解用户、了解节目。现在有一些中心化的设施的比重其实在下降,今年编辑推荐在首页上的权重是往下降的,明年还会有更多动作做出来。

这个过程中最重要还是在一个创作者越来越多,听众越来越多,大家兴趣分化的背景下,尽快把对的内容找到对的听众。让更多节目找到听众,让更多的节目能做下去,且有新的创作者进来做。

潘乱:现在尽管播客领域的头部并不大,但大家会觉得,已经有很多头部播客的情况下,一个新主播、新节目如何去获得关注跟流量呢?随着越来越多新节目新主播的出现,小宇宙怎么平衡这种分发机制?

Kyth:主要看「能够为什么样的人提供什么价值」,今天很多播客崛起,有一些趋势,我们之前也没怎么料到。今年有一个播客叫《独树不成林》,一位政治学者,话题挺宽泛的,就是表达欲和表达能力非常强的一个人。

哪怕是在现在,2024 年底,还有太多的内容,太多领域还没有被播客覆盖到,包括有一些领域在去年和前年,播客覆盖程度可能只有 3 分,今年到了 5 分。包括一些男性的品类,像电竞、游戏、体育,都是刚才说的这种级别。

另外一些领域,比如 AI、科技、商业、品牌、消费,今年我们看到他们在稳健的发展。有一些领域,包括互联网、流量领域,想要找一些最优质的内容,最懂的人,这些专业人士都已经在做播客了。

所以从今年开始,播客已经越来越成为某一个领域的专家最适合表达的渠道和平台,因为这个地方有足够的时长,可以让你非常沉浸地,深度地去聊 45 分钟或者 1 小时以上,且你会遇到有耐心的听众。这个是良性的循环。

如果你是某个领域里面相对比较懂、TOP 认知的人,你可以进来做。但如果你不是这种人,其实也有很多节目,是偏素人或普通人,几个朋友一起聊天的形式,能增进感情,有一个相对比较聚焦的定位或者话题,也能够收获很多听众。可能未必需要在一件事上遥遥领先所有人,而是你的内容如果能给听众一个 30 度倾角仰望另外一个人的感受,就很有意思。

潘乱:过去一年里像杨天真等明星和喜剧演员也入驻小宇宙了,这会让主播创作者生态发生什么变化?

Kyth:让这个盘子做得更大,最终会让更多人了解播客。很多人可能是因为某个人来听播客,但他之后会听更多其他播客,这在数据上能得到证实。用户一定会在平台里发现更多内容,少数明星主播的更新频率也不是日更,有更多时间让用户可以找到别节目去听。所以(头部入驻)这件事对播客整体还是好的,不是说会抢其他人的时间。

包括我觉得像你刚才提到的杨天真、李诞,还有更多名人,阎鹤祥、傅首尔,包括之前半边天的主持人张越,他们都开始开个人播客了。如果要提取一个共性的话,就是大家越来越意识到,播客是一个跟别的渠道不一样的,表达自己的渠道。

每个人有每个人的特点和诉求,他们做的播客也各不一样,但是都会找到一个播客跟别的我原来要做的内容渠道不一样的点。比如对于所有女性主播来讲,播客是不需要化妆就可以生产的内容,这是非常解放的事情,我不只一次跟主播交流过程当中听到这个点。

包括今天鲁豫做的《岩中花述》这个节目,其实今年也有点出圈,它的内容质量非常高,以及它是一个品牌播客,对播客商业化也有很正面的影响。除此之外很重要的是,它在告诉新一代年轻的听众,鲁豫是一个什么样的人,一些年纪比较小的朋友,没有看过凤凰卫视,他不知道鲁豫是怎样的主持人。

对这部分朋友来说,鲁豫就像活在动图里面。但像播客这种,节目有足够多的时长,足够的自由度,足够多的场景,可以让你非常清楚地了解一个人,这个东西对名人、各种领域里已经有所建树的人,文字表达者,都是很有诱惑力的选项。小宇宙没有给大家很多包袱说一定要怎样。

潘乱:所以在内容拓圈方面,有哪些新趋势?单就播客来说有哪些是特别有意思的,代表不同尝试的新播客类型?

Kyth:挺多的,大家可以关注明年 1 月我们会推出的 2024 年小宇宙播客大赏,里面系统性地讲了今年看到的很多新的趋势。我觉得可能今年会有更多不一样的尝试,刚才我已经提到了像《独树不成林》这种节目。有很多原来是在别的媒介做创作者的人,也开始做一份播客,或上播客试试看。

像很多歌手,影视剧的导演和编剧、制片人,他们会把上播客当成一个必须做的事情。今年很多机构,像出版机构,原先做公众号的机构,都会觉得过去的内容经验可以复用在播客这件事上。

今天的编辑推荐里面,有两个律师做了一个播客,叫《律人行》。我昨天第一次听,水平很高。很多专业人士都会利用播客,去输出他们的一些平时在饭桌上、日常交流中可以讲的东西,这些东西就可以成为一个很好的内容。包括听众也在拓宽,我们发现有很多 10 岁以下的听众或 60 岁以上的听众,都是惊喜。

最后推荐一个叫《叁贾一院高中部》的节目,它是一个 40 多岁的爸爸和 15、16 岁的高中生儿子,两个人的对谈节目。我之前很难想象会有这么一个组合去做播客。你会发现,有很多人觉得播客是一个声音记录,一种声音日志,他也不觉得这是内容创作或者要做号,而只是一个简单记录一下自己生活的东西。

这个东西五年后、十年后,回顾一下,也很有意思,可以保存 5-10 年前我们是一个什么状态。这也是一个非常令人兴奋的前景。我自己也希望小宇宙能够成为很多人的一个声音胶囊,留到未来某一天自己可以打开,把播客当成做给未来的自己听的一个东西。

潘乱:播客可以做记录,可以做分享,可以做给未来的自己听,也可以变成信息第一手的策源地。比如最近的韩国政变,很多人都在催更《东亚观察局》。

Kyth:是的,每天的变化太多了,我今天刚刚看到一条微博,《东亚观察局》的主理人梵一如说生产队的驴也没有这么累。但还是很开心,就是很多人在想要听人解读韩国政局的时候,第一反应就是先听《东亚观察局》。

这是一个很好的现象,我们能在播客里面聊这些、听这些,讨论这些非常垂直领域的专业内容,无论作为一个专家,作为一个嘴替,作为一个参考,播客在越来越多的领域正在发挥这样的作用。

 

小宇宙 CEO Kyth|图片来源:极客公园

 

国内播客的独特路径

潘乱:大家接触到的内容形式里面,超过一个小时的都有哪些?我能想到的只有电影和纪录片。就是你会在这个内容上花超过 1 个小时,我觉得播客给大家提供了一个非常好的,深入挖掘一件事的容器、场景。

今天大家都在讲企业家 IP,但你会发现,所有企业家 IP 他们做了之后,在你脑子里并没有留下印象,只是溪水不断的冲刷,大家认为做企业家 IP 最好的是雷军。但大家对雷军建立印象最深的,是在他长达三个小时的那一期专访播客里,不是碎片的短视频里,还是得有更系统更深入的输出才行。

Kyth:这个在美国播客世界里早就是常态了。大家知道今天播客在美国的影响力很大。我们探究原因就会发现,它看似与当下现代媒体,与这个碎片化时代的格格不入。但反而是因为它足够长,使一个人,包括一个政客,可以在节目里事无巨细地聊到很多家常、日常,贴近普通人的点,这些点就会让人感觉亲切,感觉这个人是我哥们。这个人是我能够共情的人,他也可以共情我的人。这对我们来说是一个洞察,或者说是一个深刻的变化。

(潘乱的)《乱翻书》节目,里面像李斌,还有支付宝的陈亮,这两期节目讲了很多之前很难在其他媒介形态里面聊的事情,你会更共情他们。这和媒介形态有关系。包括蔚来十周年这期节目,他(李斌)的声音在耳朵里面听有更加亲切的感觉,好像对你一个人说话一样,这是播客的特点。

包括像雷军上《高能量》播客,这个对播客来说也是很好的事。还有挺有意思的,今年叶国富也上过一期《高能量》播客,恰好是在名创优品入股永辉超市,大概过去半个月还是一个月的时候。我们会发现,第一当事人在播客讲这件事的来龙去脉和决策依据,是一件完全无法被替代的事情,甚至比纸媒或者文字采访还要真实。

听到叶国富本人去讲把为什么要相信胖东来,去投资永辉超市。这对二级市场投资人来说也是一个巨大的信息量补充,这个事情在今年,是非常明显的趋势。今天早上查了一下名创优品和永辉超市的股价,自从叶国富上播客之后,名创优品股价涨了 20% 左右,永辉超市股价涨了超过两倍。

有很多二级市场投资人和交易者现在越来越把播客当成第一手获取企业家动向的渠道。想在商业世界里产生影响力的人,就是会选择播客作为一个传播渠道,或建立自己的 IP 和影响力。因为比起 15 年前,现在听众、市场、观念和格局又是另外一个时代、另外一波人,值得去做针对新人群的传播。

潘乱:今天 AI 的第一线,就是在播客里面产生的。

Kyth:今年出了很多 AI 的节目,除了《乱翻书》以外,还有像《十字路口》,《42 章经》等等。AI 一线从业者在播客里面聊 AI 的变化,能促进一些交流,社群发展,交易。播客带来的亲切感和信息量,能形成一个领域的前沿社群,这还是挺让人兴奋的。

还有一些领域,播客正在成为一种「嘴替」属性的内容形态。像今天的超级大爆款《再见爱人》,有很多播客都会聊《再见爱人》相关的内容,和其他渠道的调子不一样。我印象比较深是,《再见爱人》播出一个月的时候,《快乐亚军》做了一集关于《再见爱人》的节目,这集讲的观点在当时全网的舆论里是比较早提供不一样观点的,当时很多人觉得讲出了心里话。

包括 9 月份还有韩国的综艺叫做《思想验证区域》,也是一个很有意思的节目,播客也是比较早聊这个综艺的。在美国播客里面,影评这个品类也非常成熟,不是很大,但就有一群人非常喜欢在播客里面听电影人聊天,包括昆汀是一个非常喜欢上播客的人,上过无数的播客,他的表达欲太强了。

现在我感觉在影视、综艺这个圈子里面,确实大家会觉得我看完一个电视、电影,再到播客里面听别人说一些想表达的东西,这是一个很顺的过程。前几天正好有一位广播圈的朋友来我们公司交流,对《展开讲讲》这个节目如数家珍,综艺、影视这个领域有很多这种节目。

潘乱:我们要聊到美国的播客生态。做个类比,我们看美国的各种社会名流、科技大佬,其实都在玩播客,大家有印象的马斯克、扎克伯格、盖茨,他们最近几年没有怎么接触过文字采访,全部都是上播客,像马斯克还上了好多期,大家看到的都是他的各种出圈的播客对谈,但感觉中国这一块趋势还不够显著,这是为什么?或者说中国播客跟美国相比会有什么不同?

Kyth:有几个原因:第一,题材上,我们还是稍微有点限制,他们在播客上可以聊的话题更多一些。第二,中国好多东西跑在更前面,中国民间视频,UGC 或者 PUGC 内容更加丰富,中国的直播业态也是极丰富。

这两年美国的视频播客起来得比较猛烈,我们想它到底满足了什么需求?我自己最近也在想,美国的视频播客一部分代替了看电视的需求,很多人愿意在电视上看播客,是因为播客里的主持人讲的是接地气的话,大家关心的事,传统媒体不太接地气了,不太关心老百姓的疾苦了。

播客在美国有很多早期优势,比如汽车保有量,比如听广播的习惯,所以美国播客博主比电视节目主持人更接地气,更能够讲出老百姓心声。另外就是美国这两年短视频的发展,使得视频播客里面的切片可以更多分发出来,挖掘出消费价值。而且视频播客的商业化能力更强,能够给播客主播带来更多收益,这几个点加在一起,「播客」这个词在美国的内涵和外延已经发生了很大变化。

现在播客在美国互联网上,更多上是指一种人与人之间的对话,会被拍下来,大家拿着话筒,有几个机位的一种秀。至于这种秀放在哪里,是不是首发在传统的播客渠道,其实悄悄地已经在发生一些变化了。

而把这个特点说回到中国,就会发现有几个基础条件是不一样的。中国并不缺在手机里面看一个人讲话的内容形式。如果对标老百姓的需求,中国的广大大众要看的视频,可能也未必是像美国的播客这样,人们在一起聊政治、聊文化的内容。

我们团队也会仔细想这件事,中国播客发展的路径跟方向,可能跟美国还是不一样。我们要做好分析和准备,了解这些东西是什么,我的意思不是说视频播客没有价值,这是一个很好的分发方式,能让大家知道你。

潘乱:从用户触达的角度来说,中国确实走在更前面,李佳琦他的商业化肯定做得很好,用户触达做得更多,最后都是通过短视频的切片,再做二次传播。

Kyth:用一个比喻,Joe Rogan 是做给兄弟(bro)的节目,李佳琦是做给姐妹们的节目。

 

Kyth 和潘乱在极客公园 IF2025 创新大会上|图片来源:极客公园

 

最重要的,还是听众

潘乱:最近关于 AI 播客讨论也非常多,不管是谷歌自动生成的 AI 播客,微信公众号也推出一个新功能就是用你的音色,把你公众号新发的文章变成播客,它们都迅速地扩大了播客的内容供给,你怎么看这个事情?在 AI 播客、真人播客这两种供给之中,小宇宙会更坚定地站在哪一边?

Kyth:一定站在真人播客这一边。最近也被问了好多次这个问题,播客五年做下来,我们的立足点不是播客供给多么多,播客走的不是多的逻辑,是稀缺的逻辑。哪怕继续往下的五年里面,播客仍然是靠这个逻辑。播客是在丰饶的时代,提供稀缺价值的东西。

大语言模型现在非常强大,在可见未来,这个方向上还会有更多创新,还会有更多有意思的东西。我们现在扔进去一个文档,可以生成一个 5-10 分钟的对话音频,但对我们来说,它还是工具性的东西,不是在内容市场里能获得更多聚焦的注意力的东西。

当我知道你可以生成一个 50 分钟的播客之后,我就会知道你可以生成 1 万个 50 分钟的内容,那我为什么还要听它呢?当我知道你可以无限供给的时候,我稀缺的消费内容时间为什么要给你这些生产成本非常低,甚至创作者本人都未必听过的内容?我的时间一定要花在创作者真实用心的地方,这是播客很难被取代的点。

生成式的内容总有一个源头,所以总有一个出发点,所以我觉得它提供的更多是工具价值。比如说我有一本书懒得看了,我请你帮我讲一讲,包括我懒得读一个文字版,我想听一个说话的声音给我讲讲,这个完全没有问题,但这是工具属性的东西,不是内容属性的东西。

它更多是尝鲜价值,我们在一些产品上感受到它好厉害,但是这个好厉害是尝鲜价值,之后用户不一定会像使用内容平台那样去使用,这是互不干预的两种产品。

潘乱:播客是在饱和时代提供稀缺价值的一种内容媒介或者创作形式,我觉得就像今天大家为什么坐到现场来听我们的对话一样。说到线下,小宇宙刚刚办过一场线下的漫游日,为什么四年来第一次办线下活动?

Kyth:其实已经有点晚了,第一次想办这个活动是 2022 年。其实就是刚才你说的这个原因,就像我虽然在流媒体里面听音乐,但还是要去看演唱会,要去现场一样,那是一种亲身参与的体验,看到与你朝夕相处的一个声音,出现在你面前的体验是无法替代的。

我们希望小宇宙给播客这个生态,给播客创作者创造更大的价值,我们想找一个场域,把创作者、听众、品牌方、把对播客感兴趣的人,甚至路人,全部都结合在一个场景里面,感受到播客的能量。

我们有很多设计,都是以这个方向设计的,我们还融进了很多技术元素。我们做了很多设施,让用户在小宇宙客户端里积累的数据,可以投射到大屏幕上,可以让小主播和头部主播享用同一块屏幕。这些东西都是尝试通过线下视觉性的场景,爆发式地呈现出播客之前只呈现在听觉维度的一些价值。效果也还不错。也是我们比较擅长的事情。

潘乱:文字、视频都产生了非常大的内容平台,不管是从头条、再到抖音,但声音这个内容到目前为止,还没有同体量的特别大的内容平台,你对小宇宙的期待是什么?

Kyth:我觉得下一步比较务实一点。看远是要看,但更多还是关注未来一年或者三到五年,具体数字我不说了,但明年的目标仍然是让更多人听播客,让更多人做播客,把它的商业价值,把它的可能性和潜力服务好,打造好。也包括让更多人投播客。

潘乱:你作为 CEO,面临的挑战是什么?需要解决的核心命题有哪些?

Kyth:一块是业务,一块是人。人包括创作者、团队、组织。另外是业务,就是增长、商业化、拓圈,形式上的迭代。小宇宙五年来,就是在不断的成长和学习,接触一些新生事物,接触一些新的领域。包括我们这几年做商业化,也是在学习交付价值、怎么服务客户、怎么在更大的圈层,服务更多不一样的听众,不一样的用户。

潘乱:能不能透露一下,下一个小宇宙的目标是什么?你希望达成的目标以及你的任务的优先级,是更多人来听,还是更多人来发,还是更多人来投放?

Kyth:最重要的还是消费者,听众是引领一切的东西,当我们有更多听众时,另外一些东西都是下游。当更多人听播客时,播客就会有更多影响力,更多商业价值,会吸引到更多创作者来做他们喜欢的东西,表达自己想表达的东西,这个飞轮的起点是更多人对播客感兴趣,过来听,觉得这个东西是好东西。

 

浏览量: 37

余凯:科技让机器的归机器,人的归人

今年是地平线创立的第 9 年,也是公司上市的第一年。

回顾地平线的发展历程,创始人&CEO 余凯的很多思考塑造了地平线今天的形状——他标记了 3 个关键节点。

第一个节点是公司成立的 2015 年,余凯预判热门的云计算和移动计算已经到了终局,机器人计算方向未来会长得很大。这个决策帮助他们避开了拥挤的竞争,也为他们日后接入智能驾驶奠定了底座。

第二个节点是 2019 年,地平线开始进行业务聚焦,砍掉了玩具机器人、智能家居等非汽车业务,All In 自动驾驶。余凯觉得,与其在众多小领域花费同样多的经历, 不如专注资源在一个大生意上,因为大舍才有大得 。那一年,蔚小理都挣扎在生死线上,智能电动车并不是一个好方向,而地平线的大部分收入还都来自于非汽车业务。

隔年,中国智能电动车市场迎来快速增长。

第三个节点是今年,地平线赴港上市,成为今年港交所最大的科技企业 IPO。

上市不是终点,而是下一个阶段的起点。对于自动驾驶,余凯有一个大胆的判断—— 未来 3-5 年内,自动驾驶将会迎来终局。为此,他们需要投入全部资源 All in 自动驾驶 。

所以,地平线还分拆除了具身智能公司地瓜机器人。在他们的判断中,人型机器人是一件比自动驾驶更长远的事业。眼下,地平线更想专注在自动驾驶即将来到的大决战中。

在这个进程中, 余凯希望地平线能够成长为机器人时代的微软、英特尔 ,用科技赋能更多的机器人产业,让更多人类去免除体力劳动带来的束缚,享受更多的自由。

《圣经》里,耶稣在对观福音里说,凯撒的物归凯撒,上帝的物归上帝。余凯说,他们希望让人类的事归人类,机器人的事归机器人。

以下是余凯在极客公园 IF2025 创新大会上与极客公园创始人&总裁张鹏对谈实录,由极客公园整理。

 

01

地平线的 3 个关键节点

 

张鹏 : 首先恭喜地平线成功地在香港上市。我听说你在香港的上市引发了很多资本的争夺,看来在今天地平线已经成为了大家一个重要的标的。我挺好奇的,当时公司上市成功之后,你们有什么庆祝活动吗 ?

余凯 :其实上市后第二天,我就在跑客户的路上了。从 10 月 24 号上市到今天,我们公司还有好多高管没在一起聚过。因为我出差比较多,大家也比较习惯网上的工作和协同,所以我们打算等到年底再稍微聚一下。

张鹏 : 有点忙得过分了 。

余凯 :上市这件事本身就那么一天,那天过后我们就回到正常的轨道上了,该干嘛干嘛。

张鹏 : 其实今天能够有一个成功的上市还是蛮不容易的,你们怎么去定义地平线这次上市的价值?

余凯 :过去的两、三年里,中国科技公司的上市市场是非常低迷的,基本上没有太多高质量的发行。如果有发行,通常可能 70%、80% 都是基石,就是自己找了「亲戚朋友」,比如说地方政府或者上下游供应链。

地平线这次是 20% 的基石,其余 80% 都是市场化的发行 ,并且几乎第一次把大量的国际长线投资机构带回香港。所以对于香港的资本市场来说,这次是非常大的提升。

整体来讲,它的发行规模、上市规模是中国科技公司过去三年境外上市最大的。同时质量也是最高的,因为大量的国际长线机构,比如说曾经特斯拉的第一大股东 Baillie Gifford、世界上最大的主权基金挪威主权财富基金,包括一些大的长线、一堆国际机构,都非常热情地参与到了地平线。 我们大概超额认购了 18 倍,还是非常不错的。

余凯介绍地平线公司的三个关键节点|极客公园

张鹏 : 这个不是不错,已经是非常少见了。所以这背后到底是什么东西,形成了大家这么强烈的共识?

余凯 :我们经常会说,这个时代真的非常富有挑战,经济也不好,包括整个消费信心方面都不太好。但是我觉得创业者真正要回答的问题是「我怎么样」、「我们怎么样」。

历史上看每次经济周期低迷的时候,往往是伟大的公司诞生的时候。比如中国的互联网,中国现在最大的几个互联网公司,其实都是在 2000 年左右互联网泡沫时期成立的;包括 2008 年的美国金融危机,Facebook 也是在这一时期成立的。

所以我们永远要问自己,在这种绝望中是不是能找到希望,你是不是有勇气、有智慧去穿越周期。

从地平线来讲,我们比较幸运的是抓住了智能电动车。智能电动车的上半场是电动化,下半场是智能化。我们在智能化这个领域成为了中国整个产业界,甚至是全世界范围内最重要的一个供应商,这个大周期对我们是非常有利的。

但是看到这个大周期的前提是 , 前面 9 年要耐得住寂寞 。我们在 2015 年创立的时候要去做智能驾驶和机器人的芯片,那个时候没人看得懂,因为那时候讲的还是互联网模式创新,关于自动驾驶或机器人的芯片,大部分投资人不但看不懂,也不愿意投资,也不是一个热门方向。

所以我觉得每个人内心还是要找到那个相信的东西,哪怕别人都不看好你、不支持你的时候,你是不是能够坚持到那个时间节点终于来的时候。

张鹏 : 听懂了,就是一个公司过去的非共识能够在一个领域内,印证成为新共识之后,过去吃的苦都会得到超额的回报 。 但我还是非常关心,在地平线整个发展过程中,有什么关键的决策节点,在今天想起来是非常重要的?

余凯 :其实从地平线创立的第一天,我们就做了几个关键决策。尽管在地平线发展过程中我们做了很多愚蠢的决策,但因为得益于一开始那个原点,有几个关键决策做对了,所以我们整个大方向还是 ok 的。

第一个就是 做芯片,不做软件 。当时我已经做了 20 多年机器学习方面的算法,从来没有摸过芯片。但是我那时候深刻意识到,如果只做软件算法,可能不能构成一个商业模式,因为大家不愿意为软件付钱。

另外如果只做软件算法,它的护城河也不够宽。比如说大模型,今天中国大大小小的公司都能推出一些大模型,好坏如果仔细比较一下还是可以比较出来的,但大致水平没有明显的优劣。那么多人去做这个事情,你就会发现这件事情太拥挤了。

所以你要找一个人迹罕至、有长期价值,并且有很宽的护城河的赛道 。我当时直觉是,把我对机器学习、深度学习算法的理解注入到对硬件架构的设计,是可以成功的。

因为 第一中国的产业界不愿意为软件付钱,但是是愿意为芯片付钱的 。

第二是要把这件事情做出来很难,所以有足够宽的护城河 。比如说我们做车规级芯片,因为关系到人的生命安全,所以跟普通的消费电子类产品不一样,它的整个开发、测试、验证周期是比较长的。每一代产品从项目启动到挣第一份钱,需要 5 年。

我在创业第一年就问自己:「如果大公司做这件事情,我怎么去 pk?」那实际上做这件事他们也得花 5 年时间, 所以这件事对大公司、小公司都是平等的,因为时间是最不可置换的 。所以我觉得这个护城河够可以的。

这是从软件到芯片,是我的一个非共识。

还有一个非共识,是做机器人的计算 。2015 年是云计算、移动计算的天下,所以周边有好多朋友跟我说,应该去做云计算的芯片,或者做手机芯片。

但是我觉得站在 2015 那个时间点,如果说移动计算是一个足球赛的话,这场球赛基本快踢完了。这个时候我冲进球场,连当捡球的都不配。 所以创业一定要创当下很小、未来可能是很大的一个业务。

至于云计算这个方向,有英伟达。地平线创立于 2015 年 7 月 14 日,那一天英伟达的市值只有 107 亿美元。但我那时候其实已经知道,这场仗英伟达赢定了,因为 CUDA 在 GPU 之上所建立的整个软件生态,我觉得是没有办法冲破的。如果去做云计算,已经晚了,于是我决定做机器人的计算。

那个时候根本没有机器人的市场,但是我们从一开始就意识到机器人的计算和自动驾驶的计算可能是一回事,都涉及环节感知、人机交互、决策控制,所以我们后面很快接入了汽车的计算。

这是 2015 年,最初的几个决策奠定了我们跟很多公司在起点和路径上是不一样的。

地平线的第二个关键节点是 2019 年,我们决定 All in 汽车。

在这之前我们花了 5 年时间去思考机器人的计算,该从什么商业的视角去切入。我们试了好多垂直领域,整体来讲是两类:一是汽车。我们认为汽车一定是大生意,但它是长周期;我们也试了玩具机器人、智能家居等等,每一个垂直领域,不会有汽车那么大,但是商业模式比较短,也不需要车规、功能安全这些东西。

2019 年的时候我们意识到还是要大舍大得、大得大赢,与其每一个小的领域花的精力同样多,还不如干脆赌一个大的。于是 2019 年我们做了一个重大的战略取舍,把汽车以外的所有项目全砍掉。

余凯介绍反共识如何指导了公司的发展|极客公园

张鹏 : 那时候那些业务一年大概营收多少 ?

余凯 :那时候地平线主要的收入都是非汽车的。但我的直觉觉得砸一堆的小坑还不如砸一个深坑,还不如 10 倍兵力投入到一个最有价值的领域。

我觉得这个转念对我的战略思考和组织能力等各个方面,其实是一个重大的升级。因为人性是愿意做加法的,是不愿意舍的, 所以我对抗了自己的惯性,思考的是从未来看现在的必要性 。

其实 2019 年汽车并不是一个好方向,根本融不到钱。但不管怎么样,我们逆周期地去做了这个决策,没想到 2020 年汽车就起来了。所以我有时候反思,就算所有的判断、战略、决策都对,但也不要忘了一件事——运气,我觉得运气也很重要。

第三个重要时间节点就是今年,地平线决定在香港上市 。当时所有人劝我说不要去香港。

我当时基于几个判断,决定去香港上市。从一个概率角度来讲,当一个股市已经很低迷的时候,那你会想,它往下走的概率高还是往上走的概率高?

还有一点是, 整个中国市场某种意义上已经到了内卷的程度,其本质是供大于求,内需不足,所以未来大趋势是中国企业的出海 。所以一个开放的国际化的金融市场,一定是这种企业最好的上市的选择。比如说美的,今年美的接近一半收入都是在海外。

基于这些判断,我们反共识地决策,一定要去香港。

一开始在路演时整个感觉也不是那么好,因为毕竟整个情况比较低迷。我们 3 月 26 号交表,4 月份开了产品发布会,投资者对我们产品更加有了信心,然后香港股市神奇地在 4 月份开始回暖。到了 8 月底的时候我们当时正好拿到了证监会的路条,9 月份过了港交所的聆询,然后 9 月 24 号整个股市都回暖了。

最后,10 月份,我们上市。

 

02

让机器的归机器,人的归人

 

张鹏 : 你刚才也将讲你做了 20 年的算法研究。我比较感兴趣 , 这些年从一个科学家变成企业家,对你最大的改变是什么?你喜不喜欢这个改变?

余凯 :我觉得这个感情是比较复杂的。在整个创业过程中,其实有很多艰难的时刻。有的朋友问我:你哪段是至暗时刻?我觉得很难回答, 因为每天一睁眼都是至暗时刻 。所以我最近对我身边好多朋友最大的贡献,就是劝阻了他们的创业冲动。因为你真的创业了以后肯定是没有生活的,要完全接受一个非常人的生活状态。

所以如果回到 2015 年,当我知道这个过程有这么难的时候,我还会不会创业?可能我就不太敢创业了,因为你要经历的挑战太多了。

但是另外一方面,我自己收获还是很大的。因为以前做科学家的人生相对来讲还是比较单维度的,你对这个世界的丰富性、复杂性是缺乏了解的。于是你经历了怎么去建立一个组织、怎么打造一个组织的文化、怎么在纷繁复杂的变化中去制定你的长期的战略,并且从战略到落地的执行、实现商业的闭环、打造销售的团队,并且在这个行业里建立生态,面对资本市场等等。

在这个过程中 的 收获 , 就是你把自己变成了一个多维度的人 ,不仅对技术,你对社会、对人文、对历史、对哲学等好多事情,都要有更深的理解。这些理解会让自己智慧有更多的升级,这种愉悦感、这种满足感也是空前的。

张鹏 : 地平线在完成成功上市之后肯定也会开启一个新阶段,因为上市从来不是终点,上市是下一个阶段的起点。那么地平线下一个阶段最重要的目标、台阶、挑战是什么?比如说未来如何变成规模化的、创造更大价值的公司,这个关键点在哪里 ?

余凯 :地平线在过去的几年里面证明了我们在芯片、软件这一块具有初步的世界级的竞争力,在过去几年我们面对的竞争对手很少是国内公司,基本上是全球的顶级硬科技企业。整个市场的竞争中,今天中国整个辅助驾驶、智能驾驶方面计算方案的供应商,去年我们是市场第二名,今年是市场第一名。

未来 5 年我们肯定也不是竞争驱动性的,还是要朝着自己的使命去勇敢做自己,思考怎么样通过我们的努力,让整个全人类更快地去享受到智能驾驶给每天的生活所带来的安全、轻松、自由。

我们希望科技能够普惠。不仅是豪车或者高端车搭载,我们希望 10 万人民币的车也能够搭载自动驾驶;我们希望 5 年时间能够让自动驾驶做到,让你可以全程脱手,可以全程看微信,可以全程开视频会议。不仅仅是中国,也包括全世界。

我们希望到 2030 年,全世界都能进入这样一个状态,同时地平线也成为世界级的一个科技企业,这是我们未来 5 年的目标。

当然我们的最终目标不仅于此。地平线创业第一天就说, 我们把公司名字叫 Horizon Robotics,就是想做机器人时代的微软,机器人时代的英特尔这样的企业 。我们希望 2030 年以后能够去赋能和成就更多的机器人产业,让这些机器人的产品搭载了地平线的计算方案后,变得更加智能,能够让更多人类去免除体力劳动带来的束缚,享受更多的自由。

《圣经》里有句话,让上帝的归上帝,凯撒的归凯撒。 我们目标就是 让机器人该做的事归机器人做,人做的事归人 。人做的事不应该在富士康的产线上,连上个厕所都要算时间,这是人做机器的事。

包括开车,在北京城市里面没有人享受开车的乐趣。如果你真的在一个开阔的原野上面你会愿意去开车,享受驾驶的乐趣,但是大部分时间我们让机器开就好了。

我们希望通过我们的努力去创造这样一个未来,让人做人的事。

「再来一次,不确定还敢创新」余凯回望创业以来的挑战|极客公园

 

03

3 年后,自动驾驶会发生巨大拐点

 

张鹏 : 你提到智能驾驶今天还有很多不足,我们作为消费者,每个人对智能驾驶有自己的理解,但是智能驾驶这件事是你最熟悉的领域。我好奇作为这个领域里专业的人 , 你觉得今天智能驾驶有什么问题?还有什么做得不够好的?

余凯 :智能驾驶一定是刚需,如果暂时还没有成为刚需,确实是因为它的技术不够好。但是我觉得最近几年,像多模态大模型、端到端的训练、还有算力,也就是摩尔定律的发展, 大概三年时间自动驾驶会发生巨大的拐点 。

其实地平线内部基于新一代的征程 6 和新一代的智驾系统 SuperDrive,我们的自动驾驶系统已经可以在北京朝阳、望京或者上海静安区或者徐汇区,在下午 6 点下班的高峰期这种很疯狂的路况下,做到全程无监管、绝对老司机,甚至可以说开车开得比我还好。

关键变化就是以后大模型多模态、端到端技术,还有更大的算力。自动驾驶技术已经有很长时间的积累,如果从 Google Waymo 算起的话,已经有 20 年了。短期来讲的话,大家对技术的发展不一定非常满意,总会去高估,但是长期的话就会低估。像去年 ChatGPT 横空出世,会让人觉得,我们以前做的自然语言理解、机器翻译,突然一下就被击穿了。

我觉得就这么两年,自动驾驶也会发生像 ChatGPT 这样巨大的拐点。

张鹏 : 你刚刚提到了一个词叫「老司机」。你怎么定义老司机?因为老司机就是一个更好的智能驾驶,你要优化它,肯定要先定义它。它会体现在什么方面呢?

余凯 :我们对这个产品赋予了一种比较性格化的描述,叫「 优雅不怂,从容笃定 」。

现在比较老一点的自动驾驶系统,第一是不优雅,在好多时候有很强的顿挫感,让你觉得不舒服。或者有时候方向盘面对不同的情况,会不停地抖动,让人类司机也觉得慌。还有一种极端,是面对比较复杂的路况,它最好的策略就是停在那不动,像个怂包一样,你也觉得不舒服。因为在北京打拼大家都不容易,赶路时间很重要的。

优雅和不怂是个矛盾,我们就想用科技升维的方法解决这个矛盾。我自己的感觉,最近我们自己内部技术的进步让我自己觉得都吃惊。两年前我很难想象用 11 个摄像头,就能够实现跟有经验的人类司机差不多的表现,我觉得技术的进步已经在超出我的想象的边界了。

张鹏 : 所以这个进步的背后支撑它的核心,还是跟端到端的这样一套新的思路有关系的 。

余凯 :我觉得首先是关键的技术的发展,像端到端技术,交互式的博弈等等,但是我觉得还有一个很重要的就是你整个的系统架构,需要具备两个能力 :一、算法创新能力,二、你需要软件、硬件、系统的强大的工程质量。

这两个能力能够支撑你在这个领域成为这个领域的领先者,最后成为这个领域的王者。但是很多年轻的公司比较关心算法创新,工程能力、系统能力不一定那么重视。

像我以前在互联网行业,互联网行业如果一个软件出现一个 Bug,马上就可以改改,改好就可以上线。但车是硬件,如果车出问题了,可能要有一批车的召回,甚至导致灾难性的事故。所以我们对这件事要有充分的敬畏之心。换句话说,其实智能驾驶这件事也是适合我们这种老年人创业,有些方面我们做得稍微扎实一点。

张鹏 : 最早马斯克提自动驾驶 Auto Pilot 概念的时候,本质上还是个辅助驾驶 。 你觉得要做到 L4 级别的自动驾驶,这个时期会多久发生?

余凯: 我自己感觉,大规模的 L4 和 L5 差不多 5 年就能搞定 。最近人工智能技术的发展,使得自动驾驶不仅对局部场景有很好的表现,而且推广性强太多了。

像以前搞翻译,中译英、中译日、中译德,每一个都要单独做一个软件系统,现在一个大模型全搞定,说明整个模型泛化能力是很强的。在自动驾驶也是一样,以前像雕花一样地搞系统,高速、泊车、城市,每个都是不同的系统。现在一个大的 AI 全搞定,现在模型的泛化能力、举一反三的能力,比以前强太多了。

张鹏 : 在这个进程中,推动它的更关键的因素是什么?是算法还是算力,或者其他?

余凯 :我始终觉得更重要的还是算法。今天早上我还看到 OpenAI 的前首席科学家 Ilya Sutskever 说人类的数据快用完了,Scaling Law 遇到问题了。互联网数据像化石能源一样,就这么多,后面人工智能的发展本质还是要通过算法的演进。

我举一个极端的例子,爱因斯坦推导相对论。他没有做过任何试验,也没有任何观测数据,完全是通过思想试验,在一个理念世界里面推导出了广义相对论。所以真正的智能是独立于这个宇宙存在的,就像数学一样。在宇宙大爆炸发生之前,数学就是存在的。所以你不需要观测数据,你不需要这个人类这个世界的数据,然后才能够发展出智能。终极的人工智能只要靠计算就可以,不需要数据。

张鹏 : 今年我们突然看到很多城市在跑 Robotaxi 这样完全无人的出租车。这一方面让大家看到了自动驾驶技术的进步,另一方面也有一些讨论说,如果未来都是这种共享模式,对于智能电动车这个产品的定位、商业模式、市场需求是否会带来很大改变 。 你觉得共享的需求和个人的需求会因为技术变化带来连锁反应吗?

余凯 : 我持有反共识的看法,随着自动驾驶的时代来临,其实汽车共享化是一个小趋势,真正的个人化才是大趋势 。

张鹏 : 为什么 ?

余凯 :你会跟别人共享你的手机吗?

张鹏 : 从来不共享 。

余凯 :其实人类的天性是随着技术的进步,拥有更多自由,而不是更少。你好不容易有一个自动驾驶的汽车,一定会存在你很多的内容。不光是数字内容,也包括你的很多物理内容。比如说你上班的时候,有时候开会你需要西装,放在车里;你下班需要打网球,运动设备在车里。

它相当于是移动会客室、移动的咖啡厅、移动的工作间、移动的娱乐室。你愿意把这些东西跟别人共享吗?你坐在车里面突然发现车里都是上一个客户吃的炸鸡翅的怪味,你会喜欢吗?不会的。 自动驾驶会释放很多可能,这些可能都在车里被存在,你不会想着跟任何人共享。

张鹏 : 所以这件事反过来跟技术无关,跟人性相关。一个创造价值的过程要讲降本增效,但是人生是不能讲降本增效的,人生其实是要更自由、更丰富的。所以这个时候如果有更丰富的供给,更自由的时间,人人都想要自己拥有,而不是共享 。

余凯 :我觉得人的生命整天追求效率,过得像是机器,这个逻辑是有问题的,科技的发展其实是应该让人生越来越丰富。

「技术的进步,该让人更加的自由」余凯阐释技术进步的意义|极客公园

 

04

人形机器人还需要时间

 

张鹏 : 今年我也看到一个新变化,就是地平线在具身智能领域孵化了地瓜机器人。地平线本身就是要给机器人造大脑,为什么要分拆一个公司出来呢 ?

余凯 :一 是两个业务节奏不一样 ,目前自动驾驶我认为属于未来 3 年、5 年就大决战,全世界范围内差不多就会把格局锁定。所以整个地平线团队还是要聚焦,把所有的带宽投入到自动驾驶大决战里面去。

对于机器人我们认为需要有更长时间的孕育,需要生态的培养。像地瓜机器人现在已经是国内机器人领域最大的计算方案的供应商,但是真正地让人形机器人这些飞入寻常百姓家,还需要时间。

拿智能电动车做比较的话,2014 年蔚小李创立的时候,其实特斯拉已经有 Model X 了,说明这个产业已经出来了。可是 今天人形机器人这个产业没有出来 ,相当于智能电动车时代的史前时代,还需要有更长时间的孕育。

现在地瓜机器人注重整个开发者生态,去支持很多的有梦想的机器人的开发者,包括我们在国内 20 多所高校里面开设课程,有点像英伟达 15、16 年搞 CUDA 那样。这件事需要超长期的耐心建设生态。

地瓜机器人跟地平线是两个不同的节奏周期、不同的战略阶段,所以我们打造相对来讲比较独立的团队,来干这个事情。

张鹏 : 所以本质上在不同的领域,不同的技术发展过程中,如果节奏不匹配,放在一个公司里是不对的,应该让他们各自匹配对应的客观环境和客观阶段去发展 。

余凯 :对。

张鹏 : 最后一个问题,机器人这件事什么时候会进入大决战的阶段?

余凯 :前几天我有几个朋友从硅谷回来,他们拜访了特斯拉、斯坦福等等。有几个人工智能领域耳熟能详的领军人物,跟他们讲了比较悲观的说法,认为人形机器人可能 30 年都不一定搞定。

但我自己觉得应该是 5-10 年。

这也很正常,今天还是在机器人早期,就像我们十年前预测自动驾驶什么时候实现一样,看法差距也非常大。

但我觉得机器人跟自动驾驶、大模型有一个最大差别,就是 大模型跟自动驾驶都非常容易收集数据,数据是海量存在的,机器人没有数据。 也就是说,现存基于大模型训练的方法论就不成立,需要一个全新的方法论去做。

但我自己还是比较乐观。

浏览量: 21

打开日本市场背后,Dify 是怎么做 AI 全球化的?

2024 年,做一款面向全球的产品几乎成为 AI 创业者的必修课,Heygen、Talkie、Monica 等都在北美获得了可观的营收。在中国 AI 创业者走向全球的地图上,人们普遍认为,美国的 AI 技术发展快、用户接受度高、付费习惯也好,是一定要尝试的优质市场。

但在一众做全球化的 AI 创业公司中,Dify 的路径让人意外。

自 2023 年 3 月创立以来,Dify 在中国、美国、日本等多个国家推出产品,但增长最快、用户最多的市场从日本「自然长出」。

对软件这个品类来说,日本是一个传统、「守旧」或者说「保守」的市场,这意味着新进入的软件提供商「难以攻入」。另一方面,日本市场对于 AI 的接受度尚处于初级阶段,外界有感知的 AI 应用也并不多。你很难想象,就是这样一个市场,成为 Dify 全球化之路上目前做得最成功的区域。

在过去一年 AI 全球化的浪潮中,Dify 成为一个绕不开的案例:产品体验越来越好、用户增长迅猛发展。作为一个开源项目,Dify 在 GitHub 上已经有 54000 个 Star,迅速跻身为全球 LLM Tools 增速 Top1 的开源项目,其开源版本在全球有 300 多万的安装量。

但不少人在聊起 Dify 时也会不约而同地表达类似的担忧:「Dify 的产品是帮助开发 AI 应用的中间层工具,在大模型时代,这是大厂一定会做的事」;「Dify 有用户但商业化难,最好的方式是被收购」。

对于这些质疑,过去一年半的实践让 Dify 团队坚定了自己的选择,尽管 AI Infra 是大厂都会做的事,但仍有未被满足的需求,比如开发者需要一个中立的、多模型的「工具箱」等。事实上,作为一个非常早期的初创公司,Dify 目前是盈利的状态,已服务超过 30 家财富 500 强企业。

2024 年 12 月 16 日,在极客公园 IF2025 创新大会上,Dify AI 创始人、CEO 张路宇,以工具产品经理的视角分享了 Dify 的全球化故事。作为连续创业者,张路宇的上一段创业生涯是面向开发者的 SaaS 软件服务,这段经历也给了团队创业 Dify 时做决策的一些必要 knowhow,张路宇也更多把 Dify 过去一年取得的成功归结为「选择」与「运气」。

 

以下是张路宇的演讲全文,经极客公园整理:

Dify 是一个开源的、面向全球的、ToB 的 AI 应用开发平台。过去一年,Dify 成为成长最快的 AI Infra 产品。

去年也是在这个舞台、同一个位置,我参加了极客公园创新大会的一个圆桌,当时就被拍下来发到网上。今年 4 月份 Dify 产品在日常市场非常火爆时,日本网友把我们扒出来贴上了这张图说:Dify 是一家什么样公司?他们是不是一个有政府背景、有腾讯背景的企业?能不能让这个公司进入我们的市场?他们对我们做了一个深度的研究,并且把这个文章放在了 Note.com 日本最受欢迎的一个平台上,售价 500 日元。

所以我们全球化第一道「坎」是极客公园带来的,好在我们的市场团队帮我们平稳度过这次危机公关。

今年 Dify 在日本市场迅速增长时,网友扒出张路宇去年参加 极客公园 IF 大会的照片|图片来源:Dify

15 世纪时,哥伦布为了做贸易带着团队向西航行,找到一个新大陆。当时认为这个地方是印度,哥伦布至死都认为找到了印度,所以今天会看到一个 Indians 这个词怎么来的,他们当时认为这是印度人。

讲这个故事是两个隐喻:

第一,你在出发、航行时,可能不能确定你最终去哪里;第二,你带着所有认知去一个新的地方时,你一定有过去的认知依赖,你会觉得这里是印度,会以当时的认知、思维面向那个市场去做。

今天的分享我想交付一些信息:面对一个增长这么快的市场,一个初创团队怎么最快得到一个成熟逻辑、去做出一个增长最快的成功产品。

具体会聊三个话题,也是我们创业时做的三个选择:

一、我们坚定的选择第一天就做全球化,

二、我们是一家 PLG ToB 公司;

三、我们做的一个最危险的决定:产品第一天就是在 GitHub 上开源的,99% 的开源。

 

01「工具产品全球化」已经被验证过

为什么要做全球化的市场?我觉得和每个团队的基因、过往经历都有关系。Dify 是一个工具的、软件的、Infra 的、开源的产品,我们认为,工具产品属性就应该面向全球化的市场。

这是 Dify 今天取得的一点成绩,左面这个图是我们在 GitHub 上的用户分布,有 50% 左右的用户来自中国。其实中国开发者基数非常大,像 LangChain 这样的产品里中国的开发者比例也占 40%,非常高的比重。

在其他市场,比如在北美、日本等,Dify 也都做了比较好的覆盖率。

另外,Dify 的产品增速已经超越了所有相关的开源产品,我们在 GitHub 上有 5 万多的 Stars,还有 500 多个全球一起共创产品的贡献者,整个产品在全球安装量超过了 300 万,这是非常大的数字。

为了做全球化产品,Dify 做的各种工作如上图|截图来源:Dify

为了做全球化这件事,我们在第一天做了很多的架构设计和一些准备工作。首先从公司层面上来说,我们是美国特拉华州的一个公司,以这样一个身份做全球服务。

全球化产品在语言问题上,我们不止有英语、日语……,Dify GitHub 页面上甚至有一个语言是克林贡语——就是星球大战里面说的那个语言,是为了提升西方用户的文化黏性。

做一个全球化的产品,除了语言问题,还要去做很多合规操作,我们聘请了非常贵的律所做一些国际认证 SOC2 等,去符合大家的期待,还有把所有数据放在合规的区域。

另外,做全球化产品本身,团队也应该是国际化的,我们在整个团队里面构建了一套信息环境,一方面我们自己用了很多 SaaS 的工具链的产品,比如我们用 Front 处理邮件,用 Linear 处理需求的流转,我们有一套自己的工具站。一个挑战是,因为 Dify 是中间件,左面是模型,右面是应用爆发,Dify 需要做非常好的信息的吞吐量,怎么跟进这么快的技术变化、怎么快速迭代产品,这也是我们一开始设计的方向。

另外招聘的环节,我们的团队分布全球,除了在国内的团队,还有北美、日本、加拿大、土耳其、澳大利亚的同事,我们进来的同事都需要做一系列的测试,包括英语和其他东西才能满足人才需求。这是我们的准备工作。

然后应该把你的鱼竿指向哪里?

我觉得这是可以通过历史数据回答的,你是做工具产品或者做硬件产品,过去在这个市场已经成功的模式是什么?什么市场是最大的,应该把钩子、把鱼竿伸向哪里?

有一个不幸的数字,中国软件不太好做,占全球营收比例不超过 5%,这里有三个产品的例子,Slack、Figma 和 WordPress 三个超过十年的、非常流行的产品。这是最终的用户数据的分布,可以看到一些国家比例是比较大的。

还有一个例子是 Notion,他们在发布 1.0 产品之前也经历了扭曲和找 PMF 的阶段。今天他们有 1 亿用户,但当时创造这个产品时团队已经扛不住了,团队从旧金山搬到日本降低成本来做这件事。他们用户数据分布也很有意思,今天 80% 的收入来自美国以外的地区,70% 以上用户在美国以外的地区,这个说明什么问题。说明美国人民也要出海(哈哈)。

另外一个数据可以参考,美国的 GDP 每年增速可能就是两个点、三个点,但美国股票指数,纳斯达克、标注普尔过去几十年的增长基本上是每年十几、二十个点的增长。为什么股票指数超过国家 GDP 的增速?

因为今天在美国标普 500 上的所有公司都是新经济、全球化公司,他们也是基于本土的技术或者其他优势做全球市场,这个是不分国界的,不管中国还是其他国家。

工具产品是没有国界的,打开电脑,你不会在意每天用的那些东西是哪个国家的,但有一些产品比如说涉及到一些人力资源或者 CRM 等等这些类似的赛道,文化属性非常重,如果选择了这个赛道,惯性会加强,会去影响你去做市场的一些摩擦度。

举个例子,我们做日本市场遇到很多问题,因为日本流程非常细致,他们会去挑战我们的产品。我们日本同事说,超过几点不过能给他发消息,我们发一封邮件哪些敬语都是有一套自己的逻辑,有很多这样的技术细节、摩擦细节,需要在做全球化的过程当中处理。

 

02「PLG ToB」是 Dify 盈利的关键

为什么选择这么一个模式,PLG ToB?(PLG,产品导向的增长)

PLG ToB 的意思是通过产品完成自身的 GTM(Go-to-Market,走向市场阶段),最终让大客户、B 端客户给你付钱。

先来分析 ToC、ToB 有什么区别?过去一年大家已经看到 ToC 的生成式 AI 应用非常卷,很多团队没有那么幸运,今天还在找自己的市场在哪、找自己的 PMF(产品市场匹配点)在哪,产品形态还没有找到。我整体觉得,ToC 产品是符合演化论的,有一个赛马机制,一些好的想法在快速市场验证中会出来,还有一些注定需要一次又一次的尝试。我们觉得在去年三四月份那个窗口,当时如果投身 ToC 直接做这个事,会失去一些市场的技术窗口。因为前面这个时间非常非常重要,(这时的增长)是钱买不回来的。

再看 ToB,是难赚钱、需要跟客户喝酒、回款非常慢、需要非常大的销售团队、需要有很多合作伙伴。这不是一个新兴的创业公司应该去做的事情,更多是云厂商等积累了很多资源的公司才能去做。

我们选择的模式叫 PLG ToB,通过开源社区、生态,完成最大化的市场覆盖率,达到最低的获客成本,通过 ToC 的成长速度、最终触达 ToB 的用户给你付钱。

如果去看 SaaS 产品的话,这类产品最大难度在于获客成本,获得一个用户需要花多少钱?

传统 SaaS 模式要么做 SEO(搜索引擎优化)、要么通过社区推广、要么通过广告投放等方式来获客,这是一个算帐的生意,投多少钱回来多少用户。

但是生成式 AI 整体的品类是世界上最卷的赛道,你需要最大化地得到你的市场覆盖率,你需要赢。当时选择传统 SaaS 模式,我们显然没有办法赢,因为这是一个算帐的模式,多少钱都不够投。

有另外一个例子,Atlassian,就是做 Jira 和 Confluence 的那家公司,我们可以看到它的获客成本比其他厂商都要低,19% 的获客成本,这些用户几乎是以非常低的成本进来、然后付订阅费的。

Dify 在过去一年半已经服务了全球 500 强企业中 40 家,也是一个非常大的数字。因为传统来说,一个 ToB 企业做到三五年才能接触到这些厂商,而且我们获客成本几乎为 0,从公司创立到现在,我们一共花了不到 40 万人民币市场费用做到这个数字,这是 PLG ToB 的力量。

传统的公司需要两年或者更久达到自己的盈亏平衡线,PLG ToB 公司基本上是在七八个月的时间。Dify 给一些开发者树立了一个榜样或者跑通了一个模式,这是一个来自于本土的企业,如果你要去做全球 ToB,这是跑得通的模式,你能通过这个方式获得增长。

 

03 开源对做 ToB 市场的好处:建立信任

第三问题是为什么选择开源?

Dify 是基于阿帕奇 2.0 协议去做的一些修正的开源协议、去开放的产品,这个产品的发行、给用户用是不要钱的,但是在特定情况下,比如大用户量、大租户情况下需要给我们一些授权费。

我们通过 PLG 去获得的最快增长速度,去赚 ToB 的钱,但是ToB 本来最大难题在于说怎么让用户信任你,他们会挑战你的工程,挑战你的 SaaS 服务或者软件工程安全,挑战你有没有供应商资质,很多这样的问题。

开源是本土团队最快 GTM(进入市场)到全球的方式,因为你把你的源代码公开了,你甚至把整个软件的构建过程,每次提交 issue、commits 都公开了,他们天然可以感知到:你是不是一个真诚的认真的团队、可以感受到你的软件是不是可靠的,这是我们跑出来的模式。

 

04 One More Thing:勇敢迈出去,不要低估自己的好运气

你在构建一个新的产品和新的公司中,你会在这个过程中去获得那些相信你的人给你的支持,我们在过去一年半有一些小经历,首先在客户上赢得了大客户。

我们曾经有一个欧洲客户来询价,我们报了一个数字,合作过程中他们说「你们的服务非常好,我要给你付两倍的报价,同时给你一个 million(百万)美金的市场推广费用」,这是我以前创业过程中从来没有遇到过的。

我们招聘员工的过程中发现,有很多来自 QS 50 大学,他们放弃了非常好的职位,找到我们,来到我们的团队。坦率说我自己是初中毕业,我真的认识了非常好的人。

再说说我们的投资人,今天大家知道,融资环境不如意。我们第一轮天使投资人,没有大篇幅跟我聊商业模式怎么样,而是说「我喜欢你们的故事、喜欢你们的团队」。这是一个非常柔性的、感性的评价。

我们的合作伙伴,因为今天 Dify 和几大云厂商,包括 Azure、AWS 都有很深的合作,AWS 在中国所有的产品销售和云捆绑带着 Dify,在日本和美国也是这样。我们以前是不敢相信可以和 AWS、微软做这么大的合作,他们都是派出全球的 VP 或者中国区负责人来跟我们做合作。这样的例子可以举出很多。

所以我想跟大家讲:不要低估自己的运气,要把自己的状态展开。我自己的职业生涯、上一次创业和现在创立 Dify,很多东西都不在我的计划之内。或者我换一种说法,如果你计划了某件事,把一个事算得非常清楚,要去做美国市场、中国市场、去做哪个国家的市场,算清楚之后其实你能达到的最好的状态,大概率也就落在你的计划里,但是如果说你把一定程度的自己开放出来交给市场,交给自己运气,交给时代给你的机会,你会发现有很多很多意想不到的惊喜出现,完全不在你自己的计划之内,这是我做所有事情的经历。

今天我相信来这里的观众很多是产品经理,我也给大家一些信心,不要去畏惧做选择,不要害怕迈出第一步,去尝试做这样的事,可能会获得意想不到的回报。初创不要紧、小公司也不要紧,你自己技术没有那么好、团队没有那么好,不要紧,把自己开放出来。

 

浏览量: 59

周鸿祎:AI 是赋能者,而不是单纯的颠覆者

头图来源:极客公园

 

两年前,大模型刚兴起时,周鸿祎开始用四个「你相不相信」呼吁现场建立 AI 信仰,从此踏上「AI 布道者」之路。

去年,作为国内第一批发布大模型的互联网公司,360 的战略调整为「All in AI」。今年,360 在 AI 领域取得不少进展,1 月底上线 360 AI 搜索;7 月发布国内首款儿童 AI 手表 360 儿童手表 A9 AI 红衣版;8 月宣布与国内 15 家大模型厂商达成合作,共同推出新一代 AI 产品「AI 助手」……

如今,大模型技术的出现,深入影响了各行各业的发展轨迹,成为不可忽视的重要力量。但在周鸿祎看来,大模型不应被神化,而是应该被视为一种赋能工具。

在极客公园 IF2025 创新大会上,360 集团创始人周鸿祎在「在大模型时代年轻人值得干点什么」的主题演讲中谈到,AI 的本质是「赋能」,而非单纯的「颠覆」。在 AI 时代,AI 的作用是为各个行业提供赋能、重构游戏规则,而不是单纯打破现有的格局,AI 应该像电动机一样嵌入到各种应用场景中,推动产业革命。

周鸿祎总结了他眼中关于未来的六个趋势:

  1. AGI(通用人工智能)和超级人工智能发展放缓;
  2. 大模型趋向专业化;
  3. 模型越做越小;
  4. 训练数据质量提高;
  5. 成本降低;
  6. InfraStructure 建设基本完善。

同时,他也列出了六大应用方向,希望年轻人能够从大模型的六大应用方向中寻求到属于自己的机会。

  1. 人人智能;
  2. 从万物互联走向万物智能;
  3. 数转智改,助力传统产业打造新质生产力;
  4. 未来和新兴产业;
  5. 打造科研新范式;
  6. AI 安全。

如今,大模型正在把所有行业、把所有赛道都重写一遍,时代的游戏规则已改变,新的机会摆在了所有人面前。

以下为周鸿祎现场演讲实录,由极客公园整理。

 

周鸿祎:今天在讲人工智能之前,先跟大家说说我为什么拍短剧。我之前唯一看的一集短剧是《二十岁总裁爱上保洁阿姨》,看的时候有两个周鸿祎,一个理性的周鸿祎一边看一边吐,能这么拍?感性的周鸿祎说快点下一集。那么我为什么拍一部短剧呢?有些部门审核了之后说:我们发现你拍的不是短剧,完全是广告片,所以我们拍短剧的目的是什么,等下跟大家分享一下。

国内把这个事说得太神秘了,一说就是企业家做 IP,一说做 IP 在座很多人就觉得我又不是什么著名人物,我有什么 IP 可做的?

但其实说白了在短视频和短剧时代,短视频和短剧已经把我们头脑格式化之后,过去传统公关部和市场部或者用户增长部要干的一件事就是要搞流量。

我前一段时间去硅谷,跟很多创业公司谈,他们没有什么 IP 的概念,但是你问每个公司说如何冷启动你的公司,如何冷启动你的产品?答案都是一致的,就是做魔性的短视频,在国外短视频平台上获取免费流量,这是我们拍短剧的目的。现在这个短剧也正在拍续集。

最近有一个概念叫 Founder Mode。在短视频时代,传播游戏规则发生了改变,跟用户沟通方式发生了改变,更大的改变是在于大模型,它的出现改变了技术架构和商业模式。所以我现在是在带领 360 二次或者三次创业。

我今天分享一下我对大模型发展的思考,关于在大模型时代年轻人值得干点什么。

许多互联网行业的「老兵」可能会认为,AI 与互联网的发展规律相似,甚至会产生一种绝望感,觉得互联网已经经历了二十年的发展,许多机会和格局已经初步成型。前几天,马云在蚂蚁集团的讲话中提到的一个观点我非常赞同——AI 是比互联网更大的机会。因此,互联网时代的规则和思维方式不一定适用于 AI 时代。如果我们在 AI 时代仍然沿用互联网时代做 APP 或 Web 的思维来开发 AI,那就像刻舟求剑。

举个简单的例子,互联网能否提升生产力?互联网确实能够提高沟通效率,但这并不是互联网的本质。互联网的核心在于连接——连接人与信息、连接人与人。

周鸿祎在极客公园 IF2025 创新大会|图片来源:极客公园

互联网完全跟现实世界无关,而是创造了一个虚拟的时空,在互联网里又产生了很多独特的社交、社区模式。而人工智能的最大不同之处在于,它是一种直接提升生产力的工具,而且生产力更强。

硅谷的一些人曾经讽刺互联网,称自己原本希望得到的是一艘宇宙飞船或一辆会飞的汽车,却最终得到了一个 140 字的推特。互联网是很牛,但是互联网很多事干不了,而今天人工智能可以研究蛋白质的结构,可以让自动驾驶、无人驾驶成为可能性,包括推动机器人的发展。

所以这是我第一个分享的内容——人工智能应当被视为一种赋能工具。之前一个经济学家陈龙发表过一篇文章,我认同他的观点。过去,互联网常被视为一种「颠覆性」力量,我也写了一本书叫《颠覆者》。但在 AI 时代,我们必须承认,AI 是赋能者,而不是单纯的颠覆者。至于它到底能否颠覆,这个问题可以以后再讨论。

关于未来的六个趋势:

网络上有很多关于 AI 将颠覆各行各业的焦虑文章,但我认为最重要的是,AI 正在把所有行业、把所有赛道都重写一遍。所以这可能是各位和我们最大的机会,所以不要刻舟求剑。

先说几个预测/趋势:

第一个预测是AGI(通用人工智能)和超级人工智能发展放缓。我曾经非常看好 AGI 的前景,甚至觉得它会在 2025 或 2027 年出现。不过现在看起来这个发展步伐正在放缓。

周鸿祎在极客公园 IF2025 创新大会|图片来源:极客公园

 

这两天 Ilya 有一个新的演讲,但是 GPT5 还没发布,包括最近出现的一些新模型依然侧重于多模态能力的提升,尤其是在编程和推理能力方面。OpenAI 最初目标是幻想构造一个全宇宙超级无敌通用人工智能,能够在各个方面超越人类,现在我觉得这个事在逻辑上不太成立。

过去很多人认为,Transformer 模型模拟了人类的多层神经网络推理,只要提供足够的计算能力和数据,AGI 就会「自然而然」地出现。但是从现在来看,Ilya 承认互联网上能用的数据用得差不多了,好像 AGI 也没有到来。

有人说不是可以合成数据吗?合成数据是能解决一部分问题,像数理化的推理合成数据可以。但是有个问题是,人类知识往高处走,越泛化还是越专业?当你从硕士到博士,再到教授,再到院士时,科技树的走向通常是越来越专业化。

比如说如何写一个操作系统,如何造一个战斗机?如何造一个航母?如何造一个发动机?这种知识并不在互联网上,不是靠互联网阅读足够多的网页和八卦就能够掌握的,而且现在合成数据不能涵盖这个领域。

有人说 O1 推理能力很强,但是 O1 没有那么神秘,其实国内已经有好几家公司做出了类似的东西,核心就是通过思维链和强化学习,让模型进行多次推理,并在得出初步答案后,反向反馈,检查是否有错误。甚至我们试验过让百度先给答案,阿里的来批驳它,头条来收拾残局,最后 360 和和稀泥。你们可以试一下 PlayGround,就让国内大模型互相 PK 一下,每个智力都会提升很多。

所以 O1 的推理能力不细究了,我的观点不代表真理。不过 O1 的推理能力比较难泛化是一个问题。因为要做强化学习就要有价值函数,价值函数就是得先判断对和错,数学题倒是挺容易判断对和错的,但是如何写一个操作系统是一个好的操作系统,甚至说问题再小一点,如何写一个浏览器,它的价值函数怎么判断?

最后 AGI 我觉得一定会来到的,但是可能不是在今年明年。

第二个趋势:大模型进一步发展,无论训练还是推理,都在往专业化发展。

除了少数几家巨头公司,许多其他公司也在往更加专业的领域发展。王小川转向医疗领域,但还是有点宽泛。最近很多人讨论的 MOE(专家混合模型)架构,实际上也是通过多个专家模型来组合能力。

我最近重新思考了谷歌的战略,突然发现谷歌的战略似乎有些后来居上的意味。大家可以想想,DeepMind 这家公司开发的 AlphaFold 在蛋白质结构解析方面几乎无与伦比,AlphaGo 也曾击败了人类围棋的超九段高手。但我们并没有看到 AlphaGo 能写诗,AlphaFold 能解奥数题,这些系统有其局限性。包括 AlphaChips,它专注于芯片设计,据说已经超越了人类设计师。那我们为什么还要追求一个既能写诗又能解奥数题的大模型呢?

第三个趋势是模型越做越小。一年前如果站在台上我肯定不是这个观点,大模型刚出来时,大家都在比拼参数量:你有千亿,我有万亿,大家普遍认为只有参数越大,才能带来更多的能力。

但经过这一年的发展,很多小规模参数的大模型架构开始崭露头角。小模型的定义变得越来越模糊,实际上我们正进入一个模型轻量化的时代。最典型代表是面壁智能,他们名字起得土一点叫小钢炮。

包括今天模型要上手机,苹果在手机上也会有一个非常小的模型,微软也在探索 1B、2B 参数规模的模型。所以模型不一定越做越大,因为越做越大的话就变成马斯克的游戏了,他确实有钱,一说就是 10 万卡集群,要买个核电站,如果模型都是这个玩法,那跟大多数人就没有太大关系。

第四个趋势:训练数据质量提高。过去有一个误区,大家觉得模型越大能力越强,但还是面壁智能提出一个能力密度的概念,实际上是知识密度,就是大家发现过去以为模型越大,能力越强,才会涌现。但现在发现模型虽然小,只要知识含量高、知识纯度、知识质量高,也能展现出强大的能力。

比如把大模型想象成人,有两个大学同学,一个特别聪明,脑子容量特别大,天天在网上看八卦,你问他谁跟谁出什么事他都一清二楚。另外一个同学大学一年级只做高数题,就把高数 3000 个题做得滚瓜烂熟,谁的高数推理能力强?一定是后一个同学,但是你问他汤姆汉克斯的妈妈是谁,他可能回答不了这个问题。

现在,全球做大模型的人都意识到这个问题了,我们把互联网上的八卦拼命学进去之后,变成了一个快速问答的知识小能手,但是推理能力并没有特别强。所以 O1 走的就是另外一条路,它很多问题回答不了,但是不影响它的推理能力很强。

所以真正知识今天不在互联网,而是在很多专家脑子里,在很多公司内部业务流程里,那现在这些知识可能是通用大模型的厂商搞不到的。所以大模型的能力增强需要依赖其他途径。

小模型能力增强方法就是多推理几次,大家本来觉得 Scaling Law 碰到了障碍,大家以为老黄的显卡卖不动了,又发明一个方法——不依赖快速思考,而是通过慢思考来增强能力。慢思考并不是让模型立即回答问题,而是让它自己在内心中反复推理,消耗更多算力,这也能显著提升小模型的推理能力。

吴恩达老师有一次讲:如果我用 gpt 3.5+一个 Agent 框架,能力可以超过 gpt 4.0,开始我没有理解什么意思,后来发现当大模型通过快速思考直接回答问题时,其答案质量可能不如通过一个较小的模型,先进行反思、反复推理,并自我纠正后得到的答案。

最后一个好消息,大模型发展趋势之五——成本越来越低,现在行业里还有人整顿开源好,闭源就好吗?腾讯混元都开源了,千问开源一直做得不错,开源越做越好,能力上来了,开源成本基本为 0,尽管训练和推理的成本依然存在。

国外和 GPT4 等效的模型价格下降了数百倍,国内抓紧时间用他们的 AGI,比如说混元开源了,你自己部署一套,自己成本比直接接他们 API 都要贵很多。

他们投了那么多 Infra,投了那么多显卡,三年以后就折旧折完了,不用也是白费,他们给的 API 价格都是低于成本价,所以大家可以用起来。

第六个趋势,InfraStructure 投资已经差不多告一段落。为什么?看看英伟达股价就知道,英伟达卖了无数显卡。为什么有人在怀疑人工智能有没有泡沫呢?实际上大家花了几千亿美金买这么多显卡,实际上是给了一个信号——基础设施已经准备好,该做应用了,这一点很像互联网第一次泡沫破碎的时候,思科卖了无数路由器,各个国家拉了很多海底光纤,但是没有应用,第一轮互联网泡沫就破碎了,而基于这些基础设施的很多互联网应用做了起来。

目前开源能力和 API 能力肯定是准备好的,所以 2024 年是应用场景之年,2025 年是 Agent 之年。

我们现在谈大模型,很多事混在一起谈不清楚的,我还是希望分成两条路:一条是 AGI 之路,这条路承载了人类梦想,让有钱人继续卷数据、卷算力,朝着万亿十万亿参数发展,最近 X.AI 三个月就搞了十万卡集群,中国还是万卡集群。但是这条路跟大家没什么关系,反正大家都面临人生痛苦的问题就是没钱。

他们有些公司就没有搞清楚自己究竟是做 AGI,还是在做应用。这条路不要摇摆,要坚定地选择一条路走到黑,别做着做着说我是在大模型的通用能力,做着做着说我又做了一个场景应用来证明我的能力,这完全是两件事情。

我有一个观点,我们都说大模型要掀起一场工业革命,但怎么掀起工业革命呢?就得把大模型拉下神坛,大模型要往产业化、垂直化、场景化、应用化发展,所以做场景、做产品,我觉得一点都不丢人,正因为有无数的应用,互联网才能起来,否则互联网光靠海底光缆、靠思科的高端交换机,是没有任何意义的。

AGI,我今天就不谈了,这是少数巨头的游戏。我这次去美国也见了一个 VC,已经没有人在投做通用大模型的公司了,Anthropic 后面是亚马逊,OpenAI 背后是微软,再加上老黄、马斯克等,你能数得出来在美国做这样的公司不会超过 10 家,而且这个格局确实对「门票」的要求太高。我们国内有些创业者还是很聪明的,表面上看来在做通用大模型,实际上他的钱都拿来做投放了,这是非常 smart 的做法,因为投放好歹能弄来用户数据,你说预训练,训了大模型,还不如开源微调的好,这钱不是白花了嘛。

走应用之路,我的意思是让大模型从「原子弹」变成「茶叶蛋」,别再卷算力、卷数据、卷参数了,说白了,我觉得走应用之路的一个非常重要的理念,就是不要期望大模型什么都能干,我们前面被误导太久了,大家陷入了迷思,天天出来「秀肌肉」,就是大模型什么都能干,好像无所不能才叫大模型,你公司里雇过这样的员工吗?请了一个司机,又能当保镖,又能当司机,又能当保姆,还能做饭,还能给你揉脚,还能写程序,还能做公关,还能拍短视频,还能剪辑,要碰到这样一个人,他自己就创业了。

所以要做专业大模型。去年看了一个电影,有句话说的特别真理,说「解决问题的关键,就是找到关键的问题」,我觉得解决问题的关键就是放弃对大模型的执念,不要高估它的能力,当然我们也不低估它的潜力,让一个大模型就干一件事,换这样的思路去想一想,会发现模型更小、算力更少、成本更低,而且应用难度更低。

大模型是能力,不是产品

所以大模型是什么?我从一开始赌错了很多东西,唯一赌对的东西就是我一直不相信大模型是产品,我也一直不相信大模型是操作系统,你把什么东西比喻成操作系统这就坏了,全世界就需要 3-4 套,还有你什么事?

大模型不是操作系统,有人老喜欢拿云计算做比喻,我后面会讲到大模型也不是电力,大家一想到电力就想到了云计算,就应该在云端,但大模型更像一个电动机,所以大模型是能力,不是产品,能力是什么概念?

周鸿祎在极客公园 IF2025 创新大会|图片来源:极客公园

 

能力很好,但是要结合应用场景才能产品化,大模型是要藏在产品后面,所以我最喜欢的产品经理是谁你们知道吗?你们喜欢周星驰吗?看过他很著名一部教人怎么做产品的电影吗?叫国产《007》,我就经常反省,它里面最经典的例子是这看起来像一个刮胡刀,实际上是一个吹风机。

今天无论各位女士用的吹风机,还是男士的刮胡刀,还是电牙刷,还是扫地机,里面都藏着一个电动机,但你意识到电动机的存在吗?不存在。会有人买个电动机回来接上电说:来,给我转个 27000 转吗?也不会。

实际上你买了一个电动机你要装上轮子才能变成汽车,装上扇叶才能变成鼓风机,装上齿轮才能变成传送带,大模型这个东西挺庸俗的,它就是个电动机。

我今天讲的就是要把大模型拉下神坛,不供着它,不顶礼膜拜,好像干大模型就积极伟大,其实这东西要变的很庸俗。

当年 IBM 做出超级电脑之后,就跟今天的超算一样,说全世界五台就够了,最后超算真正没有掀起信息革命,掀起信息革命的是谁?是 PC。PC 最早从苹果 2 开始算,到 IBM PC 到微软的成功,把这玩意做得跟玩具似的,今天我们做的服务器端都是 PC,PC 进入了百行千业,进入了千家万户,这才能掀起工业革命。

AI 能不能颠覆?肯定最终是能颠覆的,因为啥都能颠覆,你把东西做的比别人便宜很多也能颠覆,你能在晚上不需要开仓储,在网上直播带货,一分钟能卖出 1 个亿的东西也叫颠覆。

但是从 AI 来讲,我的建议是不要一上来就想着颠覆这个、颠覆那个,先想想赋能,就是当你有了一个电动机之后,如何取代原来的蒸汽机,如何取代原来手工干的事情,能不能润物细无声的嵌入到应用场景中,不是不可以做新东西,但这里面最大的机会是有了 AI 之后,有了生产力提升、生产力赋能工具,很多产品可以重做一遍。

走应用之路,我觉得要对大模型的能力重新做一个划分,因为我觉得过去两年里面,我们都被自己误导了,你看各公司一说大模型,出来讲案例,都是讲它的两层基本能力,都是讲写诗作画写文章、阅读理解、翻译、编程,实际上我把这个定义成它的基本能力。

比如说大模型的 AIGC 这面,有可灵、海螺、vidu、即梦,这两天 Sora 出来了不过没有那么惊艳,这些模型是落在创作和营销能力。但是多模态能力值得大家关注,这两天 Gemini 2.0 它把多模态能力展现到极致,但是多模态能力和 AIGC 还是要划分开,因为两个用处不一样,所以要结合场景,而不是笼统地说能够处理图象、视频、声音是多模态,原来我认为能产生视频图像也是多模态,这个概念不一样,我觉得理解非常重要,因为它是让大语言模型从看见、看懂到理解的重要差别。

业务能力的对接也至关重要,特别是如何与企业的核心业务相结合。比如,情报分析、知识管理、业务自动化以及组织协作等,这些能力过去常常被忽视,但它们正是人工智能能够提升企业生产力的关键领域。特别是在自动驾驶这种新兴产业里面,具身智能这些创新能力,实际上提供了新的工作范式。

还有一个场景是 AI for Science,在座诸位也有人在这个领域可以思考一下,未来科学研究可能有一些专业模型来辅助,AlphaFold 就是是一个例子。

所以如果有人在这个基础上把模型能力分得层次更细,分得更多是没有问题,用户购买的并不是工具本身,而是一个切实能够解决问题的结果。所以大模型过去两年里面,大家自嗨太多了,不断说这个能力那个能力,今天要搭一个桥,而是要看这些能力到底给企业、用户创造什么价值。

六个方向里,有哪些机会?

我大概列了六大应用方向,看看大家是不是能够在这六大方向中寻找创业和创新的机会。

第一是人人智能。

我一直认为 AI 是人类有史以来发明最重要的生产力工具,除了对企业提升生产力之外,对个人来说,我觉得它可以解锁你很多不具备的能力,甚至让我们个人具有超能力,比如说不会做音乐的也能产生音乐,不会作画的也能把想法变成海报,所以大模型要提高每个人的生产力,打造个体的超能力,这里面有很多机会。

大模型在第一步,尽管大家都想着做工具的人挺吃亏的,赚工具的钱还不如做社区的,做社区有网络效应,工具的话用完就走,但是大模型首先工具属性还是非常重的。所以在这一块,大家可以想一想,当然不要只是去卖课,卖课是不成功的模式。

360 在这做的是纳米 AI 搜索和 AI 办公大全,是瞄准了帮助个人来提高个人获取信息、分析信息的能力,这一块有很多机会,就看能不能深入研究,人还有哪些能力可以被 AI 去提升。

第二个方向:从万物互联走向万物智能。万物互联的观念,IoT 的概念已经很成熟了。现在 AI 的发展从云端到终端,从云端到边缘,模型越来越小,现在像苹果手机的策略是手机上有个小模型跟云端模型星座,荣耀的照明说,手机算力、芯片发展到 2027 年手机上上个百亿的模型是没有问题的。除了汽车,明年以后没有大模型上车的车可能卖不掉了,联想也在给 PC 上模型。

我们想的更广一点,所有的智能硬件如果都跟大模型发生关系,但是不是把一个通用大模型连上来,而是在所有智能硬件上有一个专业模型增加一两个能力会怎么样?

比如说半夜里肚子饿了,打开冰箱找瓶啤酒,冰箱能够跟你说话,它看见你,它告诉你太胖了,不要在晚上再喝啤酒了,而且它会自动给你的监护人发个短信。

那有人老说要做新的硬件,AI Pin 大家都知道比较失败了,他们画蛇添足非要带一个投影仪,还要做手势,手机被证明是人类比较能接受的随身携带的物品。还有戒指、手表、眼镜,Meta 最近做了一个眼镜,也是蛮成功的,我也准备推出我们的纳米眼镜,这不是玩笑,因为苹果做 Vision Pro,老是想做 VR 和 AR,这个搞得眼镜太重,功能太多。但是大家发现如果眼镜跟 AI 搜索结合起来和拍照结合起来,变成轻量级的,据说 Meta 眼镜卖了好几百万副眼镜了。在大模型的推动下,元宇宙、虚拟现实有可能梦想成真,大家想想智能硬件是不是会有机会?

第三个机会是,在中国做事情要顺势而为,国家很重要的战略是传统产业数字化,有一个词叫数转智改,也是新质生产力,大模型特别适合提升打造新质生产力。

如何帮助企业数转智改?大模型可以发挥很重要的作用。现在通用大模型肯定不适合给企业去用,我问过很多企业家和政府领导,通用大模型因为并不了解内部业务,所以说的话比较泛泛而言,而且这种聊天你们如果做过企业级应用就知道,这种 Coplot 的模式是企业最不能接受的。如果你们做过企业级应用就知道天天请一个聊天机器人回去,头三天还能有兴趣聊,长期对工作效率提升没有意义的。

在企业内部我也讲不要幻想用一个大模型解决所有的问题,企业内部将来一定是多个业务智能体的组合,背后是多个业务大模型,这目前是最大的市场,而且这个市场需要你沉到行业里,沉到客户里,,因为很难有通用的解决方案,这里面提供了比 SaaS 更大的机会。

第四个方向是未来和新兴产业。

比如说生物医药、具身智能(人形机器人)、低空经济(无人机),无人机是颠覆式的创新,还有就是智能网联车的自动驾驶到无人驾驶。这个行业里面如果不用大模型,这些行业都做不起来,因为大家想想为什么最近特斯拉 FSD 可以实现端到端的自动驾驶,端到端有两个解释,我们学术上是说基于训练学习的方法取代了基于规则的方法,用一个黑盒子系统,从输入到输出。也有人把它解释为从一个停车位到另一个停车位,不知道哪个解释更好。

第五个机会是打造科研新范式。大模型工作范式很简单,就是给我好的例子,经过足够学习之后就能产生举一反三的涌现理解,以后就能模仿;而基于规则,我曾经跟做自动驾驶的人聊过,他们大概自动驾驶的规则,像萝卜快跑就是基于规则做的,据说规则有几十万条,所以你要想吓唬一个萝卜快跑,只要把自己化装成熊猫在马路上过,我打赌百度肯定没有写规则,如果遇到熊猫在路上是撞上去还是应该停车。但是我在学驾照过程中深刻领悟到人的泛化能力,无论是否放个纸箱子,还是放一个塑料墩子,我都能灵活地绕过去。

包括具身阶段没有大模型的加持也是不可能的,原来深圳有一家公司叫优必选,大模型出来之前,它快成玩具公司了,他们机器人主要在表现团体操,但是有了大模型之后,这个公司就迅速地迎风而起,所以新兴行业对大模型的借鉴是非常多的。

AI for Science,我只能说个方向,这个具体我也不懂,但是值得关注,就是它是科研的新范式。

大模型的本质在于对语言、图像、视频和声音的理解,但其核心原理是将训练数据转化为一种序列,称为 Token。虽然「Token」这个词的翻译可能存在歧义,但从本质上来看,如果你能将需要处理的数据转化为 Token 序列,那么就有可能通过预测下一个 Token 来获得有意义的结果。这也是为什么 AlphaFold 能够成功的原因。它将蛋白质的结构视为一种序列,而人类已经研究出这些序列的规律,可以作为样本进行学习和微调。接着,AlphaFold 使用 Diffusion 方法随机生成各种可能的结构,并对这些结构进行判断。

这种思路不仅可以应用于蛋白质结构预测,也可以扩展到其他领域。例如,天气预报、股市预测、交通分析,甚至工业领域中的生产控制,都可以通过将行业数据序列化来进行处理。这时,并不需要依赖大语言模型的语言处理能力,而是要找到一种方式,将行业数据转化为可以进行序列化的形式。一旦数据能被序列化,Transformer 模型就可以用来尝试预测和推理。

我曾经发过一个关于人类长寿的视频,提出人类有可能活到 150 岁。虽然这个观点听起来似乎很极端,但美国在医学领域的观点也支持这一想法。英伟达的创始人黄仁勋多次举例提到,人的细胞最终也会以一种序列的形式表达,而人类基因的表达同样可以视为一个序列,甚至新药分子的分子结构也能以序列的方式表现。研究人员认为,只要能够将某个领域的内容转化为序列,Transformer 和 Diffusion 等技术就能进行有效的预测和推理。

在中国,关注这个领域的人还相对较少。微软研究院的前院长马维英博士,现在在清华大学专注于医学和生物领域。我相信,未来会有更多的领域等待着通过 Transformer 和类似的技术进行改造和创新。

第六个场景,就是安全场景。

为什么要加这个场景?因为我是做安全的。这里面谈的主要是 AI 安全。在很多场景中都涉及到大模型的应用,AI 的安全性显得尤为重要。顺便提一下,最近 Ilay 提出了一些耸人听闻的观点,他认为未来的智能必然依赖于推理,而推理会带来不确定性,不确定性会导致幻觉,幻觉进一步演变为意识。因此,他强调了人工智能安全性的问题。但我个人认为,专业领域的大模型不太可能产生意识,就像你雇佣一个专业员工,他不太可能会摧毁你的公司业务一样。有超级人工智能才会对人工智能的安全构成终极威胁。通用人工智能方面只有几个问题:

一是数据隐私保护和数据投毒污染的问题;二、注入攻击的问题;三、幻觉;四、AIGC产生的虚假信息问题。

我们提出的思路是以模制模,用魔法对付魔法,用专业安全大模型对付安全问题,所以安全问题不是今天重点。

如今,发展专业大模型的核心已经不再是大模型本身,而是找场景。找场景对大家最大的挑战,是要对某个行业、某个业务有深入的理解和了解,如果业务不了解,天天在玩大模型,天天用大模型做一些屠龙之技,在炫技,这个很可怕,再怎么炫,OpenAI 明天发布一个新功能,把技术一下就覆盖了,OpenAI 和这些巨头今天他们最缺的是行业和领域知识,这在美国也不例外,比如说现在美国有很多创业公司是悄无声息的在做金融的解决方案、医疗的解决方案。

我简单提出四个发展方向,或者说四个「十倍」目标:

一个方向是对上,满足老板和高管的需求,比如说这次张鹏推荐的做面试的一家美国公司,他们两头通吃,他们做了两个领域,先做人人智能领域,做了一个作弊工具,你面试的时候能够帮你在旁边提示如何回答面试官问题。他们又做了一个数转智改的应用场景,帮助老板解决如何利用机器,HR、主管面试个人的问题,所以想想都很美,大家都用他的软件,机器人面试机器人,但他挣了两份钱。

第二个方向是对下,是面向员工,看员工有什么痛点和刚需?

第三个方向是往内看,企业内部如何提高自己的效率,内部有什么管理业务流程;

第四个方向是往外看自己的产品和服务体系能否找到企业的卡点,卡点的一个衡量指标是说能不能减少 10 倍的人力、降低 10 倍的成本、提高 10 倍的效率、提升 10 倍的体验。

我跟河北钢铁企业在谈的时候,谈到群体智慧,过去你想干、干不了的事,今天大模型能干了;过去你想解决、解决不了的困难,今天大模型能解决了,就找这种卡点和堵点,这就是大模型应该发力的地方。所以一定要细分场景,包括要把业务流程拆解的足够细,大模型初期的时候,我至少做了 100 个失败的案子,你们别听今天很多人上来说六小虎接了多少大模型的例子,其实很多项目都难以交付,我也吃过这种亏,刚开始大家对大模型都极其崇拜,有人来找我说,鸿祎,我们做个养猪大模型,也会有人说我们做个钢铁大模型,还有人说做个医疗大模型,你反问他一个问题,大哥,你要解决什么问题?你把他给问死了,因为都不知道要解决什么问题怎么做?最重要的是一定要细分场景。

举两个例子,河北省的钢铁是最发达的,大家都知道中国的钢铁含量不含河北,河北的钢铁产量不含唐山,唐山的钢铁产量不含迁安,我们就到迁安去了,他们最开始也说要提升钢铁的生产效率、提高钢铁的质量,我们都认同这个目标,但他们说要做钢铁大模型,我想没有钢铁大模型,只有细分的场景,所以他们就把钢铁的整个过程列出来了,把流程划成了 142 个场景,分的特别细,这 142 个场景,可能有些场景都能单独训一个大模型出来,或者单独做一个智能体,你要分到这么细的程度才可能解决传统企业数转智改的问题,否则只做一个问答、只做一个 Copilot、只做一个办公,这些通用方案都可以解决他们的问题,如果真的要直接提升生产力就得分析到这种程度,但这种程度,我觉得巨头一个都干不了,实在太细致了,OpenAI 也干不了,因为它没有这样的数据和知识。

再举个更简单的案例。这次我在美国见了一家跟王小川做同行的事情,但做法是不一样的,你们可以听听差别,对比一下,觉得是小川的好,还是这家公司的好,这家公司是中国小伙子创办的,他们跟斯坦福医疗中心签了一个约,美国看病跟中国看病不一样,我一会要去看病,直接到医院挂个号就行了,我想到斯坦福医学院挂号,人家不给我挂号,说需要你的家庭医生或者社区医生先看过,然后发传真,把你的病情情况介绍给我们,我们再预约某一个时间来看病,他们把这个场景分的很细,发现了三个卡点或者三个堵点:

斯坦福医学院有 100 多人的队伍每天收传真,美国现在还在用传统的传真,传真才有法律效率,医生写字是全世界最潦草的,所以看传真的人都很费力,所以要打电话来回多次确认才能把你登记到数据库里,还要给病人打电话预约看病的时间,病人看完病之后要到保险公司报销,这也是一个挑战。

保险公司会拒赔,他们要请很有经验的专家有理有据的写一个为什么我这个病,根据我的诊疗过程,写最后能够报销多少,这家公司做了三个 Agent,相当于是三个大模型,第一个是多模态大模型 OCR 识别传真,现在比人做的好,可以把 100 多人看传真的队伍给取消掉了。

第二个场景是数字人用语音和病人打电话,因为这个打电话不是通用客服,是来回预约时间。

第三件事,他们把医院里历史上给病人写过的十几个万份给保险公司的报销报告训练成一个知识模型,人家不是一个通用写作产品,不是说给我写一篇小说,就是专门写如何给保险公司报销的。

他们就做这三件事,就是一个很了不起的项目,这就是典型的帮助传统企业数转智改,为什么医院愿意付钱?医院能算出节省的人力、能算出提升的效率、能算出工作量,这和我们原来做工具有个最本质的不一样,比如说很多时候企业买了我们的软件,为啥中国的 SaaS 付费一直做不起来,一个很重要的原因是你的软件有没有也不是特别重要,所以提高效率也很难算。

原来我们做的软件是什么概念,还是人的工具,但今天AI在这些关键点上,AI 基于一个大模型,封装出来了 Agent,实际上是一个数字专家,是一个数字员工,完全可以直接取代人的工作能力,这个企业的付费意愿就比原来提升了很多。

如何做好专业大模型?

做专业大模型,最重要的有这几个点:

1. 知识管理。很多失败的例子,是因为客户的数字化做的不好,没有足够多的知识,比如说斯坦福如果收到的所有传真都销毁掉了,没有过去历史的数据做训练,这个事不一定能做到,如果过去写的保险公司的报告都没有了,可能也无从训练,所以知识非常重要。

2. 业务大模型打造。这就比较容易了,用通用大模型进行蒸馏变成基座大模型,而且从现在的趋势来看,微调用的越来越少,RAG 用的越来越多。

3. 构建智能体。Agent 就不展开讲了,因为 Agent 过去是一个技术辅助,但今天 Agent 成了我们今天给企业做做应用的核心诉求,最近我准备把我做的 APP 都改成 Agent,你卖一个 APP 给企业,听起来就像卖了一个软件,软件不值钱,但是我的 APP 全都变成了 Agent 之后,我卖的就是数字人,你雇一个人得 2 万块钱,我这一个月才 1000 块钱,多便宜,价值感马上就不一样了。

4. 融合工作流。为什么大家现在谈 Workflow?你们都知道 comfyui,它的功能强大,就是因为它知道很多节点只能完成单个任务和单个技能,很多时候我们要把技能组合起来才需要 Workflow,所以 Workflow 会变的很重要,因为没有 Workflow 你就做不出复杂的智能体,就做不出合作的智能体。

5. 知识管理。大家要有思想准备,这比训大模型还困难,真到一个企业之后,发现他的知识都是暗知识、浅知识,有些知识藏在大数据里,需要把大数据进行加工,有的知识存在人的脑子里,有的知识存在员工的硬盘里,有的知识存在工作流程中。比如我们经常说一看你就是新员工,一看这个人就是老员工,为什么?因为他有很多公司潜规则的知识,如何把这些知识能够训到你的大模型里去,如何能搜集出来?所以我提出一个概念叫知识捕获,采集都不一定采集得到。

6. 业务大模型打造,要做 RAG。

7. 构建智能体。智能体最早是调 API,我问个问题向大家请教,最近 Claude 推出 MCP,我的理解是用大模型做一个黑盒子,自己调 API,我觉得这个模式应该不 work,最好的模式还是应该由 Agent 来调 API,Agent 来调大模型,由 Agent 来做整体的协作,为什么?

因为 Agent 有个很重要的价值,要实现慢思考能力,这个能力是由 Agent 多次调一个或调多个大模型,当多个大模型协作的时候,Agent 它负责发起协作并在大模型之间进行有效的调度。

2025 年是 Agent 之年,包括把日常重复性的业务流程形成 Agent,自主性的响应。

8. 融合工作流。可以认为是 Agent 操作系统,就像今天人会用钉钉、企微,另外我听到上一个 Speaker 讲一人公司、两人公司,我这里吐槽一下,我认为不可能,别被这种东西忽悠,你们读一读赫拉利的书,智人之所以成功,因为智人是最懂得群体合作的,人一定需要团队合作。

所以我们企业级的,今天钉钉也好、飞书也好,并不是为 Agent 打造的,还是为人打造的,这在未来也是一个巨大的方向,相当于是 Agent OS,如何把 Agent 工作流能够做好,当然我不能透露我们在做。

我们有一点要向美国的创业者和投资人学习的,他们编的词特别打动企业客户。他们在重新定义 SaaS,SaaS 原来的定义是什么?Software as-a Service,现在他们重新谈了一个新概念,叫Service as-a Software,这就像绕口令一样,什么叫 Service as-a Software 呢?

过去有很多事是软件干不了的,或者软件只能起到辅助工具的作用,比如说看传真,虽然有了传真机,还得有人在读传真,往数据库里录入,写保险公司报销报告,或者律师给你写个文件,都是人写的,这个市场叫 Service 市场。

美国的 Software 市场大概是 1 万亿美金,但是 Service 人力市场是 10 万亿美金的市场。有了大模型之后,在一个细分的节点上,它可以取代人,或者可以该原来干不了的事,可以解决原来解决不了的困难了,意味着这个 Service 可以用软件来干了,意味着软件从原来 1 万亿美金的市场在往 10 万亿的市场上在侵蚀,这给我们做软件的人提供了一个 10 倍的机会,从企业级市场到智能软件反攻服务市场。

过去我们交付的是软件,今天直接交付的是能力,换句话说,直接交付的是人力,我觉得未来 APP 还会在,看最近智能手机的演示,Siri 可以直接操纵各种 APP,甚至是智能体和 APP 最大的差别,APP 做的再牛,还是给人用的、是人的辅助工具,但 Agent 可以自主或者应人类要求独立地完成一个任务,换句话说,过去是工具辅助人创造价值,未来 5-10 年会变成AI直接创造价值,这就是各位最大的机会。

最近网上流传一个视频是在斯坦福的内部录像,主持人讲了一个故事,我可以把这个故事分享出来作为我的演讲结尾。大模型不是中心化云化的电力,大模型是去中心化的电动机。

周鸿祎在极客公园 IF2025 创新大会|图片来源:极客公园

 

他讲了最早工业革命在电动机取代蒸汽机,用了 30 年,为什么用了 30 年?因为蒸汽机一般的企业很难用得起,所以一个工厂如果有一座蒸汽机,蒸汽机给工厂里所有需要动力的地方都提供动力,但是蒸汽机是通过很长的连杆来输出动力,所以连杆的强度有限,不能太长,工厂的布局是以蒸汽机、锅炉房为核心,来做工厂的布局和业务流程的设计。电动机刚发明之后,老板只是把蒸汽机换掉,换等了电动机,效率一点没有提升,也没有产生额外的价值,因为所有的东西都没有变化。

后来经过了 30 年的技术发展,人们的意识和技术能力突然发现可以把电动机做小,今天小到一个电动牙刷里也是一个电动机,实际上它和小米汽车用的电动机是一个基因发展出来的,但是一个 27000 转蓬勃有力,一个就是给你刷牙用。

人们把电动机做小之后、做便宜之后,突然发现工厂里的动力不需要中心驱动了,变成单元驱动了,所有需要动力的地方装一个自己的电动机就好了,就像我说的,甚至工厂的格局都变化了,工厂可以变成不同的车间、不同的 Location,不同的 Location 之间可以用生产线、流水线连起来,工厂的鼓风机,包括纺织机都有各自的动力。

所以你们想想,如果不是这样的革命,如果我们家里买一个电动机,这电动机一方面给我们当风扇用,又给我们当吹风机用,一会还给我刷牙,还给我刮胡子,可以想象一下多可怕,买了一个大电动机,啥活都干…… 这样一来,整个工厂的业务流程、管理体系,甚至商业模式都逐渐地发生了变化。

如果这里把电动机换成大模型,是不是很贴切?我们干嘛一定要相信用一个 API 也好,或者用一个中心的超级无敌通用的大模型来解决我们在企业内部不同地方遇到的不同的业务问题呢?

现在大模型的成本很低,有开源的,有免费的,我们把每个大模型只干一件事情,就当风扇用,就当传送带用,就当鼓风机用,这种新型的架构是不是代表了大模型将来在企业和在行业内部的应用场景?反正我是相信的。

 

浏览量: 26

为什么 AI 需要一次 Web 2.0 式的革命?

大模型 AI 行业正在寻找 2.0 时代的入口。

因为 Web 2.0 的降临,就是上一轮互联网革命,最重要的爆发节点。行业在经历了千禧年的泡沫破裂后,很多人一度认为计算机对大多普通人「没有实用价值」。但随着 Web 2.0 革命,UGC、社交媒体开始出现,把所有人代入了「裂变传播」的时代,之后的智能手机、移动互联网革命,就建立在此之上。

自此之后,每一款互联网产品的成功,都与「参与性」息息相关,只有能调动用户的产品才是好产品。

但过去两年,大模型 AI 产品面临的,就是「参与」的难题。模型的性能越来越强,相关产品应用越来越多,但大多数普通用户,依然没有被调动起来。ChatGPT 完成了互联网历史上最快的冷启动,又最快遇到了增长的瓶颈,其他聊天机器人产的命运也大多类似。

很大程度上,今天的大模型 AI,需要一场类似 Web 2.0 的革命。通过降低技术门槛,拓宽开发生态,激发出有效的用户需求和产品供给。

11 月 28 日,扣子平台推出了今年最重要的更新,Project IDE。通过 UI Builder、应用模版,将 AI 应用的开发门槛进一步降低,且丰富了 AI 应用的交互范式,他们正在尝试将大模型 AI 应用开发代入「2.0 时代」。

 

01

为什么 AI 需要一次「2.0」更新?

 

要理解 AI 应用开发的 2.0 时代,我们需要先回到 20 年前。

2000 年以前,互联网还是一个类似电视和广播的「单向传播系统」。在 Web 1.0 时代,大部分人用电脑上网,基本只进行「浏览」,你可以阅读上面的新闻、文章,查询天气等信息。

这时的网页就像一张报纸,只不过设立一个页面的成本比发行报纸要低得多。所以很多人都可以建立自己的主页,整个互联网上网站的数量很多。

定义 Web 1.0 时代的应用是搜索引擎,因为整个互联网上有大量的网站,大家很难找到自己需要的信息,Google 通过关键词搜索和网页排序算法,建立了搜索引擎,人们就更容易找到自己想要的信息。

而今天的 AI 聊天机器人,它和搜索引擎在逻辑上有着很大的相似之处。它们的交互界面都是一个输入框,让用户输入关键词、提示词,AI 大模型生成内容的过程其实也就像一种「权重排序算法」,通过语言模型,把「权重最高」的词语提取出来,生成连贯的语句。

这里最大的问题在于,大部分用户,并没有自我挖掘需求的能力。在 Web 1.0 时代,他们可能并不知道自己想搜的是什么,在 AI 大模型的时代,他们又难以编写出完整严密的提示词。

所以 2000 年以后,第一轮互联网泡沫破裂,当时大部分互联网公司的用户和收入增长都不足预期,股价暴跌,包括雅虎在内的一大批互联网巨头都被时代重刷下去。

直到 2003 年后,MySpace、Facebook、Twitter 相继上线,Web 2.0 的时代到来了。

Web 2.0 让用户不再只是内容的消费者,而是成为了创造者,「社交媒体」的概念诞生,平台的内容量得到极大充实。与此同时,围绕各个社交媒体平台的「二次开发」也出现了,Web 2.0 时代的社交媒体,往往会开放很多产品接口,让开发者可以基于这些产品,二次开发出更多功能,满足用户不同的需求。

其中最典型的案例之一就是 Twitter。早期的 Twitter 只是一个短内容发布平台,但因为有着开放的第三方开发生态,Twitter 迅速成为了「独立开发者的游乐场」,各种第三方客户端、自动化 app 都被开发出来,使 Twitter 在早期竞争中,战胜了一大批对手。

2008 年,Twitter 的第三方客户端 Twitteriffic 成为了 App Store 前十热门应用

回到今天,大模型 AI 面临的状况其实与 Web 2.0 的前夜非常类似。当下大模型已经有了强大的生成能力,但大部分用户利用它的效率依然不高,很多基于大模型能力的产品应用已展现出强大的能力,比如针对视频的多模态实时字幕生成、并可以翻译,但这显然只是 AI 能做到事情的冰山一角。

特别是随着大模型训练效率的提升,同性能模型的运算成本已经在飞速下降,AI 产品化的展开面正在被拓宽。

 

02

为 AI 应用开发「搭一座桥」

 

今天,AI 产品开发的主力军是技术人员,其中有独立开发者。

造成这种情况的主要原因是,AI 产品的代码往往并不复杂,开发工作量不大,很多功能都是通过大模型的接口实现。但这个代码门槛依然存在,过去「产品经理 + 程序员」的开发模式反而不适用了。第一批 AI 创业者里,有很多都是自学代码,以实现从 0 到 1 的产品开发。

这种现状意味着,AI 开发社群里还有很多潜在力量,没有被调动起来。他们可能是产品经理、设计师,更懂产品需求、设计交互,但不一定有代码经验。如果能在大模型平台和他们之间搭一座桥,进一步降低 AI 产品的代码门槛,就能给 AI 产品开发带来更大势能。

这就是扣子过去一年花精力最多,致力于实现的事:帮助创业者以最快的速度实现从 0 到 1 的应用搭建和迭代。

扣子实现的最大改变,就是对「交互」的颠覆,通过 UI Builder,AI 产品的交互不再局限于对话,而是可以加入更多按钮、菜单、选项,来规范用户输入。

当然,对话式交互是大模型 AI 应用最重要的特点和优势,因为自然语言是人类最天然的表达方式。但在很多高频、标注化的场景里,对话不应是唯一的交互方式。

比如在一个行程规划的 AI 应用里,模型需要参考的目的地、旅行时间、人数、预算……如果只用对话式 UI,就需要多轮追问,用户体验反而不好。这里完全可以固定好一个模版,形成菜单、选项,供用户填写选择,通过这种方式避免 prompt 里的信息错漏。

同样的逻辑同样适用于写作助手应用,针对不同体裁的文章,可以直接提前进行功能划分,并提前在写作要求等要填写「提示信息」的地方填入范例,这样用户只需要基于范例修改,就可以输入更高质量的提示词。

提示词的输入效率和质量,正是目前 AI 产品面临的最大难题之一,大部分用户都很难编写出详尽完整的提示词。扣子通过在开发端加入 UI Builder,基于工作流的开发思路,将很多提示词的编写都拆分成产品功能,为 AI 产品铺好了台阶。

除此之外,扣子还在尝试解决 AI 产品的另一个难题,记忆。

目前大部分 AI 产品的用户数据库,往往都比较简陋,且有明显的「稀释」问题。用户在一个对话的前半段输入的信息,随着对话的不断进行,会迅速被稀释,AI 大模型会忘掉这些关键信息,最终偏离用户最初的意愿。

针对这个问题,扣子在工作流中加入了知识库写入、SQL 数据库查询的能力,用户输入的内容,不再只是模糊的 prompt,而是可以成为确切的数据,被写进应用。这里的数据可以是确切的时间、日期、行为,也可以是用户的特定想法,输入后这些数据就能够被反复调取,且不会被神经网络稀释。

比如之前一度很火的 App「胃之书」,用户可以通过拍照,让 AI 来记录每天的食谱,分析营养摄入。在加入了数据读写能力后,App 就可以将每天的食谱信息、营养,以数据的形式储存,之后进行多次调用。比如用户就可以知道自己每周、每个月的饮食健康程度,回顾自己「这个月吃了几次薯条」,「有多少天热量超标」。

大模型 AI 的一个特征,也是弱点,就在于它输出的内容的保质期太短了,需要转化为「数据」,才能为用户提供更长期的效用和价值。通过扣子的 UI Builder 和数据库能力,独立开发者可以将 AI 大模型与更多场景结合,比如「运动书」、「旅行书」、「星座命理书」,通过完整长效的前后端,形成长期的交互循环。

而这些,还只是当下扣子平台新功能的几个应用范例。这些新的开发功能,将为大模型 AI 应用开发「搭一座桥」,弥合模型和用户之间的距离,解锁更多 AI 应用的可能性。

 

03

AI 应用的未来需要「UGC」

 

Project IDE 的推出,不仅意味着扣子搭建起了一个更完整的 AI 应用开发平台,还降低了 AI 开发的门槛。

通过「AI 应用模版」和「工作流」,扣子已经能够实现近似「零代码」的 AI 应用开发。即便是没有代码能力的爱好者,也能够通过扣子可视化的工作流界面,将不同的 AI 功能组合在一起,还可以对功能模版进行修改。

扣子工作流的界面,有点像当年 iOS 的 Workflow 应用,或 IFTTT,它们分别是针对 iPhone 和线上互联网服务的自动化工具,通过图形化的界面,将不同的软件功能整合到一起,形成一个新的「程序」。

通过这种门槛较低的「二次开发」,即便是没有专业代码能力的用户,也可以做出满足自己的个性化需求的程序,且还可以互相分享。某种程度上,这就是应用程序领域的「UGC」。

而现在,扣子通过对 AI 应用模版的可视化,也打造了一个「人人可参与」的 AI 应用生态。比如用户可以下载一个练习英语写作的 AI 应用模版,通过修改其中的提示词,将它进行更细化的调整。比如要求它着重优化语法错误,或者是着重将过于简单的用词换成更专业的词汇……当然也可以把练习英语换成其他语言。

目前扣子平台上已经有上百个模版,可供用户调用、编辑。因为这些模版的核心往往都是一系列流程加上一个或数个「提示词文档」,所以它们的可编辑空间很大,理解门槛也并不高,即便是普通用户也能上手。

而且,「应用模版」本身也是扣子开发生态的一部分,开发者可以将自己编写的应用模版上架商店,进行变现。这种模式已相当成熟,此前 notion 在上线了 AI 功能之后,也迅速涌现了上百个工作模板,其中一半以上均为付费模版,形成了健康的商业生态。

正因为 AI 大模型能力是一种抽象的智能,并不针对任何具体的需求、功能,所以在将 AI 产品化的过程中,很需要这样的「二次开发」,将抽象的大模型能力,捏合成具体的形状,最终满足特定的需求。

如果说当下的 AI 需要一次 Web 2.0 式的革命,它的实现方式或许就是鼓动用户来创造 AI 应用的「UGC」。

朝着这一目标,扣子也建立了自己的开发者社群,并且将于 12 月 19 日,在火山引擎上海冬季 FORCE 原动力大会上,进行 「扣子开发者日(Coze AI Developer Day)」 分论坛活动。开发者有机会和团队面对面,听到资深扣子开发者的案例分享,并且一起探讨 AI 应用开发的更广阔未来。

点击「阅读原文」,立即报名 「扣子开发者日」 活动。

浏览量: 49

为什么说 AI 落地营销,才是真正的科技平权?

AI 提效一切,尤其是时间。

不知你是否发觉,如今我们的手机交互、日常搜索、音视频转写、文案与图片视频生成,工作与生活,每个角落,都已经与大模型牢牢绑定。
而在产业中,大模型也带来了新范式的可能,就连最依赖创意的营销产业也不例外:不仅大企业如麦当劳用 AI 创作的青铜器汉堡系列艺术展,康师傅的 AI 写春联都引发众多讨论;放眼周围,就连地铁、电梯广告中的模特,也有相当一部分都已经被 AI 替代。
然而,此时距离大模型真正被全世界知晓,仅仅过去了两年,其普及速度之快,历史上没有任何一场技术能够与之媲美:
三百年前,人类历史进入第一次工业革命,从瓦特 1765 年获得了第一项蒸汽机专利,到 19 世纪末全球使用蒸汽机作为主要动力来源,我们花了 150 年。
二百年前,人类历史进入第二次工业革命,从法国人毕克西 1832 年发明手摇式直流发电机,到二十世纪初电力全球普及,我们花了近 100 年。
技术变革的诞生往往对应着时代机遇的蓬勃喷发、生产力与生产关系的变迁。那么,当大模型变成了一把万能的锤子,我们应该如何去使用它?我们又该如何把握大模型应用的尺度?大模型落地的超级场景又将出现在哪里?

不久前极客公园创始人&总裁张鹏,与快手视觉生成与互动中心负责人万鹏飞、快手磁力引擎 AIGC 产品业务负责人刘路,以及乱翻书主理人潘乱围绕以上话题进行了一场深度复盘。

01

为什么说营销

是大模型落地的超级场景
没有人想到,大模型致富的起点,会出现在美股一家差点因为业绩太差而卖身的妖股 AppLovin 身上。
短短一年时间,这家公司的股价就从去年的 36 美金,增长到如今的 338 美金,涨幅高达 833%,甚至碾压了同期股价涨幅不足两倍的算力之王英伟达。

AI 营销的前景不仅股民看好,业绩更是惊人:靠着在全球 6 万款移动应用中,插入通过 AI 生成各种魔性的试玩小游戏,一年多来,AppLovin 的试玩广告的平均 IPM 提升率已经达到 250%,日活用户数更是高达 14 亿,几乎与全球顶流短视频软件的量级齐平。

IDC 也对此作出了乐观预测:到 2026 年,全球 AI 营销的市场规模将达到 1456 亿元,并以 115% 的速度高速增长。
但为什么大模型最早爆发的超级场景会是营销?
在万鹏飞看来,营销是典型的将 AI 的左脑与右脑能力综合使用,且有巨大价值空间的场景。
在万鹏飞看来,营销是典型的将 AI 的左脑与右脑能力综合使用,且有巨大价值空间的典型场景。
如果将大模型与人类的大脑类比,那么以 LLM 为代表的语言大模型对应左脑的逻辑思考能力,其智能化水平已经达到了不错的程度且在持续提升,应用案例包括快手的广告智能投放和数字员工功能。而视频生成为代表的视觉大模型则对应着右脑的创意想象能力,目前视频生成大模型的世界仿真能力在快速发展之中,在视频营销内容的生产和互动环节可以带来极大的降本增效收益,应用案例包括快手的女娲数字人和开创平台。在实际产品落地中,AI 的左脑能力和右脑能力是综合使用的,呈现给用户的最终体验也是多模态的。
而在刘路看来,营销成为 AI 超级场景的根本原因在于效果可回收。
过去的广告产业,一个共识是广告投放后,存在相当一部分无效客户,但如何判断谁是有效客户,谁是无效客户,一直是行业困扰多年的难点。
比如「以前大众传媒的时代,在电视媒体的黄金时间投放一个广告,大多数人都能看到,但如何回收广告效果,只能通过人工统计的方式分渠道去看。当互联网兴起之后,品牌广告向效果广告迁移,平台会给出承诺,让广告主看到在这里的转化数据和投放效果。整个行业遵循的是更高效,更精准的方向演进。到了大模型时代,这一过程的确定性变得更高,我们不仅可以用 AI 进行投放素材,还能用 AI 生产素材,降本增效同步进行。」
体现在快手平台本身,如今快手 AIGC 视频客户渗透率已达 24%,可灵 AI 的商业化单月流水也已经超千万人民币,商业内容上,磁力开创日均生成的短视频素材数量已经突破 10 万条以上,各大广告主使用快手 UAX 也就是智能投放的占比也已经高达一半。
效果很好,但担忧也不小。从用户侧来说,大家对 AI 生成内容的接受度又到底有多高?企业又到底该如何把握翻车与降本增效之间的微妙平衡?

02

大模型落地营销,AI 味儿重要吗?
事实上,自 2024 年以来,腾讯、阿里巴巴、百度、字节跳动、快手等平台型企业一边升级大模型,一边主推 AI 营销,早已成为市场共识。
但应用的尺度如何把握,却一直是业内争议的焦点。
以数字人直播为例,部分内容平台态度相对保守,账号使用数字人直播可能会直接被平台封禁、限流,而多数电商平台,以及快手,则对此更为开放与包容。
宇宙的尽头是带货,带货的终极形态是直播。阿里生态中李佳琦所属公司美 one 在今年 618 期间,于旗下「所有女生」直播间引入数字人直播;京东则根据其创始人刘强东形象,推出了「采销东哥」数字人,进行京东超市的直播。
而快手则更进一步,在这里,数字人直播已经成为一条完整的产业链与商业闭环。
链条的起点,是快手磁力引擎推出的女娲数字人;
中间环节是借此进行直播的各大广告主,于他们而言,技术千变万化,但增长与稳定才是企业经营的衡量指标,数字人成本低、形象好,还能全天候直播最终一环则是通过直播间购物的普通消费者。
最后一环,则是在直播间进行消费与互动的用户。
商业逻辑链条很完整,但现实落地究竟效果如何呢?
现如今,在数字人直播这一链条上,快手的爆款案例层出不穷。比如,在快手,算上老板本人也仅有三位员工的瑜伽店,不懂任何技术的前台,也可以通过根据教练形象打造数字人进行直播实现精准引流,获客效率提升十多倍。还有土豆擦丝器厂家,通过数字人直播,一天时间就卖掉了过去一个多月的库存,效果广告消耗高达五十多万。
类似的案例,还出现在内容生成环节。在快手,有体育赛事内容客户,通过 AI 将比赛通过 AI 总结,每日生成几十万量级的内容,广告引流效果增长飞快。
为什么同样用 AI 进行营销,有人流量增长十倍,也有广告大户没有取得超预期效果?
潘乱认为,效果究竟是翻车还是互相成就,取决于我们如何定义大模型:目前大模型行业,没有出现 1000W+日活的 AI 原生产品,那就说明 AI 只是个工具。就像 2020 年初 Clubhouse 如流星划过,但现场音频活动功能留在了 Spotify、Discord 和 Twitter Spaces 里。再比如 2016 年春节映客直播爆发引发国内的千播大战,但是风口过去用户最多观看直播的场景是在快手、抖音和视频号里。
也就是说,大模型的使用应该结合场景。
而在营销行业,广告分为品牌广告与效果广告,不可混为一谈:AI 营销用于品牌广告,那么相比人类艺术家的创作仍有一定差距;但是对于效果广告而言,效率、点击率、转化率的重要性则排在艺术效果之前。
至于被用户一直担心的大模型幻觉困扰,在万鹏飞的认知中,它其实只是当前大模型的一个内在特质。只要为其找到合适的场景来应用,这个特质就可以变成大模型的优势,比如在快手,用可灵 AI 生成山海经中异兽,就充分调用了大模型的想象力,来还原现实中并不存在的瑰丽想象。
但营销+AI 的能力仅限于此吗?

03

营销的新时代与 AI 带来的科技平权
1913 年,这一年的汽车产业,迎来了发展史上的决定性时刻。
这一年,福特汽车公司开发出了世界上第一条流水线,通过将汽车生产分解成一系列标准化的步骤在流水线上依次进行。一部汽车的组装时间,从 12 小时 28 分钟缩短到了 93 分钟,生产效率提高 800%。而伴随着效率的提升,汽车生产的成本也随之大幅下降,福特汽车迅速风靡全球,汽车从奢侈品变成日用品。全球制造业,自此进入生产大分工时代。
工作流程的变革,往往会带来比加班,甚至比先进工具本身更大的效率提升。
营销之于大模型,正是如此。广义的营销可以分为经营与销售,大模型不仅帮助销售,更在赋能甚至变革经营本身。
伴随着可灵、女娲等工具的成熟,广告主本身将掌握越来越多且越来越低成本的内容生产以及投放能力,具备知识有私域知识的团队会加速成长。而广告公司也会更多的回归广告行业的本质——创意与洞察。
万鹏飞总结「AI 生成只是获得内容的一种方式,而内容是通过消费和转化而产生价值,内容的质量很大程度上决定了后链路的价值。目前 AI 生成的内容在质量上还有很大提升空间,我们只摘到了一些低垂的果子,未来会有更多的果子可以摘。」
比如,流程变革与工具能力增加之后,企业的运营边界也会自此扩张。比如过去没有出海能力的企业,可以借着大模型能力,完成全球各种语言的个性化营销,一次广告制作,可以通过 AI 改变主播形象、语言,进行不同类型的客户投放……
更深一层的意义,大模型的意义在于,让所有企业真正意义上实现科技平权。
观察了无数在快手上进行创业,以及通过磁力引擎赋能营销的案例,刘路发现,未来轻创业会成为一个更大的可能和大趋势:
「过去在电商的平台公司出来之前,做电商这件事情是复杂的,或者说开一家店是复杂的。我们需要考虑怎么选址、怎么去拿到流量,怎么去维护我的产品,线下的供应链怎么做。但是有了这些电商的平台沟通之后,这个事情更变得简单了。而未来,AI 的介入,会让这个事情更简单。尤其是针对后链路相关行为,比如说我爆品怎么选?投放怎么做,全都可以交给 AI、交给快手的磁力引擎智能化完成。」
「那时候,大量出现只有 1-2 个人就能做起来的流水百万、千万公司,越来越多的人能够以更轻的投入,做出更有竞争力的产品,并且能解决用户的需求和问题。」
小公司凭借创意也能完成商业的闭环;更好的产品借助 AI 的力量被看见,更多的人只要发挥长板就能用 AI 补足短板……
科技平权带来的,是一个正在蓬勃爆发中的时代机遇。
浏览量: 46

王小川:AI 医疗,代表了 AGI 之后更大的世界

 

 

整理|黎诗韵、Moonshot

编辑|靖宇

 

在国内大模型创业公司中,百川智能是唯一一家专注医疗方向的玩家。

最初有人认为这样的选择过「窄」,但今天当整个行业开始强调从通用走向垂直、超级应用方向被大厂「围剿」,百川的这一选择看起来是明智的。

在极客公园 IF2025 创新大会上,极客公园创始人 & 总裁张鹏对谈百川智能创始人、CEO 王小川,详细复盘了他对医疗方向、 AGI 及技术进程等的完整思考。

选择医疗,是他最初的梦想、也是理性的考量。早在 2000 年,王小川在研究生期间接触到生命科学,并对生命背后的数学模型非常好奇。大模型让这一梦想有了实现的可能。

另外,他推演了大模型竞争。如果做应用,可能比不过有巨大流量优势的大厂、灵活创新的小公司。而医疗能绕开这些射程。

正是因此,百川在技术路线上非常聚焦。它没有像国内大模型公司一样,跟进文生视频、语音交互的多模态赛道,而是强调以语言为中轴、提高模型智力的上限,这才对医疗方向有意义。

大模型行业进入第二年,外界流传有大模型公司将放弃「预训练」。王小川回应称,中国大模型公司仍然要坚持「预训练」,这是一个非常关键的国家战略资源,不过可能海外是通过超级平台带动预训练,而中国是通过场景带动预训练。

今年,百川智能在儿科有了一定进展,跟儿童医院合作、做了「一大四小」的医疗模型。王小川重申了医疗的三个方向:从医生为中心到从患者为中心、从医院为中心到居家为中心、从疾病为中心到健康为中心。最终,大模型会「造医生」,形成全新的供给。

在王小川看来,医疗绝不只是垂直方向,它不仅与 AGI 是等价的,还代表着生命科学的未来想象。最终,医疗或许会改变生命结构、甚至实现人类和机器文明的融合,这或许才是对他医疗梦想的完整理解。

以下是对谈实录,由极客公园整理。

 

王小川在极客公园 IF2025 创新大会|图片来源:极客公园

 

AGI 加速了 Bio 梦想

张鹏:下面来的是极客公园的老朋友王小川,他在极客公园创新大会 15 年历史上来了至少 9 次了。

小川曾在今年年中 Founder Park 的交流里明确指出「我接下来就是要全身心投入到 AI 对医疗领域的改变」

外界对此有一些争论,这事儿真的能推动 AGI 吗?在当下大模型的发展环境下,要先选一个垂直领域做好吗?

这里面有很多别人的不理解,小川非常笃定,今天听一听他怎么理解这个时代和如何选择自己路径的?下面有请百川智能的 CEO 王小川。

王小川:先汇报一下工作,我去年开始组建一家通用人工智能公司,到今年,尤其是下半年,开始在医疗领域密集地布局,去兑现我们自己在超级应用方面的能力。

去年我们完成了通用人工智能团队的组建,今年我们吸纳了大量的医疗领域的专业人士,不断释放医疗相关的信号,之前提倡团队的含模型量,现在兑现含医疗量。

张鹏:人和精力更多不止投入在通用模型上,而是医疗,在这个领域积累人才和技术应用。

王小川:对,包括我们已经开始有一些产品跟医院和政府进行联系,医疗不是纯 To C 的事,还要和监管、卫健委、医疗从业人员沟通交流。今年我处于释放本心的状态,之前说我是做互联网的、做 AI 的,现在我对医疗的兴趣,要从一个爱好者,成长为一个能让大家认可的专业人士。

张鹏:感觉你的底层基因在转换,从互联网 AI 转换到医疗领域。你是不是感受到 AGI 这件事离得太远,发展减缓,所以在调整方向接地气?

王小川:我觉得说反了,2000 年我读研究生时,有一项工作就是研究基因测序的拼接算法,从此开始接触到生命科学,我一直好奇生命背后的数学模型是什么。

2021 年我把公司卖给腾讯时,就提到往后 20 年,我要做生命科学和大众健康,所以医疗一直是我的愿景,我的梦想。反而是因为 AGI 的到来,让我的愿景有了现实基础,AGI 能让生命数学化上更进一步。

2022 年,我创建了一个公司,做生理信号数字化相关的分析,2023 年初,我们创建百川,也是因为中间有一个接地气过程——AGI 来了,医疗数字化能做得更快。

像黄仁勋不断在说「从今天开始大家不要学计算机了,反而可以学生物医疗和生物医药」,这代表了某种未来,在黄仁勋的投资布局里,他把大量的精力放在算力和医疗上。

Anthropic CEO 达里奥在年中写了一个万字的文章描述未来愿景,是说  AGI  先到来,随后由  AGI  去解决生物医疗的问题,不是先出现医疗问题,再做 AGI。

他认为 AGI 到来之后可以做更多的试验,在未来 5-10 年里,有希望解决以前需要 50-100 年时间才能解决的科学问题。

所以他有三个观点:

一、让大家获得生物自由,让大众不再担心自己的健康问题。

二、精神自由,随着脑科学和心理学的发展,人的精神状态可以更好。

三、社会公平,但这一点是很难达到的。

不管是黄仁勋,还是达里奥,都是把生命科学发展放在 AGI 出现之后,而不是之前。所以我们选择医疗这个赛道时,尤其选择大模型,反而使得赛道变得更加落地。

百川的「百」就是 Bio(生物)的谐音。最后回答你的问题,我们不是为了落地,才聚焦在医疗赛道,而是一开始就想在医疗里长足发展。

因为我自己有一个思考,人类文明要经历三个阶段:

一、能够对物理世界建模,比如说麦克斯韦方程、相对论、万有引力,都是在物理世界做刻画、做建模。

今天是第二个阶段:对人的主观认知和活动建模,通过语言对人类展现出来的思考,对世界的认知建立一套知识和认知系统。

第三个阶段才是对于生命的建模,融合客观世界和人的主观,到达一个将生命转化为数学的共生时代。

所以当下,医疗是一个很好的业务,每个人都需要,但医疗又代表了 AGI 之后更大的世界。

张鹏:你今天比较完整的开源了百川智能诞生的整个过程,你的结论是:这不是一次从互联网到 AI 的转型,而是你的梦想被 AI 赋能的一次回归?

王小川:我想知道生命背后的数学模型有哪些东西,我接触了大量基础医学、临床医学、流行病学的内容,我医学论文读得比计算机类的还多。2000 年开始,我一直有这个梦想,不小心在互联网走了一圈之后,现在回到自己更想做的事情,我从信息时代走到了智能时代,离我对生命的解读更近了。

张鹏:在一门副业上修成了世界级水平,现在回来修主业。

王小川:第一,没有达到世界级的水平,我在中国都没有做到互联网最头部的公司,只是有一定成绩,对自己来讲有 60 分吧。

第二,互联网也不是副业,我是全身心投入在做,不过也一直在医疗领域做投资布局,医疗才是我的副业。

今天我们从互联网时代走入到了 AI 时代,我感觉很幸运,没有错过每一个时代,我大学毕业之后就进入了互联网时代,如今顺利收关。AI 时代我也赶上了这趟车,去年 8 月份,网信办发了 8 张备案牌照,百川智能是唯一一个当年成立的公司,剩下的牌照都分给了大厂,百度、国家实验室之类的。

相当于我跑步入场,还赶上了最新的时代,看起来我是互联网老兵,但是在 AI 时代里,我也是一个新人,百川也是一家新公司。

 

王小川在极客公园 IF2025 创新大会|图片来源:极客公园

 

「卷」AI,容易出现误区

张鹏:所以你认为,是因为 AGI 的到来,才让生命科学发生很大变化,让你看到这个时代有机会实现你原本的梦想。

但是 AGI 发展至今究竟怎么样,是不是撞到墙,遇到一些阻碍,你怎么看?

王小川:定义什么是  AGI,其实有很多行业讨论,大家不断在上面加码。之前我们讨论「机器怎么才算有智能?」

以前是图灵测试,对话者分辨不出来是人还是机器,这就算智能了。到了今天,机器还要会解数学题,还要有主动学习的能力。我理解  AGI  是做到「像人一样」,像一个数字员工,能够在多个职业里产生工作成果。

之前和一个技术大佬交流,他质疑当下的大模型,他说大模型七位数乘法都做不好。我反问「你会吗?你拿着科技公司的股份,你也不会七位数的乘法,你为什么要求  AGI  会?」这是个审美问题,我们以前总是把  AGI  当成一个工具,它是超级计算机,能精确地做计算,或者跑程序跑得很快。但  AGI  本身,我觉得就像人一样,如果审美没有建立好,你怎么去评价它呢。

AGI  正在产生巨大的突破,它的文章已经写得像最顶尖的文科生了,还可以写诗,随着 OpenAI o1 的推出,AI 有了更好的逻辑推理能力,文理双修。但它并不是上帝,它像一个极其聪明的人,但它现在真的知道宇宙规律吗?目前就已经可以变成特别好的医生吗?不会,它必须持续吸纳外部的信息数据。

所以从人的角度来看,它掌握了人对世界理解的知识和严格的推理范式,进化速度还非常快,诞生才两年,去年当顶尖文科生,今年当顶尖理科生,还想让它怎么样?

最近美国一家公司改口了,说虽然路线不同,但未来几年内  AGI  就将实现,大家还是对此很乐观的。AGI  出现才两年,怎么就要求它做到人类一百年、一千年都没有做到的事呢?AGI  现在还在飞速发展中。往后还有新的突破,发展速度并没有变慢。大家都过高期待这两年的速度,也许三五年后,就会非常不一样。

张鹏:你刚才那句话非常触动我,我年轻时认为图灵测试就是很科幻的、想象中的、需要技术突破才能到达的程度。但今天我和 AI 聊天,我要是一下子就觉得聊得不好,这件事就变得不可接受了。我们甩开图灵测试这个概念,其实也就一两年时间。

那你认为 AGI 这件事给你很大信心,因为技术发展很快,你很有往前推动的力量。但我问你一个问题,就在当下,OpenAI 每天都在上演大戏,发布视频  AGI 、多模态,国内都要追赶一段时间,百川智能在这些事上有点置身事外,没有参与其中,也不在意是不是首家复制了 o1 的国内公司,也不做视频  AGI 、多模态,为什么你们这么置身事外,不在圈子里卷?

王小川:首先卷,或者说跟进的目的是什么?是展示自己的力量,不要在行业里掉队。所以回到我们对百川的定义,做第一梯队的大模型公司,同时在医疗上做突破,能够做出一个超级应用,这是我们成立第一天就在思考的问题。

今天大家都在跟进的时候,我觉得有两个容易出现的误区:

第一,一定要有自己的技术路线图。我反复强调以语言为中轴,语言是智力的代表。

当 Sora 冒出来的时候,国内有很多公司去跟进,原本做语言的公司也在研究 Sora,可是 Sora 跟今天的语言模型是两个赛道。

所以有些方向上,我们就选择不跟了,更专注在我们未来的方向里。ChatGPT 也不一定就是最对的方向,也没必要必须跟它做得一模一样,或者它推出后三个月内,你就得做出来。

我觉得当下在国内,这不是我们最优的路线,去年我提到「理想上慢一步,落地上快三步」,就是说在跟进时,要有我们自己的选择,理想上慢一步,不要紧盯着它不放。

第二,在应用的时候也得小心。大公司是不会绕过超级应用的,每家公司都在做应用,还是打不过字节,因为超级应用代表了技术能力。所以你很容易两边都被挤压,一方面是技术上是超越不了 OpenAI,另一方面做应用又被字节给挤压,所以要找到一条路线,走出大厂的射程。

张鹏:说到这儿,小川你当时为什么没尝试重做搜狗输入法?搜狗输入法也是当年你三级火箭里重要的一步,最近你还发了一个朋友圈,说搜狗输入法也加了 AI。你真的没有考虑过有机会再用 AI,重新做一个上亿用户级的产品?

王小川:我太了解这个情况了,当时做搜狗的时候,我提了两个重要的待做工作,但都没有在那个时代兑现。

一是从搜索变成问答,二是做好推荐。

我们现在看到这个趋势了,输入法能在你输入到一半的时候,帮你联想输入,它知道下面应该怎么写,甚至能帮你获取更多信息,从获取信息到帮你表达,输入法都能做到。技术在今天一旦到位之后,输入法会有自然的演变,对此我很喜悦。

腾讯搜狗输入法最近增加了「智慧升级」,这是我们原来的一个功能,点一下狗头,搜狗就会帮你写,帮你回答,它的内核升级了。之前我们已经想到了产品形态是什么样,但以前做不到。因此我认为这是个机会,但已经不属于我们了,如果你想做个东西跟搜狗输入法 PK,你就得在上一代大厂产品的基础上做延伸,所以不仅要走出自己的射程,还需要走出搜狗输入法的射程。

张鹏:所以你创业的时候,核心思考是能够在谁的射程之外,有自己发展的空间?

王小川:对,包括 AI 今天在取代搜索,也有朋友说「小川,你应该第一个搞 AI 搜索」但我想了一下,虽然这能走出百度射程,甚至能够颠覆百度,但它依然在字节产品的射程里。

对百川而言,我们有几个考虑:

第一是从竞争角度,在大厂的 DAU(日活跃用户)范畴内,我们还是处于弱势地位,在很多地方也搞不过小公司,他们对于需求敏感度的把握,会把中不溜公司撕的粉碎,他们有很强的竞争力。

反过来,医疗领域大家都认为是垂类,小公司不一定做的动,虽然上一代已经投了 1000 亿进去,投资人很多都失去信心了,但投资还在持续加大。

昨天的新闻,清华每年的预算在所有高校里面排第一,遥遥领先,比第二名高 100 亿。清华预算 400 亿,其他的高校是 300 亿、200 亿,但今年清华居然被另外一个研究机构给超过了,你猜是哪个?

不是西湖大学,不是浙大,而是协和。协和在今年增长了差不多 20% 的投入,清华掉了 7%,一下子被协和给超过了。医疗领域的投入是会持续越来越大的,这是一个现实的问题。小公司今天做不动医疗,甚至大厂也在降低投入,百度、腾讯都在降低这块的投入,百度最近把医疗部门降级裁撤了。而且医疗对创新的要求特别高,大厂的职业经理人也没有能力做创新,因此我们在竞争里面有自己的深位,我们可以持续地去做创新,大家也相信你也能做出来。

反过来,我觉得医疗也不止今天这一个垂类,就像进化树一样,有些方向虽然可以长出很好的业务,但进化到后面可能就停住了,它不是 AGI 同期进步的。比如写广告文案,这个东西是挺酷的,可以快速变现,但它不需要把 AI 最前沿的技术用进去,无法持续进化。

反而医疗会牵引我们去做多模态,你需要做病理片子的识别,还要有足够好的沟通能力、同理心,或者说长期记忆力,Transformer 足够长,能够把你整个生命周期的数据用起来,还有反幻觉的能力、推理能力都得用上。这使得我们不会停在变现的阶段,或者有业务后就不追求技术了。

反过来看,我们从今天的智能时代走向生命时代,可能会越走越广阔,医疗是当下特别好的,独有的一个卡位,但我相信在三年、五年后,大家会看到它不是个 Vertical 的领域,它可能代表更广阔的未来。

就像互联网当年是个意外,互联网在诞生时期,当时我们招进来的同事,有在 IBM 做实习的,跟他说你去做网站,他觉得很诡异,结果最后大家发现,互联网代表了整个世界。生命健康也代表更广阔的世界,像马斯克讲的,机器人在地上跑,人类和机器文明融合了,这对生命本身的解构会带来更大的空间。

张鹏:我听懂了,其实这两个问题逻辑是一致的,你跟不跟视频、做不做 Sora、卷不卷美国的模型进展,它取决于你选择的要解决问题的目标。你选择目标的过程中有一套自己的逻辑,包括脱离谁的射程,但选的东西又不能只有 Vertical。

我觉得创业的本质都是要从一个山顶到一个谷底,再重新攀爬一个山顶,你是没有办法从一个山顶平移到另一个山顶的,那不叫创业,坐飞机飞过去不叫创业,所以你一定会在谷底有一个攀爬的过程。

今天中国很多大模型出身的公司,做预训练可能都很有压力了,大家都要躺平了,感觉太烧钱坚持不下去,各种声音都有,你肯定也看到很多声音,百川是什么情况?你怎么看所谓的预训练这个问题?是不是要坚持做预训练?不做就有很大的问题吗?你怎么理解今天大家的一些变化?

王小川:首先预训练大的问题是:这是中美博弈之间的一个关键的战略资源。如果中国没有预训练,全掌握在美国人手里面,底盘就被别人给抽了,所以中国一定要自己掌握预训练。

但这又很尴尬,你的卡、算力在投入上又没有美国大。在这种情况下,我们做预训练很大的资源和精力要放在超级平台,这是在提示预训练的能力,而不是说预训练走到头之后,再去想我有什么样的业务方向,我觉得这件事情在中国是不现实的。

在中国要对场景要深度的理解,由场景带动预训练,这是百川定义的选择,在做超级应用时,一定得要引领这个模型的进展,否则这个题解不开了,就会像朱啸虎说的「这个东西不赚钱,你去赚钱之后就没未来」。

张鹏:反正怎么都不对。

王小川:对,什么都会错的状态,因此今天在现实和理解中得找到自己的一条道路,百川认为自己已经打明牌了,我们有实践的路径。

 

王小川在极客公园 IF2025 创新大会|图片来源:极客公园

 

用 AI 创造医疗供给

张鹏:刚才你说的是挺典型的现象,在投资人面前,好像怎么做都不行,这怎么破局呢?你这么成熟的创业者,也见过那么多投资人,可能也跟投资人去掰扯掰扯的,遇到被投资人提了两头堵的问题,你怎么回应?

王小川:在去年我第一天做 AI 时,就跟我的合伙人说做医疗,迈向一个比大模型更加性感的未来。

但我合伙人说「大家不会信的,大家不知道你讲了啥,你不是医生,又不是院士,你不能给大家讲医疗,你就得讲大模型。」我觉得大模型推向未来的路也没错,但需要顶尖大模型才能通向医疗健康。

去年,我们的故事是讲大模型,一开始讲医疗是重要的方向,三个关键词:「健康、创造、快乐」,健康只是其中的一部分,去年「Baichuan 1」、「Baichuan 2」、「Baichuan 3」、「Baichuan 4」发布,基本没有提及我们在医疗上的想法,这种情况下,得到投资人的相应认可。

今年在定位上,我们更多强调自己不仅是大模型公司,而且是专注医疗的头部大模型创业公司。明年,我们相信会有新的故事发布,也能够找到自己巨大的市场空间。提到医疗行业,大家总担心收入不够高,老问「谁买单」,今天我刚看到一篇新闻报道,说中国的医疗器械问题,药价降的特别低的问题。

我觉得好消息是现在政策对 AI 是鼓励的,AI 服务可以在医保里有它的部分,以前要么是给药,要么给器械,要么给医生,现在影像服务可以进医保了,这就撕开了一个口子,AI 不是在器械里面、不是在药里面,而是在医生的服务里面。

未来更大的空间是在海外,国际上的服务,如果只是互联网模式,出海是很难的,但 AI 的医生是有机会出海的,如果实在不行,还可以出海做宠物医生。

张鹏:宠物医生也挺复杂的。

王小川:我相信对生命负责任,就该有最后的商业回报,无人驾驶监管上也有政策和瓶颈,但投入去做也能赚钱,造医生比起无人驾驶,我觉得是只大不小的事。

张鹏:只要你在改变供给。

王小川:对,一是造人,尤其是造医生;二是医疗行业有更多的数据,当有更多数据之后,对世界的认知,AI for Science 就有基础了。我有医生,中间有更多的数据收集,就会得到对生命更多的理解,我相信它最后会有商业回报。

张鹏:回到我问你的那个问题,不要尝试在某个时间段非得说服投资人,你可能需要跟他有同理心,要等一等他思维的演进,所以一开始出场的时候是大模型公司,是因为那时候投资人就需要大模型公司。

王小川:我要说医生他们就不理我,就跑了。

张鹏:你本来要做个包子,但是投资人说我要馒头,我就做了馒头型的包子,里面放了馅,但是他们看到是那个包子。

王小川:先不说那馅吧。

张鹏:这给创业者一点启示,不要硬去说服投资人,有一个中间地带,投资人想要的和你要做的不矛盾。

王小川:这不是我的优势,是我尝试跟他说包子,他听不进去。

张鹏:只能做馒头型的包子。

王小川:做个包子,说这个馒头挺好的。

张鹏:虽然要做包子,但是还要做成是馒头,今天大家开始要点包子了。

王小川:今天说你们为什么没有馅,但我有馅。

张鹏:首次揭秘,聊一聊百川真正的进展吧,你的产品能力怎么样?

王小川:我们在跟医院合作,跟区域卫健委平台合作。9 月份百川以儿科为切入点和北京儿童医院达成了合作,行业觉得我们做得对,因为当家长的知道,小孩总是生病,一生病就得往医院送,自己请假去医院还可能交叉感染,还有医疗挤兑的问题。

不是严重的疑难杂症的话,儿童生病的问题没有那么难。我们切入时的要点是,对于 AI 的专业性要求没到顶尖那么高,从底层往上走,同时又会从痛点切入,因此儿科会变成我们战略上的卡位。本来打算先拿技术说服大家,最后发现是靠先布局卡位,再来填技术。

我们跟儿童医院合作之后做一大四小,四个场景模型「居家、社区、医院、智控」。最近我们做了一些测试,拿了 11 个专业题,在各个在线平台上找很多医生去测,互联网线上都有找医生的平台,9.9 元级别的正确性在 30%。再好的话,像 76 元级别的医生,准确性能够到接近 70%。

百川的 AI 医生准确度略高一点,但是比不了更专业的医生,比如说像北儿医生,接近 200 元的在线服务,能够达到 90% 的准确度。百川比顶尖医生弱,但比市面上大部分平台做得更强,这是今年的现状。未来,我们的 AI 医生需要拿证,通过 CFDA 的认证,还要做个人一致性的评价,甚至要去定级再上岗。现在有小程序试用,到明年会拿出足够专业性的应用。

一方面做技术,另一方面还有跟监管部门打交道,面临卫生经济学者的评价,考察我们是否真的对社会有帮助。在这条路径上,不像做互联网那样无拘无束,推出来引爆市场就够了,医疗上要通过很多监管责任。一方面做技术,一方面也要服从于循证医学或者整个监管的体系。

张鹏:所以很难,得一关一关过。你刚才拿那个数据有点意思,今天可以像出挂号费一样,看专家是什么水平,你产品也能在这个维度对应。

王小川:两个维度,一个是主任医生、副主任,另一个维度就是在线平台不同费用的医生,在线可以做比较,按照疾病、病种再去划分,精细化做比较。

今天国家也好,医疗工作者也好,他们非常拥抱训练医生或者专科能力的模型。另一方面,医生也都在好奇模型如何去评价他们,如何定级。

所以会产生很多需要政策解决的新状况,像医疗器械定型就不能改了,改个元器件需要重新审核,一下子几个月就过去了。你写的软件代码或者硬件不能变,听起来很合理,远期来看不现实。

曾经我做过地图,需要给测绘部门审核,以前地图为纸图服务,一旦定稿之后,上面一点符号都不能变。今天大家用百度地图,改个路、换个车站,地图就变了。

所以医疗监管审核体系在 AI 介入后必须产生变化,因为 AI 能力每天都在进步,如果让它不能动,就会有很多障碍。我们会面临监管和现实之间的冲突,如何评价你的医生,能不能上岗,面对变化怎么改,出了事故怎么管,这有大量的功课要去做。

张鹏:这些都是医疗领域里面现实的问题,我们看到今天这个技术在明确进展,具备了改变一些供给的可能性。

但这件事本质上用什么方式切入,变成大家都能有自己的 AI 私人医生,还有我在去医院之前,我能先找个医生帮我看一下要不要去医院。现在恐怕不会马上出现能给病人开药,给大家直接做关键性的诊断的 AI 医生,还是要从一个阶段一个阶段往前走,你会怎么看待这个路径?

王小川:三个概念:以医院为中心变成居家为中心。以前大家洗澡都是在大澡堂,现在每家都有自己的浴室,这是愿景的一部分,可能也是在近几年寻求突破的点。

从医生为中心,变成患者为中心,如果数字问诊背后不是专业大医生,而是 AI 医生,大家心理上也能接受。

从疾病为中心,变成健康为中心,每改一步都面临大家内心的文化挑战,还有技术难度。有的医生在医院知道怎么工作,到家就不会了。

怎么造医生,而且改变医生工作的路径,我们做了一年,适配时发现还得跟院内做配合。你去医院时,医生就是开盲盒,有 AI 辅助之后,去医院之前 AI 会先跟你做很多辅助性提问,甚至把你分配给不同的医生,医生也不用开盲盒了,你也找到了对的医生。从医院到居家时,中间有很多过程,需要把理想跟现实做更多结合。

张鹏:你对这个领域充满着热情,我问个挑战性的问题,在这个领域改变现有的医疗资源、环境、流程这些事说了很多年,甚至花了上千亿的钱。你今天为什么认为现在是可以改变的时刻。还要花 1000 亿吗?

王小川:之前 1000 亿花进去,投资人是很伤心的,因为这还不包括制药的钱,更多是互联网化,帮医生做辅助决策,AI 影像就大概花了 1000 亿。

但是我会认为,以前医疗互联网化,更多还是给你提供医疗信息,帮你找医生。但是医疗上最大瓶颈是供给不足,找医生不能解决供给问题,医疗不像做外卖,跑滴滴一样供给充足。

在 AI 技术到来之前,你没有能力提升供给,互联网化不解决供给问题。而今天大模型出现了,我们能够创造医生,这是一个新起点,所以今天花的钱可能不只是 1000 亿,但是大部分钱不是花在给医疗行业做信息化,而是推动所有科研人员、医疗公司的积累,让大模型能力提升,这个钱花在医疗行业的突破上。这个时代有机会以大模型为基础去创造医生,去实现供给端的一次颠覆。

张鹏:改变这个行业的路径、条件和背后的能力出现了变化。

王小川:从连接匹配变成供给了。

 

Agent 即将爆发

张鹏:我只有最后一两个问题能问。创业者特别重要一个能力,就是面向未来时空的丈量、预测和判断能力。你认为  2025 年、5 年后、10 年后、20 年后,你所投身的大模型和 AGI 领域,接下来对这个世界会带来怎样的变化,你能不能在这几个尺度上能够简短给一些结论。

王小川:明年是 Agent 爆发的一年,在具体场景里,AGI、大模型有一些充分的表现,新的物种会产生,明年百川智能也会有各种各样的医生产生,也会跟医院做很多合作。

如果给 5 年的时间,我会认为 AGI 就已经到来了,我自己有个定义,就是能够造出一个真正的医生 AGI 就到来了,不仅能够给药,还能解决各种复杂的生理问题,还可以做日常陪伴,而且它还很聪明,能了解你的个性,这就是私人医生。

还有其他物种也会产生,我们开始拥抱 AGI 变成某种职业的人融入社会,硬件方面也开始逐步起步了。人类有新的伙伴。

 

王小川在极客公园 IF2025 创新大会|图片来源:极客公园

 

张鹏:人类生产力结构产生了根本性的变化,以前生产力都是靠人,现在生产力产生了新的伙伴。

王小川:对,到 20 年的时候,随着新的物种和人的进入,能够产生大量科学实验,通过实验可以获得更多数据,我们开始攻克生命问题,人类对自然界的理解到达新的高度,我们因为它们而更了解这个世界,更能找到人类新的定位,这是一个科学大的爆发。同时,机器人开始满地跑。

张鹏:所以那个时候人的定位到底是什么?

王小川:作为人类文明的重要一部分,我们跟机器文明走在一起了。

张鹏:刚才你也提到生命自由,这是 10 年维度还是 20 年维度?

王小川:10 – 20 年之间就可以做到。不是生命自由,是不被疾病困扰的生物自由。

张鹏:好,在座的各位都有机会,希望小川在这个领域突破会促进这件事更早一天到来,欢迎小川来到我们的现场,希望你越发展越好。

 

 

浏览量: 71

文章分页

上一页 1 … 55 56 57 … 85 下一页

Copyright © 2024 51蛙吖蛙 – 3D社交空间