大模型的耐力游戏

光子星球 | 吴坤谚 · 2024-02-28 17:35

豆包仅是字节AI版图中的一隅。

2010年,世界上首款量产纯电车型日产汽车(Nissan)聆风上市的时候,没人能想到日产汽车公司乃至整个日本汽车行业都将在十余年后的今天沦为陪跑。

类似这样由领跑者沦为追随者的案例并不鲜见,正如在大模型领域,意欲窃取百度、科大讯飞等一众大模型先行者胜利果实的字节跳动。

众所周知,百度、科大讯飞是国内大模型赛道中先声夺人的代表玩家,早在去年上半年便上线网页测试版抢占用户心智,以期在正式面向公众服务的时候能快速积累用户。然而据QuestMobile近日发布的数据,2023年11月,文心一言、豆包与讯飞星火的日活分别是155.4万、124.6万、71.9万。

不难看出,相比于早在2023上半年便上线网页测试的百度与科大讯飞,8月才开启邀测的豆包跑出了更快的增长速度。

甚至到了2024年2月19日,豆包在iOS免费榜上排名49,而文心一言排名为157,讯飞星火则排名400开外,类GPT应用的前三把交椅之间已然存在不小的差距。

在今年1月的2024年年度全员会上,字节跳动CEO梁汝波提到内部对GPT的讨论始于2023。短短一年内,基于云雀大模型的AI应用矩阵已经形成,似有复现曾经其作为爆款应用工厂之势。

豆包的胜利属于抖音

字节一度在业内享有“App工厂”之称,这源于其算法推荐机制下,集中资源与头条系流量大水漫灌的打法,可以“热启动”新的独立应用,快速积累用户。

时过境迁,互联网红利见顶催生的聚合超级App不断挤压独立App的生存空间,让字节逐渐难以持续打造爆款App,但“算法+流量”的传统打法仍不失其效果。如字节于2023年上线的新游《晶核》与《星球:重启》均基于抖音的流量,通过这个打法快速撑起用户与营收规模。

同样的启动路径自然可以复现到大模型应用上。更重要的是,国内大模型赛道无论是模型层还是应用层,都未能出现如ChatGPT、Character.AI一般站稳生态位的玩家,“大力出奇迹”的打法似乎与时下乱局正合适。

Tech星球报道,有消息人士透露豆包的月活已于去年12月增长至200万,2024年1月份则在此基础上翻了一番。我们亦自相关人士处了解到,豆包的月内平均日活已经完成了对文心一言的反超。

诚然,互联网做的一直是注意力的生意,这是为何字节这套“老打法”能再获战果的原因。但在注意力极为稀缺的当下,流量还不足以让字节做到后发突围。

要知道,业内对AI应用落地难的共识是其难以挖掘新的使用场景与功能,这同样是豆包延续其“爆款”生命力的关键所在。就创新性来看,我们能轻易在豆包目前的产品形态中找到Character.AI这位前辈的影子。

豆包与Character.AI一般主打多样化的智能体,除应用内置的“豆包”、“AI图片生成”、“编程助理”等覆盖高频需求的智能体外,用户亦可自行无代码创建。

智能体的玩法可以较好地覆盖用户低频需求,产品设计上偏向拓展C端规模。其他功能如语音交互以及AI声音创建是不错的亮点,但总体并未跳脱出Character.AI已被验证的产品框架。相比之下,隔壁文心一言显得更为成熟,不仅同样引入了智能体玩法,同时还在发力建设AI交流社区以及商业化。

我们体验发现,文心一言App已将“社区”设置为一级入口,社区中的UGC内容以文心一言生成的AIGC图文为主,并加入了移动互联网常见的赞评交流系统。此外,百度还在文心一言4.0订阅制付费的基础上推出了“灵感币”作为补充,用户可通过分享、拉新与充值的方式获取更强的模型能力。这一系列变化,都指向了商业化。

反观豆包目前尚不见商业化动作,社区建设同样未曾上马。至于文心一言目前在数据上(如iOS下载量)不如豆包好看,或是二者的流量分发效率不可同日而语的缘故。但不可否认的是,这恰好印证了此前外界对字节AI大模型进展较慢的固有印象。

早在2023年末,今年便被业内公认为是AI应用爆发的元年,多方向出击的大厂与创业公司的草台班子同台角力,看似领先的豆包无疑面临着更为激烈的竞争压力。

还得靠内容支棱起来

上文提到,豆包于模型能力产品化上的创新不多。除流量分发外,其规模化的速度还需自其他方面尝试归因。我们体验后发现,豆包在顶层设计上与其他厂商有明显区别。

首先,持续占据抖音站内“广告位”的豆包已在生态上与抖音完全打通,用户不仅可以通过抖音号快捷注册登录,更是可以在向豆包提问时,通过AI搜索抓取字节生态内部分标题中带有关键词的内容。智能体的回答会较多参考抓取图文、视频的内容,这也导致豆包在这类问题的回复上往往需要较多时间。

搜索的引入一定程度上缓解了对话模型“说胡话”的问题,另一方面,一般字节系内容唯有在自家生态内才能搜索,内容的呈现本就是其互联网服务的一部分。

这么看,字节的产品设计其实是一种对用户的心智教育——文案、绘画等高频需求塑造了用户对大模型应用的工具型感知,而字节通过提供趣味内容玩法,推动用户感知向其擅长的内容服务靠拢。换句话说,字节希望将豆包打造成一款偏向娱乐的产品,而非纯粹的工具产品。

上文提到的AI声音创建同样是为增加应用趣味性而设的功能,用户可以通过录制音频来创建AI声音,由此催生了多样的交互玩法,例如模仿明星声音并创建明星的智能体,以及春节期间足以击穿所有年轻人的财神。

图片

 谈及内容,字节可就支棱起来了。字节的内容体系经历了移动互联网由图文转向视频的历史进程,无论是昨日的头条系还是今日的抖音系都积攒了海量的信息,这不仅可以作为模型训练的“养料”,如今更是融入了模型应用的产品服务中。

进一步说,不少丧失时效的长尾内容的价值存在被再次激活的可能,这是内容平台进军大模型的优势之一。

将大模型接入自家生态的条件也不是只有字节独有,百度便早已将文心一言接入了多个产品线,如一度为业内所遗忘的百度文库。

只是上述两者在具体玩法上可以说是背道而驰,字节选择让由豆包抓取生态内内容,让生态服务模型应用,而百度选择让应用接入模型能力,让模型反哺生态。

字节更在意的是如何将豆包打造成模型时代的爆款,而百度更在意的是如何通过模型来挖掘既有业务的潜力。不同的做法各有侧重,这也一定程度上解释了豆包如今在消费端的强势表现。

字节的AI版图

豆包仅是字节AI版图中的一隅。

除了豆包这个面向国内C端的AI对话应用外,字节旗下还推出了AI工具集小悟空(原悟空搜索)、AI bot平台扣子与抖音情绪机器人等,且以上应用大多都已推出海外版。可以看出,发力AI的不仅有为创新AI应用而创建的新部门Flow,还包括多条既有业务线的AI重构。

字节最初涉足大模型领域的尝试是火山引擎于去年6月推出的大模型服务平台“火山方舟”,随着豆包与其他一系列AI应用逐渐打出市场声量,意味着字节迈出了B端MaaS之外的第二只脚。

如果说以豆包为代表的智能体对话类应用声量渐起,对应了字节AI战略版图的一面,那么更具技术深度与商业前景的文生视频则是其图景的另一面。

近日,OpenAI推出的文生视频大模型Sora点燃了AI创投圈,能够根据文本提示创建详细的视频,扩展现有视频中的叙述以及从静态图像生成场景,最长能生成60秒视频的Sora将AI军备竞赛的战火带至文生视频领域。

就在Sora推出前后,字节的两个动作耐人寻味:近日,原抖音集团CEO张楠宣布辞去集团CEO一职,未来把精力聚焦在剪映的发展上;另一方面,界面新闻报道称在Sora发布前,字节便已推出可通过文本控制生成视频中人物或物体的动作的模型产品Boximator,一度为市场解读为Sora的“竞品”。

将曾带领字节系短视频业务完成从0到1的张楠接手剪映,意味着其很可能就这款辅助视频创作工具进行“二次创业”。实际上,早在本次人事调动前,剪映便推出了AI写真、漫画等新功能。降低普通人视频创作门槛的产品设计与文生图的应用开发堆砌下,剪映本次文生视频的转向并不出人意料。

另一方面,尽管字节方面回应称Boximator目前还无法作为完善的产品落地,但这并不妨碍其可以被视作字节文生视频业务的一块拼图。

由于Sora生成视频的60秒时长恰好切中字节内容护城河中的短视频,其上述两个动作也多为市场解读成一种针对性的预判防御动作,防止Sora抢夺平台既有创作工具的用户。“预判”这一因素好似去年十二月冲击国内游戏产业的新规发布前,字节便提前鸣金收兵一般,颇有昨日重现的色彩。

实际上,字节未必是预判到了具体情况,而是对自身发展的前景与桎梏有着明确的感知。

就目前情况看,图片、文案、代码等基础需求其实早已是昨日黄花,于此之上的模型应用之争可以说是乱成一锅粥,但又决不出个高低来。早在去年下半年,赛道玩家们便有意向prompt工程、多轮对话记忆与长文本上发力,其原因恰是基础需求实际上并不能很好地体现模型水平与能力。

基础需求不过是字节可以“补课”追赶领域,而更具技术深度的文生视频,才称得上是大模型赛道竞争的胜负手。Sora的发布不过是2024年模型能力演进主线中的一位吹号人,告诉大家视频时代已至。

或许字节跳动已经追上了国内大模型赛道的进度,但在世界范围看,它还是一个追随者。

最新直播

热门活动

厦门人才企业榜暨“创道至简”创投领袖高峰论坛

  • 厦门火炬高新区管委会、厦门市高层次人才发展中心、厦门日报社
  • 厦门
  • 2024-11-22

亚洲化妆品创新峰会暨国货百年化妆品陈列展

  • 上海书航文化发展有限公司
  • 上海
  • 2024-11-22