文|沈筱
编辑|王与桐
36氪获悉,4月20日,出门问问在北京举办“AGI·降临”2023 AIGC战略发布会。会上,出门问问宣布开启自研大型语言模型「序列猴子」,以及集成大模型能力的三大系列产品/服务内测。
三个系列分别为面向创作者的CoPilot产品矩阵、面向C端的升级版语音助手魔法小问,以及面向B端的企业专属大模型服务。其中,面向创作者的CoPilot产品矩阵包括AI写作平台「奇妙文」、AI绘画平台「言之画」、AI配音平台「魔音工坊」、数字人视频与直播平台「奇妙元」。
大模型「序列猴子」,自测能拿50分
序列猴子是一款百亿参数级的多模态大型语言模型,支持文字、语音、图片、3D内容生成等多个任务。
谈及大模型命名的涵义,出门问问创始人兼CEO李志飞,以数学家埃米尔·波雷尔20世纪初提出的“无限猴子”定理为类比,解释道:“‘无限猴子’定理讲的是概率的事情。一方面可以认为只要给定无限时间,任何事情都是可能的;但另一方面实现概率非常低。而我们内部构想了一个序列猴子定理,也就是喂给机器猴子海量的文本序列,通过大规模算力训练,便会逐渐练成有智能的序列猴子。”
据介绍,目前,序列猴子的核心能力覆盖“知识、对话、数学、逻辑、推理、规划”六个维度。
在现场,李志飞对模型的上述能力进行了实时演示。从演示情况来看,序列猴子表现还算不错。比如它能够准确回答出“湖南和湖北哪一个省会的人口更多”的问题,并能阐述回答该问题的step by step推理过程。
但是,和其他大模型一样,序列猴子仍然会出现回答冗长、文生图不对应等情况。例如,其根据“画一只赛博朋克风格的猫”的描述生成了一张长着两只猫耳朵的动漫人物图片。
李志飞表示:“任何一项高科技都要经历一个长时间的发展过程,早期随着时间推移,能力刚开始发展特别慢,到了某一阶段后会‘顿悟’、‘能力涌现’,再之后就是持续优化,不断提升能力,解决胡说八道等各种问题。序列猴子在训练过程中已经展现出了‘涌现’能力,但目前正处于‘顿悟’阶段,未来提升速度会越来越快。”
那么,序列猴子到底能拿多少分?据介绍,李志飞坦言:“我们做了一个比较客观的评测,收集了500多个问题,包括逻辑推理、数学计算、文案生成,并对相关模型的回答结果进行人工评分。如果GDP4是100分,GDP3.5是80分,我们的模型就是50分。”
而针对近期讨论较多的问题——“国内企业落后OpenAI多长时间”,李志飞也给出了自己的答案,并再次呼吁“不要焦虑”。在他看来,目前所有企业都处于Google FLAN模型(Google 2022年1月发布的指令学习大模型)阶段,即落后GPT-4约16个月。
不做硬件,商业化主攻B端企业专属模型
事实上,据李志飞介绍,出门问问早在2020年就关注到GPT-3模型的发展,并开始尝试自研大模型,在2021年推出了大模型UCLAI。但是,李志飞坦言,由于当时UCLAI的效果差强人意,同时难以在研发成本和商业化应用收益之间进行可预见的权衡,所以短暂放弃了。
直到2022年,随着Stability开源Stable diffusion图像生成模型,GPT系列模型优化,美国Midjourney、Jasper AI等一系列AIGC创业公司营收、估值飙升,李志飞在2022年10月决定重拾大模型研发。
再出发的出门问问,相较于2021年,在大模型技术能力、语音助手等AIGC应用方面已经有了积累,但是,对如何做大模型这件事,包括如何商业化落地都有了新的看法。
一方面,李志飞强调,出门问问是一家AI公司而非智能硬件公司。他指出,在未来公司将更关注大模型本身,包括软件或算法层面的技术研发和优化迭代,并会以赋能的形式与智能硬件厂商展开合作。
李志飞表示:“我们仍然认为,智能硬件会是大模型在消费端落地应用的很好的场景。我们最初做智能手表、音箱、耳机等硬件的主要目的,也是为语音助手找到更好的场景落地。但是,过去我们更多是自己做硬件,也做语音助手/VPA虚拟个人助理。因为在十年前做AI,市面上还没有好的智能硬件。我现在需要强调的是,我们主要做的是AI,接下来不做硬件。我们更多希望与(智能硬件)合作伙伴合作,为他们赋能。比如为硬件升级语音助手,与他们共同探讨如何利用硬件积累的大量有时间序列关系的数据,进行数据分析,创造更多价值。”
另一方面,尽管出门问问推出了面向创作者、C端、B端三个系列的产品/服务,但公司未来会更关注B端,以及创作者小B端的商业化机会。李志飞指出:“我们希望做企业定制类的服务,帮助他们提供专属模型,提供个性化答案,这会比一个通用大模型可能更加有用。”
目前,出门问问面向创作者提供的产品矩阵,其盈利模式已经相对成熟,采取按月付费+按使用量付费的混合模式。据介绍,出门问问的奇妙文、言之画、魔音工坊、奇妙元四个AIGC产品在全球已经拥有超500万注册用户,其中付费用户超100万。
在B端,出门问问已与春秋航空、趁早、中国移动、中国电信、易车APP、中国工商银行、VIPKID等500余个行业客户开展合作探索,覆盖企业咨询、教育培训、出海产品介绍、口播短视频、直播等多类场景。
另外,在发布会上,李志飞表示,目前新的B端合作伙伴可能需要排队等候。他坦言:“主要是因为模型现在规模较大,还没有做太多优化,所以对显卡的要求较高。这(缺卡)确实是现在一个比较现实的问题。一方面我们确实需要持续打磨模型,进行训练,另一方面我们又需要为海量用户提供服务。”但是,他补充道:“我相信算力问题可以慢慢解决”。