作为AI绘图浪潮中最受关注的一家公司,Stability AI近日又宣布推出了StableLM,一个最新的开源语言模型。
根据Stability AI的介绍,目前该模型的Alpha版本有30亿和70亿参数两个版本,但随后还将推出150亿和300亿参数的模型。和Stable Diffusion一样,该模型目前同样在Github已经开源,可供开发者下载,并基于CC BY-SA-4.0进行商用。
据悉,StableLM的训练数据主要来自开源数据集The Pile,该数据集主要收集了来自维基百科、YouTube等平台的数据。在The Pile的基础上,Stability AI将带标记内容的规模扩大到了1.5万亿个,是The Pile大小的3倍。
“尽管StableLM的参数只有30亿和70亿,远远不及GPT-3的1750亿个参数,但该数据集的丰富性使得StableLM依旧可以在对话和编程等工作上展现出卓越的能力。”Stablility AI如此说道。
Stability AI 官方示例:写邮件
根据官方Github页面的展示,StableLM可以完成包括简单对话写代码、写邮件以及Rap歌词、小说、笑话段子等内容的创意性书写。
GameLook也在官方的Huggingface上体验了StableLM 70亿参数的版本后,简单用三个问题将其与ChatGPT(GPT-3.5)进行了比较。提问均由New Bing生成,并且由于StableLM目前对中文的支持有限(支持但效果不好),所以所有提问将使用英文。
第一个问题:请用一句话解释“稳定(Stability)”的含义。
ChatGPT
StableLM
在这个问题上,ChatGPT给出了不错的答案,但StableLM则在解释“稳定”这个概念时,多次出现了“Stability”这个单词。
第二个问题:请用Python1. 请编写一个Python函数,输入一个字符串,输出该字符串中每个字母出现的次数。
ChatGPT
StableLM
同样的,CahtGPT的结果经过笔者验证,完全可行,并且在回答中,不仅代码有注释,ChatGPT还给出了示例。而StableLM显然理解错了问题,给了一串统计字符数量的代码。
第三个问题:请用“春天,樱花,微风”为提示写一首诗。
ChatGPT
StableLM
由于笔者并非欧美文学方面的专业人士,于是这一题笔者请来了New bing作为裁判,分别为两首诗歌打分。最终StableLM的诗歌得到了9分,而ChatGPT的诗歌则拿到了满分10分(当然有可能是出于一家人的偏袒)。
“这只是我的个人喜好,你可能会有不同的看法。在这种情况下,一个人可能会说’美在观者的眼中‘,意思是每个人对美的定义和感受都不一样。”
虽然在测试的问题中,StableLM的表现还有提升的空间。但其最大的优势其实并不在于参数的量级,而是开源性。
在GameLook过往的一篇文章的评论区,就有网友表示,“开源和不开源的区别就是无限大。Midjourney再强大,该用Stable Diffusion的还是用Stable Diffusion。”
开源技术是近年来推动人工智能迅速发展最重要的力量之一。通过开源软件和模型,开发人员和研究人员可以协作和建立在彼此的工作之上,加速创新的步伐。
也正是因为开源为Stability AI提供的可能性,今年三月,该公司就已经在以40亿美元的估值寻求融资了,要知道,在去年10月,该公司在融资后的估值才刚刚破10亿美元。
在科技行业许多企业降低估值都很难得到融资的当下,这无疑印证了Stability AI的潜力。
凭借其稳定性和开源性质,StableLM有潜力成为研究人员和开发人员在各种项目上的有价值的工具。而随着稳定性AI不断投资于其发展并在人工智能领域推动更大的开放性,我们可以期待在未来几年看到更多激动人心的进展。