由 Stability.ai 发布的开源模型 Stable Diffusion 可以说是目前最主流也是最重要的 AI 绘画模型之一。
基于开源的 Stable Diffusion,开发者社区创作了许多有意思的插件和模型,例如可以控制图形形状的 Control Net 项目等,相关的开发项目超过 1000 个。
现在,这家热衷于开源的 AI 公司又想搞一个大事情——发布一个类似 ChatGPT 的开源大语言模型。
(资料图)
2023 年可以说大语言模型井喷的一年,这几个月以来,几乎每个星期都有一个新的大语言模型面世。大模型、小模型、文本生成的、多模态的、闭源的、开源的……现在就是大语言模型的春天,各家百花齐放。
这份热闹不仅属于微软、Google、百度、阿里等互联网大厂,也属于所有与 AI 相关的科技公司。
和现有的大模型相比,Stability.ai 发布的 StableLM 大语言模型有什么特别的呢?
根据 Stability.ai 的介绍,目前 StableLM 是一个开源且透明的模型,允许研究人员和开发者自由地检查、使用和修改代码。就像 Stable Diffusion 一样,用户们都可以自由地配置 Stable LM,打造专为自己需求而量身定制的大语言模型。
目前 Stable LM Alpha 版本模型的参数大小为 30 亿和 70 亿,未来 Stability.ai 还会提供 150 亿和 650 亿参数大小的模型版本。
尽管和 GPT-3 模型的 1750 亿参数相比,StableLM 的模型大小要小得多,但 Stability.ai 表示 StableLM 是基于一个比 The Pile 数据集还要大 3 倍的扩展数据集训练而成,在编码和自然语言对话方面都有不错的表现。
The Pile 数据集本身已经包括了大量书籍、Github 知识库、网页、聊天记录等数据,还收集了医学、物理、数学、计算机科学和哲学学科的论文,可以为通用大语言模型、跨领域文本生成训练提供很好的基准。
因此在实际使用时,StableLM 与 GPT-3 的差距并不像纸面参数数据的差异那样明显。
Stability.ai 在公告中展示了 StableLM 处理三个不同任务的实际表现,包括写邮件、写 Rap 歌词(问题:写一首深度学习网络与符号人工智能互呛的史诗级 Battle 歌词。只能说这极客味太重了)和写代码。
Stability.ai 还把 StableLM 托管在了 HuggingFace 的社区网站上,想抢先体验的朋友可以到以下地址调戏它⬇️
https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat
从我们做的简短测试来看,StableLM 的中文水平还不如郭杰瑞,更不用说和 ChatGPT 这样的优等生对比,因此在对话时尽量使用选择英语。
和包括斯坦福大学的 Alpaca 在内的众多开源大语言模型一样,StableLM 给了很多开发者在本地或者服务器亲手定制大语言模型的机会,不用再担心你的数据泄漏给了模型后台。
ChatGPT 爆火后,关于 AI 模型的数据隐私问题层出不穷,前不久三星还被爆出有多名员工向 ChatGPT 泄漏机密数据的事件,以致三星的半导体部门决定自己开发内部 AI 工具,避免类似的问题再次发生。
开源模型除了有高透明度的优势,开发者们也更容易利用开源模型开发出更具有创造力的应用。例如你可以对 StableLM 做定制化的调试,让它变成一个不会停歇的网文作家,或者是非常熟悉公司项目的资深程序员或文案写手,甚至可以调试成微博上的星座运程大师。
开源模型给了开发者更大的想象力空间,但与此同时,也会给作恶者更先进的手段。
对别有用心者来说,开源大语言模型可能就是做电信诈骗的神器,他们可以逼真的对话把人们骗的团团转。
开源总是会伴随争议,这一点 Stability.ai 早有预料。此前因为开源 Stable Diffusion,Stability.ai 已经遭到了许多涉嫌侵犯艺术家权利的法律诉讼,以及因用户使用其工具生成色情内容而引起的争议。
Stability.ai 的 CEO Emad Mostaque 在此前的采访中提到,大模型需要接受更多监督,而不是被大公司锁在小黑盒里,因此大模型的社区开放性也非常重要。Stability.ai 坚持开源,是想把技术带给更多的人,引发人们的思考。
StableLM 是对 Stability.ai 的承诺最新验证,一个人人都有专属语言模型的未来或许就此展开。
广告
X 关闭
广告
X 关闭
焦点访谈丨追星逐月步履不停 “最忙乘组”的183天(资料图片仅供参考)2022年12月4日晚,神舟十四号飞行...
(资料图片仅供参考)进一步降低企业经营成本,加大金融支持力度,稳定产业链供应链,加力稳就业保民生…...
党的二十大报告提出,“保障妇女儿童合法权益”。10月28日,最高人民检察院关于人民检察院开展未成年人...
金融支持稳经济大盘政策落地观察(相关资料图)金融工具发力稳投资 年内加速落地见效政策性开发性金融工...
(资料图片仅供参考)中新社北京12月6日电 (记者 阮煜琳)中国物流与采购联合会6日发布数据显示,11月全...
(资料图)【环球时报综合报道】为避免种族主义,迪士尼决定对乐园内受争议的游乐设施——“飞溅山”进行...
(资料图片)【环球时报综合报道】欧洲规模最大的中东书店——萨奇书店已确定将于今年12月31日关门谢客。...
【资料图】【环球时报驻美国特约记者 郑可 环球时报特约记者 余果】美国可能会通过一项法案、允许新...
(资料图片)新华社北京12月6日电国家中医药管理局近日印发《“十四五”中医药信息化发展规划》。规划提出...
(资料图片)新华社联合国12月6日电(记者王建刚)中国常驻联合国副代表耿爽6日表示,中方高度重视并积极...