BLOOMChat: 开源可商用支持多语言的大语言模型,性能逼近GPT-4!

502次阅读
5 条评论

背景: 目前开源的大语言模型对多语言支持不够理想, 且大多数模型参数量不够大, 无法商用。而 SambaNova 和 Together 联合开源的 BLOOMChat 是一个支持 46 种语言、参数达 1760 亿的开源可商用微调模型。

  • BLOOMChat: BLOOMChat 是在 SambaNova 的 AI 计算平台上训练的, 目的是打造一个开源的、支持多语言、可商用的聊天 LLM。实验表明 BLOOMChat 对多语言的支持明显优于其它开源模型。
  • 数据和方法: BLOOMChat 使用 OpenChatKit、Dolly 2.0 和 OASST1 等英语数据集进行 BLOOM(176B) 模型的微调。尽管只用英语数据微调, 但 BLOOMChat 在其他语言的对话质量也得到明显提高。
  • 实验效果: 让不同语言的 native speaker 评价 BLOOMChat 在其语言下的回答质量,BLOOMChat 明显优于其他开源模型, 但略逊于 GPT-4。对 BLOOMChat 的回答进行评分,70% 以上得到正确或可接受的评价。在 WMT 翻译任务上,BLOOMChat 优于其他开源模型, 但弱于 GPT-4。
  • BLOOMChat 的局限性: 可能生成错误或无关信息, 切换语言, 重复内容, 对代码或数学问题生成效果一般, 可能产生不适当内容等。

BLOOMChat 是一个完全开源、超千亿参数、专门针对多语言的聊天 LLM。

sambanova/bloomchat: This repo contains the data preparation, tokenization, training and inference code for BLOOMChat. BLOOMChat is a 176 billion parameter multilingual chat model based on BLOOM. (github.com)

正文完
 
评论(5 条评论)
2023-05-22 00:07:13 回复

https://huggingface.co/spaces/sambanovasystems/BLOOMChat

 Windows  Edge  中国上海上海市联通
2023-05-22 00:27:08 回复

SambaNova 提供一体化的生成式人工智能平台,包括 SambaNova 顶尖的 RDU 加速器、软件和模型管理以及预训练的生成式人工智能检查点。

 Windows  Edge  中国上海上海市联通
2023-05-22 00:27:22 回复

https://api.together.xyz/bloom-chat

 Windows  Edge  中国上海上海市联通
2023-05-26 10:51:21 回复

大杀器QLoRA出现,单GPU可部署ChatBot,甚至达ChatGPT 99%的能力
https://zhuanlan.zhihu.com/p/632051189

 Macintosh  Edge  中国上海上海市联通
2023-05-27 16:01:43 回复

开源类ChatGPT模型 | BLOOMChat | 1760亿参数 | 可支持中文在内46种语言 | Apache 2.0许可可商用 | SambaNova和Together联合推出
https://www.youtube.com/watch?v=IiHY1Mit4wM

 Windows  Edge  中国上海上海市联通