Anima—开源的33B中文大型语言模型

249次阅读

🎉 引言

👋 大家好，欢迎来到我们的播客节目。我知道你们每次来，都是期待听到一些新奇、有趣、颠覆常规的内容。那么今天，我带给大家的就是一项来自人工智能领域的重大突破——它名为 Anima。

💡 什么是 Anima？

Anima，这是一个开源的 33B 中文大语言模型 (LLM)，是目前市面上第一个开源的如此庞大的中文 LLM。但不仅如此，Anima 还支持 DPO 对齐训练，同时也是我们开源的支持 100k 上下文窗口的模型。你也许会问，这些术语是什么意思，为什么它们如此重要。别急，接下来我会一一解释给大家听。

🚀 Anima 的特性

首先，让我们来了解一下什么是大语言模型。简单来说，大语言模型是一种人工智能模型，它能理解和生成人类语言。而 33B，这个数字代表的是模型的规模，也就是模型的参数数量。在 Anima 中，这个数字达到了 330 亿，这意味着 Anima 具有极强的理解和生成语言的能力。

接下来，我要介绍的是 DPO 对齐训练。DPO，全称为 Distributed Policy Optimization，是一种分布式策略优化技术。它可以帮助我们高效地训练大规模的人工智能模型，让它们可以更好地理解和生成语言。

最后，我要说的是 100k 上下文窗口。在语言模型中，上下文窗口的大小决定了模型可以理解的语境范围。100k 的上下文窗口意味着 Anima 可以理解更长的文本，更丰富的语境，从而生成更准确、更自然的语言。

🌟 AirLLM 的升级

而最新的更新，是我们引入了 AirLLM。这是一个库，它可以帮助你使用单个 GPU，只需 4GB 的内存，就能推断 70B 的大型语言模型。这意味着，你不再需要拥有强大的计算资源，也可以使用超大规模的语言模型。这无疑为个人开发者和小型团队打开了一扇新的大门。

⭐ 结语

Anima，这是一项突破性的工作，它让我们看到了人工智能的可能性和未来。无论你是一个开发者，还是对人工智能有兴趣的听众，我都邀请你去看看 Anima 的 GitHub 页面。你会发现，那里有一个全新的世界，等待着你的探索。谢谢大家，我们下期节目再见！

👋 再见，祝你有美好的一天！

正文完

发表至： AGI

2023-11-26

ProAgent: 构建具有主动合作能力的大型语言模型

Deductive Closure Training of Language Models for Coherence, Accuracy, and Updatability

语言的桥梁：AI 如何帮助不同语言之间无障碍交流

QLoRA: 高效微调大型语言模型的利器

ICL vs Fine-tuning：迁移学习中的两种方法