各位好奇宝宝们,大家好!今天我们要聊聊 Hugging Face 推理 API 的模型支持,就像一个大型游乐场,哪些玩具我们可以玩,哪些玩具暂时不能碰。
🎢 快速变化的模型世界: 开源机器学习的世界就像一个日新月异的游乐场,每天都有新的玩具(模型)出现,也有旧的玩具被淘汰。Hugging Face 推理 API 为了保证大家的游玩体验,会根据社区的喜好和使用情况,选择最受欢迎、最热门的模型放在游乐场里。这意味着,有些玩具可能会在没有预先通知的情况下被替换,就像游乐场会定期更新设备一样。
🧸 三种类型的模型玩具:
- 热乎乎的模型 (Warm models):这些是随时可以玩的玩具,就像游乐场里最受欢迎的旋转木马,随时可以排队玩耍。
- 冷冰冰的模型 (Cold models):这些玩具没有放在外面,但如果你想玩,工作人员可以帮你拿出来。就像游乐场里的一些特殊玩具,需要提前预约才能玩。
- 冻住的模型 (Frozen models):这些玩具暂时不能玩,可能正在维修,也可能已经过时了。就像游乐场里一些暂停开放的设施。
💰 PRO 会员的特殊待遇: 如果你购买了 PRO 或企业会员,就像拥有了游乐场的 VIP 通行证,不仅可以玩所有普通玩具,还可以享受更高的游玩次数限制,并且可以免费玩一些特殊的 VIP 玩具。以下是一些 VIP 玩具的清单:
模型名称 | 大小 (Size) | 支持的上下文长度 (Supported Context Length) | 用途 (Use) |
---|---|---|---|
Meta Llama 3.1 Instruct | 8B, 70B | 70B. 32k tokens / 8B: 8k tokens✅ | 高质量多语言聊天模型,具有较大的上下文长度 |
Meta Llama 3 Instruct | 8B, 70B | 8k tokens | 最佳聊天模型之一 |
Meta Llama Guard 3 | 8B | 4k tokens | |
Llama 2 Chat | 7B, 13B, 70B | 4k tokens | 最佳对话模型之一 |
DeepSeek Coder v2 | 236B | 16k tokens | 具有编码能力的模型 |
Bark | 0.9B | – | 文本到音频生成 |
需要注意的是,这份清单并非最终版本,未来可能会更新,就像游乐场会不断引进新的玩具一样。
🤫 运行私人模型: 免费的 Serverless API 主要用于运行公共模型,如果你有自己的私人玩具(模型),可以使用 Inference Endpoints 来部署,就像在游乐场里租一个私人场地来玩自己的玩具一样。
希望这篇解释能够帮助你更好地理解 Hugging Face 推理 API 的模型支持,祝你在 AI 的游乐场里玩得开心! 🎉