🕵️‍♀️ 解密 Hugging Face 推理 API 的模型支持：哪些模型可以玩耍？

各位好奇宝宝们，大家好！今天我们要聊聊 Hugging Face 推理 API 的模型支持，就像一个大型游乐场，哪些玩具我们可以玩，哪些玩具暂时不能碰。

🎢 快速变化的模型世界: 开源机器学习的世界就像一个日新月异的游乐场，每天都有新的玩具（模型）出现，也有旧的玩具被淘汰。Hugging Face 推理 API 为了保证大家的游玩体验，会根据社区的喜好和使用情况，选择最受欢迎、最热门的模型放在游乐场里。这意味着，有些玩具可能会在没有预先通知的情况下被替换，就像游乐场会定期更新设备一样。

🧸 三种类型的模型玩具:

热乎乎的模型 (Warm models)：这些是随时可以玩的玩具，就像游乐场里最受欢迎的旋转木马，随时可以排队玩耍。
冷冰冰的模型 (Cold models)：这些玩具没有放在外面，但如果你想玩，工作人员可以帮你拿出来。就像游乐场里的一些特殊玩具，需要提前预约才能玩。
冻住的模型 (Frozen models)：这些玩具暂时不能玩，可能正在维修，也可能已经过时了。就像游乐场里一些暂停开放的设施。

💰 PRO 会员的特殊待遇: 如果你购买了 PRO 或企业会员，就像拥有了游乐场的 VIP 通行证，不仅可以玩所有普通玩具，还可以享受更高的游玩次数限制，并且可以免费玩一些特殊的 VIP 玩具。以下是一些 VIP 玩具的清单：

模型名称	大小 (Size)	支持的上下文长度 (Supported Context Length)	用途 (Use)
Meta Llama 3.1 Instruct	8B, 70B	70B. 32k tokens / 8B: 8k tokens✅	高质量多语言聊天模型，具有较大的上下文长度
Meta Llama 3 Instruct	8B, 70B	8k tokens	最佳聊天模型之一
Meta Llama Guard 3	8B	4k tokens
Llama 2 Chat	7B, 13B, 70B	4k tokens	最佳对话模型之一
DeepSeek Coder v2	236B	16k tokens	具有编码能力的模型
Bark	0.9B	–	文本到音频生成

需要注意的是，这份清单并非最终版本，未来可能会更新，就像游乐场会不断引进新的玩具一样。

🤫 运行私人模型: 免费的 Serverless API 主要用于运行公共模型，如果你有自己的私人玩具（模型），可以使用 Inference Endpoints 来部署，就像在游乐场里租一个私人场地来玩自己的玩具一样。

希望这篇解释能够帮助你更好地理解 Hugging Face 推理 API 的模型支持，祝你在 AI 的游乐场里玩得开心！ 🎉

发表评论 取消回复

发表评论取消回复