📚 开源大模型
食用指南
首页
📚 模型教程
Atom-7B-chat
Atom-7B-Chat 的 Lora 指令微调
Atom-7B-Chat 接入langchain搭建知识库助手
Atom-7B-chat 全量微调
readme
代码检索场景微调实战,基于pytorch微调BGE-M3 embedding模型
Baichuan2-7B-chat FastApi 部署调用
Baichuan-7B-chat WebDemo 部署调用
Baichuan2-7B-chat langchain 接入
Baichuan2-7B-chat lora 微调
BlueLM-7B-Chat FastApi 部署
BlueLM-7B-Chat langchain 接入
BlueLM-7B-Chat WebDemo 部署
BlueLM-7B-Chat Lora 微调
CharacterGLM-6B Transformers部署调用
CharacterGLM-6B FastApi部署调用
CharacterGLM-6B-chat
04-CharacterGLM-6B-Chat Lora微调
CharacterGLM-6B
ChatGLM3-6B Transformers部署调用
ChatGLM3-6B FastApi 部署调用
ChatGLM3-6B-chat
ChatGLM3-6B Code Interpreter
基于 ChatGLM3 和 LangChain 搭建知识库助手
06-ChatGLM3-6B-chat Lora 微调
ChatGLM3-6B Pipeline
DeepSeek-7B-chat FastApi 部署调用
DeepSeek-7B-chat langchain 接入
DeepSeek-7B-chat WebDemo 部署
DeepSeek-7B-chat Lora 微调
DeepSeek-7B-chat 4bits量化 QLora 微调
06-DeepSeek-MoE-16b-chat FastApi 部署调用
DeepSeek-MoE-16b-chat Transformers 部署调用
DeepSeek-Coder-V2-Lite-Instruct FastApi 部署调用
DeepSeek-Coder-V2-Lite-Instruct 接入 LangChain
DeepSeek-Coder-V2-Lite-Instruct WebDemo 部署
DeepSeek-Coder-V2-Lite-Instruct Lora 微调
DeepSeek-R1-Distill-Qwen-7B FastApi 部署调用
DeepSeek-R1-Distill-Qwen-7B Langchain 接入
DeepSeek-R1-Distill-Qwen-7B WebDemo 部署
04-DeepSeek-R1-Distill-Qwen-7B vLLM 部署调用
DeepSeek-R1-Distill-Qwen3-8B GRPO微调教程
readme
01-ERNIE-4.5-0.3B-PT Lora 微调及 SwanLab 可视化记录
GLM-4-9B-chat FastApi 部署调用
GLM-4-9b-Chat 接入 LangChain
GLM-4-9B-Chat WebDemo 部署
04-GLM-4-9B-Chat vLLM 部署调用
GLM4-9B-chat Lora 微调.
GLM4-9B-chat-hf Lora 微调.
01-GLM-4.1V-Thinking vLLM部署调用
02-GLM-4.1V-Thinking Gradio部署
03-GLM-4.1V-Thinking LoRA 及 SwanLab 可视化记录
01-GLM-4.5-Air vLLM 部署调用
02-GLM-4.5-Air EvalScope 智商情商&&并发评测
03-GLM-4.5-Air-LoRA 及 SwanLab 可视化记录
01-Gemma-2B-Instruct FastApi 部署调用
Gemma-2B langchain 接入
03-Gemma-2B-Chat WebDemo 部署
Gemma2b-Instruct Lora 微调
Gemma-2-9b-it FastApi 部署调用
02-Gemma-2-9b-it langchain 接入
Yuan2.0-2B WebDemo部署
Gemma-2-9b-it peft lora微调
gemma-3-4b-it FastApi 部署调用
ollama + open-webui 部署 gemma 3-4b 模型
04-Gemma3-4b evalscope智商情商评测
05-gemma-3-4b-it LoRA 微调
Gemma3-4B GRPO微调教程
01-pip、conda换源
02-AutoDL开放端口
下载模型
1.Github提交PR与修改pr
01-Hunyuan-A13B-Instruct 模型架构解析 Blog
02-Hunyuan-A13B-Instruct-vLLM
03-Hunyuan-A13B-Instruct-SGLang部署调用
04-Hunyuan-A13B-Instruct EvalScope 并发测试
Hunyuan-A13B-Instruct-LoRA 及 SwanLab 可视化记录
Hunyuan3D-2.0系列模型部署
Hunyuan3D-2系列模型代码调用
Hunyuan3D-2系列Gradio App
Hunyuan3D-2系列 API Server
InternLM-Chat-7B Transformers 部署调用
internLM-Chat-7B FastApi 部署调用
InternLM-Chat-7B 对话 Web
Lagent+InternLM-Chat-7B-V1.1
浦语灵笔图文理解&创作
基于 InternLM 和 LangChain 搭建知识库助手
readme
InternLM2-7B-chat FastAPI 部署
InternLM2-7B-chat langchain 接入
InternLM2-7B-chat WebDemo 部署
InternLM2-7B-chat Xtuner Qlora 微调
InternLM3-8B-instruct FastAPI部署
InternLM3-8B-Instruct Langchain 接入
InternLM3-8B-Instruct WebDemo 部署
InternLM3-8b-Instruct LoRA 微调
环境配置依赖
Kimi-VL-多模态推理对话助手
Kimi-VL技术报告解读
Kimi-VL 多模态对话助手
Llama-3-8B-Instruct FastApi 部署调用
LLaMA3-8B-Instruct langchain 接入
LLaMA3-8B-Instruct WebDemo 部署
LLaMA3-8B-Instruct Lora 微调
Llama3_1-8B-Instruct FastApi 部署调用
LLaMA3_1-8B-Instruct langchain 接入
LLaMA3_1-8B-Instruct WebDemo 部署
LLaMA3_1-8B-Instruct Lora 微调
05-Llama3_1-8B-Instruct o1-like 推理链实现
引言
Llama4-对话助手
Llama-4-Scout 对话助手
MiniCPM-2B-chat FastApi 部署调用
MiniCPM-2B-chat transformers 部署调用
MiniCPM-2B-chat WebDemo部署
MiniCPM-2B-chat transformers 部署调用
MiniCPM-2B-chat transformers 部署调用
MiniCPM-o 2.6 FastApi部署调用
InternLM3-8B-Instruct WebDemo 部署
MiniCPM-o-2.6 多模态语音能力
MiniCPM-o-2.6 Lora 微调
Qwen2-7B-Instruct FastApi 部署调用
OpenELM-3B-Instruct Lora 微调
1. 模型简介
Qwen-7B-hat Transformers 部署调用
Qwen-7B-Chat FastApi 部署调用
Qwen-7B-Chat WebDemo
04-Qwen-7B-Chat Lora 微调
05-Qwen-7B-Chat Ptuning 微调
Qwen-7B-chat 全量微调
Qwen-7B-Chat 接入langchain搭建知识库助手
08-Qwen-7B-Chat Lora 低精度微调
09-Qwen-1_8B-chat CPU 部署
readme
Qwen-Audio-chat FastApi 部署调用
Qwen-Audio-chat WebDemo 部署
Qwen1.5-7B-Chat FastApi 部署调用
Qwen1.5-7B-Chat 接入 LangChain 搭建知识库助手
Qwen1.5-7B-Chat WebDemo 部署
Qwen1.5-7B-Chat Lora 微调
Qwen1.5-7B-Chat-GPTQ-Int4 部署环境
Qwen1.5-MoE-Chat Transformers 部署调用
Qwen1.5-7B-Chat vLLM 部署调用
Qwen1.5-7B-chat Lora 微调 接入SwanLab实验管理平台
Qwen2-7B-Instruct FastApi 部署调用
Qwen2-7B-Instruct 接入 LangChain 搭建知识库助手
Qwen2-7B-Instruct WebDemo部署
04-Qwen2-7B-Instruct vLLM 部署调用
Qwen2-7B-Instruct Lora 微调
Qwen2-VL-2B-Instruct FastApi 部署调用
Qwen2-VL-2B-Instruct WebDemo 部署
03-Qwen2-vl-2B vLLM 部署调用
Qwen2-VL-2B-Instruct Lora 微调
Qwen2-VL-2B-Instruct Lora 微调 SwanLab可视化记录版
Qwen2-VL-2B-Instruct Lora 微调案例 - LaTexOCR
Qwen2.5-7B-Instruct FastApi 部署调用
Qwen2.5-7B-Instruct Langchain 接入
03-Qwen2.5-7B-Instruct vLLM 部署调用
Qwen2_5-7B-Instruct WebDemo 部署
Qwen2.5-7B-Instruct Lora 微调
06-Qwen2.5-7B-Instruct o1-like 推理链实现
Qwen2.5-7B-Instruct Lora 微调 SwanLab可视化记录版
Qwen2.5
Qwen2.5-7B-Instruct FastApi 部署调用
Qwen2.5-7B-Instruct Langchain 接入
Qwen2_5-7B-Instruct WebDemo 部署
03-Qwen2.5-7B-Instruct vLLM 部署调用
Qwen2.5-Coder-7B-Instruct Lora 微调 SwanLab 可视化记录版
Qwen2.5-Coder-7B-Instruct Lora 微调
Qwen3 模型结构解析 Blog
02-Qwen3-8B vLLM 部署调用
Qwen3-7B-Instruct Windows LMStudio 部署
04-Qwen3-8B EvalScope 智商情商评测
Qwen3-8B-LoRA 及 SwanLab 可视化记录
06-Qwen3-30B-A3B 微调及 SwanLab 可视化记录
Qwen3 Think 解密
大模型都这么厉害了,还需要微调吗?0.6B的小模型还有什么意义吗?
09-Qwen3-1.7B-医学推理式对话微调 及 SwanLab 可视化记录
Qwen3-8B GRPO微调及通过swanlab可视化
Qwen3-VL 模型结构解析(DeepStack解析)
Qwen3-VL-4B-Instruct FastApi 部署调用
04-Qwen3-VL-4B-Instruct-vLLM
Qwen/Qwen3-VL-4B-Instruct Lora 可视化微调案例 - LaTexOCR
Qwen/Qwen3-VL-4B-Instruct Lora 可视化微调案例 - LaTexOCR
SpatialLM 3D点云理解与目标检测模型部署
TransNormerLLM-7B FastApi 部署调用
TransNormerLLM-7B 接入 LangChain 搭建知识库助手
TransNormerLLM-7B WebDemo 部署
TransNormerLLM-7B Lora 微调
XVERSE-7B-chat Transformers 推理
XVERSE-7B-chat FastAPI 部署
XVERSE-7B-chat langchain 接入
XVERSE-7B-chat WebDemo 部署
XVERSE-7B-Chat Lora 微调
XVERSE-MoE-A4.2B Transformers 部署调用
Yi-6B-Chat FastApi 部署调用
Yi-6B-Chat 接入 LangChain 搭建知识库助手
Yi-6B-chat WebDemo 部署
04-Yi-6B-Chat Lora 微调
Yuan2.0-2B FastApi 部署调用
Yuan2.0-2B 接入 LangChain 搭建知识库助手
Yuan2.0-2B WebDemo部署
基于vLLM的Yuan 2.0推理服务部署
Yuan2.0-2B Lora微调
1. 模型简介
Yuan2.0-M32 FastApi 部署调用
Yuan2.0-M32 接入 LangChain 搭建知识库助手
Yuan2.0-M32 WebDemo部署
1. 模型简介
Index-1.9B-Chat FastApi 部署调用
Index-1.9B-Chat LangChain 接入
Index-1.9B-Chat WebDemo 部署
Index-1.9B-Chat Lora 微调
**01-GPT-OSS-20b** **vLLM** **部署调用**
02-gpt-oss-20b EvalScope 评测
03-gpt-oss-20b lmstudio 本地部署调用
04-gpt-oss-20b Lora微调以及Swanlab可视化
05-gpt-oss-20b DPO微调以及Swanlab可视化
Phi-3-mini-4k-instruct FastApi 部署调用
Phi-3-mini-4k-instruct langchain 接入
Phi-3-mini-4k-instruct WebDemo 部署
Phi-3-mini-4k-Instruct Lora 微调
Phi-4 FastApi 部署调用
Phi-4 Langchain接入
Phi-4 WebDemo 部署
Phi-4 Lora 微调
Phi-4 Lora 微调 命名实体识别任务 SwanLab 可视化记录版
Gemma3-4B GRPO微调教程
💡 示例项目
Examples
AMchat 高等数学大模型
Chat-嬛嬛 是如何炼成的
天机简介
如何练就一个我
← 返回首页