📚 开源大模型

食用指南

首页
📚 模型教程
Atom-7B-chat Atom-7B-Chat 的 Lora 指令微调 Atom-7B-Chat 接入langchain搭建知识库助手 Atom-7B-chat 全量微调 readme 代码检索场景微调实战,基于pytorch微调BGE-M3 embedding模型 Baichuan2-7B-chat FastApi 部署调用 Baichuan-7B-chat WebDemo 部署调用 Baichuan2-7B-chat langchain 接入 Baichuan2-7B-chat lora 微调 BlueLM-7B-Chat FastApi 部署 BlueLM-7B-Chat langchain 接入 BlueLM-7B-Chat WebDemo 部署 BlueLM-7B-Chat Lora 微调 CharacterGLM-6B Transformers部署调用 CharacterGLM-6B FastApi部署调用 CharacterGLM-6B-chat 04-CharacterGLM-6B-Chat Lora微调 CharacterGLM-6B ChatGLM3-6B Transformers部署调用 ChatGLM3-6B FastApi 部署调用 ChatGLM3-6B-chat ChatGLM3-6B Code Interpreter 基于 ChatGLM3 和 LangChain 搭建知识库助手 06-ChatGLM3-6B-chat Lora 微调 ChatGLM3-6B Pipeline DeepSeek-7B-chat FastApi 部署调用 DeepSeek-7B-chat langchain 接入 DeepSeek-7B-chat WebDemo 部署 DeepSeek-7B-chat Lora 微调 DeepSeek-7B-chat 4bits量化 QLora 微调 06-DeepSeek-MoE-16b-chat FastApi 部署调用 DeepSeek-MoE-16b-chat Transformers 部署调用 DeepSeek-Coder-V2-Lite-Instruct FastApi 部署调用 DeepSeek-Coder-V2-Lite-Instruct 接入 LangChain DeepSeek-Coder-V2-Lite-Instruct WebDemo 部署 DeepSeek-Coder-V2-Lite-Instruct Lora 微调 DeepSeek-R1-Distill-Qwen-7B FastApi 部署调用 DeepSeek-R1-Distill-Qwen-7B Langchain 接入 DeepSeek-R1-Distill-Qwen-7B WebDemo 部署 04-DeepSeek-R1-Distill-Qwen-7B vLLM 部署调用 DeepSeek-R1-Distill-Qwen3-8B GRPO微调教程 readme 01-ERNIE-4.5-0.3B-PT Lora 微调及 SwanLab 可视化记录 GLM-4-9B-chat FastApi 部署调用 GLM-4-9b-Chat 接入 LangChain GLM-4-9B-Chat WebDemo 部署 04-GLM-4-9B-Chat vLLM 部署调用 GLM4-9B-chat Lora 微调. GLM4-9B-chat-hf Lora 微调. 01-GLM-4.1V-Thinking vLLM部署调用 02-GLM-4.1V-Thinking Gradio部署 03-GLM-4.1V-Thinking LoRA 及 SwanLab 可视化记录 01-GLM-4.5-Air vLLM 部署调用 02-GLM-4.5-Air EvalScope 智商情商&&并发评测 03-GLM-4.5-Air-LoRA 及 SwanLab 可视化记录 01-Gemma-2B-Instruct FastApi 部署调用 Gemma-2B langchain 接入 03-Gemma-2B-Chat WebDemo 部署 Gemma2b-Instruct Lora 微调 Gemma-2-9b-it FastApi 部署调用 02-Gemma-2-9b-it langchain 接入 Yuan2.0-2B WebDemo部署 Gemma-2-9b-it peft lora微调 gemma-3-4b-it FastApi 部署调用 ollama + open-webui 部署 gemma 3-4b 模型 04-Gemma3-4b evalscope智商情商评测 05-gemma-3-4b-it LoRA 微调 Gemma3-4B GRPO微调教程 01-pip、conda换源 02-AutoDL开放端口 下载模型 1.Github提交PR与修改pr 01-Hunyuan-A13B-Instruct 模型架构解析 Blog 02-Hunyuan-A13B-Instruct-vLLM 03-Hunyuan-A13B-Instruct-SGLang部署调用 04-Hunyuan-A13B-Instruct EvalScope 并发测试 Hunyuan-A13B-Instruct-LoRA 及 SwanLab 可视化记录 Hunyuan3D-2.0系列模型部署 Hunyuan3D-2系列模型代码调用 Hunyuan3D-2系列Gradio App Hunyuan3D-2系列 API Server InternLM-Chat-7B Transformers 部署调用 internLM-Chat-7B FastApi 部署调用 InternLM-Chat-7B 对话 Web Lagent+InternLM-Chat-7B-V1.1 浦语灵笔图文理解&创作 基于 InternLM 和 LangChain 搭建知识库助手 readme InternLM2-7B-chat FastAPI 部署 InternLM2-7B-chat langchain 接入 InternLM2-7B-chat WebDemo 部署 InternLM2-7B-chat Xtuner Qlora 微调 InternLM3-8B-instruct FastAPI部署 InternLM3-8B-Instruct Langchain 接入 InternLM3-8B-Instruct WebDemo 部署 InternLM3-8b-Instruct LoRA 微调 环境配置依赖 Kimi-VL-多模态推理对话助手 Kimi-VL技术报告解读 Kimi-VL 多模态对话助手 Llama-3-8B-Instruct FastApi 部署调用 LLaMA3-8B-Instruct langchain 接入 LLaMA3-8B-Instruct WebDemo 部署 LLaMA3-8B-Instruct Lora 微调 Llama3_1-8B-Instruct FastApi 部署调用 LLaMA3_1-8B-Instruct langchain 接入 LLaMA3_1-8B-Instruct WebDemo 部署 LLaMA3_1-8B-Instruct Lora 微调 05-Llama3_1-8B-Instruct o1-like 推理链实现 引言 Llama4-对话助手 Llama-4-Scout 对话助手 MiniCPM-2B-chat FastApi 部署调用 MiniCPM-2B-chat transformers 部署调用 MiniCPM-2B-chat WebDemo部署 MiniCPM-2B-chat transformers 部署调用 MiniCPM-2B-chat transformers 部署调用 MiniCPM-o 2.6 FastApi部署调用 InternLM3-8B-Instruct WebDemo 部署 MiniCPM-o-2.6 多模态语音能力 MiniCPM-o-2.6 Lora 微调 Qwen2-7B-Instruct FastApi 部署调用 OpenELM-3B-Instruct Lora 微调 1. 模型简介 Qwen-7B-hat Transformers 部署调用 Qwen-7B-Chat FastApi 部署调用 Qwen-7B-Chat WebDemo 04-Qwen-7B-Chat Lora 微调 05-Qwen-7B-Chat Ptuning 微调 Qwen-7B-chat 全量微调 Qwen-7B-Chat 接入langchain搭建知识库助手 08-Qwen-7B-Chat Lora 低精度微调 09-Qwen-1_8B-chat CPU 部署 readme Qwen-Audio-chat FastApi 部署调用 Qwen-Audio-chat WebDemo 部署 Qwen1.5-7B-Chat FastApi 部署调用 Qwen1.5-7B-Chat 接入 LangChain 搭建知识库助手 Qwen1.5-7B-Chat WebDemo 部署 Qwen1.5-7B-Chat Lora 微调 Qwen1.5-7B-Chat-GPTQ-Int4 部署环境 Qwen1.5-MoE-Chat Transformers 部署调用 Qwen1.5-7B-Chat vLLM 部署调用 Qwen1.5-7B-chat Lora 微调 接入SwanLab实验管理平台 Qwen2-7B-Instruct FastApi 部署调用 Qwen2-7B-Instruct 接入 LangChain 搭建知识库助手 Qwen2-7B-Instruct WebDemo部署 04-Qwen2-7B-Instruct vLLM 部署调用 Qwen2-7B-Instruct Lora 微调 Qwen2-VL-2B-Instruct FastApi 部署调用 Qwen2-VL-2B-Instruct WebDemo 部署 03-Qwen2-vl-2B vLLM 部署调用 Qwen2-VL-2B-Instruct Lora 微调 Qwen2-VL-2B-Instruct Lora 微调 SwanLab可视化记录版 Qwen2-VL-2B-Instruct Lora 微调案例 - LaTexOCR Qwen2.5-7B-Instruct FastApi 部署调用 Qwen2.5-7B-Instruct Langchain 接入 03-Qwen2.5-7B-Instruct vLLM 部署调用 Qwen2_5-7B-Instruct WebDemo 部署 Qwen2.5-7B-Instruct Lora 微调 06-Qwen2.5-7B-Instruct o1-like 推理链实现 Qwen2.5-7B-Instruct Lora 微调 SwanLab可视化记录版 Qwen2.5 Qwen2.5-7B-Instruct FastApi 部署调用 Qwen2.5-7B-Instruct Langchain 接入 Qwen2_5-7B-Instruct WebDemo 部署 03-Qwen2.5-7B-Instruct vLLM 部署调用 Qwen2.5-Coder-7B-Instruct Lora 微调 SwanLab 可视化记录版 Qwen2.5-Coder-7B-Instruct Lora 微调 Qwen3 模型结构解析 Blog 02-Qwen3-8B vLLM 部署调用 Qwen3-7B-Instruct Windows LMStudio 部署 04-Qwen3-8B EvalScope 智商情商评测 Qwen3-8B-LoRA 及 SwanLab 可视化记录 06-Qwen3-30B-A3B 微调及 SwanLab 可视化记录 Qwen3 Think 解密 大模型都这么厉害了,还需要微调吗?0.6B的小模型还有什么意义吗? 09-Qwen3-1.7B-医学推理式对话微调 及 SwanLab 可视化记录 Qwen3-8B GRPO微调及通过swanlab可视化 Qwen3-VL 模型结构解析(DeepStack解析) Qwen3-VL-4B-Instruct FastApi 部署调用 04-Qwen3-VL-4B-Instruct-vLLM Qwen/Qwen3-VL-4B-Instruct Lora 可视化微调案例 - LaTexOCR Qwen/Qwen3-VL-4B-Instruct Lora 可视化微调案例 - LaTexOCR SpatialLM 3D点云理解与目标检测模型部署 TransNormerLLM-7B FastApi 部署调用 TransNormerLLM-7B 接入 LangChain 搭建知识库助手 TransNormerLLM-7B WebDemo 部署 TransNormerLLM-7B Lora 微调 XVERSE-7B-chat Transformers 推理 XVERSE-7B-chat FastAPI 部署 XVERSE-7B-chat langchain 接入 XVERSE-7B-chat WebDemo 部署 XVERSE-7B-Chat Lora 微调 XVERSE-MoE-A4.2B Transformers 部署调用 Yi-6B-Chat FastApi 部署调用 Yi-6B-Chat 接入 LangChain 搭建知识库助手 Yi-6B-chat WebDemo 部署 04-Yi-6B-Chat Lora 微调 Yuan2.0-2B FastApi 部署调用 Yuan2.0-2B 接入 LangChain 搭建知识库助手 Yuan2.0-2B WebDemo部署 基于vLLM的Yuan 2.0推理服务部署 Yuan2.0-2B Lora微调 1. 模型简介 Yuan2.0-M32 FastApi 部署调用 Yuan2.0-M32 接入 LangChain 搭建知识库助手 Yuan2.0-M32 WebDemo部署 1. 模型简介 Index-1.9B-Chat FastApi 部署调用 Index-1.9B-Chat LangChain 接入 Index-1.9B-Chat WebDemo 部署 Index-1.9B-Chat Lora 微调 **01-GPT-OSS-20b** **vLLM** **部署调用** 02-gpt-oss-20b EvalScope 评测 03-gpt-oss-20b lmstudio 本地部署调用 04-gpt-oss-20b Lora微调以及Swanlab可视化 05-gpt-oss-20b DPO微调以及Swanlab可视化 Phi-3-mini-4k-instruct FastApi 部署调用 Phi-3-mini-4k-instruct langchain 接入 Phi-3-mini-4k-instruct WebDemo 部署 Phi-3-mini-4k-Instruct Lora 微调 Phi-4 FastApi 部署调用 Phi-4 Langchain接入 Phi-4 WebDemo 部署 Phi-4 Lora 微调 Phi-4 Lora 微调 命名实体识别任务 SwanLab 可视化记录版 Gemma3-4B GRPO微调教程
💡 示例项目
Examples AMchat 高等数学大模型 Chat-嬛嬛 是如何炼成的 天机简介 如何练就一个我
← 返回首页

© 2025 开源大模型食用指南

GitHub 借一步网