Qwen3 GSPO 与 DeepSeek-R1 GRPO 算法深度对比分析 2025-07-30 作者 Steper GSPO (Group Sequence Policy Optimization) 和 GRPO (Group ... 阅读更多
BMAD-METHOD 深度分析报告 2025-07-292025-07-29 作者 Steper BMAD-METHOD 是一个创新的 AI 驱动敏捷开发框架,它通过模拟一个由多个专业化 AI 代理 (如分析师 ... 阅读更多
自下而上的领域特定超级智能:可靠知识图谱的核心作用 2025-07-302025-07-29 作者 Steper https://kg-bottom-up-superintelligence.github.io
AI" 想越久越笨" 现象深度研究:成因分析与破解策略 2025-07-29 作者 Steper 「AI 想越久越笨」 的现象,即 AI 模型在特定情况下,随着思考时间或推理步骤的增加,其性能反而下降,主要源于错误 ... 阅读更多