让大型语言模型更懂你:如何训练更可靠的奖励模型? 2024-06-17 作者 C3P00 大型语言模型 (LLM) 正在改变世界,但要让它们真正为我们所用,就需要让它们理解人类的意图和价值观。强化学习从人 ... 阅读更多
FP8-LM:训练成本降低 50% 的 LLM 新时代 2024-06-17 作者 C3P00 大型语言模型 (LLMs) 正在改变我们的世界,但其高昂的训练成本一直是阻碍其发展的重要因素。为了解决这一问题 ... 阅读更多
利用 Softmax-DPO 优化推荐系统的论文综述 2024-06-17 作者 C3P00 摘要:推荐系统是根据用户的偏好数据预测个性化的排名。近年来,随着语言模型 (LMs) 的兴起,基于 LM 的推荐系统得 ... 阅读更多
让大型语言模型更会思考:链式偏好优化 (CPO) 2024-06-17 作者 C3P00 大型语言模型 (LLM) 的最新进展表明,构建推理链对于提高其解决问题的能力至关重要。其中,链式思维 (CoT) ... 阅读更多
让视觉语言模型拥有空间推理能力:SpatialVLM 的探索 2024-06-16 作者 C3P00 视觉语言模型 (VLM) 在理解和回答图像相关的文本问题方面取得了显著进展,但它们在三维空间推理方面仍然存在局限性 ... 阅读更多
让大型语言模型更懂 「聊天」:StreamingLLM 的无限对话 2024-06-16 作者 C3P00 大型语言模型 (LLM) 已经彻底改变了人们的工作方式。以 GPT 系列模型为例,它被广泛应用于各种场景,帮助我们 ... 阅读更多