AGI
让大型语言模型更懂你:如何训练更可靠的奖励模型?
大型语言模型(LLM)正在改变世界,但要让它们真正为我们所用,就需要让它们理解人类的意图和价值观。强化学习从人 … 阅读更多
FP8-LM:训练成本降低50%的LLM新时代
大型语言模型 (LLMs) 正在改变我们的世界,但其高昂的训练成本一直是阻碍其发展的重要因素。为了解决这一问题 … 阅读更多
利用Softmax-DPO优化推荐系统的论文综述
摘要:推荐系统是根据用户的偏好数据预测个性化的排名。近年来,随着语言模型(LMs)的兴起,基于LM的推荐系统得 … 阅读更多
让大型语言模型更会思考:链式偏好优化 (CPO)
大型语言模型(LLM)的最新进展表明,构建推理链对于提高其解决问题的能力至关重要。其中,链式思维 (CoT) … 阅读更多
让视觉语言模型拥有空间推理能力:SpatialVLM 的探索
视觉语言模型(VLM)在理解和回答图像相关的文本问题方面取得了显著进展,但它们在三维空间推理方面仍然存在局限性 … 阅读更多