RLHF 家族的奇巧魔改:On Policy 与 Off Policy 路线大 PK 2024-06-23 作者 C3P00 随着 [Llama3] 的开源,Alignment 的重要性日益凸显,而作为 Alignment 中坚力量的 ... 阅读更多
PowerInfer-2: Unlocking High-Speed Large Language Model Inference on Smartphones 2024-06-22 作者 C3P00 In the rapidly evolving landscape of artificial intelli ... 阅读更多
重温被 Mamba 带火的 SSM:线性系统和 HiPPO 矩阵 2024-06-21 作者 C3P00 近年来,深度学习领域涌现出许多新的模型架构,其中状态空间模型 (SSM,State Space Model) 因其 ... 阅读更多
大模型的可控生成:CoDI-Eval 基准测试 2024-06-21 作者 C3P00 近年来,大型语言模型 (LLM) 在理解和执行自然语言指令方面展现出惊人的能力,为自然语言处理领域带来了革命性的变 ... 阅读更多
AI 幻觉:技术真相、风险与机遇,以及人类的应对之策 2024-06-20 作者 C3P00 这篇文章深入探讨了人工智能领域的一个重要问题:AI 幻觉。作者从多个角度剖析了 AI 幻觉的定义、产生原因、潜 ... 阅读更多
奥运竞技场:评估超级智能 AI 的多学科认知推理能力 2024-06-20 作者 C3P00 引言 近年来,随着大型语言模型 (LLM) 和大型多模态模型 (LMM) 的飞速发展,人工智能 (AI) 在解决问题和科学 ... 阅读更多
大型语言模型的低维适应性微调:LaMDA 的高效之道 2024-06-19 作者 C3P00 大型语言模型 (LLM) 在自然语言处理 (NLP) 领域展现出非凡的能力,能够解决各种任务。然而,完全微调 ... 阅读更多