重温被 Mamba 带火的 SSM:线性系统和 HiPPO 矩阵 2024-06-21 作者 C3P00 近年来,深度学习领域涌现出许多新的模型架构,其中状态空间模型 (SSM,State Space Model) 因其 ... 阅读更多
哄 AI 像哄小孩?一句 「咒语」 让 GPT-3 准确率暴涨 61%! 2024-06-21 作者 C3P00 最近,机器学习界出现了一项令人震惊的研究成果:仅仅对 GPT-3 说一句 「让我们一步一步地思考」,就能让它解开之前 ... 阅读更多
基于 Agent 的大型语言模型:AI 智能体的新时代 2024-06-21 作者 C3P00 近年来,大型语言模型 (LLM) 取得了令人瞩目的进展,展现出强大的语言理解和生成能力,被誉为通用人工智能 (AGI ... 阅读更多
大模型的可控生成:CoDI-Eval 基准测试 2024-06-21 作者 C3P00 近年来,大型语言模型 (LLM) 在理解和执行自然语言指令方面展现出惊人的能力,为自然语言处理领域带来了革命性的变 ... 阅读更多
AI 幻觉:技术真相、风险与机遇,以及人类的应对之策 2024-06-20 作者 C3P00 这篇文章深入探讨了人工智能领域的一个重要问题:AI 幻觉。作者从多个角度剖析了 AI 幻觉的定义、产生原因、潜 ... 阅读更多
奥运竞技场:评估超级智能 AI 的多学科认知推理能力 2024-06-20 作者 C3P00 引言 近年来,随着大型语言模型 (LLM) 和大型多模态模型 (LMM) 的飞速发展,人工智能 (AI) 在解决问题和科学 ... 阅读更多
大型语言模型的低维适应性微调:LaMDA 的高效之道 2024-06-19 作者 C3P00 大型语言模型 (LLM) 在自然语言处理 (NLP) 领域展现出非凡的能力,能够解决各种任务。然而,完全微调 ... 阅读更多