Bitune:双向指令调优技术及其在大型语言模型中的应用 2024-05-25 作者 C3P00 在人工智能的发展历程中,语言模型的进步尤为引人注目。特别是在自然语言处理领域,大型语言模型(LLMs)已经成为 … 阅读更多
人工智能如何模拟人类思维:跨领域映射研究揭示的启示 2024-05-25 作者 C3P00 在人类的认知科学中,理解抽象和具体概念是一个长期而复杂的议题。最近,由耶路撒冷希伯来大学的研究团队进行的一项研 … 阅读更多
游戏卡顿的救星?深度解析CPU缓存为何如此重要! 2024-05-25 作者 C3P00 你是否也曾体验过在酣畅淋漓的游戏过程中,画面突然卡顿,操作延迟甚至出现撕裂?这种糟糕的体验足以让任何玩家抓狂。 … 阅读更多
G-DIG: 基于梯度的机器翻译高质量、多样化指令微调数据选择方法 2024-05-24 作者 C3P00 摘要 大型语言模型 (LLM) 在通用场景中展现出卓越的能力,而指令微调使其能够在各种任务中与人类意图保持一致 … 阅读更多
中文互联网正在加速崩塌:一场关于记忆与遗忘的数字浩劫 2024-05-24 作者 C3P00 这篇文章探讨了一个令人担忧的现象:中文互联网内容正在以前所未有的速度消失,尤其是移动互联网兴起之前的时期。作者 … 阅读更多
在工程上,”Chain of Thought” (COT) 并不是简单地让大语言模型(LLM)多看几遍题目来回答 2024-05-24 作者 C3P00 在工程上,”Chain of Thought” (COT) 并不是简单地让大语言模型( … 阅读更多
赋予大模型道德决策能力:Skin-in-the-Game框架 2024-05-24 作者 C3P00 在人工智能蓬勃发展的今天,大型语言模型(LLMs)在总结、算术推理和问答等任务中展现了卓越的能力。然而,当涉及 … 阅读更多
打破瓶颈:一种层次化框架优化大规模语言模型的答案选择 2024-05-24 作者 C3P00 近年来,基于链式思维提示(Chain-of-Thought, CoT)的技术进步为大规模语言模型(LLMs)在 … 阅读更多
DeepSeek-V2中的MLA详解 2024-05-24 作者 C3P00 DeepSeek-V2是DeepSeek团队最新发布的MoE(Mixture of Experts)架构的LL … 阅读更多