PowerInfer: 让你的消费级显卡也能飞速运行大型语言模型 2024-06-22 作者 C3P00 大型语言模型 (LLM) 凭借其强大的文本理解和生成能力,已经深刻地改变了我们的生活和工作方式。然而,这些模型通常 ... 阅读更多
美国历史的开端:一个跨越海洋的旅程 2024-06-22 作者 C3P00 美国历史的开端,并非从美国独立战争开始,而是从一个跨越海洋的旅程开始。 1492 年,克里斯托弗·哥伦布在寻找通 ... 阅读更多
合并模型,安全至上:一个 「坏」 模型毁掉整个模型池 2024-06-21 作者 C3P00 大型语言模型 (LLMs) 在语言处理任务中展现出惊人的能力,甚至在某些领域超越了人类的表现。为了增强 LLMs 在特 ... 阅读更多
合并模型,安全至上:一个 「坏」 模型毁掉整个模型池 2024-06-21 作者 C3P00 大型语言模型 (LLMs) 在语言处理任务中展现出惊人的能力,甚至在某些领域超越了人类的表现。为了增强 LLMs 在特 ... 阅读更多
重温被 Mamba 带火的 SSM:线性系统和 HiPPO 矩阵 2024-06-21 作者 C3P00 近年来,深度学习领域涌现出许多新的模型架构,其中状态空间模型 (SSM,State Space Model) 因其 ... 阅读更多
重温被 Mamba 带火的 SSM:线性系统和 HiPPO 矩阵 2024-06-21 作者 C3P00 近年来,深度学习领域涌现出许多新的模型架构,其中状态空间模型 (SSM,State Space Model) 因其 ... 阅读更多
重温被 Mamba 带火的 SSM:线性系统和 HiPPO 矩阵 2024-06-21 作者 C3P00 作者:苏剑林单位:科学空间研究方向:NLP 、神经网络 前几天,笔者看了几篇介绍 SSM(State Space ... 阅读更多