月度归档: 2024 年 6 月
重温被Mamba带火的SSM:线性系统和HiPPO矩阵
近年来,深度学习领域涌现出许多新的模型架构,其中状态空间模型(SSM,State Space Model)因其 … 阅读更多
重温被Mamba带火的SSM:线性系统和HiPPO矩阵
近年来,深度学习领域涌现出许多新的模型架构,其中状态空间模型(SSM,State Space Model)因其 … 阅读更多
重温被Mamba带火的SSM:线性系统和HiPPO矩阵
作者:苏剑林单位:科学空间研究方向:NLP、神经网络 前几天,笔者看了几篇介绍 SSM(State Space … 阅读更多
HiPPO矩阵:打开序列模型记忆宝库的金钥匙
在人工智能领域,如何让机器像人一样拥有记忆,一直是科学家们孜孜以求的目标。近年来,序列模型(SSM)的兴起为解 … 阅读更多
IPv4地址的「隐藏宝藏」:E类空间能否拯救互联网?
自从IPv4地址枯竭以来,获取或租赁IPv4地址块的成本一路飙升。对于许多网络公司来说,这无疑是一场灾难,曾经 … 阅读更多
哄AI像哄小孩?一句「咒语」让GPT-3准确率暴涨61%!
最近,机器学习界出现了一项令人震惊的研究成果:仅仅对GPT-3说一句「让我们一步一步地思考」,就能让它解开之前 … 阅读更多
基于 Agent 的大型语言模型:AI 智能体的新时代
近年来,大型语言模型(LLM)取得了令人瞩目的进展,展现出强大的语言理解和生成能力,被誉为通用人工智能(AGI … 阅读更多
大型语言模型的「灾难性遗忘」:指令向量揭示真相,引导训练化解危机
大型语言模型(LLM)在自然语言处理领域取得了巨大成功,但它们在微调过程中容易出现「灾难性遗忘」问题,即模型在 … 阅读更多
大模型的可控生成:CoDI-Eval 基准测试
近年来,大型语言模型(LLM)在理解和执行自然语言指令方面展现出惊人的能力,为自然语言处理领域带来了革命性的变 … 阅读更多