变形金刚竟是状态空间模型?揭秘高效序列模型的奥秘
近年来,变形金刚(Transformers)凭借其强大的能力,在自然语言处理领域取得了巨大成功,成为深度学习的 … 阅读更多
近年来,变形金刚(Transformers)凭借其强大的能力,在自然语言处理领域取得了巨大成功,成为深度学习的 … 阅读更多
循环神经网络(RNN)长期以来一直是建模时序数据的经典架构,但它们在训练长序列时却臭名昭著地难以训练。这是因为 … 阅读更多
近年来,大型语言模型(LLM)在各个领域都取得了显著的成就,其应用范围涵盖聊天机器人、文本到图像/视频合成、代 … 阅读更多
SoftMax 是现代机器学习算法中无处不在的组成部分。它将输入向量映射到概率单纯形,并通过将概率质量集中在较 … 阅读更多
近年来,深度学习在时间序列建模领域取得了显著进展。许多最先进的模型,例如 S4、S5 和 LRU,都利用了将状 … 阅读更多
毕昇,顾名思义,取自活字印刷术的发明者,寓意着希望这款开源大模型应用开发平台能够像活字印刷术一样,推动智能应用 … 阅读更多
大型语言模型(LLM)正以前所未有的速度改变着我们的世界。它们可以写诗、编故事,甚至可以进行复杂的对话,展现出 … 阅读更多