🌏
Mamba 2: 挑战 Transformer 的新型序列模型架构
引言 自 2017 年被提出以来,Transformer 已成为 AI 大模型的主流架构,在语言建模领域长期占据主导地位 ... 阅读更多
PrExMe:大规模提示探索用于机器翻译和摘要评估的开源 LLM
引言 近年来,大型语言模型 (LLMs) 的迅速发展为自然语言处理 (NLP) 领域带来了范式转变。特别是,这些模型的 ... 阅读更多
跳至内容
引言 自 2017 年被提出以来,Transformer 已成为 AI 大模型的主流架构,在语言建模领域长期占据主导地位 ... 阅读更多
引言 近年来,大型语言模型 (LLMs) 的迅速发展为自然语言处理 (NLP) 领域带来了范式转变。特别是,这些模型的 ... 阅读更多