🌏
Mamba 2: 挑战 Transformer 的新型序列模型架构
引言 自 2017 年被提出以来,Transformer 已成为 AI 大模型的主流架构,在语言建模领域长期占据主导地位 ... 阅读更多
PrExMe:大规模提示探索用于机器翻译和摘要评估的开源 LLM
引言 近年来,大型语言模型 (LLMs) 的迅速发展为自然语言处理 (NLP) 领域带来了范式转变。特别是,这些模型的 ... 阅读更多
LangChain:ChatGPT 插件会干掉这位 「Model as a Service」 粘合剂吗?
引言:AI 应用开发的新手村 LangChain,一个在 2022 年 10 月底横空出世的开源 Python 库,凭 ... 阅读更多
RLHF 家族的奇巧魔改:On Policy 与 Off Policy 路线大 PK
随着 [Llama3] 的开源,Alignment 的重要性日益凸显,而作为 Alignment 中坚力量的 ... 阅读更多
PowerInfer-2: Unlocking High-Speed Large Language Model Inference on Smartphones
In the rapidly evolving landscape of artificial intelli ... 阅读更多