AGI
SoftMax 的困境:在稀疏性和多模态之间左右为难
SoftMax 是现代机器学习算法中无处不在的组成部分。它将输入向量映射到概率单纯形,并通过将概率质量集中在较 … 阅读更多
深度状态空间模型:稳定性与泛化能力
近年来,深度学习在时间序列建模领域取得了显著进展。许多最先进的模型,例如 S4、S5 和 LRU,都利用了将状 … 阅读更多
毕昇:开启下一代人工智能应用开发的全新旅程
毕昇,顾名思义,取自活字印刷术的发明者,寓意着希望这款开源大模型应用开发平台能够像活字印刷术一样,推动智能应用 … 阅读更多
PaCE:让大型语言模型更安全、更可靠、更懂你
大型语言模型(LLM)正以前所未有的速度改变着我们的世界。它们可以写诗、编故事,甚至可以进行复杂的对话,展现出 … 阅读更多
大型语言模型的“逢迎”:揭秘误导性关键词的危害与防御策略
大型语言模型(LLMs)在自然语言处理领域掀起了一场革命,它们在各种下游任务中展现出与人类相当的性能。然而,我 … 阅读更多
ELLE:让预训练语言模型持续高效吸收新领域知识
预训练语言模型(PLM)在自然语言处理领域取得了巨大成功,但它们通常使用固定的、不更新的数据进行训练。在现实世 … 阅读更多
大型语言模型的社会偏见:从不同视角看“你”的偏见
警告:本文包含可能具有冒犯性或令人不安的偏见示例。 大型语言模型(LLM)正在改变我们与信息互动的方式,但它们 … 阅读更多
MMLU:我们真的完成了它吗?
大型语言模型(LLM)的出现,标志着自然语言处理领域取得了重大进展,使我们能够通过自然语言与计算机进行交互。然 … 阅读更多