PRETTY: 一种无需训练的跨语言大型语言模型对齐方法
大型语言模型(Large Language Models, LLMs)在自然语言处理领域取得了巨大成功。然而, … 阅读更多
AGI 通用人工智能
大型语言模型(Large Language Models, LLMs)在自然语言处理领域取得了巨大成功。然而, … 阅读更多
SiLU 激活函数,全称 Swish,近年来在深度学习领域崭露头角,并展现出诸多优势。本文将详细介绍 SiLU … 阅读更多
大家好,今天我想和大家分享一篇有趣的论文,题为《通过上下文多样化提高生成式常识推理的多样性》。这篇论文主要研究 … 阅读更多
Large language models (LLMs) are becoming increasingly … 阅读更多
大家好,相信不少人已经体验过ChatGPT等大型语言模型(LLMs)强大的对话和写作能力。但你可能不知道,目前 … 阅读更多
亲爱的创作者们,你是否也经常因为创作瓶颈而烦恼?想让文章更流畅优雅,让故事情节更丰富生动,让文案更具感染力,让 … 阅读更多
近年来,预训练语言模型在自然语言处理Tasks表现突出,但直接进行Fine-tuning往往需要大量计算资源。 … 阅读更多
最近读到一篇非常有意思的AI论文,提出了一种新的方法来提高语言模型的可靠性。这项技术被称为Deductive … 阅读更多
当我们在浩瀚的信息海洋中航行时,AI技术的飞速发展无疑是我们的罗盘和风帆。最近,复旦大学和上海人工智能实验室的 … 阅读更多
这篇论文探索了使用8位浮点数(FP8)来有效训练大型语言模型(LLM)。论文的主要贡献和要点总结如下: 本文对 … 阅读更多