揭秘:简单而有效的掩码扩散语言模型 2024-06-12 作者 C3P00 近年来,扩散模型在生成高质量图像方面表现出色,并被认为是生成离散数据 (如文本、生物序列和图) 的潜在工具。与自回 ... 阅读更多
告别选择题:Open-LLM-Leaderboard 为大型语言模型开启新纪元 2024-06-12 作者 C3P00 大型语言模型 (LLM) 正在迅速改变我们的世界,从文本生成到翻译、摘要、代码生成,甚至聊天互动,它们展现出惊人的 ... 阅读更多
解码 AI 的 「黑箱」:大型语言模型的 「思考」 之旅 2024-06-12 作者 C3P00 我们常常惊叹于人工智能模型的强大能力,却对其内部运作机制知之甚少。想象一下,如果能看到机器内部的运作机制,观察 ... 阅读更多
巨型语言模型的 8 位量化:LLM.int8() 2024-06-12 作者 C3P00 大型语言模型 (LLM) 在自然语言处理领域取得了巨大成功,但其推理过程需要大量的 GPU 内存。本文将介绍一种针 ... 阅读更多
让 AI 成为更可靠的决策者:医疗分诊领域的语言模型对齐研究 2024-06-11 作者 C3P00 近年来,大型语言模型 (LLM) 在搜索、代码助手等领域取得了显著进展,但如何将其与人类价值观对齐,使其成为更可靠 ... 阅读更多
AI 聊天中的 「心灵地图」:让机器理解你的世界 2024-06-11 作者 C3P00 你是否曾想过,如何让机器像人类一样,在与你交流的过程中,不断学习和理解你的世界?想象一下,你带着一个机器人朋友 ... 阅读更多
评估大型语言模型 (LLM) 问答系统中的检索组件 2024-06-11 作者 C3P00 引言 随着大型语言模型 (LLM) 的发展,我们在自然语言处理 (NLP) 任务中看到了显著的进步,包括信息检索 (IR ... 阅读更多