QLoRA: 高效微调大型语言模型的利器 2023-11-23 作者 C3P00 引言:在机器学习领域,大型语言模型 (LLM) 是当前热门话题。想象一下,你是一名机器学习工程师,你的公司拥有 GP ... 阅读更多
Embroid: 无标签纠正和改进语言模型预测 2023-11-23 作者 C3P00 在最近的研究中,一项名为"Embroid"的新技术引起了广泛关注。这项技术可以在没有标签的情况下,对大型语言模 ... 阅读更多
Embroid: 无标签纠正和改进 LLM 预测 2023-11-23 作者 C3P00 近年来,人工智能领域取得了巨大的进展,其中包括了语言模型的发展。语言模型是一种能够理解和生成自然语言的模型,如 ... 阅读更多
Embroid:无需标签纠正和改进 LLM 预测 2023-11-23 作者 C3P00 导语:在人工智能领域,研究人员一直在探索如何提高预测模型的准确性。最近,斯坦福大学、 Anthropic 和威斯康 ... 阅读更多
FlashFFTConv:使用张量核心进行长序列高效卷积 2023-11-23 作者 C3P00 导语:本文将详细解析 FlashFFTConv,一种使用张量核心进行长序列高效卷积的算法。我们将介绍 FlashF ... 阅读更多
简单长卷积用于序列建模的详细解析 2023-11-23 作者 C3P00 在序列建模中,我们一直在研究如何获得良好的性能,并开发了新的系统技术和深度学习架构。今天,我们将介绍一个简单的 ... 阅读更多
RWKV-5 详细解析:理解并行训练的 RNN 网络 2024-06-072023-11-23 作者 C3P00 RWKV-5 是一种可以并行训练的 RNN 网络,相较于基于 Transformer 的模型,它具有更低的自回归解码复杂 ... 阅读更多
探索 Zephyr-7B-β:一款掀起 LLM 新浪潮的强大语言模型 2023-11-23 作者 C3P00 大家好,今天我要向你们介绍一个在人工智能领域中备受瞩目的明星——Zephyr-7B-β,这是一款性能高超的大型 ... 阅读更多
弥合神经辐射场之间的差距 采用渐进式体积蒸馏的架构 2023-11-22 作者 C3P00 神经辐射场 (NeRF) 方法已被证明是 3D 场景的紧凑、高质量和多功能表示,并支持编辑、检索、导航等下游任 ... 阅读更多
在少样本学习中双曲与欧几里得嵌入 2023-11-22 作者 C3P00 最近在表示学习领域的研究表明,层次数据在双曲空间中可以得到低维且高度信息丰富的表示。 然而,尽管在图像识别中双 ... 阅读更多