深入浅出推荐系统:微软开源工具 Recommenders 解析 2024-06-29 作者 C3P00 引言 在信息爆炸的时代,人们面对海量数据往往无所适从。推荐系统应运而生,它通过分析用户的历史行为和偏好,为用户 ... 阅读更多
DouZero+是一种斗地主 AI 系统,它通过引入对手建模和指导学习的方法,进一步提升了斗地主 AI 的性能 2024-06-28 作者 C3P00 DouZero+是一种斗地主 AI 系统,它通过引入对手建模和指导学习的方法,进一步提升了斗地主 AI 的性能。斗地主 ... 阅读更多
前向-前向 (FF) 算法:一种全新的深度学习方法 2024-06-28 作者 C3P00 引言 在 NeurIPS 2022 大会上,Geoffrey Hinton 提出了一种名为前向-前向 (Forward ... 阅读更多
思维链增强蒸馏技术的神秘面纱:探究其背后的奥秘 2024-06-23 作者 C3P00 摘要: 近年来,大型语言模型 (LLM) 在问答等推理任务中表现出色,而 「思维链」(CoT) 推理的引入更是锦上添花 ... 阅读更多
大模型推理加速新突破:FlashDecoding++ 2024-06-16 作者 C3P00 大型语言模型 (LLM) 正在改变世界,从生成文本到翻译语言,再到编写代码,LLM 的应用范围越来越广。然而, ... 阅读更多
语言模型能成为文本世界的模拟器吗? 2024-06-11 作者 C3P00 近年来,大型语言模型 (LLM) 在各个领域都取得了显著的进步,其强大的文本理解和生成能力令人惊叹。那么,LLM ... 阅读更多
巨型语言模型的推理效率:分割与优化 2024-06-11 作者 C3P00 近年来,巨型语言模型 (LLM) 在自然语言处理领域取得了显著进展,其参数规模已突破千亿甚至万亿大关。然而,这些模 ... 阅读更多
深度学习高效运转:从基本原理出发 2024-06-11 作者 C3P00 在现代的深度学习领域,如何优化模型性能成为了一个热门话题。许多人会依赖于一些曾经有效的小技巧,比如 「使用就地操 ... 阅读更多
让深度学习模型运行飞快:从基础原理出发 2024-06-11 作者 C3P00 作为一名资深科技专栏作家,我接触过许多想要提升深度学习模型性能的用户。他们常常会采取一些 「偏方」,比如使用 「i ... 阅读更多