大型语言模型的无限对话:StreamingLLM 如何实现高效流式解码 2024-06-16 作者 C3P00 大型语言模型 (LLM) 已经成为自然语言处理领域不可或缺的一部分,但它们在处理长文本时却面临着巨大的挑战。传统的 ... 阅读更多
大模型推理加速新突破:FlashDecoding++ 2024-06-16 作者 C3P00 大型语言模型 (LLM) 正在改变世界,从生成文本到翻译语言,再到编写代码,LLM 的应用范围越来越广。然而, ... 阅读更多
学会数数,才能理解语言:揭秘大型语言模型中的上下文位置编码 2024-06-16 作者 C3P00 大型语言模型 (LLM) 在处理文本、音频、代码等序列数据时,往往需要理解其中的顺序信息。例如,在理解一段文字时, ... 阅读更多
大型语言模型的 「顿悟」:揭秘上下文学习背后的机制 2024-06-15 作者 C3P00 大型语言模型 (LLM) 展现出惊人的 「上下文学习」(In-context Learning,ICL) 能力,即能够 ... 阅读更多
「哪些数据对我的分类器有益?」:通过影响力数据选择提升模型性能和可解释性 2024-06-15 作者 C3P00 近年来,机器学习模型在自动化流程和生成洞察力方面成为了社会各个领域不可或缺的工具。除了模型类型和架构的选择之外 ... 阅读更多
让大模型轻装上阵:LoftQ 量化框架助力高效推理 2024-06-15 作者 C3P00 大型语言模型 (LLM) 在自然语言处理领域取得了巨大成功,但其庞大的参数规模也带来了巨大的存储和计算负担。为 ... 阅读更多
大型语言模型的自我反思:SELF-RAG 如何提升准确性和可控性 2024-06-15 作者 C3P00 大型语言模型 (LLMs) 在各种任务中表现出色,但它们也经常犯事实错误。这是因为它们仅仅依赖于自身参数化的知识, ... 阅读更多
人工智能模型的 「柏拉图式」 表征:现实的影子,还是理想的真相? 2024-06-15 作者 C3P00 近年来,人工智能领域取得了突破性的进展,模型的能力不断提升,应用范围也越来越广。从语言模型到视觉模型,从单一任 ... 阅读更多
K-Means 聚类:一种高效且精准的新方法 2024-06-15 作者 C3P00 K-Means 聚类是机器学习中广泛应用的一种无监督学习方法,用于识别大型数据集中的模式。近年来,半定规划 ( ... 阅读更多
数据为王:深度部分标签学习中的候选标签集剪枝 2024-06-15 作者 C3P00 近年来,深度学习技术在各个领域取得了巨大成功,但其有效训练通常需要大量完美标注的数据,这在实际应用中是一个巨大 ... 阅读更多