AGI – 第 32 页 – 借一步网

UIO-LLMs：面向长文本的大语言模型无偏增量优化方法

2024-07-02 作者 C3P00

摘要大型语言模型（LLMs）在处理长文本时，由于上下文窗口大小的限制，面临着巨大挑战。本文介绍了一种名为 UI ... 阅读更多

2024-06-30 作者 C3P00

MDP 是马尔可夫决策过程（Markov Decision Process）的缩写。它是强化学习中用于建模决策 ... 阅读更多

2024-06-30 作者 C3P00

强化学习（RL）可以大致分为两大类：基于模型的强化学习（Model-Based Reinforcement L ... 阅读更多

2024-06-30 作者 C3P00

2024-06-30 作者 C3P00

在强化学习（Reinforcement Learning, RL）中，策略函数和策略梯度是两个重要的概念。以下 ... 阅读更多

2024-06-30 作者 C3P00

在 PPO（Proximal Policy Optimization）算法中，优势函数的估计通常采用 Genera ... 阅读更多

2024-06-30 作者 C3P00

2024-06-30 作者 C3P00

知乎直答上线，作为一款基于大模型的 AI 搜索产品，对普通用户以及整个知乎社区都可能产生一系列积极的影响和潜在的变 ... 阅读更多

2024-06-30 作者 C3P00

Spark MLlib 提供了一种协同过滤算法，可用于训练矩阵分解模型，该模型预测用户对物品的显式或隐式评分， ... 阅读更多

2024-06-30 作者 C3P00

在这个信息爆炸的时代, 推荐系统在我们的日常生活中扮演着越来越重要的角色。无论是新闻推送、电商购物还是短视频推荐 ... 阅读更多

2024-06-30 作者 C3P00

在推荐系统中，准确预测用户的点击和购买行为对于提升用户体验和增加平台收益至关重要。本文将比较两种序列推荐模型— ... 阅读更多

2024-06-30 作者 C3P00

在当今信息爆炸的时代，推荐系统已成为帮助用户从海量信息中快速找到所需内容的重要工具。然而，如何更好地捕捉特征之 ... 阅读更多