AGI
AGI 通用人工智能
马尔可夫决策过程 MDP(Markov Decision Process)
MDP 是马尔可夫决策过程 (Markov Decision Process) 的缩写。它是强化学习中用于建模决策 ... 阅读更多
基于模型的强化学习 (Model-Based Reinforcement Learning, MBRL) 和无模型强化学习 (Model-Free Reinforcement Learning, MFRL)
强化学习 (RL) 可以大致分为两大类:基于模型的强化学习 (Model-Based Reinforcement L ... 阅读更多
在强化学习 (Reinforcement Learning, RL) 中策略函数和策略梯度
在强化学习 (Reinforcement Learning, RL) 中,策略函数和策略梯度是两个重要的概念。以下 ... 阅读更多
序列推荐系统的性能比较:CLSR 与 SLi_Rec 在点击和购买预测上的表现
在推荐系统中,准确预测用户的点击和购买行为对于提升用户体验和增加平台收益至关重要。本文将比较两种序列推荐模型— ... 阅读更多