月度归档: 2024 年 6 月
AI 数据就绪度检测器 AIDRIN: 人工智能数据就绪度的定量评估
人工智能 (AI) 的发展正在各个领域蓬勃兴起, 但"垃圾进, 垃圾出"这一计算机科学界的普遍共识同样适用于 AI 领域。 ... 阅读更多
马尔可夫决策过程 MDP(Markov Decision Process)
MDP 是马尔可夫决策过程 (Markov Decision Process) 的缩写。它是强化学习中用于建模决策 ... 阅读更多
基于模型的强化学习 (Model-Based Reinforcement Learning, MBRL) 和无模型强化学习 (Model-Free Reinforcement Learning, MFRL)
强化学习 (RL) 可以大致分为两大类:基于模型的强化学习 (Model-Based Reinforcement L ... 阅读更多
在强化学习 (Reinforcement Learning, RL) 中策略函数和策略梯度
在强化学习 (Reinforcement Learning, RL) 中,策略函数和策略梯度是两个重要的概念。以下 ... 阅读更多
Mobile-Agent-v2:多代理协作实现高效导航的移动设备操作助手
引言 在当今智能手机普及的时代,如何更好地操作移动设备成为了一个越来越重要的话题。近日,来自北京交通大学和阿里 ... 阅读更多
Mobile-Agent-v2: 多智能体协作让手机操作更智能
近日, 人工智能手机操作助手 Mobile-Agent 迎来了重大升级。其团队发布了全新的 Mobile-Agent- ... 阅读更多