🌄 序章:在未知之地,创新如何降临
夜色下的科学家们,像一群执着的探险家,手持微光,走进未知的森林。他们不是单纯为了猎取宝藏,而是因为对「新奇」的渴望,驱使他们一次又一次深入无人之境。在人工智能与机器学习的丛林中,这股渴望催生了一种别开生面的探索范式——新奇性探索(Novelty Search)。
这场科学冒险,远不止是算法的更新换代,更是对人类创新本质的深刻追问:我们为何要追求「不同」?为什么有时候,偏离目标,反而能够触碰奇迹?
🏹 目标的诅咒:优化迷雾中的困兽
让我们先回到主流的人工智能世界。无论是让机器人学会走路,还是让算法玩转围棋,几乎所有的优化过程都遵循着同一个准则:目标导向。
目标函数(Objective Function)如同山顶的明灯,所有个体都在攀登,试图获得最高的分数。
然而,这条道路看似笔直,实则暗藏陷阱。目标越明确,可能越容易陷入局部最优(Local Optima)的泥潭。就像一只渴水的狐狸,盯着最近的小水洼,却错过了远方的清泉。
注解:
局部最优是指在优化过程中,算法找到的「最高点」并非全局最优解,而是被困在了某个小山头。
案例:机器人学步的悲剧
传统算法常常让机器人学会「原地小跳」或「机械摆动」,因为这些动作能带来微小却稳定的得分提升。它们看似进步,实则止步不前。创新,仿佛被目标的枷锁锁死。
🦄 新奇性探索的异想世界:只问新不新,不问好不好
这时,Novelty Search 站了出来。它的口号是:「别再一味追逐分数,去发现前所未见的风景吧!」
新奇性探索的核心逻辑是:奖励「与众不同」的行为,而不是「最优」的结果。算法不再追问「做得有多好」,而是思考「做得有多新」。
算法机制浅析
新奇性探索的操作流程大致如下:
- 定义行为空间:选定能够衡量个体行为差异的特征(如移动路径、最终位置、动作序列等)。
- 新奇度计算:每个个体与历史行为库中最近的 $k$ 个行为计算距离,距离越大,新奇度越高。
- 行为选择:在每一代选择新奇度最高的个体进行繁衍。
注解:
新奇度的计算公式通常为
其中 $x$ 为当前个体行为,$\mu_i$ 是历史行为库中距离最近的 $k$ 个行为,$dist$ 表示行为距离。
🗺️ 行为空间的艺术:创新的土壤
新奇性探索的魔法,很大程度上取决于行为空间的定义。
你可以把行为空间想象成一块巨大的画布,每个行为都是一笔。定义得好,画布色彩斑斓,创新如泉涌;定义得差,画面混沌一片,算法无所适从。
行为度量的多样性
- 路径轨迹:如机器人在平面上的移动轨迹。
- 终点坐标:如机械臂抓取物体后的末端位置。
- 动作序列:如棋类AI的走棋步骤。
注解:
正确的行为空间设计,能够让算法自动避开已探索区域,持续开垦「无人地带」。
🤖 算法的应用舞台:从机器到智者
1. 机器人学步的革命
在传统目标导向下,机器人很容易陷入「原地小步舞」。而 Novelty Search 鼓励机器人尝试各种新奇动作——倒立、翻滚、螃蟹步……最终,机器人的步态变得多样且灵活,诞生了出人意料的走法。

图注:左图为传统目标导向下的行为分布,右图为新奇性探索下的多样化行为。
2. 游戏AI的突破
在「Flappy Bird」等游戏中,目标导向AI容易卡在「只能飞过第一根管子」的死循环。而新奇性AI则不断尝试各类稀奇古怪的飞行策略,最终「无心插柳」地突破了人类极限。
🔍 无监督强化学习:新奇与好奇的共舞
新奇性探索与无监督强化学习(Unsupervised RL)密切相关。后者强调智能体在无明确外部奖励时,依靠内在动机(Intrinsic Motivation)进行自我驱动。
内在动机与外在奖励
- 内在动机:激励智能体探索未知、发现新奇。
- 外在奖励:针对具体目标给予奖励。
注解:
内在动机让AI更像人类儿童,通过「好奇心」不断学习新东西,而不是只为糖果(外在奖励)劳作。
理论链接
新奇性探索本质上是一种基于内在动机的算法。它不是追问「怎样做最好」,而是追问「怎样做最不同」。这种策略让AI在无监督环境下,依然能不断进化,最终在偶然间达成复杂目标。
🧪 信息论与新奇性探索:理论的支撑
近年来,研究者们用信息论为新奇性探索提供理论基础。
智能体通过最大化「经验熵」或「状态新颖度」来引导探索,避免陷入信息贫瘠的死角。
注解:
信息熵(Entropy)描述了系统的不确定性。新奇性探索追求高熵状态,鼓励多样化体验。
🏆 新奇与目标:融合才是王道
虽然新奇性探索极大增加了创新性,但它也有「只顾好玩,不问成败」的风险。
为此,科学家们提出了「新奇-目标混合算法」,将目标分数与新奇度加权结合。
混合评分公式
其中 $n(x)$ 是新奇度,$f(x)$ 是目标分数,$\lambda$ 控制两者的权重。
注解:
这样既能鼓励探索,也能保证终极目标不被遗忘,实现「在探索中进步,在进步中探索」。
🌱 创新的生态系统:从个体到群体
新奇性探索还启发了多样性维护(Diversity Maintenance)等领域。
在复杂问题中,保持解的多样性,有助于算法跳出死胡同,孕育「黑马」方案。
MAP-Elites 算法
MAP-Elites 被称为「创新的照明灯」,它将解按照特征映射到二维网格,每格都存储最优解,从而在全局上兼顾多样性与优越性。
🗃️ 图表与案例分析
图表1:传统目标导向与新奇性探索的行为分布
搜索类型 | 行为多样性 | 目标达成率 | 创新概率 |
---|---|---|---|
目标导向搜索 | 低 | 高 | 低 |
新奇性搜索 | 高 | 低-中 | 高 |
混合搜索 | 高 | 高 | 高 |
图表2:新奇度与目标分数的变化曲线
代数 | 新奇度 | 目标分数 |
---|---|---|
1 | 1.0 | 0.1 |
10 | 2.3 | 0.4 |
20 | 3.5 | 1.0 |
30 | 4.2 | 2.2 |
40 | 4.5 | 3.1 |
🏗️ 新奇性探索的应用与前景
机器人与自动化
新奇性探索让机器人能够自主开发出意想不到的操作方式,提升了适应复杂环境的能力。
游戏AI与内容生成
在游戏AI、自动关卡生成等领域,新奇性算法能挖掘更多新颖玩法和地图,为玩家带来无限可能。
生物信息学与进化设计
新奇性探索已被用于基因多样性分析、新药物结构发现、自动化机械零件设计等前沿领域。
🚧 局限与挑战:新奇的边界
- 行为空间设计难题:如何定义行为距离?
- 计算资源消耗大:大量存储和距离计算,依赖高性能并行计算。
- 盲目新奇的陷阱:仅为新奇而新奇,可能偏离实际目标。
注解:
未来研究方向包括:自动化行为空间设计、与深度学习结合、动态调整新奇-目标权重等。
🌌 创新的本质:伟大不能被计划
新奇性探索的科学哲学在于:伟大的创新往往不是计划出来的,而是在探索中意外获得。正如达尔文进化论里,物种的突变与多样性,是自然界最伟大的创新引擎。
正视偶然,拥抱新奇,才是科学与技术进步的真正动力。
📚 参考文献
- Lehman, J. , & Stanley, K. O. (2011). Abandoning objectives: Evolution through the search for novelty alone. Evolutionary computation, 19(2), 189-223.✅
- Stanley, K. O., & Lehman, J. (2015). Why greatness cannot be planned: The myth of the objective. Springer.✅
- https://jieyibu.net/htmlpages/%E6%96%B0%E5%A5%87%E6%80%A7%E6%8E%A2%E7%B4%A2.html
- https://jieyibu.net/a/67338
- Doncieux, S. , et al. (2016). Novelty search: a theoretical perspective. Proceedings of the Genetic and Evolutionary Computation Conference.✅
- Mouret, J. B., & Clune, J. (2015). Illuminating search spaces by mapping elites. arXiv preprint arXiv:1504.04909.✅