道路千万条,从源到目标的途只有一条或几条。 所有的道路够成了一个解的空间。 途则是最优解或满足条件的一组解。

上述的解释可能是不对的。任何时候,马开始识别,总是站在一个特定的位置,它的眼睛只能看到周围的景象。位置的坐标,可以看作是马的当前状态CurrentState。眼睛则是探测器Sensor。所看到的景象,则是输入或感受Percept。马的大脑对输出进行处理,得到一个动作Action,对马来说,动作即移动,可以描述为一个方向加一个距离,其实就是一个矢量。单次移动的距离应该是很短的,可以认为最小的单元是一步Step。

经过一步移动后,马的位置发生了变化,即State发生了变化,有了新的状态State。虽然外在的环境没有变化,或者没有太大的变化,在新的位置上,马眼所见到的景象,对马的大脑来说,原始的输入,跟上一个位置所见的景象是不同的。所以马的大脑会再次决定动作,移动到新的位置,获得新的状态。

所有的状态State,构成一个序列。序列的起点是马的主人迷路的地点,序列的终点即目标,可能是家,也可能是一个兵营。这个状态序列,即位置序列,就是所谓的“途”,对应Path。

解的搜索已经结束,并储存在马的大脑中

解并没有直接存在马的大脑中。“识”更准确对应的过程,应该是一次输入(马眼看到的景象),沿神经网络(马的大脑),进行一次前向计算Forward的过程。如上所述,一次“途”的产生,实际是多次识的结果的序列。马一路狂奔,一路识别。或许输入不仅仅是静态的图片,还可能是动态的视频。

核心在于大脑,更确切地,在于大脑中的神经网络。 一方面,经过长年累月的训练,可以去“识”。 另一方面,“识”的结果(“途”),也储存于马的大脑中。

刚出生的马,只能经DNA遗传,完成神经网络权重的初始化。 但这个网络,并不是“途”对应的解。 只有经过不断的迭代,才能完成学习的过程。 所以“老”是指迭代次数EpochNumber必须达到一定数量才能完成“途”的识别, Loss才能下降到一个可以接受的水平。