老马识途 | Leonzhu211

途

道路千万条，从源到目标的途只有一条或几条。所有的道路够成了一个解的空间。途则是最优解或满足条件的一组解。

上述的解释可能是不对的。任何时候，马开始识别，总是站在一个特定的位置，它的眼睛只能看到周围的景象。位置的坐标，可以看作是马的当前状态CurrentState。眼睛则是探测器Sensor。所看到的景象，则是输入或感受Percept。马的大脑对输出进行处理，得到一个动作Action，对马来说，动作即移动，可以描述为一个方向加一个距离，其实就是一个矢量。单次移动的距离应该是很短的，可以认为最小的单元是一步Step。

经过一步移动后，马的位置发生了变化，即State发生了变化，有了新的状态State。虽然外在的环境没有变化，或者没有太大的变化，在新的位置上，马眼所见到的景象，对马的大脑来说，原始的输入，跟上一个位置所见的景象是不同的。所以马的大脑会再次决定动作，移动到新的位置，获得新的状态。

所有的状态State，构成一个序列。序列的起点是马的主人迷路的地点，序列的终点即目标，可能是家，也可能是一个兵营。这个状态序列，即位置序列，就是所谓的“途”，对应Path。

识

~~解的搜索已经结束，并储存在马的大脑中~~

解并没有直接存在马的大脑中。“识”更准确对应的过程，应该是一次输入（马眼看到的景象），沿神经网络（马的大脑），进行一次前向计算Forward的过程。如上所述，一次“途”的产生，实际是多次识的结果的序列。马一路狂奔，一路识别。或许输入不仅仅是静态的图片，还可能是动态的视频。

马

核心在于大脑，更确切地，在于大脑中的神经网络。一方面，经过长年累月的训练，可以去“识”。 ~~另一方面，“识”的结果（“途”），也储存于马的大脑中。~~

老

刚出生的马，只能经DNA遗传，完成神经网络权重的初始化。但这个网络，并不是“途”对应的解。只有经过不断的迭代，才能完成学习的过程。所以“老”是指迭代次数EpochNumber必须达到一定数量才能完成“途”的识别， Loss才能下降到一个可以接受的水平。