多层感知机的故事:魔法议会的决策过程
在一个神秘的王国里,国王想要选出一位新的王国守护者。这个过程可不是随便挑选一个人,而是需要经过一套复杂的决策系统。
首先,国王召集了一群初级顾问(第一层),他们的任务是根据简单的标准筛选候选人,比如力量、智慧、忠诚等。然后,这些初级顾问会把筛选后的结果交给高级顾问(第二层),高级顾问会进一步综合分析,比如勇气、战斗经验、道德标准。最终,这些信息被提交给大祭司(输出层),由她做出最终决定——谁能成为王国的守护者!
这个复杂的决策过程,就像**多层感知机(mLp, multi-Layer perceptron)**的工作方式——通过多层计算,逐步从简单特征提取更高层次的模式,最终得出精准的判断。
1. 什么是多层感知机?
多层感知机(mLp)是一种前馈神经网络,由多个感知机(神经元)组成,至少包含一个隐藏层,能够学习复杂的非线性关系。
mLp 的基本结构包括:
? 输入层(Input Layer):接收外界数据,比如图像、文本、传感器数据等。
? 隐藏层(hidden Layers):一层或多层,负责逐步提取更复杂的特征。
? 输出层(output Layer):根据处理的结果,输出最终的预测,比如分类结果、数值预测等。
数学上,mLp 的计算流程如下:
1. 计算加权和:
其中, 是权重矩阵, 是输入数据, 是偏置。
2. 通过激活函数引入非线性:
这里的 可能是 ReLU, Sigmoid, tanh 等激活函数,使得神经网络可以学习复杂的关系。
整个过程可以层层推进,直到输出层最终给出结果。
2. 为什么单层感知机不够?(国王的错误决策)
想象国王直接让一群初级顾问(单层感知机)做最终决策,那会发生什么?
他们只能依据简单的标准,比如:
? “谁的力量最强?”
? “谁的智慧最高?”
但如果候选人需要同时具备力量+智慧+忠诚+勇气,单层感知机就无能为力了。因为它只能学习线性关系,而无法组合多个因素进行复杂决策。
数学上,单层感知机只能表示线性可分问题,但现实世界的很多问题是非线性的。例如:
? 逻辑异或(xoR)问题:单层感知机无法解决,因为它不是线性可分的。
? 图像识别:不能仅靠像素的亮度判断物体,需要多层特征提取。
? 自然语言处理:单个词的出现不够,需要理解语境关系。
这就是为什么国王需要多层顾问(mLp)——多层神经网络可以逐步提取复杂特征,使得最终决策更加准确!
3. mLp 如何学习?(国王的顾问如何改进决策)
国王知道自己的顾问系统有缺陷,于是决定引入一套学习机制,让顾问们通过经验不断优化决策。
(1)前向传播(Forward propagation)
国王向顾问们提交候选人名单,每个顾问按照自己擅长的领域打分,然后层层传递,最终大祭司给出决策。
数学上,这就是: