当前位置: 主页 > 资讯中心 > 常见问题 » 神经网络优化算法大全图,人工神经网络优化算法
神经网络并行性和自适应性很强,应用领域很广,在任何非线性问题中都可以应用,如控制、信息、预测等各领域都能应用。蚁群算法最开始应用于TSP问题,获得了成功,后来又广泛应用于各类组合优化问题。
但是该算法理论基础较薄弱,算法收敛性都没有得到证明,很多参数的设定也仅靠经验,实际效果也一般,使用中也常常早熟。遗传算法是比较成熟的算法,它的全局寻优能力很强,能够很快地趋近较优解。
主要应用于解决组合优化的NP问题。这三种算法可以相互融合,例如GA可以优化神经网络初始权值,防止神经网络训练陷入局部极小且加快收敛速度。
蚁群算法也可用于训练神经网络,但一定要使用优化后的蚁群算法,如最大-最小蚁群算法和带精英策略。
谷歌人工智能写作项目:小发猫
优化算法是通过改善计算方式来最小化或最大化损失函数E(x)人体神经网络的工作原理,神经系统的工作原理。
模型内部有些参数是用来计算测试集中目标值Y的真实值和预测值的偏差程度的,基于这些参数就形成了损失函数E(x),比如说,权重(W)和偏差(b)就是这样的内部参数,一般用于计算输出值,在训练神经网络模型时起到主要作用。
优化算法分的分类一阶优化算法是使用各参数的梯度值来最小化或最大化损失函数E(x),最常用的一阶优化算法是梯度下降。函数梯度导数dy/dx的多变量表达式,用来表示y相对于x的瞬时变化率。
二阶优化算法是使用了二阶导数也叫做Hessian方法来最小化或最大化损失函数,由于二阶导数的计算成本很高,所以这种方法并没有广泛使用。
自己找个例子算一下,推导一下,这个回答起来比较复杂神经网络对模型的表达能力依赖于优化算法,优化是一个不断计算梯度并调整可学习参数的过程,Fluid中的优化算法可参考?优化器?。
在网络的训练过程中,梯度计算分为两个步骤:前向计算与?反向传播?。前向计算会根据您搭建的网络结构,将输入单元的状态传递到输出单元。
反向传播借助?链式法则?,计算两个或两个以上复合函数的导数,将输出单元的梯度反向传播回输入单元,根据计算出的梯度,调整网络的可学习参数。BP算法隐层的引入使网络具有很大的潜力。
但正像Minskey和Papert当时所指出的.虽然对所有那些能用简单(无隐层)网结解决的问题有非常简单的学习规则,即简单感知器的收敛程序(主要归功于Widrow和HMf于1960年提出的Delta规刚),BP算法但当时并没有找到同样有技的含隐层的同培的学习规则。
对此问题的研究有三个基本的结果。一种是使用简单无监督学习规则的竞争学习方法.但它缺乏外部信息.难以确定适台映射的隐层结构。第二条途径是假设一十内部(隐层)的表示方法,这在一些先约条件下是台理的。
另一种方法是利用统计手段设计一个学习过程使之能有技地实现适当的内部表示法,Hinton等人(1984年)提出的Bolzmann机是这种方法的典型例子.它要求网络在两个不同的状态下达到平衡,并且只局限于对称网络。
Barto和他的同事(1985年)提出了另一条利用统计手段的学习方法。
但迄今为止最有教和最实用的方瑶是Rumelhart、Hinton和Williams(1986年)提出的一般Delta法则,即反向传播(BP)算法。
Parter(1985年)也独立地得出过相似的算法,他称之为学习逻辑。此外,Lecun(1985年)也研究出大致相似的学习法则。
神经网络就像多项式或者线性模型一样,是个看不见表达式的模型,它的表达式就是网络,它比一般模型具有更高的自由度和弹性;同时它是一个典型的黑箱模型方法;比多项式等模型还黑。
优化算法,就是寻优的算法,所谓寻优过程,就是寻找使目标函数最小时(都是统一表示成寻找使函数具有最小值)的自变量的值。
回归或者拟合一个模型,例如用一个多项式模型去拟合一组数据,其本质就是寻找使残差平方和最小的参数值,这就是一个寻优的过程,其实就是寻找使函数F(x)值最小时的x的值;对于这个具体的寻找过程就涉及到算法问题,就是如何计算。
所谓算法,是数值分析的一个范畴,就是解这问题的方法;例如一个一元二次方程x^2-3x+1=0的解法,因为简单可以直接求解,也可以用牛顿逐个靠近的方法求解,也即是迭代,慢慢接近真实解,如此下去不断接近真值,要注意迭代算法是涉及算法精度的,这些迭代算法是基于计算机的,算法的初衷也是用近似的算法用一定的精度来接近真实值。
比如上面的方程也可以用遗传算法来解,可以从一些初始值最终迭代到最佳解。
神经网络在寻找网络的参数即权值的时候,也有寻找使训练效果最好的过程,这也是寻优的过程,这里涉及到了算法就是所谓的神经网络算法,这和最小二乘算法是一样的道理;例如做响应面的时候,其实就是二次回归,用最小二乘得到二次模型的参数,得到一个函数,求最大产物量就是求函数模型的最大值,怎么算呢?
顶点处如果导数为0,这个地方对应的x值就是最优的,二次模型简单可以用偏导数=0来直接解决,这过程也可以遗传算法等来解决。说到底所谓寻优的本质就是,寻找函数极值处对应的自变量的值。
人工神经网络(ArtificialNeuralNetworks,ANN)系统是20世纪40年代后出现的。
它是由众多的神经元可调的连接权值连接而成,具有大规模并行处理、分布式信息存储、良好的自组织自学习能力等特点。
BP(BackPropagation)算法又称为误差反向传播算法,是人工神经网络中的一种监督式的学习算法。
BP神经网络算法在理论上可以逼近任意函数,基本的结构由非线性变化单元组成,具有很强的非线性映射能力。
而且网络的中间层数、各层的处理单元数及网络的学习系数等参数可根据具体情况设定,灵活性很大,在优化、信号处理与模式识别、智能控制、故障诊断等许多领域都有着广泛的应用前景。
工作原理人工神经元的研究起源于脑神经元学说。19世纪末,在生物、生理学领域,Waldeger等人创建了神经元学说。人们认识到复杂的神经系统是由数目繁多的神经元组合而成。
大脑皮层包括有100亿个以上的神经元,每立方毫米约有数万个,它们互相联结形成神经网络,通过感觉器官和神经接受来自身体内外的各种信息,传递至中枢神经系统内,经过对信息的分析和综合,再通过运动神经发出控制信息,以此来实现机体与内外环境的联系,协调全身的各种机能活动。
神经元也和其他类型的细胞一样,包括有细胞膜、细胞质和细胞核。但是神经细胞的形态比较特殊,具有许多突起,因此又分为细胞体、轴突和树突三部分。细胞体内有细胞核,突起的作用是传递信息。
树突是作为引入输入信号的突起,而轴突是作为输出端的突起,它只有一个。树突是细胞体的延伸部分,它由细胞体发出后逐渐变细,全长各部位都可与其他神经元的轴突末梢相互联系,形成所谓“突触”。
在突触处两神经元并未连通,它只是发生信息传递功能的结合部,联系界面之间间隙约为(15~50)×10米。突触可分为兴奋性与抑制性两种类型,它相应于神经元之间耦合的极性。
每个神经元的突触数目正常,最高可达10个。各神经元之间的连接强度和极性有所不同,并且都可调整、基于这一特性,人脑具有存储信息的功能。利用大量神经元相互联接组成人工神经网络可显示出人的大脑的某些特征。
人工神经网络是由大量的简单基本元件——神经元相互联接而成的自适应非线性动态系统。每个神经元的结构和功能比较简单,但大量神经元组合产生的系统行为却非常复杂。
人工神经网络反映了人脑功能的若干基本特性,但并非生物系统的逼真描述,只是某种模仿、简化和抽象。
与数字计算机比较,人工神经网络在构成原理和功能特点等方面更加接近人脑,它不是按给定的程序一步一步地执行运算,而是能够自身适应环境、总结规律、完成某种运算、识别或过程控制。
人工神经网络首先要以一定的学习准则进行学习,然后才能工作。现以人工神经网络对于写“A”、“B”两个字母的识别为例进行说明,规定当“A”输入网络时,应该输出“1”,而当输入为“B”时,输出为“0”。
所以网络学习的准则应该是:如果网络作出错误的的判决,则通过网络的学习,应使得网络减少下次犯同样错误的可能性。
首先,给网络的各连接权值赋予(0,1)区间内的随机值,将“A”所对应的图象模式输入给网络,网络将输入模式加权求和、与门限比较、再进行非线性运算,得到网络的输出。
在此情况下,网络输出为“1”和“0”的概率各为50%,也就是说是完全随机的。这时如果输出为“1”(结果正确),则使连接权值增大,以便使网络再次遇到“A”模式输入时,仍然能作出正确的判断。
神经网络算法可以解决的问题有哪些。
从20世纪80年代末期,人工神经网络方法开始应用于遥感图像的自动分类。
目前,在遥感图像的自动分类方面,应用和研究比较多的人工神经网络方法主要有以下几种:(1)BP(BackPropagation)神经网络,这是一种应用较广泛的前馈式网络,属于有监督分类算法,它将先验知识融于网络学习之中,加以最大限度地利用,适应性好,在类别数少的情况下能够得到相当高的精度,但是其网络的学习主要采用误差修正算法,识别对象种类多时,随着网络规模的扩大,需要的计算过程较长,收敛缓慢而不稳定,且识别精度难以达到要求。
(2)Hopfield神经网络。属于反馈式网络。主要采用Hebb规则进行学习,一般情况下计算的收敛速度较快。
这种网络是美国物理学家J.J.Hopfield于1982年首先提出的,它主要用于模拟生物神经网络的记忆机理。
Hopfield神经网络状态的演变过程是一个非线性动力学系统,可以用一组非线性差分方程来描述。
系统的稳定性可用所谓的“能量函数”进行分析,在满足一定条件下,某种“能量函数”的能量在网络运行过程中不断地减少,最后趋于稳定的平衡状态。
Hopfield网络的演变过程是一种计算联想记忆或求解优化问题的过程。(3)Kohonen网络。
这是一种由芬兰赫尔辛基大学神经网络专家Kohonen(1981)提出的自组织神经网络,其采用了无导师信息的学习算法,这种学习算法仅根据输入数据的属性而调整权值,进而完成向环境学习、自动分类和聚类等任务。
其最大的优点是最终的各个相邻聚类之间是有相似关系的,即使识别时把样本映射到了一个错误的节点,它也倾向于被识别成同一个因素或者一个相近的因素,这就十分接近人的识别特性。
人工神经元是人工神经网络的基本处理单元,而人工智能的一个重要组成部分又是人工神经网络。人工神经网络是模拟生物神经元系统的数学模型,接受信息主要是通过神经元来进行的。
首先,人工神经元利用连接强度将产生的信号扩大;然后,接收到所有与之相连的神经元输出的加权累积;最后,将神经元与加权总和一一比较,当比阈值大时,则激活人工神经元,信号被输送至与它连接的上一层的神经元,反之则不行。
人工神经网络的一个重要模型就是反向传播模型(Back-PropagationModel)(简称BP模型)。
对于一个拥有n个输入节点、m个输出节点的反向传播网络,可将输入到输出的关系看作n维空间到m维空间的映射。由于网络中含有大量非线性节点,所以可具有高度非线性。
(一)神经网络评价法的步骤利用神经网络对复垦潜力进行评价的目的就是对某个指标的输入产生一个预期的评价结果,在此过程中需要对网络的连接弧权值进行不断的调整。(1)初始化所有连接弧的权值。
为了保证网络不会出现饱和及反常的情况,一般将其设置为较小的随机数。(2)在网络中输入一组训练数据,并对网络的输出值进行计算。
(3)对期望值与输出值之间的偏差进行计算,再从输出层逆向计算到第一隐含层,调整各条弧的权值,使其往减少该偏差的方向发展。
(4)重复以上几个步骤,对训练集中的各组训练数据反复计算,直至二者的偏差达到能够被认可的程度为止。(二)人工神经网络模型的建立(1)确定输入层个数。
根据评价对象的实际情况,输入层的个数就是所选择的评价指标数。(2)确定隐含层数。
通常最为理想的神经网络只具有一个隐含层,输入的信号能够被隐含节点分离,然后组合成新的向量,其运算快速,可让复杂的事物简单化,减少不必要的麻烦。(3)确定隐含层节点数。
按照经验公式:灾害损毁土地复垦式中:j——隐含层的个数;n——输入层的个数;m——输出层的个数。人工神经网络模型结构如图5-2。
图5-2人工神经网络结构图(据周丽晖,2004)(三)人工神经网络的计算输入被评价对象的指标信息(X1,X2,X3,…,Xn),计算实际输出值Yj。
灾害损毁土地复垦比较已知输出与计算输出,修改K层节点的权值和阈值。灾害损毁土地复垦式中:wij——K-1层结点j的连接权值和阈值;η——系数(0<η<1);Xi——结点i的输出。
输出结果:Cj=yj(1-yj)(dj-yj)(5-21)式中:yj——结点j的实际输出值;dj——结点j的期望输出值。
因为无法对隐含结点的输出进行比较,可推算出:灾害损毁土地复垦式中:Xj——结点j的实际输出值。
它是一个轮番代替的过程,每次的迭代都将W值调整,这样经过反复更替,直到计算输出值与期望输出值的偏差在允许值范围内才能停止。
利用人工神经网络法对复垦潜力进行评价,实际上就是将土地复垦影响评价因子与复垦潜力之间的映射关系建立起来。
只要选择的网络结构合适,利用人工神经网络函数的逼近性,就能无限接近上述映射关系,所以采用人工神经网络法进行灾毁土地复垦潜力评价是适宜的。
(四)人工神经网络方法的优缺点人工神经网络方法与其他方法相比具有如下优点:(1)它是利用最优训练原则进行重复计算,不停地调试神经网络结构,直至得到一个相对稳定的结果。
所以,采取此方法进行复垦潜力评价可以消除很多人为主观因素,保证了复垦潜力评价结果的真实性和客观性。(2)得到的评价结果误差相对较小,通过反复迭代减少系统误差,可满足任何精度要求。
(3)动态性好,通过增加参比样本的数量和随着时间不断推移,能够实现动态追踪比较和更深层次的学习。
(4)它以非线性函数为基础,与复杂的非线性动态经济系统更贴近,能够更加真实、更为准确地反映出灾毁土地复垦潜力,比传统评价方法更适用。
但是人工神经网络也存在一定的不足:(1)人工神经网络算法是采取最优化算法,通过迭代计算对连接各神经元之间的权值不断地调整,直到达到全局最优化。
但误差曲面相当复杂,在计算过程中一不小心就会使神经网络陷入局部最小点。
(2)误差通过输出层逆向传播,隐含层越多,逆向传播偏差在接近输入层时就越不准确,评价效率在一定程度上也受到影响,收敛速度不及时的情况就容易出现,从而造成个别区域的复垦潜力评价结果出现偏离。
?