百科查询网经验知识百科全书!
首页 >游戏数码 >互联网 > AlphaGo的神奇全靠它,详解人工神经网络!

AlphaGo的神奇全靠它,详解人工神经网络!

0次浏览 | 2022-10-25 02:09:13 更新
来源 :互联网
最佳回答
本文由作者推荐

详细内容

  • 01

    Alphago在不被看好的情况下,以4比1击败了围棋世界冠军李世石,令其名震天下。随着AlphaGo知名度的不断提高,人们不禁好奇,究竟是什么使得AlphaGo得以战胜人类大脑?AlphaGo的核心依托——人工神经网络。

    什么是神经网络?

    人工神经网络是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是一种非线性统计性数据建模工具,常用来对输入和输出间复杂的关系进行建模,或用来探索数据的模式。

    神经网络是一种运算模型,由大量的节点(或称“神经元”,或“单元”)和之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。

    例如,用于手写识别的一个神经网络是被可由一个输入图像的像素被激活的一组输入神经元所定义的。在通过函数(由网络的设计者确定)进行加权和变换之后,这些神经元被激活然后被传递到其他神经元。重复这一过程,直到最后一个输出神经元被激活。这样决定了被读取的字。

    它的构筑理念是受到人或其他动物神经网络功能的运作启发而产生的。人工神经网络通常是通过一个基于数学统计学类型的学习方法得以优化,所以人工神经网络也是数学统计学方法的一种实际应用,通过统计学的标准数学方法我们能够得到大量的可以用函数来表达的局部结构空间,另一方面在人工智能学的人工感知领域,我们通过数学统计学的应用可以来做人工感知方面的决定问题(也就是说通过统计学的方法,人工神经网络能够类似人一样具有简单的决定能力和简单的判断能力),这种方法比起正式的逻辑学推理演算更具有优势。

    人工神经网络是一个能够学习,能够总结归纳的系统,也就是说它能够通过已知数据的实验运用来学习和归纳总结。人工神经网络通过对局部情况的对照比较(而这些比较是基于不同情况下的自动学习和要实际解决问题的复杂性所决定的),它能够推理产生一个可以自动识别的系统。与之不同的基于符号系统下的学习方法,它们也具有推理功能,只是它们是建立在逻辑算法的基础上,也就是说它们之所以能够推理,基础是需要有一个推理算法则的集合。

    2AlphaGo的原理回顶部

    AlphaGo的原理

    首先,AlphaGo同优秀的选手进行了150000场比赛,通过人工神经网络找到这些比赛的模式。然后通过总结,它会预测选手在任何位置高概率进行的一切可能。AlphaGo的设计师通过让其反复的和早期版本的自己对战来提高神经网络,使其逐步提高获胜的机会。

    从广义上讲,神经网络是一个非常复杂的数学模型,通过对其高达数百万参数的调整来改变的它的行为。神经网络学习的意思是,电脑一直持续对其参数进行微小的调整,来尝试使其不断进行微小的改进。在学习的第一阶段,神经网络提高模仿选手下棋的概率。在第二阶段,它增加自我发挥,赢得比赛的概率。反复对极其复杂的功能进行微小的调整,听起来十分疯狂,但是如果有足够长的时间,足够快的计算能力,非常好的网络实施起来并不苦难。并且这些调整都是自动进行的。

    经过这两个阶段的训练,神经网络就可以同围棋业余爱好者下一盘不错的棋了。但对于职业来讲,它还有很长的路要走。在某种意义上,它并不思考每一手之后的几步棋,而是通过对未来结果的推算来决定下在哪里。为了达到职业级别,AlphaGp需要一种新的估算方法。

    为了克服这一障碍,研究人员采取的办法是让它反复的和自己进行对战,以此来使其不断其对于胜利的估算能力。尽可能的提高每一步的获胜概率。(在实践中,AlphaGo对这个想法进行了稍微复杂的调整。)然后,AlphaGo再结合多线程来使用这一方法进行下棋。

    我们可以看到,AlphaGo的评估系统并没有基于太多的围棋知识,通过分析现有的无数场比赛的棋谱,以及无数次的自我对战练习,AlphaGo的神经网络进行了数以十亿计的微小调整,即便每次只是一个很小的增量改进。这些调整帮助AlphaGp建立了一个估值系统,这和那些出色围棋选手的直觉相似,对于棋盘上的每一步棋都了如指掌。

    此外AlphaGo也使用搜索和优化的思想,再加上神经网络的学习功能,这两者有助于找到棋盘上更好的位置。这也是目前AlphaGo能够高水平发挥的原因。

    3神经网络的延伸和限制回顶部

    神经网络的延伸和限制

    神经网络的这种能力也可以被用在其他方面,比如让神经网络学习一种艺术风格,然后再将这种风格应用到其他图像上。这种想法很简单:首先让神经网络接触到大量的图像,然后来确认这些图像的风格,接着将新的图像带入这种风格。

    这虽然不是伟大的艺术,但它仍然是一个显著的利用神经网络来捕捉直觉并且应用在其他地方的例子。

    在过去的几年中,神经网络在许多领域被用来捕捉直觉和模式识别。许多项目使用神经这些网络,涉及的任务如识别艺术风格或好的视频游戏的发展战略。但也有非常不同的网络模拟的直觉惊人的例子,比如语音和自然语言。

    由于这种多样性,我看到AlphaGo本身不是一个革命性的突破,而是作为一个极其重要的发展前沿:建立系统,可以捕捉的直觉和学会识别模式的能力。此前计算机科学家们已经做了几十年,没有取得长足的进展。但现在,神经网络的成功已经大大扩大,我们可以利用电脑攻击范围内的潜在问题。

    事实上,目前现有的神经网络的理解能力是非常差的。神经网络很容易被愚弄。用神经网络识别图像是一个不错的手段。但是实验证明,通过对图像进行细微的改动,就可以愚弄图像。例如,下面的图像左边的图是原始图,研究人员对中间的图像进行了微小的调整后,神经网络就无法区分了,就将原图显示了出来。

    另一个限制是,现有的系统往往需要许多模型来学习。例如,AlphaGo从150000场对战来学习。这是一个很庞大额度数字!很多情况下,显然无法提供如此庞大的模型案例。

蚂蚁集团完成投票权的调整  会带来什么影响
蚂蚁集团股票权的调整,直接影响到了整个集团的战略和决策,近日,蚂蚁集团对外公布了已经完成的投票权的调整,引起了业内外人士...
5G+北斗 高精定位能做些什么
近日,工业和信息化部批复中国移动使用4.9G赫兹部分的5G频率资源,在我国的多个省份开展5G地空通讯技术的试验,该技术的...
邮政快递改地址如何修改
生活当中很多人都会选择网购,使用邮政快递收发快递也是很常见的,那么邮政快递改地址如何修改呢?具体修改方法如下。首先打开邮...
星偶软件怎么设置谁可以和我合照
 有很多朋友都在用星偶软件,但是很多朋友不知道星偶软件怎么设置谁可以和我合照,其实步骤很简单,跟随我一起看看吧!首先打开...
皮皮虾怎样开启微信授权
皮皮虾是一款非常不错的软件,这里又有很多搞笑的帖子,在这里可以寻找到快乐,并且也能够看到众多幽默的神评论,那么皮皮虾怎样...
excel阅读模式找不到怎么办
Excel表格之间很多人都在使用,可以把自己想要记录的数据记录在其中,展现的方法会非常好,那么Excel阅读模式找不到怎...
如何抹掉iPhone手机的数据
使用iPhone手机时间久了之后,手机当中会有多种多样的数据,如果说决定不再使用这款手机,那么要把手机当中的数据消除,那...
Tencent是什么文件夹(Tencent文件夹能删除吗)
Tencent文件夹主要是腾讯应用程序当中默认安装的一种文件夹,它是不可以删除的。日常生活中只要使用腾讯QQ,微信,腾讯...
如何在excel中打钩(excel里打勾在哪里)
很多人在日常办公或学习时都离不开excel等软件,但也有些小白对excel这些软件缺乏了解,不知该如何在内容中打勾,下面...
win7怎么设置屏幕休眠密码(win7屏幕保护设置密码)
想要设置win7系统电脑的屏幕休眠密码很简单,只需在桌面的个性化设置功能中操作即可,下面就给大家来介绍一下详细内容。1....
关于我们 | 版权声明 | 免责声明 | 联系我们
免责声明:百科查询网所有文字、图片、视频、音频等资料均来自互联网,不代表本站赞同其观点,内容仅代表作者本人意见,若因此产生任何纠纷作者本人负责,本站亦不为其版权负责! 如有问题,请联系我们
CopyRight©1999-2022 www.chaxunla.com All Right Reserved 闽ICP备16000424号