根据新时代专业技术人员的机遇与挑战,基于深度学习的AlphaGo主要采用哪些关键技术()A、行为网络B、策略网络C、视觉网络D、价值网络E、蒙特卡洛树搜索

题目

根据新时代专业技术人员的机遇与挑战,基于深度学习的AlphaGo主要采用哪些关键技术()

  • A、行为网络
  • B、策略网络
  • C、视觉网络
  • D、价值网络
  • E、蒙特卡洛树搜索

相似考题
更多“根据新时代专业技术人员的机遇与挑战,基于深度学习的AlphaGo主要采用哪些关键技术()A、行为网络B、策略网络C、视觉网络D、价值网络E、蒙特卡洛树搜索”相关问题
  • 第1题:

    AlphaGo是利用深度神经网络和树搜索精通围棋游戏。()

    此题为判断题(对,错)。


    正确答案:正确

  • 第2题:

    1997年,国际象棋大师加里·卡斯帕罗夫败给了电脑“深蓝”;2016年,谷歌人工智能AlphaGo又战胜了韩国棋手李世石。这标志着人工智能终于征服了它在棋类比赛中最后的弱项——围棋,谷歌公司的DeepMind团队比预期提前了整整10年达到了既定目标。
    对计算机来说,围棋并不是因为其规则比国际象棋复杂而难以征服——与此完全相反,围棋规则更简单,它其实只有一种棋子,对弈的双方轮流把黑色和白色的棋子放到一个19x19的正方形棋盘中,落下的棋子就不能再移动了,只会在被对方棋子包围时被提走,到了棋局结束时,占据棋盘面积较多的一方为胜者。
    围棋的规则如此简单,但对于计算机来说却又异常复杂,原因在于围棋的步数非常多,而且每一步的可能下法也非常多。以国际象棋作对比,国际象棋每一步平均约有35种不同的可能走法,一般情况下,多数棋局会在80步之内结束。围棋棋盘共有361个落子点,双方交替落子,整个棋局的总排列组合数共有约10701种可能性,这远远超过了宇宙中的原子总数——10^{80}!
    对于结构简单的棋类游戏,计算机程序开发人员可以使用所谓的“暴力”方法,再辅以一些技巧,来寻找对弈策略,也就是对余下可能出现的所有盘面都进行尝试并给予评价,从而找出最优的走法。这种对整棵博弈树进行穷举搜索的策略对计算能力要求很高,对围棋或者象棋程序来说是非常困难的,尤其是围棋,从技术上来讲目前不可能做到。
    “蒙特卡罗树搜索”是一种基于蒙特卡罗算法的启发式搜索策略,能够根据对搜索空间的随机抽样来扩大搜索树,从而分析围棋这类游戏中每一步棋应该怎么走才能够创造最好机会。举例来说,假如筐里有100个苹果,每次闭着眼拿出1个,最终要挑出最大的1个。于是先随机拿1个,再随机拿1个跟它比,留下大的,再随机拿1个……每拿一次,留下的苹果都至少不比上次的小。拿的次数越多,挑出的苹果就越大。但除非拿100次,否则无法肯定挑出了最大的。这个挑苹果的方法,就属于蒙特卡罗算法。虽然“蒙特卡罗树搜索”在此前一些弈棋程序中也有采用,在相对较小的棋盘中也能很好地发挥作用,但在正规的全尺寸棋盘上,这种方法仍然存在相当大的缺陷,因为涉及的搜索树还是太大了。
    AlphaGo人工智能程序中最新颖的技术当属它获取知识的方式——深度学习。AlphaGo借助两个深度卷积神经网络(价值网络和策略网络)自主地进行新知识的学习。深度卷积神经网络使用很多层的神经元,将其堆叠在一起,用于生成图片逐渐抽象的、局部的特征。对图像分析得越细,利用的神经网络层就越多。AlphaGo 也采取了类似的架构,将围棋棋盘上的盘面视为19×19的图片输入,然后通过卷积层来表征盘面。这样,两个深度卷积神经网络中的价值网络用于评估盘面,策略网络用于采样动作。
    在深度学习的第一阶段——策略网络的有监督学习(即从______I____中学习)阶段,拥有13层神经网络的AlphaGo借助围棋数据库KGS中存储的3000万份对弈棋谱进行初步学习。这3000万份棋谱样本可以用a、b进行统计。a是一个二维棋局,把a输入到一个卷积神经网络进行分类,分类的目标就是落子向量A。通过不断的训练,尽可能让计算机得到的向量A接近人类高手的落子结果b,这样就形成了一个模拟人类下围棋的神经网络,然后得出一个下棋函数F go()。当盘面走到任何一种情形的时候,AlphaGo都可以通过调用函数F go()计算的结果来得到最佳的落子结果b可能的概率分布,并依据这个概率来挑选下一步的动作。在第二阶段——策略网络的强化学习(即从____II______ 中学习)阶段,AlphaGo开始结合蒙特卡罗树搜索,不再机械地调用函数库,而类似于一种人类进化的过程:AlphaGo会和自己的老版本对弈。即,先使用F_go(1)和F_go(1)对弈,得到了一定量的新棋谱,将这些新棋谱加入到训练集当中,训练出新的F_go(2),再使用F_go(2)和F_go(1)对弈,以此类推,这样就可以得到胜率更高的F_go(n)。这样,AlphaGo就可以不断改善它在第一阶段学到的知识。在第三阶段——价值网络的强化学习阶段,AlphaGo可以根据之前获得的学习经验得出估值函数v(s),用于预测策略网络自我对抗时棋盘盘面s的结果。最后,则是将F_go()、v(s)以及蒙特卡罗树搜索三者相互配合,使用F_go()作为初始分开局,每局选择分数最高的方案落子,同时调用v(s)在比赛中做出正确的判断。
    这就是AlphaGo给围棋带来的新搜索算法。它创新性地将蒙特卡罗模拟和价值网络、策略网络结合起来训练深度神经网络。这样价值网络和策略网络相当于AlphaGo的两个大脑,策略网络负责在当前局面下判断“最好的”下一步,可以理解为落子选择器;价值网络负责评估整体盘面的优劣,淘汰掉不值得深入计算的走法,协助前者提高运算效率,可以理解为棋局评估器。通过两个“大脑”各自选择的平均值,AlphaGo最终决定怎样落子胜算最大。通过这种搜索算法,AlphaGo和其他围棋程序比赛的胜率达到了99.8%。
    AlphaGo的飞快成长是任何一个围棋世界冠军都无法企及的。随着计算机性能的不断增强,遍历蒙特卡罗搜索树将进一步提高命中概率。大量的计算机专家,配合大量的世界围棋高手,在算法上不断革新,再配合不断成长的超级计算能力,不断地从失败走向成功,最终打造出围棋人工智能。在AlphaGo击败李世石后,欧洲围棋冠军樊麾说了这么一句话:“这是一个团队的集体智慧用科技的方式战胜了人类数千年的经验积累。”人和机器其实没有站在对立面上,“是人类战胜了人类”。
    根据文章,回答下列问题:

    下列关于AlphaGo“两个大脑”的说法正确的是:

    A.价值网络负责评估盘面优劣
    B.策略网络负责判断走法优劣
    C.策略网络能够协助价值网络提高运算效率
    D.价值网络和策略网络共同确定最终的落子位置

    答案:A,B,D
    解析:
    A项:锁定第8段中价值网络负责评估整体盘面的优劣,淘汰掉不值得深入计算的走法。与选项A内容一致。
    B项:锁定第8段中策略负责在当前局面下判断最好的下一步,可以理解为落子选择器。与B项内容一致。
    C项:锁定第8段中价值网络负责评估整体盘面的优劣,淘汰掉不值得深入计算的走法,协助前者提高运算效率,可以理解为棋局评估器。而C选项是,策略网路协助价值网络提升运算效率,与原文刚好相反,因此错误。
    D项:锁定第8段最后,通过两个大脑各自选择的平均值,AlphaGo最终决定怎样落子胜算最大。选项D与原文一致,因此正确。

  • 第3题:

    基于网站的网络营销中低价策略主要包括哪些?


    正确答案:直接低价;折扣定价;促销定价。

  • 第4题:

    根据新时代专业技术人员的机遇与挑战,影响深度卷积神经网络算法的关键参数是()

    • A、网站数量
    • B、网络深度
    • C、网络结构
    • D、网络主体

    正确答案:B

  • 第5题:

    构成网络学习环境的基本要素包括()

    • A、基于网络的智能教学系统
    • B、基于网络的题库系统
    • C、基于网络的学习评价系统
    • D、基于网络的交流与协作系统
    • E、基于网络的辅助工具系统

    正确答案:A,B,C,D,E

  • 第6题:

    网络营销的内涵有()

    • A、网络营销是现代化管理
    • B、网络营销是经营上的不断提升
    • C、网络营销是经营上的不断创新
    • D、网络营销是机遇与挑战

    正确答案:A,C,D

  • 第7题:

    多选题
    网络课程是网络学习资源的核心部分,网络课程的主要成分有()
    A

    学习目标

    B

    网络课程内容

    C

    指导性策略

    D

    网络课程评价


    正确答案: C,A
    解析: 暂无解析

  • 第8题:

    多选题
    人工神经元网络与深度学习的关系是()。
    A

    人工神经元网络是深度学习的前身

    B

    深度学习是人工神经元网络的一个分支

    C

    深度学习是人工神经元网络的一个发展

    D

    深度学习与人工神经元网络无关


    正确答案: D,B
    解析: 暂无解析

  • 第9题:

    填空题
    《新时代专业技术人员的机遇与挑战》以苹果公司为例指出,从()看,“互联网+”使网络化实时化成为产业链上下游协作的新趋势。

    正确答案: 供应链管理
    解析: 暂无解析

  • 第10题:

    多选题
    根据新时代专业技术人员的机遇与挑战,对于人工智能而言,目前有哪些学习方法()
    A

    监督学习

    B

    网络学习

    C

    强化学习

    D

    无监督学习

    E

    以上都不对


    正确答案: A,C,D
    解析: 暂无解析

  • 第11题:

    多选题
    《新时代专业技术人员的机遇与挑战》详细介绍了工作家庭冲突的类型,以下哪些选项是正确的?()
    A

    基于时间的冲突

    B

    基于压力的冲突

    C

    基于行为的冲突


    正确答案: B,C
    解析: 暂无解析

  • 第12题:

    多选题
    根据新时代专业技术人员的机遇与挑战,基于深度学习的AlphaGo主要采用哪些关键技术()
    A

    行为网络

    B

    策略网络

    C

    视觉网络

    D

    价值网络

    E

    蒙特卡洛树搜索


    正确答案: C,D
    解析: 暂无解析

  • 第13题:

    2016年DeepMind公司研发的AlphaGo击败了围棋大师李世石。AlphaGo使用的主要算法有()。

    A.遗传算法

    B.深度学习

    C.模糊计算

    D.蒙特卡洛树搜索算法


    答案:BD

  • 第14题:

    1997年,国际象棋大师加里·卡斯帕罗夫败给了电脑“深蓝”;2016年,谷歌人工智能AlphaGo又战胜了韩国棋手李世石。这标志着人工智能终于征服了它在棋类比赛中最后的弱项——围棋,谷歌公司的DeepMind团队比预期提前了整整10年达到了既定目标。
    对计算机来说,围棋并不是因为其规则比国际象棋复杂而难以征服——与此完全相反,围棋规则更简单,它其实只有一种棋子,对弈的双方轮流把黑色和白色的棋子放到一个19x19的正方形棋盘中,落下的棋子就不能再移动了,只会在被对方棋子包围时被提走,到了棋局结束时,占据棋盘面积较多的一方为胜者。
    围棋的规则如此简单,但对于计算机来说却又异常复杂,原因在于围棋的步数非常多,而且每一步的可能下法也非常多。以国际象棋作对比,国际象棋每一步平均约有35种不同的可能走法,一般情况下,多数棋局会在80步之内结束。围棋棋盘共有361个落子点,双方交替落子,整个棋局的总排列组合数共有约10701种可能性,这远远超过了宇宙中的原子总数——10^{80}!
    对于结构简单的棋类游戏,计算机程序开发人员可以使用所谓的“暴力”方法,再辅以一些技巧,来寻找对弈策略,也就是对余下可能出现的所有盘面都进行尝试并给予评价,从而找出最优的走法。这种对整棵博弈树进行穷举搜索的策略对计算能力要求很高,对围棋或者象棋程序来说是非常困难的,尤其是围棋,从技术上来讲目前不可能做到。
    “蒙特卡罗树搜索”是一种基于蒙特卡罗算法的启发式搜索策略,能够根据对搜索空间的随机抽样来扩大搜索树,从而分析围棋这类游戏中每一步棋应该怎么走才能够创造最好机会。举例来说,假如筐里有100个苹果,每次闭着眼拿出1个,最终要挑出最大的1个。于是先随机拿1个,再随机拿1个跟它比,留下大的,再随机拿1个……每拿一次,留下的苹果都至少不比上次的小。拿的次数越多,挑出的苹果就越大。但除非拿100次,否则无法肯定挑出了最大的。这个挑苹果的方法,就属于蒙特卡罗算法。虽然“蒙特卡罗树搜索”在此前一些弈棋程序中也有采用,在相对较小的棋盘中也能很好地发挥作用,但在正规的全尺寸棋盘上,这种方法仍然存在相当大的缺陷,因为涉及的搜索树还是太大了。
    AlphaGo人工智能程序中最新颖的技术当属它获取知识的方式——深度学习。AlphaGo借助两个深度卷积神经网络(价值网络和策略网络)自主地进行新知识的学习。深度卷积神经网络使用很多层的神经元,将其堆叠在一起,用于生成图片逐渐抽象的、局部的特征。对图像分析得越细,利用的神经网络层就越多。AlphaGo 也采取了类似的架构,将围棋棋盘上的盘面视为19×19的图片输入,然后通过卷积层来表征盘面。这样,两个深度卷积神经网络中的价值网络用于评估盘面,策略网络用于采样动作。
    在深度学习的第一阶段——策略网络的有监督学习(即从______I____中学习)阶段,拥有13层神经网络的AlphaGo借助围棋数据库KGS中存储的3000万份对弈棋谱进行初步学习。这3000万份棋谱样本可以用a、b进行统计。a是一个二维棋局,把a输入到一个卷积神经网络进行分类,分类的目标就是落子向量A。通过不断的训练,尽可能让计算机得到的向量A接近人类高手的落子结果b,这样就形成了一个模拟人类下围棋的神经网络,然后得出一个下棋函数F go()。当盘面走到任何一种情形的时候,AlphaGo都可以通过调用函数F go()计算的结果来得到最佳的落子结果b可能的概率分布,并依据这个概率来挑选下一步的动作。在第二阶段——策略网络的强化学习(即从____II______ 中学习)阶段,AlphaGo开始结合蒙特卡罗树搜索,不再机械地调用函数库,而类似于一种人类进化的过程:AlphaGo会和自己的老版本对弈。即,先使用F_go(1)和F_go(1)对弈,得到了一定量的新棋谱,将这些新棋谱加入到训练集当中,训练出新的F_go(2),再使用F_go(2)和F_go(1)对弈,以此类推,这样就可以得到胜率更高的F_go(n)。这样,AlphaGo就可以不断改善它在第一阶段学到的知识。在第三阶段——价值网络的强化学习阶段,AlphaGo可以根据之前获得的学习经验得出估值函数v(s),用于预测策略网络自我对抗时棋盘盘面s的结果。最后,则是将F_go()、v(s)以及蒙特卡罗树搜索三者相互配合,使用F_go()作为初始分开局,每局选择分数最高的方案落子,同时调用v(s)在比赛中做出正确的判断。
    这就是AlphaGo给围棋带来的新搜索算法。它创新性地将蒙特卡罗模拟和价值网络、策略网络结合起来训练深度神经网络。这样价值网络和策略网络相当于AlphaGo的两个大脑,策略网络负责在当前局面下判断“最好的”下一步,可以理解为落子选择器;价值网络负责评估整体盘面的优劣,淘汰掉不值得深入计算的走法,协助前者提高运算效率,可以理解为棋局评估器。通过两个“大脑”各自选择的平均值,AlphaGo最终决定怎样落子胜算最大。通过这种搜索算法,AlphaGo和其他围棋程序比赛的胜率达到了99.8%。
    AlphaGo的飞快成长是任何一个围棋世界冠军都无法企及的。随着计算机性能的不断增强,遍历蒙特卡罗搜索树将进一步提高命中概率。大量的计算机专家,配合大量的世界围棋高手,在算法上不断革新,再配合不断成长的超级计算能力,不断地从失败走向成功,最终打造出围棋人工智能。在AlphaGo击败李世石后,欧洲围棋冠军樊麾说了这么一句话:“这是一个团队的集体智慧用科技的方式战胜了人类数千年的经验积累。”人和机器其实没有站在对立面上,“是人类战胜了人类”。
    根据文章,回答下列问题:

    比较分析AlphaGo新算法与蒙特卡罗树搜素的不同之处。
    要求:概括准确,层次清晰,文字简洁,不超过250字。


    答案:
    解析:
    新算法和蒙特卡罗树搜索的不同之处:
    1.核心算法不同:新算法创新性地将蒙特卡罗模拟和价值网络、策略网络结合起来,具备“两个大脑”,而蒙特卡罗树搜索是一种基于蒙特卡罗算法的启发式搜索策略,是单一神经网络。
    学习方式不同:新算法深度学习分为三个阶段,即策略网络的监督学习,策略网络的强化学习,价值网络的强化学习。蒙特卡罗树搜索是启发式搜索,不涉及学习阶段。
    应用范围不同:蒙特卡罗树搜索在正规的全尺寸棋盘上存在缺陷,而新算法的使用不存在棋盘尺寸限制问题。

  • 第15题:

    根据新时代专业技术人员的机遇与挑战,对于人工智能而言,目前有哪些学习方法()

    • A、监督学习
    • B、网络学习
    • C、强化学习
    • D、无监督学习
    • E、以上都不对

    正确答案:A,C,D

  • 第16题:

    基于深度学习的AlphaGo主要采用哪些关键技术()。

    • A、行为网络
    • B、策略网络
    • C、视觉网络
    • D、价值网络
    • E、蒙特卡洛树搜索

    正确答案:B,D,E

  • 第17题:

    以下哪些属于网络营销?()。

    • A、网上市场调查
    • B、网络消费者行为分析
    • C、网络产品和服务策略
    • D、网络促销与网络广告

    正确答案:A,B,C,D

  • 第18题:

    网络课程是网络学习资源的核心部分,网络课程的主要成分有()

    • A、学习目标
    • B、网络课程内容
    • C、指导性策略
    • D、网络课程评价

    正确答案:A,B,C,D

  • 第19题:

    多选题
    网络营销的内涵有()
    A

    网络营销是现代化管理

    B

    网络营销是经营上的不断提升

    C

    网络营销是经营上的不断创新

    D

    网络营销是机遇与挑战


    正确答案: B,C
    解析: 暂无解析

  • 第20题:

    多选题
    基于深度学习的AlphaGo主要采用哪些关键技术()。
    A

    行为网络

    B

    策略网络

    C

    视觉网络

    D

    价值网络

    E

    蒙特卡洛树搜索


    正确答案: E,D
    解析: 暂无解析

  • 第21题:

    问答题
    请阐述企业在网络时代会面对哪些机遇与挑战?

    正确答案: 企业在网络时代面对的机遇是:
    (一)企业可以更好的满足顾客的个性化需求
    (二)企业可以降低交易成本
    (三)企业可以减少库存
    (四)企业可以使合作竞争战略更便利的实施
    (五)提高获取知识、应用知识的能力
    企业在网络时代面对的挑战是:
    (一)企业面临日益激烈的竞争
    (二)顾客的权力大大增强
    (三)企业的整体盈利水平将会降低
    (四)企业关键的成功因素将会改变
    (五)企业资源配置的方式和界限将会发生重大变化
    解析: 暂无解析

  • 第22题:

    单选题
    根据新时代专业技术人员的机遇与挑战,影响深度卷积神经网络算法的关键参数是()
    A

    网站数量

    B

    网络深度

    C

    网络结构

    D

    网络主体


    正确答案: C
    解析: 暂无解析

  • 第23题:

    多选题
    《新时代专业技术人员的机遇与挑战》提到,在网络经济下,消费者可以通过()等方式获得大量资源,参与创新创业。
    A

    众创

    B

    众筹

    C

    众包


    正确答案: B,A
    解析: 暂无解析