强化学习的框架是智能体()通过观察当前状态作出相应动作。
第1题:
第2题:
第3题:
第4题:
在强化学习中,主体和环境之间交互的要素有()。
第5题:
Dreamweaver MX2004的“文件”菜单命令中,菜单项“保存框架页”表示的是()。
第6题:
DOS系统中,要列出当前目录下所有文件的命令是()。
第7题:
通过观察环境中他人的行为及其后果而发生的学习是()
第8题:
学习者通过观察其他人实施这种行为后所得到的结果来决定自己的行为指向,这是一种()。
第9题:
对
错
第10题:
观察学习
我学习
直接学习
强化学习
第11题:
状态
动作
回报
强化
第12题:
直接强化
自我强化
替代强化
第13题:
第14题:
第15题:
在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。
第16题:
替代强化指学习者通过观察他人行为所带来的奖励性后果而受到强化。
第17题:
儿童通过观察他人所表现的行为及其结果中获取信息称为()。
第18题:
通过一定的榜样来强化相应的学习行为或学习行为倾向是()
第19题:
通过一定的榜样来强化相应的学习行为或学习行为倾向是()
第20题:
学习者通过观察他人行为所带来的_____后果而受到强化,心理学上称之为替代强化。
第21题:
S
A
Agent
Environment
第22题:
探索;开发
开发;探索
探索;输出
开发;输出
第23题:
自我强化
替代强化
内部强化
负强化