违法和不良信息举报
联系客服
登录
注册
搜
当前位置:
首页
问答
人工智能与信息社会
Q函数Q(s,a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的()。A、期望值B、最大值C、最小值D、总和
Q函数Q(s,a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的()。A、期望值B、最大值C、最小值D、总和
题目
Q函数Q(s,a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的()。
A、期望值
B、最大值
C、最小值
D、总和
查看参考答案
相似考题
搜答案
相关内容
电网调度计划考试
建筑工程
福建住院医师急诊科
计算机网络技术(网络管理)专科
疾病控制主治医师
诺基亚认证考试
传播与沟通
锅炉操作工考试
机械设备维修
磨矿机工考试
开通会员查看答案