A.the number of cities in each state
B.the number of families in each state
C.the size of population in each state
D.the size of cities in each state
第1题:
3、Q-learning属于哪种算法
A.On-policy算法
B.Off-policy 算法
C.Model-based 算法
D.Value-based 算法
第2题:
在实际的工作计划制定过程中,主要采用三种方法:“基于项目(Project-based)”,“基于流程(Process-based)”和基于时间(Time-based)。
第3题:
不需要建模环境,等待真实反馈再进行接下来的动作,这是哪种强化学习算法
A.Model-free方法
B.Model-based 方法
C.Policy-based 方法
D.Value-based 方法
第4题:
2、Q-learning属于哪种算法
A.On-policy算法
B.Off-policy 算法
C.Model-based 算法
D.Value-based 算法
第5题:
3、孟子和荀子都是先秦时期儒家学说的代表人物。
A.Mencius and Xunzi were the early Qin Period' Confucianism' representatives.#B.Mencius and Xunzi were Confucianist representatives in the early Qin Period.#C./#D./第6题:
17、不需要建模环境,等待真实反馈再进行接下来的动作,这是哪种强化学习算法
A.Model-free方法
B.Model-based 方法
C.Policy-based 方法
D.Value-based 方法