A准确度并不适合衡量不平衡类别问题
B准确度适合衡量不平衡类别问题
C精确度和召回率适合于衡量不平衡类别问题
D精确度和召回率不适合衡量不平衡类别问题
第1题:
4、假设您正在使用垃圾邮件分类器,其中垃圾邮件是正例(y=1),非垃圾邮件是反例(y=0)。您有一组电子邮件训练集,其中99%的电子邮件是非垃圾邮件,另1%是垃圾邮件。以下哪项陈述是错误的?
A.一个好的分类器应该在交叉验证集上同时具有高精度precision和高召回率recall。
B.如果您总是预测非垃圾邮件(输出y=0),那么您的分类器在训练集上的准确度accuracy将达到99%,而且它在交叉验证集上的性能可能类似。
C.如果您总是预测非垃圾邮件(输出y=0),那么您的分类器的准确度accuracy将达到99%。
D.如果您总是预测非垃圾邮件(输出y=0),那么您的分类器在训练集上的准确度accuracy将达到99%,但在交叉验证集上的准确率会更差,因为它过拟合训练数据。
第2题:
7、过拟合是指()。
A.在训练集表现非常好,但在测试集上表现很差
B.在训练集表现非常好,但在测试集上表现也非常好
C.在训练集表现非常差,但在测试集上表现也差
D.在训练集表现非常差,但在测试集上表现非常好
第3题:
8、欠拟合是指()。
A.在训练集表现非常好,但在测试集上表现很差
B.在训练集表现非常好,但在测试集上表现也非常好
C.在训练集表现非常差,但在测试集上表现也差
D.在训练集表现非常差,但在测试集上表现非常好
第4题:
6、下列关于数据集的说法,正确的是______。
A.训练集用来训练模型,确定模型参数
B.验证集用来评估模型的泛化能力
C.测试集用来确定网络的超参数
D.A、B、C均错误
第5题:
1、下面的说法中,错误 的是:
A.特征列是指用于预测目标数据的数据列
B.测试集是用来评估模型效果的数据行
C.训练集数量一般要大于测试集
D.即使测试集数量大于训练集,测试集也不能当成训练集