一般地,不会把给定的整个数据集都用来训练模型,而是将其分成训练集和测试集两部分,使用训练集对模型进行训练或学习,然后把测试集输入训练好的模型并评估其表现。
第1题:
我们想要减少数据集中的特征数,即降维.选择以下适合的方案()
1.使用前向特征选择方法
2.使用后向特征排除方法
3.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.
4.查看相关性表,去除相关性最高的一些特征
A.1和2
B.2,3和4
C.1,2和4
D.All
第2题:
训练SVM的最小时间复杂度为O(n2),那么一下哪种数据集不适合用SVM()
A.大数据集
B.小数据集
C.中等大小数据集
D.和数据集大小无关
第3题:
A.验证数据集
B.训练数据集
C.测试数据集
D.未知数据
第4题:
A增加神经网络层数,可能会增加测试数据集的分类错误率
B减少神经网络层数,总是能减小测试数据集的分类错误率
C增加神经网络层数,总是能减小训练数据集的分类错误率
第5题:
A.使用前向特征选择方法
B.使用后向特征排除方法
C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.
D.查看相关性表,去除相关性最高的一些特征
第6题:
()是语义记忆的两个网络模型。
A集理论模型和层次网络模型
B激活扩散模型和特征比较模型
C激活扩散模型和层次网络模型
D集理论模型和特征比较模型
第7题:
关于MNIST,下列说法错误的是()。
第8题:
预测分析将原始数据分为训练数据集和测试数据集其中训练数据集的作用在于()
第9题:
什么是集计模型?什么是非集计模型?
第10题:
对
错
第11题:
可以引用发展得比较成熟的关系数据库管理技术实现模型的管理
使模型单元易于与其他单元通信,但模型不便于更新
模型可描述为由一组参数集合和表示模型结构特征的数据集合的框架
输入数据集在关系框架下进行若干关系运算,得出输出数据集
第12题:
用于对模型的效果进行无偏的评估
用于比较不同模型的预测准确度
用于构造预测模型
用于选择模型
第13题:
如果一个训练好的模型在测试集上有100%的准确率,这是不是意味着在一个新的数据集上,也会有同样好的表现()
A.是的,这说明这个模型的范化能力已经足以支持新的数据集合了
B.不对,依然后其他因素模型没有考虑到,比如噪音数据
第14题:
A、定量评价机器学习性能
B、估算模型
C、验证模型
D、定性评价机器学习性能
第15题:
A、非集计模型是以个人为单位进行分析的
B、非集计模型计算
C、非集计模型需要的样本数量较小
D、非集计模型以明确的行为假说为基础,逻辑性强
第16题:
A.把除了最后一层外所有的层都冻住,重新训练最后一层
B.对新数据重新训练整个模型
C.只对最后几层进行调参(finetune)
D.对每一层模型进行评估,选择其中的少数来用
第17题:
测试用例包括输入值集和__________值集。
第18题:
在有指导的数据挖掘中,有关测试集的说法错误的是()
第19题:
企业要建立预测模型,需要准备建模数据集,以下四条描述建模数据集正确的是()。
第20题:
通过布尔运算(并集、差集和交集)可以创建复杂的三维实体模型。
第21题:
模型的数据表示就是通过数据的转换来研究模型,下列哪项不是其优点()
第22题:
第23题:
是著名的手写体数字识别数据集
有训练集和测试集两部分
训练集类似人学习中使用的各种考试试卷
测试集大约包含10000个样本和标签
第24题:
测试集和训练集是相互联系的
测试集是用以测试模型的数据集
通常测试集大约占总样本的三分之一
K-次交叉验证中,测试集只有