在机器学习中,如果数据较少,同时采用的模型较复杂,得到的模型在给定的训练集上误差非常小,接近于0,但是在训练集之外的数据上预测效果很差,这种现象称为()。
A.欠拟合(under-fitting)
B.过拟合(over-fitting)
C.损失函数(loss function)
D.经验风险(empirical risk)
第1题:
训练SVM的最小时间复杂度为O(n2),那么一下哪种数据集不适合用SVM()
A.大数据集
B.小数据集
C.中等大小数据集
D.和数据集大小无关
第2题:
此题为判断题(对,错)。
第3题:
在关系数据模型中,通常可以把字段称为属性,而把____称为关系模式。
A、记录
B、记录类型
C、元组
D、元组集
第4题:
第5题:
在有指导的数据挖掘中,有关测试集的说法错误的是()
第6题:
从结构的角度看,数据仓库有3种模型:企业仓库、(1)和虚拟仓库。数据挖掘就是要智能化和自动化地把数据转换为有用的信息和知识,目前已有多种数据挖掘方法。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,该方法称为(2)。空白(2)处应选择()
第7题:
预测分析将原始数据分为训练数据集和测试数据集其中训练数据集的作用在于()
第8题:
模型的数据表示就是通过数据的转换来研究模型,下列哪项不是其优点()
第9题:
在智能变电站ICD模型中,哪个是保护日志的数据集()。
第10题:
时间序列分析
动态规划
指数平滑法
经济计量模型
第11题:
可以引用发展得比较成熟的关系数据库管理技术实现模型的管理
使模型单元易于与其他单元通信,但模型不便于更新
模型可描述为由一组参数集合和表示模型结构特征的数据集合的框架
输入数据集在关系框架下进行若干关系运算,得出输出数据集
第12题:
用于对模型的效果进行无偏的评估
用于比较不同模型的预测准确度
用于构造预测模型
用于选择模型
第13题:
A、定量评价机器学习性能
B、估算模型
C、验证模型
D、定性评价机器学习性能
第14题:
A.验证数据集
B.训练数据集
C.测试数据集
D.未知数据
第15题:
A.使用前向特征选择方法
B.使用后向特征排除方法
C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.
D.查看相关性表,去除相关性最高的一些特征
第16题:
某种使用加权平均方法对下期数据进行预测,这种预测的依据是使实际数据和预测数据之间的误差最小。这种预测方法称为:()
第17题:
关于MNIST,下列说法错误的是()。
第18题:
企业要建立预测模型,需要准备建模数据集,以下四条描述建模数据集正确的是()。
第19题:
数字地面模型,是在空间数据库中存储并管理的空间数据集的通称,它是地形属性特征数字的描述,其简称为()。
第20题:
在实体类型及实体之间联系的表示方法上,层次模型采用__(1)__结构,网状模型采用__(2)__结构,关系模型则采用__(3)__结构。在搜索数据时,层次模型采用单向搜索法,网状模型采用__(4)__的方法,关系模型则采用__(5)__的方法。空白(1)处应选择()
第21题:
数据分析法
实验分析法
主观想象法
特殊预测法
第22题:
有向图
连通图
波特图
卡诺图
结点集
边集
二维表
树
第23题:
用户仓库
产品仓库
关系型OLAP
数据集市
第24题:
测试集和训练集是相互联系的
测试集是用以测试模型的数据集
通常测试集大约占总样本的三分之一
K-次交叉验证中,测试集只有