在机器学习中,如果数据较少,同时采用的模型较复杂,得到的模型在给定的训练集上误差非常小,接近于0,但是在训练集之外的数据上预测效果很差,这种现象称为()。A.欠拟合(under-fitting)B.过拟合(over-fitting)C.损失函数(loss function)D.经验风险(empirical risk)

题目

在机器学习中,如果数据较少,同时采用的模型较复杂,得到的模型在给定的训练集上误差非常小,接近于0,但是在训练集之外的数据上预测效果很差,这种现象称为()。

A.欠拟合(under-fitting)

B.过拟合(over-fitting)

C.损失函数(loss function)

D.经验风险(empirical risk)


相似考题
参考答案和解析
D
更多“在机器学习中,如果数据较少,同时采用的模型较复杂,得到的模型在给定的训练集上误差非常小,接近于0,但是在训练集之外的数据上预测效果很差,这种现象称为()。”相关问题
  • 第1题:

    训练SVM的最小时间复杂度为O(n2),那么一下哪种数据集不适合用SVM()

    A.大数据集

    B.小数据集

    C.中等大小数据集

    D.和数据集大小无关


    正确答案:A

  • 第2题:

    如果一味追求提高对训练数据的预测能力,所选模型的复杂度往往比“真”魔性更高,这种现象称为欠拟合。()

    此题为判断题(对,错)。


    正确答案:错误

  • 第3题:

    在关系数据模型中,通常可以把字段称为属性,而把____称为关系模式。

    A、记录

    B、记录类型

    C、元组

    D、元组集


    参考答案:B

  • 第4题:

    在多元回归模型中,模型的拟合优度R2越接近于1,说明模型对于样本预测数据的拟合程度越好,模型的预测效果也会越好。( )


    答案:对
    解析:
    R2的取值范围为:0≤R2≤1,R2越接近1,拟合效果越好;R2越接近0,拟合效果越差。

  • 第5题:

    在有指导的数据挖掘中,有关测试集的说法错误的是()

    • A、测试集和训练集是相互联系的
    • B、测试集是用以测试模型的数据集
    • C、通常测试集大约占总样本的三分之一
    • D、K-次交叉验证中,测试集只有

    正确答案:A

  • 第6题:

    从结构的角度看,数据仓库有3种模型:企业仓库、(1)和虚拟仓库。数据挖掘就是要智能化和自动化地把数据转换为有用的信息和知识,目前已有多种数据挖掘方法。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,该方法称为(2)。空白(2)处应选择()

    • A、关联规则挖掘
    • B、特征描述
    • C、聚类分析
    • D、分类分析

    正确答案:D

  • 第7题:

    预测分析将原始数据分为训练数据集和测试数据集其中训练数据集的作用在于()

    • A、用于对模型的效果进行无偏的评估
    • B、用于比较不同模型的预测准确度
    • C、用于构造预测模型
    • D、用于选择模型

    正确答案:C

  • 第8题:

    模型的数据表示就是通过数据的转换来研究模型,下列哪项不是其优点()

    • A、可以引用发展得比较成熟的关系数据库管理技术实现模型的管理
    • B、使模型单元易于与其他单元通信,但模型不便于更新
    • C、模型可描述为由一组参数集合和表示模型结构特征的数据集合的框架
    • D、输入数据集在关系框架下进行若干关系运算,得出输出数据集

    正确答案:B

  • 第9题:

    在智能变电站ICD模型中,哪个是保护日志的数据集()。

    • A、dsAlarm
    • B、dsTripInfo
    • C、dsLog
    • D、dsSetting

    正确答案:A

  • 第10题:

    单选题
    某种使用加权平均方法对下期数据进行预测,这种预测的依据是使实际数据和预测数据之间的误差最小。这种预测方法称为:()
    A

    时间序列分析

    B

    动态规划

    C

    指数平滑法

    D

    经济计量模型


    正确答案: C
    解析: 暂无解析

  • 第11题:

    单选题
    模型的数据表示就是通过数据的转换来研究模型,下列哪项不是其优点()
    A

    可以引用发展得比较成熟的关系数据库管理技术实现模型的管理

    B

    使模型单元易于与其他单元通信,但模型不便于更新

    C

    模型可描述为由一组参数集合和表示模型结构特征的数据集合的框架

    D

    输入数据集在关系框架下进行若干关系运算,得出输出数据集


    正确答案: B
    解析: 暂无解析

  • 第12题:

    单选题
    预测分析将原始数据分为训练数据集和测试数据集其中训练数据集的作用在于()
    A

    用于对模型的效果进行无偏的评估

    B

    用于比较不同模型的预测准确度

    C

    用于构造预测模型

    D

    用于选择模型


    正确答案: C
    解析: 暂无解析

  • 第13题:

    根据是否需要标注数据,机器学习方法可以分为有监督学习和无监督学习。监督学习中的训练集用于()

    A、定量评价机器学习性能

    B、估算模型

    C、验证模型

    D、定性评价机器学习性能


    答案:B

  • 第14题:

    评估模型的分类预测准确率,使用()进行评估。

    A.验证数据集

    B.训练数据集

    C.测试数据集

    D.未知数据


    正确答案:C

  • 第15题:

    我们想要减少数据集中的特征数,即降维.选择以下适合的方案:( )

    A.使用前向特征选择方法

    B.使用后向特征排除方法

    C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.

    D.查看相关性表,去除相关性最高的一些特征


    答案:ABCD

  • 第16题:

    某种使用加权平均方法对下期数据进行预测,这种预测的依据是使实际数据和预测数据之间的误差最小。这种预测方法称为:()

    • A、时间序列分析
    • B、动态规划
    • C、指数平滑法
    • D、经济计量模型

    正确答案:C

  • 第17题:

    关于MNIST,下列说法错误的是()。

    • A、是著名的手写体数字识别数据集
    • B、有训练集和测试集两部分
    • C、训练集类似人学习中使用的各种考试试卷
    • D、测试集大约包含10000个样本和标签

    正确答案:C

  • 第18题:

    企业要建立预测模型,需要准备建模数据集,以下四条描述建模数据集正确的是()。

    • A、数据越多越好
    • B、尽可能多的合适的数据
    • C、训练集数据是建模集数据的一部分
    • D、以上三条都正确

    正确答案:D

  • 第19题:

    数字地面模型,是在空间数据库中存储并管理的空间数据集的通称,它是地形属性特征数字的描述,其简称为()。


    正确答案:DTM

  • 第20题:

    在实体类型及实体之间联系的表示方法上,层次模型采用__(1)__结构,网状模型采用__(2)__结构,关系模型则采用__(3)__结构。在搜索数据时,层次模型采用单向搜索法,网状模型采用__(4)__的方法,关系模型则采用__(5)__的方法。空白(1)处应选择()

    • A、有向图
    • B、连通图
    • C、波特图
    • D、卡诺图
    • E、结点集
    • F、边集
    • G、二维表
    • H、树

    正确答案:H

  • 第21题:

    单选题
    当系统结构复杂,性质不明确,没有足够的数据,又无法在系统上做实验时,可以先认为地建立模型,这种方法称为()。
    A

    数据分析法

    B

    实验分析法

    C

    主观想象法

    D

    特殊预测法


    正确答案: D
    解析: 暂无解析

  • 第22题:

    单选题
    在实体类型及实体之间联系的表示方法上,层次模型采用__(1)__结构,网状模型采用__(2)__结构,关系模型则采用__(3)__结构。在搜索数据时,层次模型采用单向搜索法,网状模型采用__(4)__的方法,关系模型则采用__(5)__的方法。空白(3)处应选择()
    A

    有向图

    B

    连通图

    C

    波特图

    D

    卡诺图

    E

    结点集

    F

    边集

    G

    二维表

    H


    正确答案: G
    解析: 暂无解析

  • 第23题:

    单选题
    从结构的角度看,数据仓库有3种模型:企业仓库、(1)和虚拟仓库。数据挖掘就是要智能化和自动化地把数据转换为有用的信息和知识,目前已有多种数据挖掘方法。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,该方法称为(2)。空白(1)处应选择()
    A

    用户仓库

    B

    产品仓库

    C

    关系型OLAP

    D

    数据集市


    正确答案: A
    解析: 从结构的角度看,有3种数据仓库模型,分别是企业仓库、数据集市和虚拟仓库。企业仓库收集跨越整个企业的各个主题的所有信息,它提供全企业范围的数据集成,数据通常来自多个操作型数据库和外部信息提供者,并且是跨多个功能范围的。它通常包含详细数据和汇总数据;数据集市包含对特定用户有用的、企业范围数据的一个子集,它的范围限定选定的主题;虚拟仓库是操作型数据库上视图的集合。

  • 第24题:

    单选题
    在有指导的数据挖掘中,有关测试集的说法错误的是()
    A

    测试集和训练集是相互联系的

    B

    测试集是用以测试模型的数据集

    C

    通常测试集大约占总样本的三分之一

    D

    K-次交叉验证中,测试集只有


    正确答案: D
    解析: 暂无解析