一般地,不会把给定的整个数据集都用来训练模型,而是将其分成训练集和测试集两部分,使用训练集对模型进行训练或学习,然后把测试集输入训练好的模型并评估其表现。

题目

一般地,不会把给定的整个数据集都用来训练模型,而是将其分成训练集和测试集两部分,使用训练集对模型进行训练或学习,然后把测试集输入训练好的模型并评估其表现。


相似考题
参考答案和解析
A
更多“一般地,不会把给定的整个数据集都用来训练模型,而是将其分成训练集和测试集两部分,使用训练集对模型进行训练或学习,然后把测试集输入训练好的模型并评估其表现。”相关问题
  • 第1题:

    我们想要减少数据集中的特征数,即降维.选择以下适合的方案()

    1.使用前向特征选择方法

    2.使用后向特征排除方法

    3.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.

    4.查看相关性表,去除相关性最高的一些特征

    A.1和2

    B.2,3和4

    C.1,2和4

    D.All


    正确答案:D

  • 第2题:

    训练SVM的最小时间复杂度为O(n2),那么一下哪种数据集不适合用SVM()

    A.大数据集

    B.小数据集

    C.中等大小数据集

    D.和数据集大小无关


    正确答案:A

  • 第3题:

    评估模型的分类预测准确率,使用()进行评估。

    A.验证数据集

    B.训练数据集

    C.测试数据集

    D.未知数据


    正确答案:C

  • 第4题:

    对于神经网络的说法,下面正确的是:( )

    A增加神经网络层数,可能会增加测试数据集的分类错误率

    B减少神经网络层数,总是能减小测试数据集的分类错误率

    C增加神经网络层数,总是能减小训练数据集的分类错误率


    答案:A

  • 第5题:

    我们想要减少数据集中的特征数,即降维.选择以下适合的方案:( )

    A.使用前向特征选择方法

    B.使用后向特征排除方法

    C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.

    D.查看相关性表,去除相关性最高的一些特征


    答案:ABCD

  • 第6题:

    ()是语义记忆的两个网络模型。

    A集理论模型和层次网络模型

    B激活扩散模型和特征比较模型

    C激活扩散模型和层次网络模型

    D集理论模型和特征比较模型


    C

  • 第7题:

    关于MNIST,下列说法错误的是()。

    • A、是著名的手写体数字识别数据集
    • B、有训练集和测试集两部分
    • C、训练集类似人学习中使用的各种考试试卷
    • D、测试集大约包含10000个样本和标签

    正确答案:C

  • 第8题:

    预测分析将原始数据分为训练数据集和测试数据集其中训练数据集的作用在于()

    • A、用于对模型的效果进行无偏的评估
    • B、用于比较不同模型的预测准确度
    • C、用于构造预测模型
    • D、用于选择模型

    正确答案:C

  • 第9题:

    什么是集计模型?什么是非集计模型?


    正确答案:集计模型以交通小区为基本*单位预测出行方式的选择率,非集计模型先以个人为基本*单位预测出行方式的选择率,然后把个人对出行方式的选择率集计起来。

  • 第10题:

    判断题
    通过布尔运算(并集、差集和交集)可以创建复杂的三维实体模型。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第11题:

    单选题
    模型的数据表示就是通过数据的转换来研究模型,下列哪项不是其优点()
    A

    可以引用发展得比较成熟的关系数据库管理技术实现模型的管理

    B

    使模型单元易于与其他单元通信,但模型不便于更新

    C

    模型可描述为由一组参数集合和表示模型结构特征的数据集合的框架

    D

    输入数据集在关系框架下进行若干关系运算,得出输出数据集


    正确答案: B
    解析: 暂无解析

  • 第12题:

    单选题
    预测分析将原始数据分为训练数据集和测试数据集其中训练数据集的作用在于()
    A

    用于对模型的效果进行无偏的评估

    B

    用于比较不同模型的预测准确度

    C

    用于构造预测模型

    D

    用于选择模型


    正确答案: C
    解析: 暂无解析

  • 第13题:

    如果一个训练好的模型在测试集上有100%的准确率,这是不是意味着在一个新的数据集上,也会有同样好的表现()

    A.是的,这说明这个模型的范化能力已经足以支持新的数据集合了

    B.不对,依然后其他因素模型没有考虑到,比如噪音数据


    正确答案:B

  • 第14题:

    根据是否需要标注数据,机器学习方法可以分为有监督学习和无监督学习。监督学习中的训练集用于()

    A、定量评价机器学习性能

    B、估算模型

    C、验证模型

    D、定性评价机器学习性能


    答案:B

  • 第15题:

    下面非集计模型说法错误的是()

    A、非集计模型是以个人为单位进行分析的

    B、非集计模型计算

    C、非集计模型需要的样本数量较小

    D、非集计模型以明确的行为假说为基础,逻辑性强


    参考答案:B

  • 第16题:

    考虑某个具体问题时,你可能只有少量数据来解决这个问题。不过幸运的是你有一个类似问题已经预先训练好的神经网络。可以用下面哪种方法来利用这个预先训练好的网络?( )

    A.把除了最后一层外所有的层都冻住,重新训练最后一层

    B.对新数据重新训练整个模型

    C.只对最后几层进行调参(finetune)

    D.对每一层模型进行评估,选择其中的少数来用


    答案:C

  • 第17题:

    测试用例包括输入值集和__________值集。


    正确答案:
    输出

  • 第18题:

    在有指导的数据挖掘中,有关测试集的说法错误的是()

    • A、测试集和训练集是相互联系的
    • B、测试集是用以测试模型的数据集
    • C、通常测试集大约占总样本的三分之一
    • D、K-次交叉验证中,测试集只有

    正确答案:A

  • 第19题:

    企业要建立预测模型,需要准备建模数据集,以下四条描述建模数据集正确的是()。

    • A、数据越多越好
    • B、尽可能多的合适的数据
    • C、训练集数据是建模集数据的一部分
    • D、以上三条都正确

    正确答案:D

  • 第20题:

    通过布尔运算(并集、差集和交集)可以创建复杂的三维实体模型。


    正确答案:正确

  • 第21题:

    模型的数据表示就是通过数据的转换来研究模型,下列哪项不是其优点()

    • A、可以引用发展得比较成熟的关系数据库管理技术实现模型的管理
    • B、使模型单元易于与其他单元通信,但模型不便于更新
    • C、模型可描述为由一组参数集合和表示模型结构特征的数据集合的框架
    • D、输入数据集在关系框架下进行若干关系运算,得出输出数据集

    正确答案:B

  • 第22题:

    问答题
    什么是集计模型?什么是非集计模型?

    正确答案: 集计模型以交通小区为基本*单位预测出行方式的选择率,非集计模型先以个人为基本*单位预测出行方式的选择率,然后把个人对出行方式的选择率集计起来。
    解析: 暂无解析

  • 第23题:

    单选题
    关于MNIST,下列说法错误的是()。
    A

    是著名的手写体数字识别数据集

    B

    有训练集和测试集两部分

    C

    训练集类似人学习中使用的各种考试试卷

    D

    测试集大约包含10000个样本和标签


    正确答案: D
    解析: 暂无解析

  • 第24题:

    单选题
    在有指导的数据挖掘中,有关测试集的说法错误的是()
    A

    测试集和训练集是相互联系的

    B

    测试集是用以测试模型的数据集

    C

    通常测试集大约占总样本的三分之一

    D

    K-次交叉验证中,测试集只有


    正确答案: D
    解析: 暂无解析