假设目标遍历的类别非常不平衡,即主要类别占据了训练数据的99%,现在你的模型在训练集上表现为99%的准确度,那么下面说法正确的是:( )A准确度并不适合衡量不平衡类别问题B准确度适合衡量不平衡类别问题C精确度和召回率适合于衡量不平衡类别问题D精确度和召回率不适合衡量不平衡类别问题

题目
假设目标遍历的类别非常不平衡,即主要类别占据了训练数据的99%,现在你的模型在训练集上表现为99%的准确度,那么下面说法正确的是:( )

A准确度并不适合衡量不平衡类别问题

B准确度适合衡量不平衡类别问题

C精确度和召回率适合于衡量不平衡类别问题

D精确度和召回率不适合衡量不平衡类别问题


相似考题
更多“假设目标遍历的类别非常不平衡,即主要类别占据了训练数据的99%,现在你的模型在训练集上表现为99%的准确度,那么下面说法正确的是:( ) ”相关问题
  • 第1题:

    4、假设您正在使用垃圾邮件分类器,其中垃圾邮件是正例(y=1),非垃圾邮件是反例(y=0)。您有一组电子邮件训练集,其中99%的电子邮件是非垃圾邮件,另1%是垃圾邮件。以下哪项陈述是错误的?

    A.一个好的分类器应该在交叉验证集上同时具有高精度precision和高召回率recall。

    B.如果您总是预测非垃圾邮件(输出y=0),那么您的分类器在训练集上的准确度accuracy将达到99%,而且它在交叉验证集上的性能可能类似。

    C.如果您总是预测非垃圾邮件(输出y=0),那么您的分类器的准确度accuracy将达到99%。

    D.如果您总是预测非垃圾邮件(输出y=0),那么您的分类器在训练集上的准确度accuracy将达到99%,但在交叉验证集上的准确率会更差,因为它过拟合训练数据。


    在服务器端,应该设置发信人身份认证,以防止自己的邮件服务器被选做垃圾邮件的传递者。现在包括不少国内知名电子邮件提供者在内的诸多邮件服务器被国外的拒绝垃圾邮件组织列为垃圾邮件来源。结果是:所有来自该服务器的邮件全部被拒收! 在用户端,防范垃圾邮件有如下方式: 1)不随便公开自己的电子邮件地址,防止其被收入垃圾邮件的发送地址列表。因为有很多软件可以自动收集这些新闻组文章或者论坛中出现过的电子邮件地址。一旦被收入这些 垃圾邮件的地址列表中,一些不怀好意的收集者将出售这些电子邮件地址牟利,然后,很不幸地,这个地址将可能源源不断地收到各种垃圾邮件。 2)尽量采用转发的方式收信,避免直接使用ISP提供的信箱。申请一个转发信箱地址,结合垃圾邮件过滤,然后再转发到自己的真实信箱。实践证明,这的确是一个非常有效的方法。只有结合使用地址过滤和字符串特征过滤才能取得最好的过滤效果。 不要回复垃圾邮件,这是一个诱人进一步上当的花招。

  • 第2题:

    7、过拟合是指()。

    A.在训练集表现非常好,但在测试集上表现很差

    B.在训练集表现非常好,但在测试集上表现也非常好

    C.在训练集表现非常差,但在测试集上表现也差

    D.在训练集表现非常差,但在测试集上表现非常好


    在训练集上有非常好的表现,但在测试集上表现不佳。

  • 第3题:

    8、欠拟合是指()。

    A.在训练集表现非常好,但在测试集上表现很差

    B.在训练集表现非常好,但在测试集上表现也非常好

    C.在训练集表现非常差,但在测试集上表现也差

    D.在训练集表现非常差,但在测试集上表现非常好


    欠拟合一般是由于样本集合太大而造成的

  • 第4题:

    6、下列关于数据集的说法,正确的是______。

    A.训练集用来训练模型,确定模型参数

    B.验证集用来评估模型的泛化能力

    C.测试集用来确定网络的超参数

    D.A、B、C均错误


    使用模型的hidde/append方法进行数据集的输出处理;通过filter方法对数据集的结果进行筛选过滤;对数组函数进行了封装,在处理数据集的时候更方便调用,让数据更加对象化

  • 第5题:

    1、下面的说法中,错误 的是:

    A.特征列是指用于预测目标数据的数据列

    B.测试集是用来评估模型效果的数据行

    C.训练集数量一般要大于测试集

    D.即使测试集数量大于训练集,测试集也不能当成训练集


    B