假设目标遍历的类别非常不平衡,即主要类别占据了训练数据的99%,现在你的模型在训练集上表现为99%的准确度,那么下面说法正确的是:( )A准确度并不适合衡量不平衡类别问题B准确度适合衡量不平衡类别问题C精确度和召回率适合于衡量不平衡类别问题D精确度和召回率不适合衡量不平衡类别问题

题目

假设目标遍历的类别非常不平衡,即主要类别占据了训练数据的99%,现在你的模型在训练集上表现为99%的准确度,那么下面说法正确的是:( )

A准确度并不适合衡量不平衡类别问题

B准确度适合衡量不平衡类别问题

C精确度和召回率适合于衡量不平衡类别问题

D精确度和召回率不适合衡量不平衡类别问题

相似考题

1.“点击率问题”是这样一个预测问题,99%的人是不会点击的,而1%的人是会点击进去的,所以这是一个非常不平衡的数据集.假设,现在我们已经建了一个模型来分类,而且有了99%的预测准确率,我们可以下的结论是()A.模型预测准确率已经很高了,我们不需要做什么了B.模型预测准确率不高,我们需要做点什么改进模型C.无法下结论D.以上都不对

2.13、以下哪项陈述是正确的？选出所有正确项（）A．在构建学习算法的第一个版本之前，花大量时间收集大量数据是一个好主意。B．逻辑回归使用了Sigmoid激活函数C．使用一个非常大的训练集使得模型不太可能过拟合训练数据。D．如果您的模型拟合训练集，那么获取更多数据可能会有帮助。

3.1、下列关于训练模型的说法中，错误的是______。A．训练模型的过程，就是计算损失函数梯度，迭代更新模型参数B．只采用训练集来更新模型参数C．训练集和测试集都参与了对模型参数的更新D．训练集和测试集的误差都需要被记录下来

4.监督学习的主要特点是在训练模型时提供给学习系统训练样本以及样本对应的类别标签。

更多“假设目标遍历的类别非常不平衡,即主要类别占据了训练数据的99%,现在你的模型在训练集上表现为99%的准确度,那么下面说法正确的是:( ) ”相关问题

第1题：

4、假设您正在使用垃圾邮件分类器，其中垃圾邮件是正例（y=1），非垃圾邮件是反例（y=0）。您有一组电子邮件训练集，其中99%的电子邮件是非垃圾邮件，另1%是垃圾邮件。以下哪项陈述是错误的？
A．一个好的分类器应该在交叉验证集上同时具有高精度precision和高召回率recall。
B．如果您总是预测非垃圾邮件（输出y=0），那么您的分类器在训练集上的准确度accuracy将达到99%，而且它在交叉验证集上的性能可能类似。
C．如果您总是预测非垃圾邮件（输出y=0），那么您的分类器的准确度accuracy将达到99%。
D．如果您总是预测非垃圾邮件（输出y=0），那么您的分类器在训练集上的准确度accuracy将达到99%，但在交叉验证集上的准确率会更差，因为它过拟合训练数据。

在服务器端，应该设置发信人身份认证，以防止自己的邮件服务器被选做垃圾邮件的传递者。现在包括不少国内知名电子邮件提供者在内的诸多邮件服务器被国外的拒绝垃圾邮件组织列为垃圾邮件来源。结果是：所有来自该服务器的邮件全部被拒收! 在用户端，防范垃圾邮件有如下方式： 1）不随便公开自己的电子邮件地址，防止其被收入垃圾邮件的发送地址列表。因为有很多软件可以自动收集这些新闻组文章或者论坛中出现过的电子邮件地址。一旦被收入这些垃圾邮件的地址列表中，一些不怀好意的收集者将出售这些电子邮件地址牟利，然后，很不幸地，这个地址将可能源源不断地收到各种垃圾邮件。 2）尽量采用转发的方式收信，避免直接使用ISP提供的信箱。申请一个转发信箱地址，结合垃圾邮件过滤，然后再转发到自己的真实信箱。实践证明，这的确是一个非常有效的方法。只有结合使用地址过滤和字符串特征过滤才能取得最好的过滤效果。不要回复垃圾邮件，这是一个诱人进一步上当的花招。
第2题：

7、过拟合是指（）。
A．在训练集表现非常好，但在测试集上表现很差
B．在训练集表现非常好，但在测试集上表现也非常好
C．在训练集表现非常差，但在测试集上表现也差
D．在训练集表现非常差，但在测试集上表现非常好

在训练集上有非常好的表现，但在测试集上表现不佳。
第3题：

8、欠拟合是指（）。
A．在训练集表现非常好，但在测试集上表现很差
B．在训练集表现非常好，但在测试集上表现也非常好
C．在训练集表现非常差，但在测试集上表现也差
D．在训练集表现非常差，但在测试集上表现非常好

欠拟合一般是由于样本集合太大而造成的
第4题：

6、下列关于数据集的说法，正确的是______。
A．训练集用来训练模型，确定模型参数
B．验证集用来评估模型的泛化能力
C．测试集用来确定网络的超参数
D．A、B、C均错误

使用模型的hidde/append方法进行数据集的输出处理;通过filter方法对数据集的结果进行筛选过滤;对数组函数进行了封装，在处理数据集的时候更方便调用，让数据更加对象化
第5题：

1、下面的说法中，错误的是：
A．特征列是指用于预测目标数据的数据列
B．测试集是用来评估模型效果的数据行
C．训练集数量一般要大于测试集
D．即使测试集数量大于训练集，测试集也不能当成训练集

B

niusouti.com

题目

相似考题

更多“假设目标遍历的类别非常不平衡,即主要类别占据了训练数据的99%,现在你的模型在训练集上表现为99%的准确度,那么下面说法正确的是:( ) ”相关问题

相关内容