要根据不同的目标选取合适的评估指标.
进行二分类问题的时候, 数据集之间的不平衡, 会导致评价指标 accuracy 很高, 但是却不能反应模型的好坏.
.confusion_matrix
如果标记数字的话, 则按标签从小到大排序, 如果为字符型的化, 自己设计 labels 参数来表示其顺序, 否则系统会自动将字符转化为其他类型就好.
dummy_majority = DummyClassifier(strategy = 'most_frequent').fit(X_train, y_train)
dummy classifier 的 strategy 参数取值解释如上图.
来源: http://www.bubuko.com/infodetail-3004755.html