python 计算机视觉深度学习工具 4 图像分类数据集 (机器学习常用数据集)

MNIST

图片. PNG

此数据集是正确分类手写数字, 0-9.

MNIST(NIST:National Institute of Standards and Technology,M 为 modified), 数据经过预处理, 以减轻计算机视觉的处理负担, 该数据集专注于数字识别. 训练集 (training set) 由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局 (the Census Bureau) 的工作人员.

此数据集是正确分类手写数字 0-9. 在许多情况下它是机器学习算法排名的标准. Geoffrey Hinton 将数据集描述为 "the drosophila of machine learning".

MNIST 本身包含 60,000 个训练图像和 10,000 个测试图像. 每个特征向量是 784-dim, 对应于图像的 28*28 灰度像素强度. 这些灰度像素强度是无符号整数, 落在 [0,255] 范围内.

下载 http://yann.lecun.com/exdb/mnist/

wiki 参考 https://en.wikipedia.org/wiki/MNIST_database

Animals: 狗, 猫和熊猫

image.PNG

每种动物 1000 张, 共有 3000 张图片. 可以在我们的 CPU 或 GPU 上快速训练深度学习模型并获得合理的准确性.

CIFAR-10

image.PNG

CIFAR-10 由 60,000 32323 (RGB)图像组成.

CIFAR-10 由 10 类组成, 包括: 飞机, 汽车, 鸟, 猫, 鹿, 狗, 青蛙, 马, 船和卡车.

虽然很容易训练在 MNIST 上获得> 97％分类精度的模型, 但在 CIFAR-10(以及更大集 CIFAR-100)很难获得这样的模型.

挑战来自于物体出现方式的巨大差异.

参考: https://www.cs.toronto.edu/~kriz/cifar.html

SMILES

image.PNG

SMILES 数据集由面部图像组成, 这些图像要么是微笑的, 要么是不笑的, 数据集中有 13,165 个灰度图像, 每个图像大小 64*64. 数据集中的图像被紧紧地裁剪在脸部周围, 允许我们设计机器学习算法专注于微笑识别.

Kaggle:Dogs vs. Cats

Dogs vs. Cats 挑战是 Kaggle 比赛的一部分, 旨在设计学习算法正确地将图像分类为包含狗或猫. 共提供了 25,000 张图片

使用不同的图像分辨率.

image.PNG

参考: https://www.kaggle.com/c/dogs-vs-cats/data

Flowers-17

image.PNG

Flowers-17 数据集是 17 类别的数据集, 每个类别有 80 个图像, 由 Nilsback 等人策划.

Flowers-17 为具有挑战性的数据集, 因为规模大, 视角, 背景负责, 变化的光照条件和类内变化.

参考: http://www.robots.ox.ac.uk/~vgg/data/flowers/17/

Flowers-17

来源: http://www.jianshu.com/p/d519a0787af3

与本文相关文章

暂无,快来抢沙发吧！