MNIST
图片. PNG
此数据集是正确分类手写数字, 0-9.
MNIST(NIST:National Institute of Standards and Technology,M 为 modified), 数据经过预处理, 以减轻计算机视觉的处理负担, 该数据集专注于数字识别. 训练集 (training set) 由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局 (the Census Bureau) 的工作人员.
此数据集是正确分类手写数字 0-9. 在许多情况下它是机器学习算法排名的标准. Geoffrey Hinton 将数据集描述为 "the drosophila of machine learning".
MNIST 本身包含 60,000 个训练图像和 10,000 个测试图像. 每个特征向量是 784-dim, 对应于图像的 28*28 灰度像素强度. 这些灰度像素强度是无符号整数, 落在 [0,255] 范围内.
下载 http://yann.lecun.com/exdb/mnist/
wiki 参考 https://en.wikipedia.org/wiki/MNIST_database
Animals: 狗, 猫和熊猫
image.PNG
每种动物 1000 张, 共有 3000 张图片. 可以在我们的 CPU 或 GPU 上快速训练深度学习模型并获得合理的准确性.
CIFAR-10
image.PNG
CIFAR-10 由 60,000 32323 (RGB)图像组成.
CIFAR-10 由 10 类组成, 包括: 飞机, 汽车, 鸟, 猫, 鹿, 狗, 青蛙, 马, 船和卡车.
虽然很容易训练在 MNIST 上获得> 97%分类精度的模型, 但在 CIFAR-10(以及更大集 CIFAR-100)很难获得这样的模型.
挑战来自于物体出现方式的巨大差异.
参考: https://www.cs.toronto.edu/~kriz/cifar.html
SMILES
image.PNG
SMILES 数据集由面部图像组成, 这些图像要么是微笑的, 要么是不笑的, 数据集中有 13,165 个灰度图像, 每个图像大小 64*64. 数据集中的图像被紧紧地裁剪在脸部周围, 允许我们设计机器学习算法专注于微笑识别.
Kaggle:Dogs vs. Cats
Dogs vs. Cats 挑战是 Kaggle 比赛的一部分, 旨在设计学习算法正确地将图像分类为包含狗或猫. 共提供了 25,000 张图片
使用不同的图像分辨率.
image.PNG
参考: https://www.kaggle.com/c/dogs-vs-cats/data
Flowers-17
image.PNG
Flowers-17 数据集是 17 类别的数据集, 每个类别有 80 个图像, 由 Nilsback 等人策划.
Flowers-17 为具有挑战性的数据集, 因为规模大, 视角, 背景负责, 变化的光照条件和类内变化.
参考: http://www.robots.ox.ac.uk/~vgg/data/flowers/17/
Flowers-17
来源: http://www.jianshu.com/p/d519a0787af3