我们都知道机器学习是一门综合性极强的研究课题, 对数学知识要求很高因此, 对于非学术研究专业的程序员, 如果希望能入门机器学习, 最好的方向还是从实践触发
我了解到 Python 的生态对入门机器学习很有帮助因此希望以此作为突破口入门机器学习
我将会记录一个系列的学习与实践记录记录内容主要参考 Youtube 中 sentdex 发布的视频, 有兴趣的读者可以自己 FQ 到油管看一下
下面介绍一下我将如何通过 Python 入门机器学习
学习 Python 基本语法
首先我在 Python 官网找到入门教程, 快速过了一遍 Python 的基本语法相信对于稍微有点编程基础的人来说这都不是事儿
作为实践, 接着我用 Python 实现了一个基于命令行翻译脚本到此 Python 算入门了
这里啰嗦一下 Mac 下的 Python 环境的搭建过程我在这篇文章中介绍如何处理系统自带和自己安装的 Python 版本
Python 机器学习相关库
Python 有好多涉及机器学习的库, 如 TheanoTensorFlowPyTorchscikit-learn 等考虑到 scikit-learn(以后将简写为 sklearn) 对机器学习进行了高度封装与抽象, 能够让初学者跳出数学的梦魇进行机器学习实践, 我选择它作为入门的跳板
除此之外还需要学习下面几个 Python 库, 用于数据处理或者科学计算等
numpy: 提供强大的 N 维数组及相关操作的库, 参考 NumPy 快速入门笔记
pandas: 提供类似关系型或标签型数据结构的库, 参考 Pandas 快速入门笔记
scipy: 集成众多数学运算函数的库, 请自行参考官方文档
matplotlib: 把数据绘制成图像的工具, 可以参考 Matplotlib 快速入门笔记
出发机器学习冒险旅程
sklearn 提供了很多机器学习的算法实现, 在学习过程中我很难做到一个不漏地全面学习与覆盖经过多番查找, 我在 Youtube 上找到 sentdex 发布的视频 Machine Learning with Python 至此, 我也将跟随 sentdex 的脚步一步步进行学习
后续的文章主要也是参考视频, 并结合自己的理解进行必要的扩展
初次看 sklearn 可以读一下官网的 Tutorials 文档
其中 An introduction to machine learning with scikit-learn 章节可以让你初步了解 sklearn 这个库能做什么机器学习基本概念 sklearn 环境搭建基础功能等
而 A tutorial on statistical-learning for scientific data processing 章节能让你了解有关监督学习和非监督学习的基本概念
深入原理
sklearn 能够以黑盒方式提供机器学习算法的实现, 这对初学者是有利的但是如果仅仅停留在这里显然是不够的, 如果不掌握一定的基础知识与原理, 我们无法对显示问题进行建模与选型所以在学习了 sklearn 的算法后, 一定要查阅相关文档, 了解算法背后的知识与原理
这个过程应该是最艰难的, 希望我们都不停留在这一步
来源: http://www.bubuko.com/infodetail-2494947.html