python
参考《Python 机器学习基础教程》
参考 国外有关 pandas 库的教程
为什么是 Python
今天 Python 已经成为许多数据科学应用的通用语言. 如果想学习机器学习除了 python 当然还可以使用 R,matlab 或者 c++ 来进行机器学习, 不过前提是你了解这些语言中一种, 如果你对这些语言都不算了解, 那就推荐你使用 python
常用的 Python 库
Scipy
在 Numpy 基础添加了众多科学计算工具包
numpy
Numpy 是科学计算的基础包, 主要处理多维数组, 高级数学函数.
numpy 可以高效率生成多维数组 (矩阵)
结构化数据更利于计算
Python 科学应用库 numpy(1)
- x = np.array([[1,2,3],[3,4,5]])
- print("x:\n{}".format(x))
- x:
- [[1 2 3]
- [3 4 5]]
- matplotlib
matplotlib 是 Python 主要的科学绘图库, 将数据内容以可视化表示出来, 提供丰富的绘图库.
- %matplotlib inline
- import matplotlib.pyplot as plt
- x = np.linspace(-10,10,100)
- y = np.sin(x)
- plt.plot(x,y,marker="x")
图
pandas
pandas 是用于处理和分析数据的 Python 库. pandas 的提供模仿 R 语言中的 DataFrame 的数据结构.
DataFrame 类似 Excel 表格, 可以像 SQL 一样对表格进行查询和连接.
- import pandas as pd
- from IPython.display import display
- data = {
- "Title":["Angular","React","vue"],"Author":["Zidea","Zidea","Matthew"],"Courses":[12,12,10]
- }
- data_pandas = pd.DataFrame(data)
- display(data_pandas)
图
来源: http://www.jianshu.com/p/18cab507c180