Supervised Learning
首先给出一些基本定义,x(i) 表示输入变量或者输入特征,y(i) 表示输出变量或者目标值.(x(i),y(i) 称为一对样本,一组样本 {(x(i),y(i));i=1,2,...,m} 称为训练集,其中X 表示输入变量的值域,Y 表示输出变量的值域,一般来说,我们都只考虑实数域.
The goal of supervised learning can be described as follows: given a training set, to learn a function h:X→Y so that h(x) can predict the output value as close as the corresponding value of y. The function h is called hypothesis.
基于目标值的形式不同,Supervised Learning 主要分成两大类.
Regression Problem(回归问题): 输出变量是连续值.
Classification Problem(分类问题): 输出变量是离散值.
线性回归
我们先考虑一个简单的线性回归问题,我们假设输入变量 x 是一个在二维空间R2的向量, 我们有以下的表达式:
hθ(x)=θ0+θ1x1+θ2x2
来源: http://lib.csdn.net/article/machinelearning/36690