统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,统计学习也称为统计机器学习。(引自<<统计学习方法>>)
统计学习方法概论
统计学习(statistics learning)
统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,统计学习也称为统计机器学习。(引自<<统计学习方法>>)
统计学习的特点
- 统计学习的特点主要有以下几点
- 统计学习的对象是数据(data),从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到数据的预测与分析中。
- 统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提
- 因为统计学习研究的数据都具有统计规律性,所以可以使用概率统计方法加以处理
- e.g. 可以用随机变量描述数据中的特征,用概率分布描述数据的统计规律
- 统计学习的过程中,以变量或变量组表示数据
- 数据分为连续变量表示的类型和离散变量表示的类型
统计学习的目的:对数据进行预测与分析
统计学习的方法:
- 分类
- 监督学习(supervised learning)
- 非监督学习(unsupervised learning)
- 半监督学习(semi-supervised learning)
- 强化学习(reinforcement learning)
- 统计学习方法的三要素
- 模型(model)
- 策略(strategy)
- 算法(algorithm)
- 实现统计学习方法的步骤
- 得到一个有限的训练数据集合
- 确定包含所有可能的模型的假设空间,即学习模型的集合
- 确定模型选择的准则,即学习的策略
- 实现求解最优模型的算法,即学习的算法
- 通过学习方法选择最优模型
- 利用学习的最优模型对新数据进行预测或分析
注:
- 本文多参考自《统计学习方法》,李航著,偏于个人学习笔记的整理。