概率论与数理统计

名词解释

  • 概率论部分主要是讲:大千世界中,数据的分布呈现出来的形状 (分布函数,密度函数..)。
  • 数理统计部分则是在讲:建立在各种分布的前提下,我们如何用少量的样本数据来推断总体的一些性质; 或者推断两个样本是否来自一个总体; 等等…
    -

统计学(statistics)是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。统计学主要分为描述统计学和推断统计学。

统计推断,或者叫做推断统计学(statistical inference)是指统计学中研究如何根据样本数据去推断总体数量特征的方法。统计推断主要可以分为两大类:一类是参数估计问题;另一类是假设检验问题。

统计学习(statistical learning)关注的是最小化预测的误差。是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称为统计机器学习(statistical machine learning)。统计学习是概率论,统计学,信息论,计算理论,最优化理论及计算机科学等多个领域的交叉学科。statistical learning 讲的是 在machine learning 学科下, 利用统计学知识和数值型数据 来进行机器 学习 (或叫 优化). machine learning 除了 statistical learning 以外,还有其他 learning 的方法.

样本估计

statistics 统计学是基础. statistical inference 是学统计的目的,即根据样本数据,对总体进行统计推断(假设检验 或 预测). 这两个概念都可以算属于统计学学科.

[统计学] 里,用的最多的就是回归模型,而回归模型里参数的求解,主要是通过[最小二乘(OLS)]和[最大似然估计(MLE)] 来求解。OLS 和 MLE 其实是一个 [数值优化 (Optimization)] 的问题。
而 [数值优化] 就和机器学习联系起来了。

关系 & 架构

  • [概率论] 是 [数理统计] 的理论基础;
    学[数理统计] 就等于在学习如何进行 [统计推断];
  • [概率论]+[数理统计] = [统计学];
  • 学习[统计学] 的目的 就是进行[统计推断]。

从概念和内容上,三者的关系是:
statistics < statistical inference < statistical learning

总结

统计推断

统计学习

扔硬币 1000000次的人是不是傻?

参考

https://www.zhihu.com/question/23687389

  • 概率导论 第二版 - 翻译真差劲,错别字多。
  • ss