搜索
写经验 领红包
 > 设计

什么叫经验分布函数(经验分布函数的概念)

导语:概率论--什么是经验分布函数

很多数学是体育老师教的小伙伴,在学习机器学习的时候,都会对经验分布产生迷惑,下面让李coder 来给大家普及下什么经验分布吧,能看明白的,给个赞!!!

经验分布函数(英语:empirical distribution function)是统计学中一个与样本经验测度有关的分布函数。该累积分布函数是在所有n个数据点上都跳跃1/n的阶跃函数。对被测变量的某个值而言,该值的分布函数值表示所有观测样本中小于或等于该值的样本所占的比例。

上面是经验分布函数的定义,你蒙不蒙?反正我是蒙了,所以你可以往下面看了:

没有对比理解就不够深刻,所以先列举一个非经验分布的例子:

你现在手上有一个六面的骰子,这六个面分别为1, 2, 3, 4, 5, 6. 那么请问:如果你抛骰子的话,数字3朝上的概率是多少呢?

答案很显然是六分之一? 那么这六分之一是怎么得出的呢,是因为我们已经知道这六个面的朝上的概率是一样的,所以每个面朝上概率是六分之一。

假如我们并不知道 骰子每个面朝上概率是一样 的呢? 这就要用到经验分布了。

我们使劲儿的抛骰子,抛一千多次,发现每个面向上的概率分布是这样的:

抛骰子概率直方图

从上图可以看到,抛了1000次后,每个面向上的概率接近于六分之一。这就是经验分布,是观测数据的分布。

如果用数学公式表达的话,就是:

经验分布表达公式

怎么理解? 其实这个公式表达的就是所有样本中,测量值等于或者比x小的概率。打个比方,我们投掷骰子十次,值从小到大排列为,1,1,2,3,3,4,4,5,6,6 那么F(2)=3/10=0.3

免责声明:本站部份内容由优秀作者和原创用户编辑投稿,本站仅提供存储服务,不拥有所有权,不承担法律责任。若涉嫌侵权/违法的,请反馈,一经查实立刻删除内容。本文内容由快快网络小德创作整理编辑!