四分位数

四分位数

四分位数

四分位数(英语:Quartile)是统计学分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。

概念

第一四分位数( Q 1 {\displaystyle Q_{1}} a8ea6463cb36d8278ff71214fb4d13127039ae53.svg_-1),又称较小四分位数,等于该样本中所有数值由小到大排列后第25%的数字。 第二四分位数( Q 2 {\displaystyle Q_{2}} b86e8bff64d5e62fc8f45a35875e78bc9bef74a9.svg_-1),又称中位数,等于该样本中所有数值由小到大排列后第50%的数字。 第三四分位数( Q 3 {\displaystyle Q_{3}} f7b6c2a91a49263a333768fc2ebebdc379ddf5d1.svg_-1),又称较大四分位数,等于该样本中所有数值由小到大排列后第75%的数字。

第三四分位数与第一四分位数的差距又称四分位距InterQuartile Range, IQR)。

运算过程

关于四分位数值的选择尚存争议[1]

主要选择四分位的百分比值 p {\displaystyle p} 81eac1e205430d1f40810df36a0edffdc367af36.svg_-1,及样本总量 n {\displaystyle n} a601995d55609f2d9f5e233e36fbe9ea26011b3b.svg_-1有以下数学公式可以表示:[2]

L p = n ⋅ p 100 {\displaystyle L_{p}=n\cdot {\frac {p}{100}}} 59bf5c0a7c24863f3b5dd6331aa4f7ab348630eb.svg_情况1:如果 L {\displaystyle L} 103168b86f781fe6e9a4a87b8ea1cebe0ad4ede8.svg_是一个整数,则取第 L {\displaystyle L} 103168b86f781fe6e9a4a87b8ea1cebe0ad4ede8.svg_和第 L + 1 {\displaystyle L+1} 75933f53b57abd647b7e539c51c4f90fd122bb63.svg_的平均值 情况2:如果 L {\displaystyle L} 103168b86f781fe6e9a4a87b8ea1cebe0ad4ede8.svg_不是一个整数,则取下一个最近的整数。(比如 L = 1.2 {\displaystyle L=1.2} 5b6d3d99a3e2e52acbc1a7f46f6eff6b02f219a5.svg_, 则取 2 {\displaystyle 2} 901fc910c19990d0dbaaefe4726ceb1a4e217a0f.svg_

举例

220px-Boxplot_vs_PDF.svg_-1
图示中箱形图(有四分位数及四分位距)和概率密度函数 为描述一个常规总量 N ( 0 , 1 σ 2 ) {\displaystyle N(0,1\sigma ^{2})} 329ffa78e51c9895dc224a2bdbba0f79b184f9aa.svg_的分布情况

一个算法如下(可以兼用TI-83计算器):

利用中位数使数据分成两列(不要把中位数放入已分好的数列)。 第一四分位数为第一组数列的中位数;第三四分位数为第二组数列的中位数。

以下例子可以用来参考。

例1

数据总量: 6 , 47 , 49 , 15 , 42 , 41 , 7 , 39 , 43 , 40 , 36 {\displaystyle 6,47,49,15,42,41,7,39,43,40,36} a981323a845848d78e66e0ee1ce922baa2f20097.svg_

由小到大排列的结果: 6 , 7 , 15 , 36 , 39 , 40 , 41 , 42 , 43 , 47 , 49 {\displaystyle 6,7,15,36,39,40,41,42,43,47,49} 82f5ddf3954f5fd381fc2ce74c0cf5b8c1f329e5.svg_

{ Q 1 = 15 Q 2 = 40 Q 3 = 43 {\displaystyle {\begin{cases}Q_{1}=15\\Q_{2}=40\\Q_{3}=43\end{cases}}} ba44470ef2c0548c1eec75a6871735d807afac33.svg_例2

数据总量: 7 , 15 , 36 , 39 , 40 , 41 {\displaystyle 7,15,36,39,40,41} 6271f2a2f87504796825d38968a3cac6927edad3.svg_

{ Q 1 = 15 Q 2 = 37.5 Q 3 = 40 {\displaystyle {\begin{cases}Q_{1}=15\\Q_{2}=37.5\\Q_{3}=40\end{cases}}} 0029685edb95523fce05c63758866ac438a4cc2f.svg_例3

数据总量: 1 , 2 , 3 , 4 {\displaystyle 1,2,3,4} be93d63fddb04c779e9c815b99a82aa8073f577f.svg_

{ Q 1 = 1.5 Q 2 = 2.5 Q 3 = 3.5 {\displaystyle {\begin{cases}Q_{1}=1.5\\Q_{2}=2.5\\Q_{3}=3.5\end{cases}}} 7b3077766bf1e72ee669c77e4484a695570683b4.svg_

应用

不论 Q 1 , Q 2 , Q 3 {\displaystyle Q_{1},Q_{2},Q_{3}} 9ddf0d0c3a5913a13ec2b1f92a68ac2f0e035a7f.svg_变异量数数值为何,均视为一个分界点,以此将总数分成四个相等部分,可以通过比较 Q 1 , Q 3 {\displaystyle Q_{1},Q_{3}} bb2fac1deda7898519fa55a855f714ad6e34e22a.svg_-1,分析其数据变量的趋势。

参考文献

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注