四分位数
四分位数(英语:Quartile)是统计学中分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。
概念
第一四分位数( Q 1 {\displaystyle Q_{1}} ),又称较小四分位数,等于该样本中所有数值由小到大排列后第25%的数字。 第二四分位数( Q 2 {\displaystyle Q_{2}} ),又称中位数,等于该样本中所有数值由小到大排列后第50%的数字。 第三四分位数( Q 3 {\displaystyle Q_{3}} ),又称较大四分位数,等于该样本中所有数值由小到大排列后第75%的数字。第三四分位数与第一四分位数的差距又称四分位距(InterQuartile Range, IQR)。
运算过程
关于四分位数值的选择尚存争议[1]。
主要选择四分位的百分比值 p {\displaystyle p} ,及样本总量 n {\displaystyle n} 有以下数学公式可以表示:[2]
L p = n ⋅ p 100 {\displaystyle L_{p}=n\cdot {\frac {p}{100}}} 情况1:如果 L {\displaystyle L} 是一个整数,则取第 L {\displaystyle L} 和第 L + 1 {\displaystyle L+1} 的平均值 情况2:如果 L {\displaystyle L} 不是一个整数,则取下一个最近的整数。(比如 L = 1.2 {\displaystyle L=1.2} , 则取 2 {\displaystyle 2} )举例
一个算法如下(可以兼用TI-83计算器):
利用中位数使数据分成两列(不要把中位数放入已分好的数列)。 第一四分位数为第一组数列的中位数;第三四分位数为第二组数列的中位数。以下例子可以用来参考。
例1数据总量: 6 , 47 , 49 , 15 , 42 , 41 , 7 , 39 , 43 , 40 , 36 {\displaystyle 6,47,49,15,42,41,7,39,43,40,36}
由小到大排列的结果: 6 , 7 , 15 , 36 , 39 , 40 , 41 , 42 , 43 , 47 , 49 {\displaystyle 6,7,15,36,39,40,41,42,43,47,49}
{ Q 1 = 15 Q 2 = 40 Q 3 = 43 {\displaystyle {\begin{cases}Q_{1}=15\\Q_{2}=40\\Q_{3}=43\end{cases}}} 例2数据总量: 7 , 15 , 36 , 39 , 40 , 41 {\displaystyle 7,15,36,39,40,41}
{ Q 1 = 15 Q 2 = 37.5 Q 3 = 40 {\displaystyle {\begin{cases}Q_{1}=15\\Q_{2}=37.5\\Q_{3}=40\end{cases}}} 例3数据总量: 1 , 2 , 3 , 4 {\displaystyle 1,2,3,4}
{ Q 1 = 1.5 Q 2 = 2.5 Q 3 = 3.5 {\displaystyle {\begin{cases}Q_{1}=1.5\\Q_{2}=2.5\\Q_{3}=3.5\end{cases}}}应用
不论 Q 1 , Q 2 , Q 3 {\displaystyle Q_{1},Q_{2},Q_{3}} 的变异量数数值为何,均视为一个分界点,以此将总数分成四个相等部分,可以通过比较 Q 1 , Q 3 {\displaystyle Q_{1},Q_{3}} ,分析其数据变量的趋势。