你说的平均数到底是什么平均?——译自HLF海德堡桂冠论坛博客

来源:易游体育app    发布时间:2026-01-16 21:16:46

  种种平均数有何不同?原文标题中Mean是一个双关语,既有“你是啥意思?”的意思,也暗指数学中的“平均数”(Mean)。

  如果你问别人最喜欢的数字,大多数人都会有答案。可能是他们的结婚日期,可能是一个对称性极佳的数字(我一直喜欢8),也可能是具有文化意义的数字。然而,很少有人会有最喜欢的平均值,大多数人听到这样的一个问题可能会有些困惑。

  所以,我有一个目标。我不仅想让每一个人都有自己最喜欢的平均值,还想让大家探索各种平均值构成的复杂体系,以及它们之间的关联。

  首先需要说明的是,本文不会讨论众数(mode)或中位数(median)。众数、中位数和平均数在学校里常被作为三剑客一并介绍:众数是样本中出现次数最多的结果,中位数则是将数据按升序排列后中间位置的数值。虽然这两者在统计学中都有其应用场景,但平均数(mean)的应用场景范围却涵盖了数学的更多领域。

  其次要说明的是,我用了复数形式的“means”(平均值)。因为确实存在不止一种平均值。就像中位数和众数是均值的不一样一样,平均数也有不一样的种类。你在学校里学到的“平均数”,实际上只是其中一种特定类型的平均数,不妨称之为算术平均数。我们的探索之旅就从这里开始。

  算术平均数是大家都熟悉的一种——计算方式是将数据集中所有数值相加,然后除以数值的个数。

  也就是说,如果你的数据是x₁, x₂, ..., xₙ,那么算术平均数就是:

  它通常用于求解数据集的“中心”数值,因此在统计学中应用广泛。将它与中位数结合,还能进行更深入的分析。例如,如果一个国家的算术平均收入上涨的速度快于中位数收入,这可能意味着超级富豪的薪资上涨的速度超过了大多数人口。

  算术平均数在概率论中也很有用。假设某个随机事件的可能取值为x₁, x₂, ..., xₙ,且每个取值的发生概率相等,那么算术平均数就是该事件的期望值——即如果反复进行这个试验,你期望得到的平均结果。

  即所有n个元素乘积的n次方根。有必要注意一下的是,这等价于以自然常数e为底、以对所有数值取自然对数的算术平均数为指数的幂:

  几何平均数常用于数据呈现乘法组合关系的场景,比如人口增长率,也可用于计算平均利率。例如,某人投资1000货币单位(选择你喜欢的货币),获得的回报率依次为+10%、-4%、-8%和+25%,最终资金变为1214.4货币单位。

  此时总回报率为21.44%,回报率的几何平均数为4.98%(即1+10%、1-4%、1-8%、1+25%这四个数相乘之后开4次方∜,然后减1。原文写的几何平均值为20%,疑有误,译者注),相较于5.75%的算术平均数(四个回报率+10%、-4%、-8%和+25%,直接相加除以4),它更能反映资金的实际变动情况(逐次平均变化率,每次都按相同的变化率均匀变化,消除忽高忽低的波动,常用于多年的年化收益率计算场景,译者注)。

  关于几何平均数和算术平均数,有一个有趣的结论:算术平均数始终大于或等于几何平均数,当且仅当数据集中所有数值相等时,两者才相等。

  当n=2(即数据集中只有两个元素)时,这个结论很容易证明。设这两个元素为a和b。

  平方数恒非负,因此(a - b)² ≥ 0,当且仅当a = b时等号成立。展开括号可得:

  在上图中,O是圆的圆心,P、G、R位于圆周上。由于P和R构成直径,所以△PGR是直角三角形(原文写的等边三角形,写错了,译者注)。Q是直径PR上的一点,PQ的长度为a,QR的长度为b。圆的半径为(a + b)/2,即a和b的算术平均数,在图中以粉色线段AO标示。

  要计算紫色线段GQ的长度(设为x),我们大家可以利用直角三角形的相似性得到a/x = x/b或射影定理:x²=ab,解得x = √(ab),即几何平均数。从图中能清楚地看到,粉色线段AO长于紫色线段GQ(仅当Q位于圆心时,两者长度相等),这直观地证明了算术平均数大于几何平均数。

  这个关于算术平均数和几何平均数的结论被称为AM-GM不等式(取自两种平均数的首字母),是全球高中数学竞赛中的常见知识点。该不等式的一个巧妙应用是:对于周长固定的矩形,当它为正方形时,面积最大!

  这是因为如果矩形的边长为a和b,其周长为2(a + b),即算术平均数的4倍。因此,周长固定意味着算术平均数固定,而几何平均数(即矩形面积的平方根)有一个固定的上限,且仅当a = b时才可以做到这个上限。

  短暂的插曲过后,我们继续探索新的平均值,接下来是调和平均数。它是所有数值倒数的算术平均数的倒数。因此,对于数据集x₁, x₂, ..., xₙ,调和平均数的计算公式为:

  调和平均数有一些令人意想不到的应用,常用于与比率和速率相关的场景。例如,一辆汽车以速度x驶出,再以速度y沿原路返回,那么它的平均速度就是x和y的调和平均数。

  有趣的是,这里我们假设往返距离相等;如果改为往返时间相等,那么平均速度就会是x和y的算术平均数。

  最后一种平均值是均方根,顾名思义:先取每个元素的平方,计算这些平方值的算术平均数,再对结果开平方。用公式表示为:

  它有时也被称为二次平均数(quadratic mean),这个名称虽然不够直观,但也能让人大致了解其计算逻辑。

  均方根在现实世界中有诸多应用,例如在电气工程中,交变电流的均方根值等于在特定电阻中产生相同功率的恒定直流电流值。

  正如我们有算术-几何平均值不等式(AM-GM不等式)一样,也存在一个包含调和平均数(HM)和均方根(RMS)的类似不等式。这个不等式有时被称为均方根-算术-几何-调和平均值不等式(RMS-AM-GM-HM不等式),其内容为:均方根大于或等于算术平均数,算术平均数大于或等于几何平均数,几何平均数大于或等于调和平均数,当且仅当所有元素相等时,等号成立。

  这个不等式的代数证明相当繁琐,但完全可行。因此,我将为你呈现一个优美的图形证明,敬请欣赏!

  二次平均数(均方根)算术平均数几何平均数调和平均数的几何无字证明,由CMG Lee根据美国数学协会网站 上的图绘制。

  A是圆的圆心,N、Q、G、P位于圆周上(NP构成直径)。M是直径NP延长线上的一点(MG垂直于AG,AQ垂直于AM)。

  设N到M的距离为a(红色线段NM),P到M的距离为b(蓝色线段PM)。圆的直径为a - b,因此半径r = (a - b)/2(灰色线段AQ、AG,也即线段AN、AP)。

  A到M的距离为b加上半径,即(a + b)/2,这是算术平均数(橙色线段AM)。对直角三角形△AGM应用勾股定理,可得r² + GM² = a²。已知r = (a - b)/2,解得GM = √(ab),即几何平均数(绿色线段GM)。

  最后,利用相似三角形求调和平均数HM的长度。由相似三角形的性质可得HM/GM = GM/AM,因此HM = GM²/AM = 2ab/(a + b),这确实是调和平均数(紫色线段HM)。