基尼系数二三事
本文选自《中国统计》2021年第2期文章,原文已获出版社和作者授权。
党的十八届五中全会明确提出要坚持以人民为中心的发展思想,把增进人民福祉、促进人的全面发展、朝着共同富裕方向稳步前进作为经济发展的出发点和落脚点。习近平同志围绕社会主义社会建设发表了一系列重要论述,提出人民对美好生活的向往,就是我们的奋斗目标,提出促进社会公平正义,让广大人民群众共享改革发展成果。这其中共同富裕和公平正义是关键词,也是我们要谈的基尼系数的度量对象。大家知道,社会财富分配平均则不利于促进竞争和社会进步,差距太大则不利于社会稳定和人民幸福。基尼系数是描述一个国家或地区社会成员收入差距的重要指标,常常被用来反映社会财富分配的公平程度,也被用于监测社会的稳定程度,而且也被用于检验政府税收等政策在调节收入分配上的作用。本文就谈谈基尼系数的二三事。
关于基尼系数的比较系统的研究最早可以追溯到Gastwirth在1972年的成果,里面系统论述了其样本估计的性质。一个与基尼紧密相关的概念是洛伦兹曲线,在以往的研究中,对基尼系数的估计常常转化为对洛伦兹曲线的估计。有大量的文献讨论了洛伦兹曲线的参数形式,而针对中国的具体情况,世界银行向中国推荐的拟合模型为VA模型和β模型,Kakwani则是将基尼系数和洛伦兹曲线的概念推广到经济学中的其他分支中,用来描述一些收入分配以外的问题。北京大学基尼系数项目组自2010年起多次承担了国家统计局统计科学研究所的研究基地项目。项目组就分组汇总数据单总体情形、混合总体情形、不完全回答数据情形、有税收调节情形等对基尼系数估计和影响分析进行研究,取得了一些研究成果,有部分思想在本文进行了展现。
基尼系数的定义非常简单,它表示为每两个社会成员收入之差的平均与社会成员收入总平均的比值。如果社会财富平均分配,各成员收入都一样,则基尼系数为零;如果社会财富都归于一人则基尼系数为1;一般情况下这是一个位于0和1之间的数。由于它具有尺度不变性,不受计量币种的影响,非常有利于进行不同国家或地区之间的比较。可以说,基尼系数只依赖社会收入在社会成员中的分布比例,与社会收入值无关。通常情况下人们认为0.4是一个合适的门槛,如果不超过0.4则认为情况良好,高于0.4则认为应该值得社会警惕。
我们可以探讨一个有趣的简单情形。若社会成员被分为两组,人口占比分别为α,1-α, 收入占比分别为k,1-k,而每组内均富贵。此时基尼系数可以表达为
利用这个有趣的简单公式就可以计算出相应的基尼系数值。如果90%的人占有社会财富的10%,则。有趣的是,此时基尼系数恰好是到门限值0.4。所以门限值0.4是一个很不均匀的分布下的值。我们还可以计算出其它一些有趣的值。通过计算数值可以看到,固定一个比例,关于另一个比例不是单调变化的。另外,很多分配比例都可以达到门限值0.40。读者们可以通过这个公式计算出很多感兴趣的情形。
洛伦兹曲线是区间[0,1]上单调不减的下凸曲线。它的横坐标表示社会成员数的一个比例,纵坐标表示这个比例的较低收入者的收入平均值与全社会收入总平均的比值。如果财富平均分配,则这条曲线就变成从原点到点(1,1)的直线。如果一个社会90%比例的较低收入者占有社会财富的8%,则洛伦兹曲线上横坐标是90%的地方,纵坐标就是8%。可以看出,洛伦兹曲线上的一些特殊点本身也具有重要的指标意义。而基尼系数恰好是洛伦兹曲线与从原点到点(1,1)的直线之间豆荚般图形面积的两倍。
说完了基尼系数的定义,我们可以来看看中国和世界上其他国家的基尼系数具体大小。国家统计局网公布有2003-2016的基尼系数。可以看到在经历了2008年的最高值0.491之后,基本走势是连续下降的,2016年是0.465。作为比较,我们指出根据美国国家统计局网站公布美国2017年基尼系数为0.482,2018年基尼系数为0.485。世界银行公布有世界各国的基尼系数,年份不同是由于数据统计时间的不同。公布的基尼系数值最小的是2005年的丹麦0.24, 最大的是2007年的塞舌尔0.658。数据显示中美两国这些年基尼系数基本运行在0.45-0.49之间。从这个角度出发,对中美两个大国来说,这似乎是一个有利于竞争和快速发展的区间。
社会幸福程度和基尼系数也有很大关系。基尼系数较大,则预示着社会财富的分配差距拉大,这样会影响到民众的幸福程度,但一个社会绝对收入高低也会影响民众的幸福程度。如果我们只考虑收入对幸福程度的影响,给具有一定收入的社会个体定义一个描述幸福程度的幸福函数,则这个函数的应该具有经济学们给出的效用函数所具有的性质。即随着收入增长,幸福程度会增加,但单位收入增长的效应逐渐减弱。这就是经济学中的边际效用原理,即穷人收入增加1元钱时,其增加的幸福程度要比富人收入增加1元钱得到的幸福程度多。一个社会的幸福程度可以用社会个体的幸福程度的平均值来度量。由于这个平均幸福程度也与财富的收入分布有关,从而也与基尼系数产生了关系。但很遗憾的是,由于基尼系数只是衡量相对差距,不反映收入绝对值,所以社会幸福程度关于基尼系数不是单调的。我们可以引入推广的洛伦兹曲线的概念,含义是一定比例的较低收入者的平均收入,而不再像洛伦兹曲线那样考虑和总平均的比值。则可以从数学上证明若个体幸福函数也相同,则广义洛伦兹曲线越高,社会幸福程度越高,反之亦然,这就是著名的Shorrocks定理。所以从某种意义上来说,我们可以通过推广的洛伦兹曲线来了解社会的幸福程度,而不必考虑具体的幸福函数形式。
最后我们再谈一下基尼系数的两种作用。我们知道,基尼系数可以作为社会公平程度的度量,也可以作为社会稳定指标。这两种作用是有关系的,但意义是不同的,其门限值也应该有所不同。中国社会具有城乡二元结构,2009年城镇基尼系数为0.3252-0.3441之间,乡村为0.3609-0.4066之间。合在一起时为0.46左右。分开计算基尼系数并不大,但合在一起时却比较大,远远超出门限值0.40。可以看出,如果作为衡量公平性的指标,整个社会的基尼系数偏大,反映社会财富分配有失公平性,但作为社会稳定性指标基尼系数并不特别敏感。
这其中的原因是什么?我们认为作为影响社会稳定程度的指标,用整体指标来度量并不合适。可以举一个极端的例子,拿中美两国来说,如果合在一起计算两国一起的基尼系数会很大,但这个较大的值并不会反映社会各自的稳定程度。实际上,社会成员并不会与全社会所有成员相比较,而往往是与之相近的个体相比较。这种相近可能并不只是距离的意义,还有可能是个体相似性。比如社会地位,阶级的相似性。这还与信息交流的程度,交通的便捷性等有关。我们知道,基尼系数计算的是社会群体中任何两两个体之间收入差距的平均值。就是说每两个个体都做比较,所以用全社会的基尼系数来做衡量社会稳定程度的指标并不敏感。基于以上原因,可以考虑给出一种新的衡量社会和谐程度的基尼系数,只计算其中相近个体之间的比较,而不必去考虑相差较远个体间的比较。
要想社会快速发展,就不能吃大锅饭,应该积极鼓励竞争。但鼓励竞争的同时也要考虑社会整体的幸福程度,促进公平正义共同富裕社会的实现。一个重要手段是通过税收调节实现二次分配。我们可通过税收函数和税收集中曲线研究不同收入群体的税收负担情况,从而研究税收的二次分配的效果,特别是对基尼系数和幸福程度的效果。集中曲线是与洛伦兹曲线相类似的曲线,它的纵坐标表示一定比例的低收入者所交税收占总税收的比重。需要指出的是,以上谈的这些指标都受收入分配的影响,都可以通过概率统计术语和符号来严格定义描述。它们的值都可以通过调查数据或者大数据利用统计技术来估计。期望通过本文能使大家更多探讨收入分配的合理性研究,促进公平正义、共同富裕且发展强劲的社会建设。
敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。
统计之都:专业、人本、正直的中国统计学社区。
关注方式:扫描下图二维码。或查找公众号,搜索 统计之都 或 CapStat 即可。
往期推送:进入统计之都会话窗口,点击右上角小人图标,查看历史消息即可。
编辑|李萧纹
微信扫码关注该文公众号作者