聊聊青年失业率的统计数字
统计数据有问题,就打开看一看,披露一下原始数据和统计口径,透明一点,没啥大不了的。
1
本来不想蹭这个热点,好几个人发信息让我聊。就写一篇聊聊青年失业率这个问题吧。
让我们先看几个数据图 - 过去二十年的四个国家的失业率和青年(16-24岁)失业率:
日本:
美国:
意大利:
韩国:
几个国家,日本、美国、意大利、韩国,失业率有高有低,日本比较低,意大利比较高。有的国家做了季调,比较平缓,有的没有,波动大一些。但四个国家有共同的特点:第一,青年失业率远高于全年龄段平均失业率,四个国家上面的曲线都是青年失业率,下面的是全年龄段平均失业率(总失业率)。大概是2-3倍。第二,两条曲线基本上是同方向变动,总失业率上升,青年失业率也上升,总失业率下降,青年失业率也下降。
这两个特点很好理解,符合常识。青年工作经验少,找工作更难,失业率会高一些。同时,经济有高潮有低谷,失业率有升有降。但经济繁荣与衰退,是同时作用在所有人身上的,不太可能经济衰退,只有某一个特定年龄组倒霉,其他年龄的人不受影响。
这些数据图都符合常识,符合逻辑。全世界做这个统计的国家,大都有这样两个特点。
那让我们看看中国的图,情况大不一样。
中国的全年龄段平均调查失业率,和25-59岁人口的调查失业率都比较稳定,变动方向也比较一致。但16-24岁青年失业率,从2018年开始,排除季节波动的影响,呈现单边上升的趋势。从2018年的10%,单边上升到2023年的20%。
这事就奇了怪了。全世界都没出现这种情况,不符合常识和逻辑。比较这几张图,中国的数据肯定是有问题的。问题在哪里,不知道。
2
之前写文章,和大家聊过MECE的分析方法,大体上就是把所有的可能都列出来,再逐一排除,最后剩下的,就是真凶...... 不,是答案。
中国统计局的数据,一直以来都是只给结论,不给原始数据,不详细描述计算方法,也不披露调查问卷。所以,很多东西都只能靠常识和逻辑去推理。这一点后面再吐槽。先列举一下全部的可能:
第一个可能,就是25-59岁的失业率数据,有问题,造假了。低估了25-59岁的失业率。然而,这个可能逻辑上不合常理。既然25-59岁的数据造假了,为啥16-24岁的数据不造假?然后每个月数据公布的时候都被舆论炒作一把,最后实在没辙了,羞羞答答的说,以后不公布了,统计方法要调整,然后再被群嘲。
要造假,为啥不一起造假,为啥16-24岁的统计非要给真实的,25-59岁的造假。逻辑上说不通呀。一起造假岂不又省事又安全。
第二个可能,就是中国25-59岁和16-24岁用的统计方法不同,16-24岁用的方法会算出一个很高的数字。这个逻辑上也说不通。从统计局挤牙膏一样披露的信息看,调查失业率应该是同样的统计方法收集数据,然后分年龄段汇总。此外,如果搞两套方法,那干嘛16-24岁要用一个会把数据算高的方法,统一用25-59岁的那套不就行了。
不同年龄段用了不同统计方法,这个解释逻辑也说不通。
第三个可能,中国16-24岁青年人和外国完全不一样?但这个也很奇怪呀,大家两只眼睛一只鼻子一张嘴,有啥不一样的。外国青年失业率就随着经济周期波动,中国青年失业率就单边上扬?人和人哪里有这么大区别。
第四种可能,就是中国16-24岁的青年人,和外国有些微的差别。中国统计16-24岁和25-59岁时也是用的同一方法同一标准,但整体方法和西方也有些微差别。统计方法的微小差别,放大了中国青年和外国青年的微小区别。最终形成了这个结果。
我自己在用户调研方面多少也有过一些经验。看统计数字,不能只看结论,要看原始数据,看原始的问卷的写法,提问的问法。同一样本,问卷里问题的不同提法,就可能得到完全不同的结果。可惜我们的统计局披露数据,从来只对公众披露结果,原始数据,问卷一概不公开,所以,分析中国的问题,就很难,反而给网络上各色人等留下了曲解数据的巨大空间。唉......
3
我们回到失业率的数据。失业率计算,分子是失业人口,分母是劳动力人口。这一点国际标准和中国统计局是一致的。
按官方说法:将16岁及以上人口划分成三类,一类是就业,一类是失业,还有一类是非劳动力。就业人口就是有工作的。失业人口是没有工作,在近期寻找工作,而且立即能去工作的人。这些人有工作能力、工作意愿,但尚未找到工作,属于失业人口。非劳动力是指16岁及以上人口既不属于就业人口也不属于失业人口的人。比如,没有工作意愿或失去劳动能力的人,调查失业率的计算,用的是失业人口除以就业人口和失业人口之和,非劳动力是不纳入计算的。
统计局公布了一个青年失业率,但16-24岁城镇青年中,就业人口总数,失业人口总数,非劳动力人口总数,都没公布。只能从答记者问的一些只言片语中找信息,比如:
刚刚发布的,8月的答记者问:近年来,我国城镇青年人中,在校学生规模不断扩大。2022年,我国16-24岁城镇青年有9600多万人,其中在校学生达到6500多万人。
2023年6月的统计局答记者问:关于您关心的青年人就业情况,青年失业率处在高位。从总量看,初步测算,5月份,16-24岁城镇青年人总量大概有9600多万。16-24岁青年人很多是在校学生,未进入到劳动力市场,而进入到劳动力市场寻找工作的青年人有3300多万。这3300多万青年人中有2600多万人已经找到工作,大概有600多万人目前还在寻找工作。也就是说,青年人中失业总量总共600多万人。
这两个答记者问,第一个信息是2023年5月,20.8%的16-24岁青年失业率,是600多万/3300多万得出来的。这个600多万,应该是680多万。
第二个信息,就是2022年,我国16-24岁城镇青年中,非在校生的人数,只有9600-6500万 = 3100万人。
2023年5月的劳动力人口比2022年的非在校生人数还多。
简单列个算式:
16-24岁城镇青年中,
2023年5月的16-24岁城镇劳动力人口 = 2022年的非在校生劳动力 + 2023年毕业进入劳动力市场的2022年的在校生 - 这段时间年龄增加超过24岁的劳动力 = 2022年的非在校生 - 2022年非在校生非劳动力 + 2023年毕业的在校生 - 2023年毕业在校生中的非劳动力 - 这段时间年龄增加超过24岁的劳动力
把有限的数字代入进去。就是 16-24岁城镇青年中的 非在校生中的非劳动力人口 = 2023年毕业的在校生 - 200万 - 2023年毕业在校生中的非劳动力人口 - - 这段时间年龄增加超过24岁的劳动力
我国的毕业季是7月,2023年5月还没到毕业季高峰,就算按全年毕业人数算。高等教育2022年毕业1100万人,加上高中生中职生没上大学的(高考报名人数减录取人数不到100多万,中等职业学校每年毕业不到500万),大概1700万?减去考研考公专升本不找工作的(考研报名每年接近500万人)和年龄超过24岁的退出统计的劳动力(24岁这个年龄段的劳动力估计500万以上)。新增部分能有500万?这么算那3100万非在校生中的非劳动力人口才不到300万?这个数字肯定不对的。
有时候真的很郁闷,统计局明明都有这些统计数据,但从来不披露。毕业生在什么时点开始算进入劳动力市场,毕业时点,开始找工作的时点?这些也都不披露。2022年那个在校生6500万数据,是2022年底,还是2022年6月毕业前,也不披露。
没办法,中国没数据,看看美国的数据做参考吧,灯塔国的统计数据一直做的比较完善。BLS2023年5月发布的2022年数据。美国一共3800万 16-24岁人口。其中,2100万在校生,1700万非在校生。(16-24岁人口中美国的在校生比例比中国还低)
1700万非在校生中,大约340万是非劳动力人口,120万失业人口,1200多万就业人口。非劳动力人口占非在校生的约20%。
如果按美国20%的标准,中国3100万非在校生,应该也得有600多万非劳动力人口。
4
从常识分析,中美16-24岁的非在校生中,劳动参与率到底谁更高?
我们思考一下中美青年的区别。中国的父母有供孩子上大学的传统(不仅上大学,甚至买房都要用六个钱包)。美国的父母普遍认为孩子18岁就独立了,大学学费,自己想办法。美国大学学费比中国更贵,大学生普遍都借学生贷款。美国总统奥巴马,名校毕业,当律师,40多岁才还清学生贷款。美国超过50%的大学生是靠贷款也完成学业的。
中国大学生里面,靠贷款付学费的不多,40多岁还不清学生贷款的更少。
美国的大学生毕业之后就面临还贷,就业的压力,比中国大学生大,退出劳动力市场,躺平的比例,应该比中国大学生低得多。
常识推断,16-24岁的非在校生,退出劳动力市场的比例,中国应该远大于美国,应该不止20%。但这个数字似乎没有体现在统计报表里(当然也没披露)。一共只有3100万非在校生,劳动力人数却有3300万,就算劳动力人数要扣掉在校生劳动力的人数,感觉3100万非在校生中的非劳动力人口,也就几百万规模,低于应有的数字。这里又忍不住吐槽,为啥统计局就是不披露更多数字呢......
那么问题来了,统计局是怎么分辨一个16-24岁的,不工作的非在校生,是失业,还是躺平退出劳动力市场?
只能靠问卷或者入户调研。调查员问非在校生,说不定还是问的家长:“你到底是不是躺平暂时不打算找工作了?”如果回答“是”,就算非劳动力,回答“否”,就算失业人口。
这时中美的文化差异,又导致了新的问题。
美国的青年,如果家庭条件好,父母愿意支持,可以躺平不找工作,那是兴高采烈,理直气壮的。美国有所谓Gap Year的传统,青年毕业后,或者换工作间隙,一年不工作,出去旅游,饱览大好河山,陶冶身心。这是理直气壮的躺平。调查员问,是不是打算躺平,美国躺平青年一般都理直气壮的回答,我躺平我自豪。
中国情况就有所差别。仅仅分享一下我个人体验。我的一个远亲长辈,家庭条件不错,孩子学校一般,毕业后都找不到理想的工作,索性在家躺平做全职儿女,招工作就不上心了。但父母很着急呀,各种托人找工作,估计也天天唠叨孩子。孩子嘴上不说,心里估计也有压力。如果调查员问,是不是打算躺平不找工作了?回答估计是:“谁说我躺平,我在找工作,你全家才躺平。”
有没有工作,是客观事实。是不是选择躺平了,是主观的,是自由心证。中国还是有劳动光荣的传统,就算实际已经躺平了,在填问卷或者回答问题时,回答“在积极找工作没躺平”的中国青年的比例,我自己猜测是大于美国的。当然,这只是猜测。
5
从2018年到2023年,16-24岁城镇青年的调查失业率单边上升。那有什么相关联的数据,也有单边走势呢?平均失业率是很稳定的。
在校生人数,特别是高等教育在校生人数,2018-2023年,单边上升。学历教育在校生从2018年的2.76亿上升到2.93亿,1700万。2018年 高等教育在学总规模达3833万人,2022年 达到4655万,增加822万。
总的16-24岁人口,从2018-2023年,应该是下降趋势。2018年16-24岁人口,对应 1994-2002年的出生人数,是1647-2104万。2023年16-24岁,对应1999-2007年的出生人口,是1594 - 1909万。
在校生人数增加,总人口下降,意味着非在校生人数大幅下降,16-24岁的劳动力人数,应该也是大幅下降。这一点应该是中国特有的。
同样600万失业人口,3000万劳动力总数,就是20%失业率,5000万劳动力总数,就只有12%的失业率了。就算16-24岁区间的失业人口总数变动不大,劳动力总数持续下降,也会导致失业率单边上升。
另一个因素,读了大学,就期望找一个理想一点的白领办公室工作。没读过大学,可能愿意去去工厂工地,大学生就不肯定愿意了。如果实在没饭吃或者要还贷,可能也只能去,但家里稍微有点条件,不愁吃穿,就宁可躺平。
北京我家阿姨,没啥文化,做两份工,包吃住,一个月能挣1万出头。但大学生肯定不愿意做这样的工作,宁可在家躺平。
6
上面都是我的猜测。没有数据,只能猜测。但是,2018年-2023年,中国总体失业率稳定,但16-24岁失业率的单边上升,和世界其他国家的情况都不一样。奇怪的数据,里面一定是有原因的,如果仔细分析数据,八成也能找出原因。
18-23年,中国在校生人数的持续上升,16-24岁的劳动力人口总数持续下降,这些都是中国特有的情况,其他西方发达国家没有这个单边趋势。可能这是一个原因。
中国的父母持续支持孩子的文化传统,青年找理想工作难度加大,躺平青年的增加是一个事实。而中国的文化特点,让躺平青年在接受调查的时候,不愿意承认躺平,实际上也加大了失业率的统计数字。这可能是第二个原因。
数据不好看,就不好看呗。分析数据,找原因呗,向公众披露解释呗。把16-24岁总人口,在校生人口,分在校生和非在校生的劳动力人口,失业人口,就业人口,18-23年的按月的时间序列数据都披露出来,失业率的计算公式,统计调查的问卷模版,也都披露出来,有啥大不了的。
这个青年失业率数据,仔细分析一下原始数据,是能找到解释和原因的。但我们统计局,明明都有数,但从来不愿意披露,实在应付不过去了,就答记者问挤牙膏一样挤出一点点信息。
现在好了,索性不披露了。客观说,这个统计确实有问题,大概率高估了青年失业率,应该调整方法。但现在,不披露,过段时间调整方法,披露一个低一点的数据,还不透明,不说为啥调整,怎么调整的,这不是找骂吗?到时候一定被喷死,人人说你在造假。
透明,清晰的向公众披露信息,披露原始数据,取样方法,统计口径,其实没啥大不了的。网络上啥事都会炒作一把,不用怕。遮遮掩掩反而问题更大。唉......真是没办法。很多东西,你遮遮掩掩,反而给了谣言大肆传播的空间。
之前有些自媒体拿了一个2013 - 14年的收入分层数据反复炒作。到了2023年改个年份还用这个说事儿。为啥?因为这个颗粒度的数据,官方从来不披露。当年把数据给了学术机构合作做了一个研究,结果,快十年了,还只有那套数据反复去炒冷饭。
微信扫码关注该文公众号作者