真题大搜罗 | 人大应统432真题(2011-2022)
此系列我们会分享全国各大院校的真题整理,希望给大家呈现齐全完备的真题,助力各位同学的应统432备考,如果觉得这个系列对你有帮助的话,请记得为我们撑腰哦。
只需满足以下要求,即可获取排版更为精美的PDF版
点赞并点击在看 将本篇文章转发至朋友圈,配文【应统联盟,专注应统考研与求职,连接十万名应统专业同学,欢迎大家关注】,保留两小时以上 截屏后发送至后台,发送文字【人大432真题】,即可触发后台获取pdf链接
我们会陆续在公众号以及后台更新以下院校的真题,敬请关注
北京地区:北大、清华、人大、中财、外经贸、首经贸、北师大、北理工、中央民族、北工商、北工大、华北电力、中科大 上海地区:上财、华东师范、上交、复旦、上海对外 华北地区:南开大学、天津大学、天津财经大学、山西财经大学 东北地区:东北大学、大连理工大学、东北财经大学、辽宁大学、吉林大学、东北师范大学、哈尔滨工业大学 华东地区:山东大学、中国海洋大学、山东财经大学、南京大学、东南大学、南京航空航天大学、苏州大学、浙江大学、浙江工业大学、浙江财经大学、南京财经大学、厦门大学、江西财经大学 华南地区:中山大学、华南理工大学、暨南大学、汕头大学 华中地区:武汉大学、华中科技大学、中南财经政法大学、中南大学、湖南大学 西北地区:西安交通大学、西安电子科技大学、西北大学、西北工业大学、兰州大学 西南地区:四川大学、西南财经大学、重庆大学、西南大学、电子科技大学
2011年真题
一、(10 分)给出若干数据: 32 34 32 39 44 45 38 ......(共 30 个数值型数据) (1)这些数据可以用哪些图表来表示? (2)这些数据可以用哪些统计量描述?
二、(20 分)t 分布,卡方分布,F 分布在统计学中有哪些应用?三种分布的假设 条件是什么?
三、(20 分)给出一些数据和背景: (1)写出原假设和备择假设 (2)95%置信区间的含义 (3)p 值的含义
四、(20 分)对影响试验数据的一个因子进行单因素方差分析,给出:
(1)简述模型中各参数的含义 (2)简述该模型的假设条件 (3)写出原假设和备择假设? (4)问好像是要写出检验统计量。
五、(20 分)给出了一个二元回归分析的 EXCEL 表格。(1)简述各个回归系数的含义(2)计算 ,并解释其含义 (3)计算 ,并解释其含义 (4)通过给出的 EXCEL 结果,对这个回归模型进行 评价
六、(15 分)一个含有各种要素时间序列的预测步骤。
七、(15 分)总体数量为 1000,总体均值 32,总体方差 5,从中抽出样本量为 100 的样本: (1)样本平均值的期望和标准差 (2)样本平均值的分布 (3)以上结果的得出,依靠那条定理?简述这条定理
八、(20)有人认为人口密度与国民收入有关系,依据的数据给出了一个表,表中 随着人口密度的减小,人均国民收入呈现递增趋势,接着题目又给了一个表, 表中给出的是高收入国家的人口密度和人均国民收入的数据, 可以看到高收入 国家中也有几个国家的人口密度也是很大的,比如新加坡、日本。第一问:从国土面积的角度去解释。(我表述的貌似有点问题)第二问:对题目的分析过程进行改进, 写出你认为比较合适的方法来分析人口密度与国民收入的关系。
2012年真题
一、为研究不同地区与购买汽车的消费价格之间的相关关系,调查得到如下的数据:
对于以上的数据可以用什么统计图表分析,并说明这些图表的用途。对于以上的数据可以用什么统计方法分析,并说明这些方法的用途。
二、为检验一厂家生产的产品,提出如下的假设检验:H0:u=500,H1: u=! 500, 现在抽取了部分的样品进行检验。若检验结果拒绝 H0, 则意味着什么?若 检验结果没有拒绝 H0, 则又意味着什么?能否恰好取到一组样本证明 H0: u=500 成立?为什么?若检验的 P=0.03,则意味着什么?P 值的真实含义是 什么?
三、现研究某地区平均 GDP 与居民消费总额、固定投资、进出口额、年末总 人口之间的关系,进行了多元回归分析。题目分别给出了三个表: 表 1:整体拟合程度:R,R 方,调整的可绝系数。表 2:整体线性关系的 F 检验 表 3:系数的显著性 t 检验,方差扩大因子 VIF(存在多重共线性) 请对上述回归模型进行综合评价。
四、 题目中给出了从 99 年 1 月到 2004 年 3 月某地区各月的销售额的一个 时间序列图,该序列图中包含哪些成分?可以用什么方法来分析此模型,并 简要叙述可种方法的基本原理。
五、说明距离判别法与贝叶斯判别法的区别与联系。
六、说明大数定律与中心极限定理的内容和应用?
七、在敏感性问题的调查中,为了保证回答者尽量真实回答,采用如下方法: 以比例 p 的人回答敏感性问题(1) :你具有特征 A 吗?回答结果为是或 不是。另外 1-p 的比例人回答问题(2) :比如你的手机号尾数是奇数吗?回答是 的比例为 t。假设总体具有特征 A 的人数比例为 q,样本中回答是的比例为 R。试提出 q 的一个估计证明该估计是 q 的一个无偏估计。求出 q 的方差的表达式。
2013年真题
一、给了一个列联表
有几个变量?都是什么类型?可以用什么图形展示?各种图形用途。还可以对 以上数据做什么分析?
二、有两个盒子,一个盒子里装了 8 个红球,2 个黑球,一个盒子里装了 8 个 黑球,2 个红球,做如下游戏:从两个盒子里随机挑一个,再随机摸一个球, 如果摸到红球,就认为是从第一个盒子里摸的球,如果是黑球,就认为是从第 二个盒子里摸的球。请用假设检验的术语。(原假设、被择假设、拒绝域、非拒 绝域等)说明这个游戏规则的合理性。
三、有甲乙两人说了自己对置信度、置信区间的看法,谈谈你对置信区间的理 解,以及置信区间的使用。
四、给出中国某几年的社会零售消费品总额时间序列曲线图,问其中存在哪几 种成分(趋势、季节性、随机性) ,可以对其用何种方法分析和预测?
五、将中国 31 个省市按所属区域分为东部、西部、中部等,如下表:以税收额为因变量,所属区域和地区生产总值为自变量,如何对以上数据进行 分析?以及分析中每种方法的假定。
六、因子载荷的含义?因子旋转对因子载荷的影响?
七、如何对因变量 y 和 k 个自变量 x1,x2......xk 建立多元回归线性模型?请 写出步骤和详细评论。
2014年真题
一、题目中测试某个产品的重量,一共有 25 袋,要求对这 25 个数据进行分析, 对于以上的数据可以用什么统计图表分析,并说明这些图表的用途。对于以上的数据可以用什么统计方法分析,并说明这些方法的用途。
二、甲乙两人玩一个游戏,求出甲乙的收益期望分布(概率统计的问题,挺简单的)
三、主要提问是假设检验的第一类错误及第二类错误的相关概念(比较简单)
四、简述样本平均数和总体参数的的关系,代表性,并举例分析。
五、多重共线性的影响以及处理方法
六、题目给出一组1997—2013年的 GDP 数据走势图,提问应该对数据采取何种处理方法(是个指数的曲线图,应该对数据进行低阶差分处理)
七、某小组要分析经济发展和生活水平的关系,分别统计150个国家的指标(包括基尼系数、饮用水使用率等) ,提问应用何种统计方法进行分析(应该是多元统计分析中的典型相关分析)
2015年真题
一、抽样调查了 60 名大学生月花费(元)的数据,根据下列表格和图片,对大学生的月消费进行分析:
【一张 QQ 图、一张直方图,都大致正态分布】
二、某产品满意度调查:
问:能用哪些统计方法分析?给出分析过程
三、为了分析职业对收入的影响,我们调查了金融业、IT 业、旅游业、制造业各 500 人的 收入情况。问我们能用哪种统计方法分析?给出步骤和方法原理
四、现有 11 家上市银行今年前三个季度 14 个指标(每股收益、每股净资产、每股公积金、每股未分配利润、每股经营现金流、以及公司主营业务收入、净利润、净资产收益率、不良贷款等)的数据,为了评价各银行的业绩,你选择用什么样的统计方法?给出方法步骤,并评价这种方法
五、下面是农夫山泉 550ml 装的营养成分(单位:μg/100ml) :【主要是钙≥400,PH 值(25℃) :7.3±0.5】 为了检验钙是否≥400,你应该怎么提原假设?厂家应该怎么提?为什么?当你接受原假设时,你能得出什么结论?第一类错误的实质是什么?当你拒绝原假设时,你能得出什么结论?第二类错误的实质是什么?“PH 值(25℃) :7.3±0.5”这样的叙述有什么问题?
六、简述多元线性回归建模的步骤
七、简单指数平滑模型、Holt 模型、Winter 模型的构造,以及它们分别适用什么类型的时间序列?
2016年真题
一、表格中记录的是1978年以来高校入学的城市、农村学生所占当年全部新生的比例,分类依据是性别和户口类型,由于数据缺失,一些年份的数据没有出现在表格中,而且由于户籍登记规则发生变更,2000年以后采用户口记录学生比例,2000年以前采用出身类别记录学生比例,试给出以上数据可用什么图表分析,并对以上数据做出解释(考虑数据质量)(20分) 注:这个题的数据具体的我记不清了,主要随时间呈现一个上下波动吧,反正不是单调上升或下降,而且其中一些年份的数据是未给出的,表格仅供参考
二、解释中各个字符的含义,说明这个公式在实际操作中都有哪些应用。(20分)
三、
研究不同机器类型和班组对于次品率的影响,试问以上用的是哪种实验设计方法,以上分析中研究的主要因子是什么?以上数据可用什么统计方法分析,给出它的基本原理。(20分)
四、检验一个药物是否有疗效,选取两组志愿者,一组服用此药物并记录(记录什么我忘了..感觉这个不重要),另一组服用安定剂并记录(同不记得..),这是匹配样本还是独立样本?给出原假设和备择假设,若p=0.05意味着什么?此时容易犯的错误的实际含义是什么?(20分)
五、一个时间序列数据中含有趋势、季节、随机成分,请写出用于分析这个序列的方法,并简要介绍各个方法。(20分)
六、单因素方差分析中的有什么含义?给出它发生作用的基本原理。(20分)
七、自变量:出口总额、社会消费品总额、还有一个变量不记得了;因变量:地区生产总值给出了以上变量的线性回归模型分析结果,都是表格,有可决系数,调整的可决系数,方差分析表,回归系数检验结果,VIF(其中两个变量小于10,一个变量为18)(30分) 问题:1.这个模型有哪些假定 2.这个模型中哪个自变量对因变量的影响更重要?3.请对这个模型做出综合评价
2017年真题
一、3 个学校分为 3 个学习等级,每个等级抽取一个班共九个班的数据,分别有 数学和语文成绩。计算出了均值和方差。这两个数据分别能供什么信息?有什 么缺陷?分位数能否消除这种缺陷?比较各个班级的数据分布用什么图展示,绘 制方法?对每个班学生数学成绩由高到低排序后画出折线图在一张纸上反映出 什么信息,改进方法?对语文和数学画散点图反映了什么信息,改进方法?(不 要在试卷上画图)20 分
二、假设美国总统候选人特朗普和希拉里票数比 51:49 ,抽取一定的样本估计 这个比例。为了预测,你认为合理的估计误差?样本量?区间计算公式的依据? 比例对样本量的影响?20 分。
三、T 分布比正态分布构造的置信区间的宽,为什么?本题中 n 为 50 选用 T 分 布是否合理?20 分。
四、给出了几个职业和几个游戏时长的区间,给出了各个职业在各个区间的人数。用什么方法分析?基本原理?步骤?相关系数的取值范围和构造原理?20 分
五、方差分析因素 A 三个处理,效应为,因素 B 四个处理效应为β,响应变量为 y,每种处理 5 次实验,简述模型?写出原假设备择假设?简述步骤。20 分
六、选用全部的自变量纳入回归方程的估计模型是否合理?用什么方法选择自 变量?20 分
七、人的肩宽,身高,体重,三围...13 个指标。选用什么分析方法建立衣服型号 标准?简述步骤 10 分
八、时间序列的预测步骤,趋势、季节性,随机性。20 分
2018年真题
一、 1.1 请说明雷达图和箱线图的基本要点。1.2 下面的数据集为8个同学的数学、语文和英语的成绩,如何利用雷达图和箱线图来描述这个数据集?
二、 2.1 说明在方差已知的条件下,正态总体均值区间估计的宽度与样本量的关系。2.2 现在有一组来自正态总体的随机样本,可以由此得到在方差已知和方差未知两种条件下的置信区间,请分析这两个置信区间的中点和宽度的异同。
三、 3.1 给出一个列联表,写出可以描述上述数据的所有的图形,并说明这些图形的用途, 3.2 写出可以分析上述数据所有可能的方法,并说明用途。
四、设因变量为 ,自变量为,写出建立多元线性回归建模的基本思路。
五、 5.1 方差分析有哪些基本假定?5.2 简要说明检验这些假定的方法。
六、在同一个概率空间中是否存在三个随机事件 使得同时成立下面三个不等式:
如果存在,请列举一个例子;若不存在,证明你的结论。
七、设为一个来自均值为,方差为的分布的样本,和未知,考虑均值为的线性无偏估计类
求出中为的无偏估计的充要条件,并求出无偏估计类中方差一致最小的估计。
八、设是一个正值随机变量,方差有界,证明:对于, 有
九、设地区生产总之(亿元)为因变量,固定资产投资(亿元)、社会消费品零售总额(亿元)、出口总额(亿美元)、地方财政收入(亿元)、电力消费量(亿千瓦时)、居民消费水平(元)为自变量,根据31个样本数据得到回归结果如下:
Coefficients | Estimate | Std. Error | t value | Pr(t) | |
---|---|---|---|---|---|
-2.377 e+03 | 1.166 e+03 | -2.038 | 0.05270 | ||
固定资产投资 | 4.504 e-01 | 8.166 e-02 | 5.515 | 1.14 e-05 | |
社会消费品零售总额 | 1.110 e+00 | 1.572 e-01 | 7.060 | 2.68 e-0.7 | *** |
出口总额 | 1.887 e+01 | 6.379 e+00 | 2.958 | 0.00686 | ** |
地方财政收入 | 9.596 e-01 | 6.959 e-01 | 1.379 | 0.18061 | |
电力消费量 | 6.683 e-01 | 5.671 e-01 | 1.178 | 0.25016 | |
居民消费水平 | 1.194 e-01 | 6.949 e-02 | 1.718 | 0.09868 |
Residual standard error: | 1526 | 自由度 | 24 |
---|---|---|---|
Multiple R-Squared: | 0.9944 | Adjusted R-squared | 0.993 |
F -statistic: | 708.8 | P-Value | < 2.2 e-16 |
对该回归模型进行综合分析,评价是否需要改进,并给出思路。【10分】
2019年真题
一、当检验统计量没有落入拒绝域时,可不可以说“接受原假设”,请说明理由。
二、在时间序列中,请说明严平稳和宽平稳的定义是什么?二者之间有什么联系?并说明如何判断数据的平稳性。
三、某研究小组想要研究某城市中A、B两种疾病的发病率,其中A疾病的发病率为0.2,B疾病的发病率为0.1,为了使抽样的绝对误差不超过1%,则需要随机抽取的样本是多少?并分析简单随机抽样的可行性和效率,如果你来设计试验,你会怎样设计?
四、在回归分析中,说明如何判别是否存在异方差?
五、在多元统计分析中,和的用处非常多,请用至少三种不同的多元分析方法来说明和的应用(文字+公式)
六、设X服从P维正态分布,即,其中是对角矩阵,对角元素分别为,从p维正态总体中抽取一个样本量为n的样本,试估计和的极大似然估计。
七、 (1)证明,与是等价的 (2)如果,证明
2020年真题
一、变量的分布如下:
从总体中抽取两个独立样本,求样本均值的抽样分布、均值和方差。
二、中国国际航空公司和中国南方航空公司在以下几个城市的延误情况如下:请问,从上述表格中可以发现什么?能得到什么结论?
三、有如下规则信号道,若信号源输入 1,2,3三个数值中的一个,输出原数字的概率为,输出另外两个数字的概率均为. 现输入 1111,2222,3333 三个信号源的其中一个,输入概率分别为 请计算已知得到结果为 1231,输入的是 1111 的概率(假设信号道传输每个字符独立)。
四、分别是来自总体~,, ~的两个简单随机样本,是的一个无偏估计,具有如下性质:
求满足什么条件时,是的最小方差无偏估计。
五、对于一个时间序列进行模型拟合后,应如何评价所拟合模型的优劣?简述步骤。
六、检验一种产品的装载容量是否为 500ml,用简单随机抽样的方法在产品中抽样进行检验。独立进行了 3 次实验,情况如下表:
1)判断在不同样本下的统计结论,并比较的大小。
2)以第一批样本为例,说明为什么得到你的结论。(假设装袋容量服从正态分布,给定所容忍的第一类错误,给定检验临界值均为2)
七、线性回归模型的随机误差项存在序列相关时,会对统计推断带来什么问题?如何处理?
八、简述概率抽样的误差来源,其中哪些可以通过统计方法量化,哪些无法控制?
2021年真题
一、某高校教务处打算对教师进行教学质量评价,对每个班级的教学质量评价进行回收,现在想查看男、女教师的教学质量评估是否有所差异,有人提出采用直方图进行差异分析,你觉得这种统计图好吗?为什么?如果是你,你会采用什么统计图进行分析?(10分)
二、某种资格证书需要考核甲、乙两种课程,需要同时通过两门课程才能获取资格证书。倘若第一次考试没通过还能进行第二次考试,只有通过了甲课程之后才能进行乙课程的考核,假设小明每次考核甲课程通过的概率都是0.75,每次通过乙课程的概率都是0.5。先假设小明一直考试直到不能考或者获得证书。设X为考试次数,求X的分布律,并且求出获取资格证书的概率。(25分)
三、设为总体X的一组独立同分布,其概率密度函数为
求的矩估计和极大似然估计,并求出它们的均值和方差。具体运用当中,你会选择什么方法进行估计?请说出你的理由。(25分)四、现欲调查某大学学生对于手机依赖症对成绩绩点(GPA)的影响,设自变量手机依赖症为哑变量(X),成绩绩点()为因变量,高考成绩(GK),回归模型如下:
请问随机误差项和手机依赖症(X)有相关性吗?为什么?倘若从该学校抽取500分简单随机样本,参数的最小二乘估计量有没有偏差?你认为该模型有哪些需要改进的研究建议?(25分)五、原始数据,其中一个协方差为,请计算第一主成分解释的方差比例,请简述主成分的思想,因子分析和主成分之间有哪些区别和联系。(25分)
六、 某行业协会想要调查颁布新政策之后,行业内各公司的经营收入情况。现在使用两年前的抽样框对其内的行业公司进行抽样,抽取了4000分样本,进行电子邮件的问卷调查,现在只有50%的公司完成问卷调查,这样做会有怎样的误差?如何进行误差控制?(20分)
七、 设为时间序列模型
设残差项为白噪声,,序列是否为平稳过程?请计算出该序列的自相关系数和的比例。(20分)2022年真题
一、给出了表格,30个学生对学校食堂满意度(0~100分)其中
男生:24,27,36,42,46,47,49,55,57,62,63,63,67,67,69,75,78,79,100 女生:29,28,39,52,58,63,67,72,76,77,85
请问你认为用什么描述统计方法分析合适?通过你可以得到什么样的结论?
二、设二维随机变量(X,Y)的联合密度函数为
确定常数A,并求概率,,
三、设总体X有密度函数
已知 是来自总体的一个样本,证明的矩估计
是的一致估计量
四、采用随机抽样估计某有限总体的均值。总体规模为,样本容量。请分别推导放回简单抽样与不放回简单随机抽样的所有可能样本均值的估计量方差,并进行比较分析。
五、
回归系数 | 标准误差 | |
---|---|---|
截距项 | 2.100 | 0.258 |
价格 | -0.304 | +0.178 |
品牌-华为 | 1.218 | 0.233 |
品牌-苹果 | 2.133 | 0.557 |
有促销 | 1.385 | 0.278 |
品牌-华为*有促销 | -0.327 | 0.067 |
品牌-苹果*没有促销 | 0.419 | 0.141 |
n=500台,因变量为电脑销量(万台),建立自变量价格(万元),品牌(三个水平,华为,苹果,其他),促销(有两个水平,有促销,无促销)的多元线性回归模型。并在模型中考虑了品牌与促销活动的交互效应。
请根据检验结果评估对的影响。要求写出完整的假设检验步骤。
()
六、请问平稳性在时间序列中的意义?请问写出MA(q)模型的完整形式,说明该模型是否平稳,并给出可逆条件。MA(2)模型:
请将其改写成AR模型。
七、已知五个样本点两两间的距离矩阵如下:
用系统聚类法对五个样本点进行聚类,类间距离采用最短距离法,并画出谱系聚类图。
八、在建立多元线性回归模型进行数据分析时,对数据进行“标准化”是一种常用的做法,请问为什么需要进行数据标准化?标准化的具体步骤是什么?请证明标准化回归系数和原始回归系数之间的关系,并阐述如何解读标准化回归系数?
课程推荐
小统微信
扫一扫,添加官方微信号小统,备注考研院校,邀你加入相应院校的交流群:
微信扫码关注该文公众号作者