|
1、数据收集
此次在线英才薪资调查,被测试者不需填写姓名,系统只将e-mail地址做为唯一识别号,这就减小了被测试者的作弊动机,并且通过技术手段,三层筛选,确保同一回答者不能回答同一问卷两次及更多次。
2、数据处理和分析
a. 前期数据修整
◎年薪原始数据修正
if 年薪<=月薪 or 年薪<=6×月薪, then 年薪=12×月薪
按年薪升序排序,剔除年薪<=500元的数据。
◎剔除少量缺失数据
考虑到样本容量已经足够大,剔除少量数据对分析结果的精度影响微乎其微,并为了利于处理,以下数据不在处理范围内。
| 任职时间 |
7个 |
| 职务类别 |
15个 |
| 担任现职务时间 |
21个 |
| 城市 |
10个 |
| 现单位性质 |
11个 |
| 性别 |
58个 |
| 年龄 |
25个 |
|
◎根据年薪的分布情况,截取数据
由于年薪明显呈右偏分布,均值明显受极值影响(方差很大),截取3%-98%之间的数据,确保剩余数据能涵盖95%回答者的薪金状况,且众数和中位数值不变,并消除极值的影响(如年薪为7,000,000--恶意数据)
b. 样本容量确定
通过对原始数据的修整和截取,此次分析的样本容量为36,291,年薪大于200,000元的回答者的数据另做高薪者分析。如果此次调查数据通过简单随机抽样取得,则所得分析结果精度可达到99.98%,月平均薪金估计误差小于50元人民币。
c. 统计分析
采用简单描述统计和分层交叉分析,得出网民的薪金概况和各层次网民的薪金水平。由于国外的同行业的薪金水平明显高于中国大陆,而本次薪金调查主要针对于中国大陆各行业的雇员,除分城市薪金分析外的其他分层分析,薪金分析结果均以中国大陆的薪金水平为准。
d. 建立CHR指数
通过建立CHR薪金指数TM,使统计结果更为简洁,更具可比性,并可根据不同时间收集的数据进行薪金对比和时间序列分析,看出各城市,各行业,各职务,甚至不同性别之间的薪金动态变化及趋势走向。
|