势均力敌?呃...这只是因为你没有用到主成分分析

    发布日期:2022-05-06 10:04阅读:

    主成分分析法

      主成分分析法即PCA(Principal Component Analysis),由名字就可以看出来,这是一个挑重点分析的方法。主成分分析,是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法,又称主分量分

      在实际生活中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映所关心问题的某些信息。

    为了加深了解,下面举个例子

      假如你是一家公司的HR,你需要从很多申请者中挑选出最佳的候选人。不妨假设1000个人中,挑选出一个人。这个是一项十分具有挑战性的工作,虽然你可能已经把范围缩小到十个人,但是这十个人各有千秋,难分伯仲,你很难决定。这时候你想起了数学,既然我选不出来,就让数学去选吧。于是,你拿起笔开始给每一个人打分,分了七八个指标,比如学历,实习经历,领导力,沟通能力等等。

      但是你卡在了最后一步,每个人都有七八个分数,把这七八个分整合成一个分数难住了你。你本来想的是给每一个指标一个权重,加起来求和就可以了,但是你又想到如果主观地给权重,我还要用数学搞这一套干嘛。怎么才能客观地给一个权重呢?这时候主成分分析就出场了。因为这十个人实力十分接近,所以给的权重要尽量得把这十个人区分开来。这和高考一样,高考命题的其中一个目的就是把学生区分开来。而恰恰主成分分析就是构建一个新变量(第一主成分),并且使得这个新变量的方差达到最大。于是你利用主成分分析,很快搞了一套权重,然后得到每个人的分数,一目了然。

      需要指出的是,主成分分析可不知道什么是学历,什么是领导力,所以这个结果一定是客观的,而且使得每个人的分数尽量区分开来,但是这个新指标的表现究竟怎么样呢?举一个极端的情况,这七八个指标是独立的,在这种情况下使用主成分分析,结果会告诉你,哪个指标变化最大用哪个作为新指标(第一主成分)。也就是说其他六七个指标完全没用到(当然如果其他指标都保持不变的话,确实没有任何作用),这样做好像让人不太能接受,你不能因为这个指标变化大就让这个指标权重就大甚至为1。

      所以我们需要衡量这个(第一)主成分的表现情况。主成分的方差与总的方差的比值可以作为评价指数,这个比值总是介于0和1之间,越接近于1说明(第一)主成分包含总的变化就越多,直观地说,等同于包含的有用信息就越多。比值等于1时,(第一)主成分已经包含所有的有用信息,是一个“最理想”的(第一)主成分。

      当然现实往往与理想不同,对于实际问题,很难构造一个“最理想的”主成分。而且评价(第一)主成分的标准也因具体而异,比如对于某些问题90%以上才可能接受,但是对于另外一些问题,10%以上就十分理想了。需要注意,虽然评价无统一标准,但大多数情况,变量越多,评价标准就越低。

没有找到您需要的服务与信息?

请留下您的具体需求,我们将立刻安排相关领域的专业人士与您联系; 或者您也可以致电我们: 025-5275 8185 [工作日09:00-18:30]