引言:精益六西格玛黑带培训首要成本分析(principal components)
精益六西格玛黑带培训首要成本分析(principal components)
一、使用该命令可以帮助理解数据结构或构成少数不相关量。
二、对话框内容。
1、variables:输入需包含在分析中的变量栏。
2、Number of components to compute:输入需提取的主要成分数量,如未指定成分数量且有P个变量被选择,则P个主要成分将被提取,如P过大,则只需排在前面几个。
3、Type of metrix
A、correlation:用相关矩阵计算主要成分。如果需将变量标准化,需使用相关矩阵。
B、Covariance:用协方差矩阵计算主要成分。如不需对变量进行标准化。
三、主要成分分析例:
某人口学家记录了14个地区的人口状况,项目包括总人口、受教育水平中值、总工作人数、工作于健康服务社区的人数及家庭数量中值,数据如下表,他想确认数据结构而进行了首要成分分析,因为测量尺度差异,他使用相关矩阵来将数据进行标准化处理。
主要成分分析流程如下:
1、选择“stat>multivate>principal components”
2、在出现的对话框输入下图所示信息。

3、点击“groups”按钮,在出现的对话框选择下图所示信息。
4、minitab任务视窗输出如下图:
5、minitab图形视窗输出如下图
6、结果分析
从输出可以看出,第一个主要成分变差为3.0289,占总变差的60.6%,对主要成分的解释是主观的,但可看出明显的模式,可以将主要成分解释为总人口、受教育水平、工作人数和在健康服务社区工作的人数等,因为这些项目的符号相同且值都不接近0.第2个主要成分的变差为1.29111,占数据总编差的25.8%,该值是用PC2中所列的系数从原始数据计算而来,成分可以解释为受教育水平和家庭值得水平对比。前两个主要成分代表了总变差的86.4%,前三个主要成分代表了总变差的97.8%,因此,绝大多数数据结构可被2-3个主要成分来解释,其余成分占变差的很小一部分比例,因此是不重要的。从特征值图上可以得出类似的结论。
一、使用该命令可以帮助理解数据结构或构成少数不相关量。
二、对话框内容。
1、variables:输入需包含在分析中的变量栏。
2、Number of components to compute:输入需提取的主要成分数量,如未指定成分数量且有P个变量被选择,则P个主要成分将被提取,如P过大,则只需排在前面几个。
3、Type of metrix
A、correlation:用相关矩阵计算主要成分。如果需将变量标准化,需使用相关矩阵。
B、Covariance:用协方差矩阵计算主要成分。如不需对变量进行标准化。
三、主要成分分析例:
某人口学家记录了14个地区的人口状况,项目包括总人口、受教育水平中值、总工作人数、工作于健康服务社区的人数及家庭数量中值,数据如下表,他想确认数据结构而进行了首要成分分析,因为测量尺度差异,他使用相关矩阵来将数据进行标准化处理。
People | School | Employ | Health | home |
5.935 1.523 2.599 4.009 4.687 8.044 2.766 6.538 6.451 3.314 3.777 1.530 2.768 6.585 |
14.2 13.1 12.7 15.2 14.7 15.6 13.3 17.0 12.9 12.2 13.0 13.8 13.6 14.9 |
2.265 0.597 1.237 1.649 2.312 3.641 1.244 2.618 3.147 1.606 2.119 0.798 1.336 2.763 |
2.27 0.75 1.11 0.81 2.50 4.51 1.03 2.39 5.52 2.18 2.83 0.84 1.75 1.91 |
2.91 2.62 1.72 3.02 2.22 2.36 1.97 1.85 2.01 1.82 1.80 4.25 2.64 3.17 |
主要成分分析流程如下:
1、选择“stat>multivate>principal components”
2、在出现的对话框输入下图所示信息。

3、点击“groups”按钮,在出现的对话框选择下图所示信息。

4、minitab任务视窗输出如下图:

5、minitab图形视窗输出如下图

6、结果分析
从输出可以看出,第一个主要成分变差为3.0289,占总变差的60.6%,对主要成分的解释是主观的,但可看出明显的模式,可以将主要成分解释为总人口、受教育水平、工作人数和在健康服务社区工作的人数等,因为这些项目的符号相同且值都不接近0.第2个主要成分的变差为1.29111,占数据总编差的25.8%,该值是用PC2中所列的系数从原始数据计算而来,成分可以解释为受教育水平和家庭值得水平对比。前两个主要成分代表了总变差的86.4%,前三个主要成分代表了总变差的97.8%,因此,绝大多数数据结构可被2-3个主要成分来解释,其余成分占变差的很小一部分比例,因此是不重要的。从特征值图上可以得出类似的结论。
相关热词:精益六西格玛黑带培训