偏差是6西格玛抽样收集到的数据与整个母体或动态流程在本质上有差异。未察觉的偏差会影响你对问题或流程的理解和结论。这儿有几种抽样偏差的例子:
.是6西格玛方便的抽样:收集数据只因它容易取得。例如:因为每天午后打徉前的20分钟生意清淡,所以只在这个时候收集数据,如此一来生意忙碌的数据便被忽略—也许那会是全然不同的数据;
.是6西格玛判断式抽样:凭经验猜测哪些人与事可以代表你的流程。例如:只调查在上次调查中显示顾客满意度高的人。
较好的抽样策略—比较能避免偏差,包括:
.是6西格玛系统化抽样:我们建议多数的企业使用此法。
对流程做有系统的取样,所指的是在一定的时间间隔取得数据样本(每半小时或每20件)。但请留意:要确保你的系统化抽样并不等同于某些会误导数据的隐藏模式。例 如:从每10件保险理赔申请案中抽查一件,很可能意味着你每次拿到的都是同一位职员在同一台电脑上审核的申请案件,因而忽略了其他职员和电脑;
.是6西格玛随机抽样:随机指的是母体或流程的每一项都有同等的机会被选出参与计算。随机挑选数据有其挑战性,但至少数据中没有无意识的偏见或隐藏模式。多数的随机抽样是利用电脑从要调查的项目中随意选出;
.分层抽样:假设你的公司有一个1万名顾客的数据库,而你的工作是调查某个抽样以决定顾客满意状况,这时该对1万名顾客的意见都一视同仁吗?答案也许是“不”。了解最大顾客和最可靠顾客的需求和感受,比去找出往来只有一次的顾客的想法重要多了(如果你想拓展市场份额,情况就刚好相反,你也许得了解如何让难得光顾的顾客变成常客)。
母体或流程的结构如果有类似的情况, 你便可作出分层的抽样计划—进行随机或系统化抽样。在顾客满意度的案例中,也许是把1万名顾客分成4群:常见大户、常见 小户、不常见的新户,以及流失的客户。而后你可以利用不同的作法在每一群中随机取样,也许每5个常见大户取一户,对所有流失的顾客则是只取几户就够了。 分层抽样可以避免那些由于数据取自代表性不够完整的大型母体而出现的差距。