这里有必要了解连续性数据与离散性数据间的差异,因为此差异影响你怎样界定你的测量、如何收集你的数据,以及你可以从中学到些什么。此差异也会影响数据的抽样以及分析的方法。
有时,这两种测量之间的差异似乎有点让人迷惑不解,因此,我们尽可能地把规则定得清楚些:
.6西格玛连续测量,指那些能够被 “无限可除”的计数和连续性测量者,比如时间 (时、分、秒)、高度(英尺、英寸、几分之几英寸)、音量(分贝)、温度 (度数)、电阻 (欧姆)和金钱 (美元、日元、欧元和几分)。
.6西格玛离散测量,指那些能归成独特、个别或不重叠类别的项目。例如飞机机型、汽车的款式、信用卡的种类。离散测量包括人为的记数,比如调查时使用的评级制度,让被调查人对某产品或服务给出1-5的等级。离散测量有时被称为属性测量,因为它们测量的是那些单项和事件的特性或属性,从而使它们有别于不同特性和属性的事物:顾客是男还是女?送货的时间准时还是迟到?地址正确还是有误?
其中一个让人搞混的地方是,有时离散数据会显示连续的形式。比方说,你发现37.81%的顾客年龄在67一70岁之间。不因为有了十进位和数字就表示有了连续的数据。你计算的是分享单一特性或属性的人:这群顾客属于年龄66一70岁这个类别,另外62.19%显然属于其他不同的年龄层。
这里有个快速检验的方法可区别离散和连续测量。试想“测量单位”— 也就是被测量的东西— 然后自问“半个这个东西”能否说得通?如果能,那就是连续测量;如果不能,就是离散测量。
第二个容易让人搞混的地方是,有些6西格玛项目能用连续的计数来测量的有时却是 用离散的计数来测量。例如,我们可以用“准时”或“迟到”(离散类)来计算货送到的时间,而不是以日、时、分、秒 (连续类)来计算。在许多汽车的驾驶 “仪表板”上,会用警告灯来告诉你油压太低或没问题,而不是用显示连续数据的油压表。图表9一1提供了一些离散和连续数据的范例,以及连续数据如何转换为离散数据。

离散数据的概念很重要,因为6西格玛绩效就是建立在对缺陷的测量上 (通常是离散性数据),或者是测量哪些被改为离散类的项目 (如瑕疵)。一般情况下,连续数据比较受欢迎,因为它会让流程的真正波动无所循形。
另一方面,如果从连续数据开始,那么你只要把连续数据与一些均值或基准—“凡低于50就是缺陷”或 “凡营业收人少于50万美元的顾客就是小企业”—进行比较,就一定可以将连续数据转换成离散数据。反之,如果你从离散数据开始,通常不可能转换成连续数据。然而,6西格玛离散数据确有一定的优势。
以下是一些6西格玛离散数据的优缺点。
6西格玛离散数据的优点
.易于收集。收集离散数据通常比收集连续数据要容易得多,快得多,因为你所测量的是符合标准还是不符合,考试及格了还是不及格,人们是喜欢还是不喜欢这部电影。许多业务流程之所以成立就是为了自动记录离散的数据,如地点 (国、州、市、街)、顾客类型 (新顾客或常客、个人用户或商业用户)、产品数和产品状况 (破损/未破损)。
.易于解释。用连续的计数难以衡量的无形因素,常常可以改变为离散的计数,如顾客满意度的调查就可以转换为有形的1 -5级的 “顾客态度”。
.易于决定6西格玛绩效层级。6西格玛计算告诉我们,在顾客要求内的缺陷品有多少— 这是个属性的测量 (在规格内或超过规格、可以接受或瑕疵品)。
6西格玛离散数据的缺点
.有失精确。比较一下,是把手放在你的额头说:“你发烧了”的医生还是用温度计量你的体温后说你的体温是38摄氏度的医生更可信?连续数据比离散数据更准确,如果你有足够的时间和资源,最好是获得连续数据。
.需要收集更多的数据。解释离散数据基本上是要找出数据类别的模式,因此,你需要用许多数据才能准确判断某个模式是否存在。例如,即使是使用简单的工具,如排列图或直方图,都需要有50或100个数据点。反之, 使用基于连续数据的工具—如直方图或走势图—只要几个数据点便可对其进行解释。更多数据的需求会分散数据的收集工作。
流程愈接近6西格玛—也就是你的做法在每百万次机会中只有少于50或60个缺陷时—光是为了找出缺陷就得收集大量的数据。
.错过重要信息的可能性增加。由于6西格玛离散数据属于“是或否”的性质,因此会隐藏有关产品或服务的重要细节信息。

