SPSS Modeler(Clementine)的类型节点
1、范围 用于描述数值,例如0–100或0.75–1.25的范围。范围值可以是整数、实数或日期/时间。离散 用于字符串值,当确切数量的非重复值未知时。这是一个未实例化的数据类型,这意味着关于数据的台仵瑕噤存储和使用的所有可能信息尚不清楚。读取数据后,类型将是flag、set或typeless,具体取决于在stream properties对话框中指定的最大集合大小。标志用于具有两个不同值的数据,例如Yes和No或1和2。数据可以表示为文本、整数、实数或日期/时间。注:日期/时间指三种类型的存储:时间、日期或时间戳。集用于描述具有多个不同值的数据,每个值都被视为一个集合的成员,例如small/medium/large。在这个版本的Clementine中,集合可以有任何存储数字、字符串或日期/时间。请注意,将类型设置为Set不会自动将值更改为string。有序集合用于描述具有多个具有内在顺序的不同值的数据。例如,可以将薪资类别或满意度排名键入有序集。有序集的顺序由其元素的自然排序顺序定义。例如,1、3、5是一组整数的默认排序顺序,而HIGH、LOW、NORMAL(按字母顺序升序)是一组字符串的顺序。有序集类型使您能够将一组分类数据定义为序数数据,以便进行可视化、模型构建(C5.0,C&R树,两步),并导出到其他将序数数据识别为不同类型的应用程序(如SPSS)。可以在任何可以使用集合字段的地方使用有序集合字段。此外,任何存储类型(实数、整数、字符串、日期、时间等)的字段都可以定义为有序集。无类型用于不符合上述任何类型的数据,或用于成员过多的集合类型。对于类型为包含多个成员(如帐号)的集合的情况,它很有用。为字段选择“无类型”时,角色将自动设置为“无”。集合的默认最大大小为250个唯一值。此数字可以在“流属性”对话框中调整或禁用。
