名义(Nominal)变量:又叫无序列别变量,比如性别:男/女
有序(Ordinal):又叫有序类别变量,比如收入划分为:低/中/高
度量(Scale):又叫连续性变量,比如具体工资收入金额
特征分析和处理
- 名义变量:One-Hot编码。比如,两个变量采用10和01的形式来编码,三个变量采用100、010和001的形式,以此类推
- 有序变量:按照因变量影响由小到大的顺序编码为1、2、3,…。比如,收入低中高编码为1、2、3,以此类推
- 度量变量:为了防止结果受某些值较大的属性的影响一般需要进行标准化处理。比如,Z-Score标准化,Max-Min标准化等
关于数据分析与人工智能的更多内容,欢迎到作者主页查看~