文章目录

如果需要预测房价,就要考虑什么因素可能会影响房价,综合这些可能影响房价的因素作为自变量,房价作为因变量。这些影响房价的因素,如房子位置、面积、户型、朝向、楼层、周边医疗、学校、交通等因素分别对房价的影响大小不同。在使用线性回归或逻辑回归模型预估房价时,这些影响房价的因素就是特征,如何选择特征,对特征进行预处理,如连续值特征离散化、离散特征编码,特征组合,生成中间特征等,属于特征工程的范畴。

特征工程体现对业务的理解深度,对业务熟悉、熟练特征工程技巧,才有可能训练出好模型。下面思维导图是特征工程一般流程和技巧。

文章目录