数据挖掘过程中常用的操作
数据清洗
合并列表
1 | data_wx = pd.concat([data_kdgd, data_pmsc, data_trn, data_clg]) # 自动填充空列 |
数据内容分割
1 | df['area'].str.split("-", expand=True) # 按照“-”划分,如分割地点“省份-城市” |
异常值处理
1 | #识别空值 |
数据特证名替换
1 | data_salary = pd.concat([data_wx[['salary_clean', 'teacher_type']], |
数据内容替换
1 | data_wx['exp'].unique() # 检查取值空间 |
绘图
1 | #结构化多绘图网格 |
其他
1 | # 工资分析 |