建立台区线损率预测模型
更新日期:2022-02-24     浏览次数:89
核心提示:1)缺失值填充:缺失值填充可以使用固定值、均值、中位数、众数、上下条数据和插值法等方法,也可以采用k 最邻近算法选择比较接近的样本进行填补。根

1)缺失值填充:缺失值填充可以使用固定值、均值、中位数、众数、上下条数据和插值法等方法,也可以采用k 最邻近算法选择比较接近的样本进行填补。根据业务理解选用不同方法填充,如供电量使用台区1-12月平均供电量填充,台区编号、变压器容量使用上下条相同的数据填充。

2)无效数据剔除:剔除不适合建模的数据、重复的数据、异常值等,如供电量、售电量为零或负数的的数据;如线损率大于100%的数据。

3)数据转换处理:中文名称、电压等级转换为机器可以识别的离散分类变量,投运时间和采集时间为时间变量,需要将时间变量编码为分类变量。