工业过程中产生的数据大都属于时间序列数据,描述了不同变量随时间的变化情况。可以用以分析工业过程中部件,设备,系统等的不同特性。

工业过程如化工过程,传统能源动力过程中产生的数据在大部分时间下呈平稳状态。而新能源如风光的出力则波动情况较大,因此对新能源出力的预测是一件比较有意义的事。

而传统的火电气电已经比较成熟,我们更关注的是对已有机组的优化。时序数据可以用来分析机理复杂部分的特性,可以用于预测来更好地配置控制策略,同时结合机理知识可以建立更加准确的模型,用于监控以及做各种实验。

时序数据发展较成熟的方法有模式表示,相似性度量,聚类,分类,异常点检测,预测等。

其中时序预测因机器学习,深度学习的大火而发展迅速。根据笔者经验,多变量小数据集使用GBDT较好,复杂系统使用简单的深度学习就够用了,在文本翻译,图像识别等领域较火的seq2seq,transformer等复杂模型效果并不好。当然具体情况具体分析。要注意的是,在建立预测模型时,要以机理为主,机理不够清晰的地方再使用数据驱动方法。这样不仅能有效提高精度,还可以提高模型的可解释性和泛化能力,毕竟工业过程不像车牌识别那样对错误结果的容忍度高。