说到钢铁生产,你最先想到的是什么画面
黑漆漆的矿石,还是红彤彤的铁水?
总之不会是AI代替人类指挥生产的画面
因为鲜有人把AI用到过钢铁生产过程中
更不用说有决策能力的AI啦
然而,有一个中国教授带领的团队
正在用国际前沿基础研究成果改变画风
推出了无需大动干戈就能部署的强化学习智能决策系统
这门技术是随着AlphaGo和AlphaStar战胜人类顶级棋手/玩家而闻名于世的
南京大学的俞扬教授团队先于国外研究者做到了将强化学习在现实生产中的落地
越是人类carry不动全场的复杂任务
越适合用强化学习勇攀高峰
钢铁生产工艺繁复、环环相扣、耗能巨大
如果能从从原料端开始就提高效率和品质、摸索降低能耗的方法
将是一件非常有意义的事
于是就有了智能决策系统自动控制烧结工艺中加水环节的“神操作”
以前的方式是工人通过观察烧结矿水分含量决定是否调整加水量、怎么调整
虽然很多钢企也用上了水分仪这类感知技术产品,但整个判断主要还是凭经验
凭经验操作很难保持准确和稳定,这点想必人人都有感触
新手没有经验的情况下更是控制不好
但这些经验、判断、控制,通通会影响到品质、产量等等
当我们知道智能决策能够超越人类经验的时候,不妨一试
所以智能决策系统如何针对烧结加水这个任务做出最优决策呢
有点像做菜的时候边加盐边尝味道,最终找到最合适的加盐量
智能决策系统学习处理任务的动作,并根据环境反馈判断动作效果的好坏
但不能让它在真实的生产环境中尝试,必须避免大规模调参带来的扰动
所以要先造出一个仿真环境,准确地说是从历史数据中还原出生产决策环境
要知道生产环境可不是轻易能仿出来的
这也是俞教授团队最厉害的地方之一
然后系统通过与仿真环境的交互找到最合适的加水量和调整时机
历史数据中是有一些经验可供系统学习的,但如果只学到经验就不能说是决策寻优
系统已经具备了站在有限数据的“肩膀”上看得更远、做得更多、收益更大的能力
这是俞教授团队另一个厉害之处啦
一顿操作下来,智能决策系统就根据生产需要自动完成烧结加水的任务咯
优质的烧结矿吭哧吭哧被输送到下一个环节的同时,能源和原料的浪费也减少了
这还只是一个画风改变的例子
刚刚看到某北方城市因为空气质量不佳对钢企采取限产措施
全流程的节能降碳优化,强化学习智能决策系统也能胜任
同样是先通过历史数据还原出用能生产环境构建一个用于寻找节能减碳最优策略的仿真环境
系统在这个环境里自主学习控制设备
在一个工人有限的职业生涯中,他最多能对设备进行多少次控制操作,也许没有人数过
但系统学会控制设备并找到最佳控制方案只需要几天时间
在这几天里,系统尝试了亿万次的推演
是人一辈子也做不到的量级
并且系统能综合考虑影响能耗和排放的各种变量以及变量间相互的关系
服务于长远的节能减碳目标
生产调度也是可以使用强化学习智能决策系统的一个方向
针对供需预测和生产节奏建立仿真环境
通过策略学习和优化
找到更好的资源调度、货物调度、运输调度策略
帮助钢企向智能化生产运营再靠近一步
畅想未来,无限可能
当老工业风钢企遇上未来科技风决策AI
尽情共舞,不在话下