国际标准期刊号: 2319-7293
陈明
调度中的完工时间优化是一个非常值得研究的课题,死锁的检测和预防是其中的基本问题之一。在本课程所学知识的支持下,开发了一种强化学习方法来解决这一优化难题。通过在 40 个经典的非缓冲基准测试上评估这个 RL 模型,并与其他替代算法进行比较,我们给出了接近最优的结果。