盖世汽车讯 从机器人技术、医学再到政治学,各个领域都在尝试训练人工智能系统做出各种有意义的决策。例如,在拥堵的城市中使用AI系统智能控制交通,可以帮助驾车者更快到达目的地,同时提高安全性或可持续性。
然而,教AI系统做出正确的决策并非易事。这些AI决策系统的基础是强化学习模型,当被训练执行的任务出现哪怕很小的变化时,它们仍然经常失败。以交通为例,一个模型可能难以控制一组交叉路口。
据外媒报道,为了提高强化学习模型的可靠性,以应对具有可变性的复杂任务,麻省理工学院的研究人员引入一种更有效的算法来训练它们。
该算法策略性选择最佳任务来训练AI代理,以使其能够有效执行相关任务集合中的所有任务。在进行交通信号控制的情况下,每个任务可以是任务空间中的一个交叉口。
通过关注最有益于算法整体有效性的少数交叉路口,该方法可以充分提高性能,同时保持低训练成本。研究人员发现,在一系列仿真任务中,这种技术比标准方法的效率高5-50倍。这有助于该算法以更快的方式学习更好的解决方案,最终提高AI代理的性能。研究人员Cathy Wu表示:“通过跳出框框思考,使用非常简单的算法,我们看到惊人的性能提升。社区更可能采用不太复杂的算法,因为它更容易实施,也更容易被其他人理解。”
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。