新的XOT方法是与佐治亚理工学院和华东师范大学合作开发的。他们将强化学习和蒙特卡洛树搜索(MCTS)相结合,这两种技术以其在复杂决策中的有效性而闻名。
研究人员说,这些技术结合在一起可以使语言模型有效地概括未知问题。研究人员对各种具有挑战性的任务进行了试验,如24人游戏、8拼图和口袋魔方。取得了令人印象深刻的结果。XOT在解决阻碍其他方法的问题方面已经超越了同时代人。然而,这种优越性并非没有局限性。尽管该系统取得了进步,但它还没有达到100%的可靠性。
微软资讯推荐
win10系统推荐
系统教程推荐