热门搜索词：安卓APP MySQL Javaweb 三维建模机械手施工组织建筑结构单片机

在不具备人类知识的前提下掌握围棋

来源：doc163.com 资料编号：DC25042 文件类型：资料等级： %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9ADC25042

以下是资料介绍,如需要完整的请充值下载.
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.仅供学习参考之用.
密惠保帮助中心

资料介绍：

在不具备人类知识的前提下掌握围棋(中文14800字,英文PDF)
摘要
人工智能的一个长期目标是建立在具有挑战性的领域中学习、从tabula rasa开始和获得超人能力的算法。最近，AlphaGo成为第一个在围棋比赛中击败世界冠军的程序。AlphaGo中的搜索树评估位置并使用深度神经网络选择移动步。这些神经网络是通过从人类专家动作中进行监督学习和从自我演练中强化学习来训练的。在这里，我们提出了一种完全基于强化学习的算法，它不需要人的数据、指导或者超出游戏规则领域的知识。AlphaGo成为自己的老师：神经网络被训练来预测AlphaGo自己的移动选择，以及AlphaGo游戏的胜者。该神经网络提高了树搜索的优势，在下一次迭代中提高了移动选择的质量并加强了自我训练的能力。从tabula rasa开始，我们的新程序AlphaGo实现了超人的表现，以100比0战胜了先前打败了冠军的AlphaGo的版本。
[资料来源：Doc163.com]

[来源：http://Doc163.com]

以上是资料介绍,如需要完整的请充值下载

上一篇：干涉辅助光谱拟合法用于薄膜厚度的精确测定

下一篇：关于高铁列车-桥梁系统的动力相互作用的理论研究和应用

在不具备人类知识的前提下掌握围棋

相关内容：