不就是调试几个数值,有这么麻烦吗?况且,阿尔法零内部嵌套的又不是什么太过深奥的程序。
这类学习类围棋机器人的核心代码,虽然在外界看来是机密的存在,但在内行人眼里,只不过是几个自学程序的优化叠加罢了。
“比赛开始!”
终于,阿尔法零被调教好了,程诺正襟危坐在棋桌上,而对面坐着的是阿尔法零的一位开发者,由他来代替阿尔法零和程诺在棋牌上下棋。
程诺先手。
不用犹豫,程诺率先占据棋盘最中央。
阿尔法零紧随其后,白棋落在程诺黑子左侧位置。
啪嗒~!啪嗒~!
前十几手,程诺不急不慢的落子。
而阿尔法零由于运算速度比程诺要快,每次落子,只需要一到两秒的时间。
半个小时后……
棋盘上的战争开始变得白热化。
每次落子的时间,不只是程诺,连阿尔法零都变得久了起来。
阿尔法零的算法,并不是通过预测对手后几手,或者后几十手的落子,来进行计算最佳策略,而是通过一个叫做“局面评估器”的东西,构建价值网络。
辅之以落子选择器,经过复杂的计算后,得出获胜概率最大的落子选择。
也就是说,阿尔法零想着是怎么去赢,而并非对手怎么去下!
程诺现在的情况也异常难受。
在阿尔法零的步步紧逼之下,场上的局面对程诺已经非常不利。
无论他用小迷你华国流,宇宙流,都被阿尔法零以凌厉的姿态化解。
一个小时后,程诺在整体局面上已经完全陷入劣势。
“看来只能用出那一招了!”
出来吧,奥义-双四劫循环!
程诺默念一句,啪啪啪的落子。
赢已经没多大可能,如此,那只能尽量把这盘棋变成和棋。那还有的打。
十手之后,程诺进双四劫循环构造完毕。
一个四劫循环的话,阿尔法零或许还能稍微让一下,但一下子就是两个,程诺肯定,以阿尔法零内部的算法,这次绝对会和程诺继续纠缠下去。
“和棋!”
见程诺和阿尔法零在这两个四劫循环上纠缠了一个多小时还没有结果,裁判果断叫了声和棋。
按照比赛规则,由于是淘汰赛,和棋之后,还需要再赛,直至分出胜负。
程诺VS阿尔法零第二局:和棋!
第三局:和棋!
第四局:和棋!