请联系Telegram电报飞机号:@hg4123

人类与阿尔法狗的博弈方式《 < 》人类与阿尔法狗的博弈方式是什么

2024-09-11 9:50:39 足球心水 鹿问柳

大家好,今天小编关注到一个比较有意思的话题,就是关于人类与阿尔法狗的博弈方式的问题,于是小编就整理了2个相关介绍人类与阿尔法狗的博弈方式的解答,让我们一起看看吧。

柯洁落败阿尔法狗,除了围棋,人工智能的打牌技术又是怎样的呢?

国际上比较受关注的人工智能打牌有两个:德州扑克以及桥牌。这两个项目很有技术含量,2017年人工智能顶级会议NIPS上的最佳论文,不是Deepmind终结各种棋类的AlphaZero,而是德州扑克1V1战胜人类的Libratus(冷扑大师)。桥牌人工智能的水平还比较低。

打牌时,一般各家的牌是互相看不见的,所以叫“非完全信息博弈”,比“完全信息”的棋类难度高。开发打牌机器人用的技术,与开发下棋机器人用的不一样。例如Libratus就没有用现在十分流行的深度学习与神经网络技术,而是用较为传统的优化算法(当然也很专业)。

人类与阿尔法狗的博弈方式《 < 》人类与阿尔法狗的博弈方式是什么

在德州扑克上,人工智能解决了1V1(机器与1个人类对战)。2017年1月30日,CMU开发的 Libratus击败了四位人类顶级职业扑克玩家。比赛共打了 20 天,四人分别对战Libratus,玩了12 万手,最终AI令人信服地取得了统计性的压倒胜利。

上图是四位人类玩家与Libratus每天的收益表,人类越输越多。Libratus还曾经到中国(新闻中名为“冷扑大师”)与中国“龙之队”对战,中国玩家输得更多。

德州扑克更常见的玩法是多人在一张桌上混战,比1V1更为复杂。这方面人工智能学界还需要开发,但预计没有本质的困难。

另一个在西方比较受关注的扑克类竞技项目是桥牌,这也是中国体育总局明确纳入体育竞技项目的唯一扑克类,各级别的智力运动会都有桥牌项目。桥牌项目是四人打,分成两边对抗,需要两个同伴相互配合。

在桥牌项目上,人工智能也有了一些进展,在国际流行的BBO桥牌网,中国的新睿桥牌网上,都有机器人自动打牌。但是从目前的技术水平来说,机器人打桥牌的技术还不行,经常作出令人哭笑不得的打法。打桥牌需要更多的逻辑与概率思考,比德州有更多的逻辑,而且需要两边配合,理解同伴与对手的行为,对人工智能还是相当有挑战性的。

目前桥牌人工智能对于确定性的局面,能够给出确定性的答案,如四家牌明了,最佳攻防结果是什么,牌手们都相信机器给出的结果。但是桥牌的精髓正好是不确定性,攻防双方需要在不确定性的概率里找到最佳方案。在只看到自己牌的叫牌阶段,如何达到最佳定约,非常复杂,人工智能还没有很好的开发方向。

德州扑克,是世界上奖金最多的竞技项目(世界冠军奖金上千万美元,职业玩家收入也很高)。桥牌是智力游戏里牌类的代表。人工智能在这两个项目上还需要新的技术突破,特别是桥牌。至于其它牌类,如斗地主、80分之类的,甚至麻将,技术含量要低很多,不会是研究热点。

人工智能打败围棋顶尖棋手也就这两年的事,侧面说明围棋的复杂程度是其它任何棋牌都没法相提并论的。所以你就会明白这些公司为什么没开发一个阿发牌出来,因为他们不屑于搞这个,没挑战性,QQ游戏那个程度足以。

如果假设两台条件完全相同的AI,进行围棋博弈,结果会是什么?

两台完全相同的AI,在重申一次两台完全相同的AI。结果很简单,不是平局,而是一胜一负。原因是刚开始的时候双方套路一样,但通过不断的深度学习,两台AI会出现不同的拐角。例如两个双胞胎兄弟,父母有意对他们进行一模一样的教育,吃穿住行。但长大后性格和智商还是不一样。当然AI和人不一样,但经过多年甚至很多年的深度学习后肯定会出现拐角的。这个是肯定的,毋庸置疑的。

假设人工智能已经穷尽所有围棋路数。我认为两者结果完全根据贴目规则决定。以目前主流的七目半规则,贴目后是白棋必胜。

围棋规则里有贴目的规则,从无到有,且一直是先走的黑棋需要贴目。

贴目规则在现代社会能进行大数据统计后,也经历了多次更改。

2002年之前,通用规则为贴五目半,那时统计了1998年到2002的一万盘对局,黑棋胜率为53%左右,所以2003开始,国际规则改为黑棋贴六目半。此时黑棋胜率为50.78%,比较公平了,但黑棋胜率依然超过一半。17年前,著名围棋比赛应氏杯开始使用黑贴8点,与我国实行多年的三又四分之三子一样,也就是贴7目半,从此开始,日韩棋手普遍愿意选择白棋,因为实行时间较短,需要更多时间进行验证。

假设谷歌公司的最新款阿尔法元穷尽了所有算法。以目前我们有数据统计来看,图中显示六目半规则下,黑棋胜率高过50%,七目半则白棋占优势。因为人工智能永远不会失误,如果没有贴目,毫无疑问,黑棋必胜。如果开始贴目,无论是五目半,六目半,都是黑棋必胜。七目半则是白棋必胜。

但因为贴目规则的存在,才让同实力人工智能比赛有了悬念。

围棋目数能拆分成最小的单位是有极限的。所以无论何种规则,都有一方是必胜的。比如说六目半偏向黑方,则黑方必胜。七目半偏向白方,则白方必胜。一切胜负,在随机抽取黑白棋谁先走的时候,就已经决定。除非能贴7.273681566目这种。

正因为这样,两个人工智能不知疲惫的下棋到一定盘数时,就能为人类贴目规则提供指导性参考意见了。

我围棋下的不好,人工智能也不精通,只是从概率和逻辑分析一下。

欢迎关注我哦~

到此,以上就是小编对于人类与阿尔法狗的博弈方式的问题就介绍到这了,希望介绍关于人类与阿尔法狗的博弈方式的2点解答对大家有用。