首页 > 资讯列表 > 科技资讯 >> 互联网

专访杜悦:胜率仅10%,我为什么还要挑战扑AI

互联网 2017-03-31 08:00:13 转载来源: 聚焦

(图注:杜悦,常春藤资本合伙人,前人人网副总裁,2016年WSOP(World Series of Poker,世界扑克系列赛)金手链获得者。)出品网易「聚焦」栏目组作者贺树龙4月6日至10日,杜悦要率领五位华人扑克高手在海南挑战来自美国卡内基梅隆大学的扑人工智能Libratus(下译为“冷扑大师”)

(图注:杜悦,常春藤资本合伙人,前人人网副总裁,2016WSOPWorld Series of Poker,世界扑克系列赛)金手链获得者。)

出品网易「聚焦」栏目组

作者贺树龙

46日至10日,杜悦要率领五位华人扑克高手在海南挑战来自美国卡内基梅隆大学的扑人工智能Libratus(下译为“冷扑大师”)。面对战绩斐然、所向披靡的冷扑大师,杜悦会重复李世石输给AlphaGo的故事,还是能够找到机器的弱点、捍卫人类牌手的尊严?

在这场扑人机大战开幕之前,网易科技独家专访了杜悦,他详细介绍了自己接受挑战的原因,也坦承胜率或许只有10%。不管杜悦最终能否战胜冷扑大师AI时代的到来已不可避免,我们,只能投身其中。

杜悦遇上李开复

两年前的一天,杜悦和太太在加州滑雪。期间,杜悦花费很多时间研究美国顶尖扑克手的打牌视频。

“你这么痴迷德州扑克,你的水平到底怎么样?”太太问他。

“我觉得我好像是世界级的。”杜悦笑着回答。

为什么有这样的判断?”

“因为我的预测和顶尖高手的实际出牌完全一样。”

太太觉得杜悦在吹牛,因为杜悦的才能过去一直展现在商业和投资上(他有清华本科和硕士学位、斯坦福大学MBA学位,曾任人人网副总裁,现任常春藤资本合伙人),德州扑克只是他的业余爱好,他甚至从来没有参加过正规的扑克大赛。

直到2016年杜悦第一次参加扑界的顶级赛事WSOP,太太才改变了对他的看法。

20167月,杜悦首次在拉斯维加斯参加WSOP,一路杀到决赛,出人意料夺下冠军,赢得金手链,他花费5000美金买入的筹码也随之变成了80万美元(约合535万人民币)。

一个业余的扑手凭什么能拿到顶级荣耀?杜悦的答案是――热爱和专注,当然,也需要那么一些运气。

拿到金手链之后,扑在杜悦的生活中扮演起了更重要的角色。他成立了一个名叫“杜氏学堂”的扑高级研修班,还发起了扑“龙之队”――旨在以团队互助的方式,帮助华人扑克选手征战世界顶级德州扑克赛场。

一个月前,杜悦和创新工场的李开复在三亚的一个活动上相遇。李开复是卡内基梅隆大学的博士。2016基梅隆大学Tuomas Sandholm教授开发了一个打扑克的程序Claudico但在与人类牌手的比赛中惨败,这Libratus的前身2017年,LibratusSandholm教授和他的学生Noam Brown开发完成,对战水平迅速提升,在与四位美国职业玩家的比赛中获得完胜。


母校研发的Libratus逐渐风起,让李开复有了把人机大战引进国内的想法,他想引发更多关于人工智能未来创新及产业发展的讨论。当然,这与创新工场在这一领域的布局有关――不久之前,他们刚刚宣布成立人工智能工程院,一个针对AIArtificial Intelligence,人工智能)创业的早期投资孵化机构。

“你是目前在国内生活和居住的唯一金手链获得者,有没有兴趣一起参与这个事情?”李开复问杜悦。

两人一拍即合。

胜率只有10%

“挑战冷扑大师,你认为自己的胜率有多大?

10%左右,不会超过20%。”杜悦这样回答网易科技记者的提问,他说:“冷扑大师的出牌全部基于科学的计算,它就像一个内力极其深厚、可以把自己立于不败之地的顶级大师。而且,冷扑大师永远理性,不能保持头脑冷静却是人类选手的最大缺陷。

德州扑克起源于美国德克萨斯州洛布斯镇,是一个技巧性非常强的游戏。要想成为德扑赢家,运气、耐性、毅力和智慧一个都不能少。在杜悦看来,玩德扑最应具备的素质还是理性,他说:“德扑有很多运气成分,但长远来看是公平的;德扑有很大的技术含量,但顶尖高手的技术水平差距并不大;与运气和技术相比,理性是最重要的一点,玩德扑比较忌讳心态失衡、情绪不稳定。”

杜悦当年在清华大学读的是计算机系,对他而言,玩德扑就像做计算,是在四个变量的作用中求最优的过程,这四个变量分别是:对自身牌力的评估、对对手牌力的评估、对桌面位置的评估、对筹码深度的评估。

越复杂的游戏,人越容易出错,而机器的优势越明显。去年3月,谷歌旗下的围棋人工智能程序AlphaGo和围棋世界冠军、职业九段选手李世石的人机大战吸引了全世界的关注,AlphaGo最终以41完胜李世石。到了年底,AlphaGo伪装成Master,再次横扫整个围棋界。

在杜悦看来,AI一旦能够战胜人类顶级玩家,就证明它的理论和模型是对的,在成熟的AI面前,“人类没有丝毫的胜算”。

不过,扑和围棋略有不同。围棋是“完全信息博弈”,AI可以了解到对手的所有走棋信息;扑是“不完全信息博弈”,AI看不到对手手里的牌、也无法准确预测对手的筹码策略。一个好的扑玩家,会根据出牌的序列、对手的风格、对手的位置和筹码深度等等因素来反推对手手中的牌,从而精确计算各自的胜率。对于AI来说,要想模仿类似的思考分析能力难度并不小。

简言之,冷扑大师AlphaGo虽然都是AI程序,但特点并不一样。杜悦认为,在AlphaGo面前没有机会的人类,在冷扑大师面前或许还有一些胜算。去年李世石赢过一次AlphaGo,不少人认为是因为李世石触发了AlphaGo的一个BUG。这次,“龙之队”战胜冷扑大师的机会,在杜悦看来,或许会因为运气,或许会因为他们能找到冷扑大师的弱点。

“科学是无边界的,今天的AI虽然还没有达到巅峰,但我们人类选手已经感觉不可企及。”杜悦说,未来一定是属于AI的。

AI到来不可避免

“既然胜算不大,为何还要挑战冷扑大师

杜悦说:“虽然冷扑大师是目前扑界的最强AI,但考虑到扑的不完全信息博弈特征,冷扑大师究竟能不能彻底玩转这个游戏,我们还有一点疑问。”除了想检验冷扑大师的真实实力究竟如何之外,杜悦挑战AI还想让更多的人了解扑、了解“龙之队”。

“龙之队”里,除了杜悦,还有许朝军、张淮、童舟、朱亚希、王天建等华人扑高手。许朝军是点点网、啪啪创始人兼CEO,曾任盛大在线COO、千橡互动副总裁、搜狐技术总监等;张淮长期在IT公司担任CTOCIO职位;童舟是北京千山剧影视传媒有限公司董事长兼总经理;朱亚希就职于咨询公司,在EPTACOPWPT等赛事中均获过奖;王天建是中扑网创始人,德堡扑克战队创始人,2013年亚洲杯中国冠军队队长。

龙之队的主要成员均来自创业圈和投资圈,这并不意外,长期以来,扑深受创投人士喜爱。杜悦说,这是因为玩扑和做投资、做企业很像。首先,它们要求的素质一致――一手牌就像一个项目,什么时候该全进、什么时候该退出、什么时候该控制风险,这些考虑都要基于将来的回报;在投资和创业时,往往没有太多机会可以让人细致的思考和复盘,而扑可以,“如果每一手牌都在锤炼你的基本素质,那自然而然会养成很多好的习惯”;最后,业余时间打扑也是一种交友的方式。

但是如果AI大行其道,那些职业的人类围棋手、扑手还有必要再把这些游戏当做自己终身奉献的事业吗?

杜悦告诉记者,大家必须弄清楚,龙之队和冷扑大师的对战形式是一对一,也就是单挑,最后计算累计成绩。在现实生活中,扑是多人游戏,而眼下的AI还玩不转多人形式。“跟单挑相比,多人游戏在计算复杂度上不是一个量级的,而是指数级的增长。所以,在可预见的未来,我们应该不会看到最顶尖的机器人在多人桌上出现。”

不管是AlphaGo还是冷扑大师,在今天更像是AI的一个象征。科学家想通过它们告诉世界:如果AI可以下围棋、玩扑,像人类一样思考,那么未来就会无所不能。不远的将来,AI或许会取代司机、工人、快递员、收银员、保安等等基础职业,也许还会危及医生、教师、律师、作家、工程师的饭碗。到那一天,人类何去何从?

“人工智能的到来不可避免。人机共存时代,人类会和机器互相帮助,也会互相竞争。”杜悦说,“龙之队和冷扑大师的对战很有可能会成为一个具有历史意义的事件,能参与其中我很荣幸。

标签: 专访 杜悦 胜率 为什么 还要 挑战 AI


声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持