钢笔论坛

标题: 接下去,谁能从Alpha Go身上拿到一局? [打印本页]

作者: 韦伯猫    时间: 2016-3-10 17:14
标题: 接下去,谁能从Alpha Go身上拿到一局?
看起来,貌似接下去,就不是谁输谁赢的问题了,而是,全体人类中,接下去,谁能从Alpha Go身上拿到一局的问题了。

作者: 哥本哈根精神    时间: 2016-3-10 17:56
听说今天李又败了,真是让人唏嘘.今天的还没看,昨天感觉他压力太大,状态不好.
作者: ochl    时间: 2016-3-10 19:26
不知巅峰时期的李昌镐能不能。。
作者: xuexixiaoheiwu    时间: 2016-3-10 20:02
后天继续看。
作者: AresKnight    时间: 2016-3-10 22:41
计算机赢不是很正常的事嘛。。。。
发明计算机就是为了解决人脑计算能力不够的问题啊。。。。。

现在比围棋完全是计算机发展到现在计算能力够用了!!!
如果用当年那台深蓝玩围棋,计算机早就输了,不是超时就是被李打败了
深蓝的计算能力放在今天完全无法支持围棋的算法,
今天一颗主流桌面处理器就超过当年深蓝的计算能力了
算法正确,计算能力足够,计算机没有理由输!!


现在就看算法是不是有漏洞,不然李很难有机会,
还有,如果再压缩时间,或者30秒一手,
那计算机可能无法得到精确计算结果,或无法完成计算,
那样结果可能更加有利于人类,


作者: 公子高    时间: 2016-3-10 23:05
看来真的没人想谈柯洁
作者: ralfes    时间: 2016-3-10 23:23
AresKnight 发表于 2016-3-10 22:41
计算机赢不是很正常的事嘛。。。。
发明计算机就是为了解决人脑计算能力不够的问题啊。。。。。

猫猫我以前学过博弈树的算法(简单入门的那种),如果可以穷举所有路径的话,理论上没人是对手,但是实际上是无论硬件如何发展都不能支持穷举法的,只能递归几层,其他的需要靠算法上的自学习和历史数据的截枝以降低运算的复杂度(和探索的层数是成指数增长的时间和空间开销)。当然深蓝和alpha go那些算法要先进和牛叉很多,alpha go可能是基于google的搜索功能和大数据分析来计算关联矩阵的(比如收集很多以前类似的情景的最优解),就是不断用局部最优解来探索最优的路径。然后根据大数据作为诱导的因子来做为启发因子来截枝(减少探索层级的开销)。如果是这个层面的话,应该是计算机算法上的优化,而不仅仅是靠堆硬件可以解决了。(因为不可能对所有情况穷举,空间和时间上都不可能支持)

作者: nchen    时间: 2016-3-11 12:24
看了2天详细的棋谱,感觉是 Alpha go 最强的地方在于不按定式出牌,完全是自我训练出来的天才。
比如昨天第二局的:
第13手脱先抢中国流连片;
第37手肩冲5路;
中后盘的灵活的弃取转换,等等。

种种迹象表明 Alpha 的大局观超强,招招先手。
为抢先手,在很多地方不惜下出了常人判断下不该脱先或者有点亏损的变化。

真的是时刻『全局在心中』,你要对杀,我能做到计算力比你强;你要围空,我形势判断能力更好。

完全没辙了。估计人类将一胜难求。
力战型棋手完全没戏。均衡型棋手(李昌镐、常昊)在其巅峰期也许可以跟电脑比比。


作者: nchen    时间: 2016-3-11 12:26
Alpha 以后的棋谱将颠覆很多围棋届对现有定式或变化的认知。
人需要从 Alpha 身上学招了。

作者: crossfire    时间: 2016-3-11 12:38
不是说A G可以自己和自己下棋,进而学习促进么。
人自己估计已经不可能赢了,再设计个更高端的战胜A G倒还可行。
作者: ghghgh    时间: 2016-3-11 13:23
       设想一:多台同样的阿法狗,对阵多名棋手组成的一个或多个集团,对每一步,大家意见相同则一步步下,意见有分歧则各执己见,各找各的阿法狗,但面对同一局面,未必每台阿法狗都一个下法,所以有时我们是因为自己集团的意见不同而主动分兵,有时是因为阿法狗集团的意见不同而被动分兵,反正落到一人对一台阿法狗,穷举法使得每个对阵尽量不同,争取把获胜几率显露。
       设想二:一台阿法狗,棋风、沟通合得来的棋手若干人组团与之对阵,有分歧表决采纳多数或以棋力给予加权,如高段位、高积分者一票等于多票,如此得出对策。
       欢迎批评。
      
作者: 江湖少年春衫薄    时间: 2016-3-11 13:29
李世石有翻盘的可能吗?
作者: ruleson    时间: 2016-3-11 14:46
就像段子说的那样,如果在中国下,阿法狗会输,因为连不上服务器,基本上,这不是一个简单的阿法狗,背后还有海量的网络信息和资源做后盾。
阿法狗的脑袋里有海量的棋谱,人脑塞不下海量棋谱。
阿法狗的逻辑运算不会出错(除非算法是错的,目前看,没有这个问题),而人有犯错几率,在这方面,计算机有压倒性优势。
跟阿法狗下棋,相当于跟几千个顶级棋手对弈。人似乎没有神算。
作者: ruleson    时间: 2016-3-11 14:48
ruleson 发表于 2016-3-11 14:46
就像段子说的那样,如果在中国下,阿法狗会输,因为连不上服务器,基本上,这不是一个简单的阿法狗,背后还 ...

自我修正一下: 关于是否需要连服务器的问题,没有求证过。我的意思是,阿法狗的脑袋里,有海量的棋谱和资料,不管是否实时调取,还是预先储存。

作者: 韦伯猫    时间: 2016-3-11 15:15
本帖最后由 韦伯猫 于 2016-3-11 15:16 编辑
ruleson 发表于 2016-3-11 14:46
就像段子说的那样,如果在中国下,阿法狗会输,因为连不上服务器,基本上,这不是一个简单的阿法狗,背后还 ...


你连不上服务器吗?本论坛自称连不上服务器的基本就是按照贴吧新人待遇了
作者: ruleson    时间: 2016-3-11 15:37
韦伯猫 发表于 2016-3-11 15:15
你连不上服务器吗?本论坛自称连不上服务器的基本就是按照贴吧新人待遇了

请参考自我修正的内容。

作者: Yard-O-Led    时间: 2016-3-11 19:25
ruleson 发表于 2016-3-11 14:46
就像段子说的那样,如果在中国下,阿法狗会输,因为连不上服务器,基本上,这不是一个简单的阿法狗,背后还 ...

小弟愚见:如果小弟没有记错,科普是说阿法狗是基于神经网络的程序,其关键是各个网络节点的权重。这个权重是通过无数局棋局优化、调整出来的一组参数,就是一个超大号的矩阵。就是说阿法狗没有记忆任何棋谱,没有存储任何棋局,只需要一台能运行其神经网络的服务器就可以了,不需要额外的存储空间。
至于目前是需要联网,大概是因为运行这个超大规模神经网络程序的服务器没办法做到单台,只能用分布式计算来实现。
请坛子里的高手指点。

作者: 韦伯猫    时间: 2016-3-11 20:10
Yard-O-Led 发表于 2016-3-11 19:25
小弟愚见:如果小弟没有记错,科普是说阿法狗是基于神经网络的程序,其关键是各个网络节点的权重。这个权 ...

google多年前就连语音识别都是必须联网才能实现了。。。。深蓝时代两样,ibm自己是做服务器的,卖的也是服务器。google自己并不做服务器没必要放着自己的计算中心不用而去搞个集装箱搬来搬去,他们的文化就是能在云端解决的绝不在本地解决。不能在云端解决的,那就想办法弄成可以在云端解决。google是极端不喜欢offline的。

另外么,这些连不上网啊,打麻将啊什么的段子真的很low啊我是一点都看不出笑点在哪
作者: Yard-O-Led    时间: 2016-3-11 21:31
韦伯猫 发表于 2016-3-11 20:10
google多年前就连语音识别都是必须联网才能实现了。。。。深蓝时代两样,ibm自己是做服务器的,卖的也是 ...

云才是王道。offline服务器利用效率太低扩展还不方便。
和人参禅修道闭门苦参不如遍历红尘阅人无数有点相似的。

作者: xiaozuei00    时间: 2016-3-11 21:45
Yard-O-Led 发表于 2016-3-11 19:25
小弟愚见:如果小弟没有记错,科普是说阿法狗是基于神经网络的程序,其关键是各个网络节点的权重。这个权 ...

这是一个伪命题吧,实际上阿尔法的储存并不能局限于一个个体的硬件。实际上是很多硬件以及网络的组合体,大家的硬件都不是很高但是连接起来就会变得极高-

作者: Yard-O-Led    时间: 2016-3-11 22:07
xiaozuei00 发表于 2016-3-11 21:45
这是一个伪命题吧,实际上阿尔法的储存并不能局限于一个个体的硬件。实际上是很多硬件以及网络的组合体, ...

还真是。阿尔法需要的硬件是有限的,可以离线。但是这个有限的数目又和某些局域网的硬件数量处于同一量级。

作者: nchen    时间: 2016-3-12 00:30
Alpha 是基于神经网络深度学习的算法,因此不记棋谱。Alpha 采用了分布式记算,所以背后有很多电脑分担计算量。另外 alpha 还使用了 gpu 加强浮点运算的性能。
作者: ralfes    时间: 2016-3-12 00:43
nchen 发表于 2016-3-12 00:30
Alpha 是基于神经网络深度学习的算法,因此不记棋谱。Alpha 采用了分布式记算,所以背后有很多电脑分担计算 ...

你头像的猫猫是你养的吗?好可爱哇

作者: 坦逸凌水    时间: 2016-3-12 00:50
不懂围棋,就阿尔法来说如果算法不出错,学习的棋谱足够多,估计按已有的下法赢的概率不大。
人脑能在古今的棋谱里面发现学习的知识会不会比机器多呢。如果打赢了阿尔法,阿尔法会在自我学习程序继续学习,再赢就更不容易了。
我就想知道研发阿尔法发明算法的人懂不懂围棋,是仅仅把围棋规则当做训练模式,棋谱当输入直接训练的么。
作者: 坦逸凌水    时间: 2016-3-12 00:58
nchen 发表于 2016-3-12 00:30
Alpha 是基于神经网络深度学习的算法,因此不记棋谱。Alpha 采用了分布式记算,所以背后有很多电脑分担计算 ...

没做过分布式,分布式的瓶颈是不是在mapreduce那块?那样的话电脑数量也会有限制。这么看阿尔法主要靠的是云计算喽。忽然想到炮姐妹妹。。有点出戏。。




作者: ralfes    时间: 2016-3-12 10:19
比起alphago我觉得更有价值的是google开放了第二代自学习系统TensorFlow,并开源。如果自己改良,应用于量化交易系统,应该是挺有用的。喜欢谷歌是因为它总是将技术贡献于改善人类生活品质的事业,不像某果,某软那样。
作者: ralfes    时间: 2016-3-12 10:33
https://storage.googleapis.com/d ... nd-mastering-go.pdf
作者: charismandrew    时间: 2016-3-14 12:36
有个想法,既然阿法狗的优势除了计算还有学习能力,以后每人一只阿法狗,分别单独调教,然后放入斗兽场厮杀如何?哈哈。
作者: xiaozuei00    时间: 2016-3-14 15:29
Yard-O-Led 发表于 2016-3-11 22:07
还真是。阿尔法需要的硬件是有限的,可以离线。但是这个有限的数目又和某些局域网的硬件数量处于同一量级 ...

感觉阿尔法其实就是P2P的更高级版本,或者类似于优酷路由宝。你的高级电脑或者处理器当他属于闲置状态下,那我短暂租借用来做我的事情,其支付款则是我的服务器使用权限,以互相租借的方式形成庞大的网络最终达到所谓的云端计算机。看了下报道说是咱们中国的银河三号一小时还是一天的运行成本大概20万到40万,阿尔法的运行成本只要6000就够了。第一次知道原来电脑运行也要这么贵。

作者: konvmi    时间: 2016-3-14 17:19
xiaozuei00 发表于 2016-3-14 15:29
感觉阿尔法其实就是P2P的更高级版本,或者类似于优酷路由宝。你的高级电脑或者处理器当他属于闲置状态下 ...

租用和买断的区别。

作者: ralfes    时间: 2016-3-14 17:55
xiaozuei00 发表于 2016-3-14 15:29
感觉阿尔法其实就是P2P的更高级版本,或者类似于优酷路由宝。你的高级电脑或者处理器当他属于闲置状态下 ...

27楼有算法的文献。

作者: nchen    时间: 2016-3-14 20:09
ralfes 发表于 2016-3-12 10:33
https://storage.googleapis.com/deepmind-data/assets/papers/deepmind-mastering-go.pdf

资料不错

作者: nchen    时间: 2016-3-14 20:09
ralfes 发表于 2016-3-12 00:43
你头像的猫猫是你养的吗?好可爱哇

哈哈,是网上随便找的~

作者: 冰是睡了的水    时间: 2016-3-15 19:01
马上就要输了
作者: 冰是睡了的水    时间: 2016-3-15 19:02
科普是说阿法狗是基于神经网络的程序
作者: 冰是睡了的水    时间: 2016-3-15 19:02
其关键是各个网络节点的权重。这个权重是通过无数局棋局优化、调整出来的一组参数,就是一个超大号的矩阵。就是说阿法狗没有记忆任何棋谱,没有存储任何棋局,只需要一台能运行其神经网络的服务器就可以了,不需要额外的存储空间。
作者: 冰是睡了的水    时间: 2016-3-15 23:36
现在就看算法是不是有漏洞,不然李很难有机会
作者: romanstart    时间: 2016-3-17 03:53
阿法狗的技术很强大。预强更强。
作者: nchen    时间: 2016-3-17 09:14
别说 alpha 了,昨天我对阵天顶围棋(Zen), 输…
作者: romanstart    时间: 2016-3-19 10:32
狗狗遇强更强。
作者: 羽暘    时间: 2016-4-2 22:42
第四局挖一手,看的好激动
作者: YZW    时间: 2016-4-2 23:52
3000万个棋谱构成的数据库,人类每走一步,就立刻开启搜索引擎,将所有的可能性算干算尽。不能说一定赢不了。到这样的概率实在太小太小。有人说,机器的智能化是人赋予的,所以它永远无法战胜人类,其实AlphaGo积聚了多少人的心血与智慧,用它来对付一个个体的,受感情影响的,有血有肉的人,人类又怎能有十足的胜算呢?




欢迎光临 钢笔论坛 (http://penbbs.com/) Powered by Discuz! X3.2