作者jane3031 (珊牛)
看板GO
标题[问题] 想问李世石lphago第四战那一手
时间Fri Jul 20 15:21:47 2018
本身很少在下围棋但很想知道第四战李世石对alphago那一场电脑到底是什麽缺陷?
第78手时alphago预判李世石下那手的机率是0.0007
结果下了以後电脑开始乱下
我的问题是:
1.电脑之所以会乱下是因为机率太低、alphago在那样情况下的棋谱样本不够所以alphago不知道该下哪吗?
2.所以第78手以棋手来看是很笨稳输的一手吗?如果是人类棋手对人类棋手李世石第78手会稳输吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 123.193.9.160
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/GO/M.1532071310.A.FF5.html
※ 编辑: jane3031 (123.193.9.160), 07/20/2018 15:23:24
※ 编辑: jane3031 (123.193.9.160), 07/20/2018 15:24:35
※ 编辑: jane3031 (123.193.9.160), 07/20/2018 15:27:07
1F:推 HeterCompute: 电脑之所以乱下是因为他自认的前几个选点都找不到 07/20 16:41
2F:→ HeterCompute: 好方法,於是开始找一些对方必定得应的地方来维持 07/20 16:42
3F:→ HeterCompute: 胜率,但是那几手全部都是亏的,原来的问题还是无法 07/20 16:42
4F:→ HeterCompute: 解决,所以电脑就看起来像是在乱下导致输棋 07/20 16:43
5F:→ HeterCompute: 而造成的原因确实是因为棋谱样本不够 07/20 16:43
6F:→ HeterCompute: 以人类棋手来看,需要一些时间计算来下出正确着手 07/20 16:44
7F:→ HeterCompute: 强职业可能10分钟就把里面全部看清了,但如果在时间 07/20 16:45
8F:→ HeterCompute: 紧迫的情况下也有可能应对错误,但无论如何都不会像 07/20 16:45
9F:→ HeterCompute: 实战电脑发疯那样惨就是了 07/20 16:45
10F:→ jane3031: 所以如果是面对人类棋手而不是电脑的话是不会下出那样 07/20 17:59
11F:→ jane3031: 的78手吗? 07/20 17:59
12F:→ jane3031: 所以这样评论对吗「这场本应是稳稳的由alphago胜出,但 07/20 18:05
13F:→ jane3031: 李世石靠着人类不会犯的错的电脑漏洞而产生逆转」 07/20 18:05
14F:推 callpolice: 不,不会因为对方是谁就下出怎样的棋步,同样的盘面, 07/20 19:07
15F:→ callpolice: 不论对手是谁,自己想出的最佳解都是一样的 07/20 19:07
16F:→ HeterCompute: 面对人类棋手也会下78手,因为李世石也是选最复杂 07/20 19:07
17F:→ kenwufederer: 对方如果是人类,小李不会这样下 07/20 19:07
18F:→ HeterCompute: 的下,这场也是应该由alphago稳稳胜出 07/20 19:08
19F:→ kenwufederer: 看小李一直忍住不断就觉得心里有需影响 07/20 19:08
20F:→ callpolice: 除非是实力有落差要故意退让 07/20 19:08
21F:→ kenwufederer: 否则对电脑来说,你从第一步就是不成立的 07/20 19:09
22F:→ HeterCompute: 应该说第四盘一开始的策略就是刻意营造出来的,所以 07/20 19:09
23F:→ HeterCompute: 前面对人类不会这样下,不过78手对李世石应该是唯一 07/20 19:09
24F:→ HeterCompute: 一手 07/20 19:10
25F:→ kenwufederer: 靠BUG也是获胜,不会有人去否定那一场的胜利 07/20 19:10
26F:→ callpolice: 所以重点不在於是人还是电脑,而是你知道自己和对手的 07/20 19:10
27F:→ callpolice: 棋力後拟出的策略 07/20 19:10
28F:→ HeterCompute: 人类本来就会因为对手而选择不一样的下法 07/20 19:11
29F:推 ilw4e: 那时候的电脑就是还没完全体,现在版的下几手就会自己投了 07/20 19:47
30F:推 ilw4e: 李那手在电脑意料外原本就算得少,然後又算错就开始崩了 07/20 19:50
31F:推 ddavid: 用人类的说法就是,AlphaGo没排过这个定石或手筋,临场又 07/21 05:30
32F:→ ddavid: 来不及算出来所以爆破了 07/21 05:31
33F:推 ddavid: 至於为什麽爆破後会看起来乱下,我在 #1P_VopGM 有做比较 07/21 05:34
34F:→ ddavid: 详细的解释 07/21 05:34
35F:→ ddavid: 一楼说「找必应的地方来维持胜率」我个人觉得不算是最正确 07/21 05:35
36F:→ ddavid: 的解释,不过以人来解读是一定程度可以那麽解释 07/21 05:37
37F:→ HeterCompute: 楼上是不是搞错了?这篇专门讨论第4局78手 07/21 06:00
38F:推 ddavid: 我并没有搞错啊,那一挖造成的後续诡异下法本来就是这一类 07/21 19:42
39F:→ ddavid: 的问题 07/21 19:42
40F:→ ddavid: 「找必应的地方来维持胜率」这个说法是人为解读过的加料, 07/21 19:42
41F:→ ddavid: 事实上就是「维持胜率」而已,AI并不会特别去想什麽必应不 07/21 19:42
42F:→ ddavid: 必应的,只不过在当下情况,饮鸠止渴的必应手刚好会是最能 07/21 19:44
43F:→ ddavid: 带来「维持现状」假象的下法而已 07/21 19:44
44F:→ ddavid: 胜率暂时掉最少就被视为是目前最佳着手而已 07/21 19:46
45F:→ HeterCompute: 「找必应的地方来维持胜率」只是描述行为结果,也没 07/21 20:30
46F:→ HeterCompute: 加料 07/21 20:31
47F:推 ddavid: 我不是说你真的讲错了,但是这句就是太过人为解读後的结果 07/22 16:50
48F:→ ddavid: 假设有一处着手对方没有必应,但是刚好胜率就跟所谓必应之 07/22 16:51
49F:→ ddavid: 处维持差不多,AI一样会去选择这个着手,它并没有刻意去选 07/22 16:52
50F:→ ddavid: 必应之处 07/22 16:52
51F:→ ddavid: 只是因为下到这种局面很有可能「只剩」必应之处不会太快掉 07/22 16:52
52F:→ ddavid: 胜率,所以才会表现出只下这些地方,因果是相反的 07/22 16:54
53F:推 enjoytbook: 应该说电脑不会打乱局面这种下法,那时候就是被逼到没 07/23 19:15
54F:→ enjoytbook: 琪了却不会认输吧? 07/23 19:15
55F:推 ddavid: 也是理由之一。AI其实并不知道什麽局面复不复杂,所以也没 07/23 19:53
56F:→ ddavid: 有什麽就算胜率低但是复杂乱战的思考方向,它找不出那种人 07/23 19:54
57F:→ ddavid: 类思维中虽然并非最佳着手但可以乱战一拚的胜负手概念 07/23 19:55
58F:推 wadashi1: 3天版的AG Zero跟李世石版对奕已经100盘100连胜 07/24 09:28
59F:→ wadashi1: 是自己对奕而来,并非由李世石版本进化,无版本演进克制问 07/24 09:29
60F:→ wadashi1: 题!是可以讨论第78手,但那也只是曾胜过李世石版的指标! 07/24 09:30
61F:→ wadashi1: 真要研究,相信黄士杰博士早有答案,之前他也说过,Master 07/24 09:32
62F:→ wadashi1: 跟Zero版都已克服这一手的问题,接着下都不会有乱下的状 07/24 09:33
63F:→ wadashi1: 况。真要研究的话,请dp用出变化棋谱可能有些麻烦,但LZ这 07/24 09:34
64F:→ wadashi1: 个免费软体,不知道有没有人拿来试过? 07/24 09:34