作者ill1983 (ill1983)
看板Tech_Job
标题[心得] ChatGPT and DS 数学问问
时间Tue Jan 28 19:48:09 2025
想不到他们都有一样的错误跟逻辑脉络呢~
deepseek是我中午看到别人测试,我从网路抓下来的图。ChatGPT是我刚刚拿第二只手机
测试的。
後面的故事耐人寻味啊
https://i.imgur.com/w2sdwx0.jpeg
https://i.imgur.com/uJ3sGrB.jpeg
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 42.73.64.120 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Tech_Job/M.1738064891.A.0D0.html
1F:嘘 tgyhuj01 : 这举例惨不忍睹 111.71.30.221 01/28 19:55
2F:推 zaiter : 开启r1就不一样了 114.35.101.56 01/28 19:59
4F:→ zaiter : qcdPlj7.jpg 114.35.101.56 01/28 19:59
6F:→ ill1983 : 可惜来不及注册r1,不然我也想试试 42.73.64.120 01/28 20:03
8F:推 yueayase : 延伸Lexicographic order看看? 114.47.75.222 01/28 21:30
9F:→ Aquarius126 : 这个吵很久了,就问法的问题 101.9.137.18 01/28 21:58
11F:嘘 AxelGod : 真的是废文 111.71.80.74 01/28 23:03
13F:推 newasus : 刚刚试R1,是对的但太话捞,GPT是错 42.77.154.162 01/29 00:16
14F:→ newasus : 的 42.77.154.162 01/29 00:16
19F:推 CoNsTaR : 如果是版本号的话这逻辑没错啊 223.23.193.166 01/29 00:44
20F:推 CoNsTaR : r1 要和 o1 比才公平吧 223.23.193.166 01/29 00:48
21F:推 s8952889 : ds r1要对标o1,o1的回答是对的且完 36.227.78.92 01/29 02:44
22F:→ s8952889 : 整(不过花1分钟左右),甚至o1mini 36.227.78.92 01/29 02:44
23F:→ s8952889 : 也对而且只要1秒 36.227.78.92 01/29 02:44
26F:嘘 straggler7 : 又来了 36.229.35.179 01/29 06:36
27F:→ ert0700 : 还是先教会那些模型大小跟加减乘除 223.138.36.96 01/29 10:50
28F:→ ert0700 : 的意义吧,明显不懂大小跟减法关联 223.138.36.96 01/29 10:50
29F:推 EasyVinus : 如果是版本,不会用‘大’这个词形 111.249.75.76 01/29 12:14
30F:→ EasyVinus : 容 111.249.75.76 01/29 12:14
31F:→ EasyVinus : 不要连中文基本语法都ooxx 111.249.75.76 01/29 12:14
32F:嘘 NexusPrime : 我问ChatGPT 是 3.9 > 3.11 49.229.180.140 01/29 12:51
33F:嘘 jhangyu : 栅栏坏了 101.9.131.231 01/29 14:15
35F:推 MVPkobe : 老梗错误了 早期很多模型都有这种 42.72.87.167 01/30 16:16
36F:→ MVPkobe : 错,chatgpt3.5 ,o1回答正确,cha 42.72.87.167 01/30 16:16
37F:→ MVPkobe : tgpt4o错误 42.72.87.167 01/30 16:16