作者claymath (ヽ(‵・ω・′)ゝ)
看板MenTalk
标题[闲聊] 最近用LLM
时间Wed Jan 7 23:05:00 2026
最近刚好一段时间同时在用 Gemini 跟 GPT,本来想说算了也没什麽好写的,但 Gemini 用久了真的会让人忍不住想记录一下,算是自我疗伤。
先讲清楚,我不是什麽模型分析派,也没在算参数量,我就是一个实际坐在那边跟它聊天、然後一直被打断的人。
Gemini 给我的最大感想不是它笨,
是它很不可靠。
那种不可靠不是「答错题」,而是你永远不知道下一句它还是不是同一个人格。
有时候你们聊得好好的,它下一轮突然失忆;
同一句话重问三次,它可以给你三种完全不同宇宙观的答案;
更烦的是,有时你会开始怀疑是不是自己中文退步,不然怎麽会被理解成那样。
用到後面真的会出现一个念头:
「靠北,现在是我在用模型,还是模型在训练我?」
你会开始修正自己讲话方式、调整提示、避开某些说法,最後发现不是你要答案,是你在配合它的情绪。
然後还有 session 问题。
那个对话连续性真的很迷,有时像是还在同一串,有时又像直接换了一个模型接手,前面讲的东西当没发生过。
可能是系统还有bug 常常卡一半後面就中断
再後来就资料整串不见
整体感觉就是:
算力很大,但心智状态很飘。
反观 GPT,我不会说它多神,但至少它给人的感觉是「同一个人从头跟你聊到尾」。
它也会答错,但错得很合理;
它也会卡,但会告诉你它卡在哪;
你不太会有那种「我现在到底在跟谁讲话?」的困惑。
当然 GPT 免费版额度是真的很抠,有时聊到一半被砍也很烦,但老实说我比较能接受「我被限制」,而不是「我被乱搞」。
就是 你是有明确知道限制的状态
gpt 对齐问题跟理解问题能力还是高出Gemini一级
亏我当时以为跟其他人团了3250/6人份的gemini可以高枕无忧
结果我只是找了一个新进员工
他产出我还要前後看很多次
不过好在一年份下来才541 没花多少钱
但整个成效 比gpt降版本的模型还差了一截
Gpt整体感觉像是你还有一个大脑帮你想全面性的问题…整体感差很多
-----
Sent from JPTT on my iPhone
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.226.198.43 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/MenTalk/M.1767798304.A.E55.html
1F:推 yggyygy: 绝们奶真的烂到没资格站上同一个平台讨论 01/08 10:46
2F:→ yggyygy: 微软那个还好一点点 01/08 10:47
3F:推 freshguy: 我不知道用AI要怎麽帮我工作…我只会用来问资料性的问题 01/09 00:03
4F:→ freshguy: ,偶尔生图玩或是叫他写诗文 01/09 00:03
5F:→ freshguy: 能不能跟我说花钱买算力要算什麽? 01/09 00:04
6F:→ takomalu: 我用Gemini 帮我翻游戏字串 好像比ChatGPT 通俗一点 Cha 01/09 10:24
7F:→ takomalu: tGPT 有时候翻出来很硬 明明要求台湾通俗的口语 01/09 10:24
8F:推 heartlock: Gemini的设计者可能患有ASD,创造出如ASD思考逻辑的AI 01/11 02:21
9F:推 lazybr: 最近知道有个Grok可以玩 01/11 14:30
10F:→ KasmirLo: Gemini当生图器玩就好 01/11 18:39