Re: [問卦] gemin的錯誤跟反應都比GPT差，為什麼

時間Mon Dec 15 23:23:02 2025

※ 引述《Sam27 (Sam)》之銘言： : 要看做哪些事情 : 要生活推理，要聊天GPT還是輾壓，Gemini幻覺比GPT重說幻覺，各家都會有。各有千秋啦。昨天問如果把暖被桌的被子掀起來放桌上，能提高室內溫度嗎？ GPT跟Gemini跟Claude都跟我說會發生火災，很緊張地警告我不要這樣做。說萬一被子不小心從桌面上掉下來，碰到桌子的電熱器，就會燒起來喔！！！有一家還把頁面名稱取為「危險行為比較分析」=_= ……大家如果看過小叮噹或日本動漫或實際用過暖被桌就知道，被子要能碰到桌子裡面中央的電熱器有難度。如果不是人故意抓去碰，根本很難會碰到。結果這一題只有Grok說沒有火災風險： =============================== 掀開被子堆在桌上，雖然不穩定，但只要沒直接蓋到發熱器上，風險不一定比正常使用高。 =============================== Grok查找資訊能力果然不錯。有時候也要看剛好AI實例挑了什麼回答，上述例子也許換個頁面問又都不一樣。 : 要學術討論，我覺得大概一半一半 : 要拿來國高中大學研究所的課業輔導，Gemini算很夠用 : 還可以很快速丟Youtube影片總結 : 要寫程式應該還是Claude，Google現在整合到最新出的IDE : Antigravity除了有Gemini，還有Claude的模型!!! : 同樣20美金，Google給6個帳號還送2TB，還送八成的Claude : 想不到有什理由不用Gemini 好少人提到Claude，Claude Sonnet 4.5也很會回答生活問題喔不過他有時候會用python格式回答，很有趣(其他家AI看了都會讚嘆一下)。例如以下這樣： pythonclass UncertaintyAwareAI: def answer(self, question): # 生成多個候選答案 candidates = self.generate_multiple(question, n=10) # 評估一致性 consistency = self.measure_agreement(candidates) # 評估每個答案的證據強度 evidence_scores = [] for ans in candidates: score = self.count_supporting_facts(ans) evidence_scores.append(score) # 計算整體確信度 confidence = self.compute_confidence( consistency, evidence_scores ) # 根據確信度決定回應方式 if confidence > 0.8: return f"答案是{best_answer}" elif confidence > 0.5: return f"可能是{best_answer},但我不太確定" else: return "我不知道,因為[具體原因]" --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 146.70.76.182 (日本) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/Gossiping/M.1765812185.A.B98.html

本網站已依台灣網站內容分級規定處理。此區域為限制級，未滿十八歲者不得瀏覽。

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Gossiping 板

Re: [問卦] gemin的錯誤跟反應都比GPT差，為什麼

熱門看板

贊助商連結