作者MARKMARK (馬克)
看板Soft_Job
標題[討論] AI評論魯肉飯會不會很難...
時間Mon Mar 30 06:38:39 2026
https://ithelp.ithome.com.tw/m/questions/10220070
看到有人做了一個魯肉飯評論器
覺得蠻有趣的..
畢竟我自己也蠻喜歡吃的
不過魯肉飯都長一個樣
AI要區分感覺挺難的
很多細節差異,像是肥瘦比例
醬汁顏色、肉燥顆粒大小、油亮程度,甚至配菜等等..
現在的視覺模型不曉得能不能辨別?或是需要fine-tuning,或重新訓練?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.79.37.3 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1774823922.A.EFC.html
1F:→ DrTech: 看要做到多準而已吧。技術都有。不過很多人半桶水而已,例 03/30 08:35
2F:→ DrTech: 如這個連結,文字相似度用CLIP?如果是 OpenAI 版本的CLIP 03/30 08:35
3F:→ DrTech: ,不支援中文。很多人跟本亂用。 03/30 08:35
4F:→ DrTech: 用import clip 根本搞笑。OpenAI版本的CLIP完全看不懂中文 03/30 08:40
5F:→ DrTech: 。 03/30 08:40
6F:→ DrTech: 這就是我常說的,claude寫的程式碼很有效率。但專業領域一 03/30 08:44
7F:→ DrTech: 直很爛,日常工作很難用。連CLIP不支持中文都不知道,亂套 03/30 08:44
8F:→ DrTech: 。然後一堆外行人,還以為自己程式是對的,覺得很好用。 03/30 08:44
9F:→ MARKMARK: 看了一下,這個工具用的CLIP好像是圖對圖的KNN比對,我 03/30 09:23
10F:→ MARKMARK: 對這塊比較沒研究 03/30 09:23
11F:→ DrTech: 對喔,對店家照片。不過CLIP本身就沒有對店家照片這種資料 03/30 10:17
12F:→ DrTech: 做訓練,embedding出來,幾乎純亂數,算相似度也沒意義。 03/30 10:17
13F:→ DrTech: 真的要這樣搞。dinov2, dinov3這種學通用特徵的模型比較適 03/30 10:19
14F:→ DrTech: 合。 03/30 10:19
15F:→ Firstshadow: 真不愧是D大...連滷肉飯都懂 03/30 11:14
16F:推 holypiggy: 除非訓練資料也都是用同個裝置拍 不然色調那些就無法 03/30 12:40
17F:→ holypiggy: 校正了吧 03/30 12:40
18F:→ MARKMARK: 看作者說照片是自己吃飯拍的,感覺資料量不足 03/30 13:12
19F:推 kurtsgm: 直接用通用LLM丟個照片說"看起來好不好吃"感覺都還準些 03/30 13:47
20F:→ kurtsgm: 我剛剛做了實驗 直接丟幾張滷肉飯進去讓gemini 挑... 03/30 13:50
21F:→ kurtsgm: 還真的挑出那張我覺得看起來最好吃的 03/30 13:50
22F:推 viper9709: 用照片感覺不準吧... 03/30 17:08
23F:→ MARKMARK: 晚上剛好吃魯肉飯順便來試試 03/30 20:36
24F:推 RINPE: 沒有髒地板和胖大叔我可不吃 04/01 08:27
25F:推 ssadow: 我沒接串接API,只是單純丟文章的圖給ChatGPT問評價 04/02 14:27
26F:→ ssadow: 結果AI分析是肉燥飯不是滷肉飯,以評論來說算有參考性的 04/02 14:27
27F:→ MARKMARK: 跟滷肉飯的特徵相比,判斷哪一家店感覺很難 04/02 16:03