作者stayfool (fool)
看板DataScience
標題[問題] 機器學習向量空間一對多的表示方法?
時間Tue Nov 22 15:15:42 2022
作業系統:win10
問題類別:ML
使用工具::python,tensorflow
問題內容:
有A , B 兩個空間,A空間的1個元素會對應到B空間的多個元素,
例如A空間有一元素叫作水果,會對應到B空間的荔枝、香蕉、芭樂等元素,
要訓練機器將荔枝、香蕉、芭樂等等元素看過後(B空間的水果元素當作訓練集),
然後輸入某個水果,假設輸入西瓜,西瓜是不在B空間的水果元素當作測試集,
讓機器能夠判斷西瓜跟香蕉、芭樂等元素相似,會輸出"水果"這個答案,
想要輸入荔枝、香蕉、芭樂等各種水果元素
機器能回應"水果",該怎麼作?該找哪方面的資料?請各位大大提點,謝謝
PS: 水果元素只是舉例,並不是真的要讓機器看水果圖片,
訓練資料都是文字,沒有圖片
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.160.217.64 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1669101344.A.CC9.html
1F:推 yiche: 測試資料如果沒在training時被模型看過,卻希望模型能準確 11/22 17:21
2F:→ yiche: 識別分類,整個難度會上升很多 11/22 17:21
3F:→ yiche: 因為是文字資料seq2seq 是可以考慮的 11/22 17:21
4F:→ yiche: 另外不清楚是不是有multi-label的情況,有的話要注意不是一 11/22 17:21
5F:→ yiche: 般multi-class的分類問題。 11/22 17:21
6F:→ lycantrope: a一下作者 可以省下不少時間 11/22 17:59
7F:→ yoyololicon: 生成模型有一些概念類似你想做的事 11/23 20:10
8F:→ yoyololicon: 也許你可以換個方向思考 11/23 20:10
9F:→ chang1248w: 佛渡有緣人 11/24 21:26
10F:→ chang1248w: 這不就是word embedding 在做的目標嗎 11/24 21:27
11F:→ chang1248w: 把bert的結構用contractive learning的角度想一遍 11/24 21:27
12F:→ chang1248w: 只要A集是已決定的,剩下好說 11/24 21:28
13F:→ chang1248w: 寒酸一點詞袋也不是不行做 11/24 21:29
14F:→ chang1248w: 比較有意思的是要怎麼把B分群之後,定出有代表性的屬 11/24 21:30
15F:→ chang1248w: 性當作A的。標籤 11/24 21:30
16F:推 hsuchengmath: 讓bert 預測 水果 荔枝 是不是同一類,bert應該能tr 11/28 15:00
17F:→ hsuchengmath: ansfer 學習到其他 類別的對應 預測 11/28 15:00
18F:推 OnePiecePR: 很像 word2vec 12/12 15:39