作者stayfool (fool)
看板DataScience
标题[问题] 如何用机器学习制作特殊用途的词向量
时间Sun Apr 24 17:25:35 2022
作业系统: win10
问题类别: ML
使用工具: python
问题内容:
栏位结构如右,[(类别,原因),(资料,频率)],举例如下,
[(食物,购买),(汉堡,10次),(米饭,5次),(牙刷,2次)]
[(食物,不吃),(牙刷,10次),(米饭,5次),(青菜,2次)]
要如何把「食物」这个单词作成向量,
当食物跟购买 一起出现时,食物跟汉堡 相似度最高
当食物跟不吃 一起出现时,食物跟牙刷 相似度最高
用Apriori 或 FP growth 能作出来吗? 或是其它方式才能作? 该如何作?
求解,谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.160.205.52 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1650792337.A.21E.html
1F:→ chang1248w: 你要不要全部拿出来一次问一问 04/24 19:31
2F:嘘 chang1248w: embedding 的做法很多,看你爽用哪一个就用哪一个 04/24 19:49
3F:嘘 chang1248w: 有了frequency pattern 要找彼此之间的conditional 04/24 19:56
4F:→ chang1248w: probability 就是小菜一碟,会这样问代表你求关键字 04/24 19:56
5F:→ chang1248w: 回去以後根本没做功课。 04/24 19:56
6F:→ ddavid: frequent pattern mining / association rule 04/24 20:47
7F:→ ddavid: 可见上次给你关键字,你根本没去了解 04/24 20:47
8F:→ stayfool: 我查了FP的资料,范例是2个词、3个词以上,一起出现 04/24 20:51
9F:→ stayfool: 的频率,例如食物跟汉堡一起出现10次,FP就可处理问题 04/24 20:53
10F:→ stayfool: 我是ML新手,不知道在某条件下的frequency pattern 04/24 20:57
11F:→ stayfool: 该如何作?因为给定的条件跟出现频率无关,条件只出现1次 04/24 21:00
12F:→ stayfool: 例如购买是条件,食物碰到购买会和汉堡相似 04/24 21:03
13F:→ stayfool: 衣服碰到购买,也许会和透气相似,这种情况下 04/24 21:05
14F:→ stayfool: 该如何作出词向量,想不出来,才再次发文请教 04/24 21:07
15F:嘘 chang1248w: 太好了,新关键字条件机率 04/24 22:28
16F:→ ddavid: 你是不是没发现 fp 的後面还有另一个关键字 association 04/27 21:34
17F:→ ddavid: rule XD 04/27 21:34
18F:→ ddavid: 然後你这目标性,看起来并不是要做词向量啊 04/27 21:36
19F:→ ddavid: 你可以明确说看看拿了词向量要怎麽用吗,你期待一个词向量 04/27 21:37
20F:→ ddavid: 在 A 情况跟一个词向量 X 距离近,在 B 情况却又要能跟另 04/27 21:38
21F:→ ddavid: 一个词向量 Y 接近? 04/27 21:38
22F:→ diabolica: 要问几次 05/01 01:47
23F:推 hsuchengmath: 可以查查contractive learning, 在同个阵列的物件 05/01 05:51
24F:→ hsuchengmath: 他们互为正样本,在另一个阵列的物件 他们互为负 05/01 05:51
25F:→ hsuchengmath: 样本,这种训练方式也适用於few shot learning, 就 05/01 05:51
26F:→ hsuchengmath: 提点到这了xdd 05/01 05:51