作者FantasyChopi (Fantasy_Chopin)
看板Python
标题[问题] 多个list项目取交集
时间Tue Nov 8 23:49:55 2022
譬如有个list的资料是:
list=[[a,b,c,d],[b,c],[a,c,e],[b,c,f]]
则各项目的交集有
[c](*4)
[b](*3)
[b,c](*3)
[a,c](*2)
想请教板上的大大
若是想用python找出上面的资讯
要如何操作呢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.240.133.22 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1667922597.A.BCA.html
1F:→ tzouandy2818: 用set()吧11/09 00:49
2F:→ venomsoul: 如果list下面的每个sub list内的元素都是不重复的话,11/09 09:21
3F:→ venomsoul: 遍历每个sub list然後把每个元素当作key放进另一个dic11/09 09:21
4F:→ venomsoul: tionary,value就从1开始count,每次遇到就让他+1,如11/09 09:21
5F:→ venomsoul: 果每个sub list的element会重复出现就先取set,以上最11/09 09:21
6F:→ venomsoul: 基本办法11/09 09:21
不好意思 我有点看不太懂 可以请问详细的程式码要怎麽打吗
7F:→ lycantrope: 先把list of list转list of set後就用set取交集11/09 09:52
8F:推 kikicheng: 直觉是用Apriori 但不知道是否会杀鸡焉用牛刀~11/09 10:57
10F:→ kikicheng: 取length就可以达到你要的结果11/09 10:58
请问他里面的antecedent跟consequents是在同一笔交易里的先後顺序吗 还是5笔消费资
料的先後顺序呢
若想要知道不同笔资料是否存在次序关系也是用Aprior吗
11F:推 venomsoul: 喔我看懂你的题目了,我那个方法应该不是你要的解,我11/09 12:38
12F:→ venomsoul: 想想看…11/09 12:38
※ 编辑: FantasyChopi (120.126.194.246 台湾), 11/09/2022 13:55:34
13F:→ Hsins: 我是看不出来要取交集,还是要找元素在集合中出现的次数啦11/09 14:25
14F:→ Hsins: …11/09 14:25
15F:→ Hsins: 你这样的话还有 [a]*2 啊11/09 14:26
16F:→ Hsins: 然後会不会有 [a, a, b] 这种? 如果还有 [a, a, c] 的话11/09 14:33
17F:→ Hsins: 要算次数的话 [a] 要算几次? [a, a] 要不要算是一种?11/09 14:33
18F:推 venomsoul: 我只想到暴力解,会用到itertools.combinations 11/09 14:36
19F:→ venomsoul: 首先,把原始list里面所有的element都单独取出,建立 11/09 14:37
20F:→ venomsoul: arr = [a, b, c, d, e, f] 11/09 14:37
21F:→ venomsoul: 然後,用combinations跑出从1个元素到len(arr)个元素 11/09 14:39
22F:→ venomsoul: 的组合,假设放在arr1 11/09 14:39
23F:→ venomsoul: 然後,创立一个函数,比对a, b两个iterable物件中,a 11/09 14:41
24F:→ venomsoul: 的元素是否都在中,如果都有就回传True11/09 14:41
25F:→ venomsoul: a的元素是否都在b中* 11/09 14:41
26F:→ venomsoul: 然後,把arr1中的每个组合跟原始list中的每个sub list 11/09 14:44
27F:→ venomsoul: 跑a, b的比对函数,如果为True,检查字典d是否有这个t 11/09 14:44
28F:→ venomsoul: uple做为key的纪录,没有的话就加入字典,value给1 11/09 14:44
29F:→ venomsoul: 有的话,value就+1,这样最後字典里面就是每种combina 11/09 14:45
30F:→ venomsoul: tion在所有list的sub list中出现的次数,然後从字典中11/09 14:45
31F:→ venomsoul: 取出只有value > 1的key,同时跟他的value挂在一起输11/09 14:45
32F:→ venomsoul: 出就可以了 11/09 14:45
33F:→ venomsoul: 我只想到暴力解就是了Orz 11/09 14:46
34F:推 venomsoul: 喔对,这是预设在每个原始list中的sub list下面的元素11/09 14:51
35F:→ venomsoul: 都不重复出现的方法11/09 14:51
36F:→ venomsoul: 然後上面Hsins大提到应该还会有[a]*2才对才符合我想的11/09 14:53
37F:→ venomsoul: 题目11/09 14:53
38F:推 venomsoul: 如果是一个sub list中会出现两次以上的相同元素而且要11/09 14:55
39F:→ venomsoul: 视为独立的两个元素的话,一开始extract元素的时候就11/09 14:55
40F:→ venomsoul: 要刻意多加入一个该元素去跑combinations 11/09 14:55
41F:推 kakar0to: set可以处理交集的问题 11/09 15:02
42F:推 venomsoul: 喔…小地方,跑combinations的时候不用跑到len(arr), 11/09 15:12
43F:→ venomsoul: 跑到sub list最长那个长度就好 11/09 15:12
我目前已经成功用aprior做出来了 感谢各位
※ 编辑: FantasyChopi (111.240.129.139 台湾), 11/09/2022 19:28:43
45F:推 n3rd: set()还蛮容易理解的 而且程式码会蛮乾净的 11/17 18:10