作者seagal (基因宝宝)
看板C_Sharp
标题Re: 挑选重复图片的演算法
时间Thu Jan 8 22:37:48 2004
※ 引述《tomex (tomex)》之铭言:
: 很多人有收集美女图的经验吧! 有只程式「图片清洁工」就可比对重复的图,
: 让你预览之後再决定是否删除!
: 不过,资讯过量的时代里,希望能直接删除或比对後做一些事情
: 最好的方式就是直接比对档案大小(虽有误差但可接受)
: 更精准的是辨识图档的格式加以读取(不过这样工程/效率太浩大了)
: 单就比对档案大小,程式很简单,假设n张图里有x对重复图
: 最笨的big-o就是 n*n次!
: 我常在想,有否更好的演算法,因为看到硬碟一直闪
: 实有心中不忍!
: 听说有个矩阵比对的方式更快,但我不会!
: 我目前想到的是比较简单的,先使用快速排序大小,再删重复档
: 这样的big-o是 n*x,大大地减少很多!
: 你有其他的想法吗?
用hash去存
key => file大小, value => 出现次数
BigO => n
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.109.73.177