Re: [问题] 读文字档及搜寻字串的效率

时间Sun May 11 17:44:52 2008

※ 引述《banco (Acoustic)》之铭言： : 平常自己都在 Linux 下操作程式 : 後来发现把相同程式转到 Windows 平台上执行 : 效率竟是天差地远 [注] : 烦请诸位大德拨冗替小弟解惑 : (1) : 我手边有个文字档, 约 27MB : 在搜寻想要的字串时, : 我一向用 @file = <FH>; 把内容倒进 @file 後再处理 : 然後再针对 @file 的内容, 一列一列地进行检查 : 不晓得 @file = <FH> 会不会是一个多余的动作 : 会不会直接用 foreach (<FH>) 效率会比较好些? 自问自答以下原始程式 Unihan.txt 为 27MB 的文字档, 内含 1,116,642 行资料程式执行花了 180 秒左右 1: open( Funi, "Unihan.txt" ) or die "no Unihan.txt"; 2: @UniInfo = <Funi>; 3: 4: foreach (@UniInfo){ 5: if( $_ =~ /^(U\S+)\t(\S+)\t(.*)$/ ){ 6: $Unihan{$1}{$2} = $3; 7: } 8: } 9: close( Funi ); ==修改一== 将第2行 @UniInfo = <Funi> 拿掉, 第4行换成 foreach( <Funi> ) 程式执行花了 100 秒左右另外原本第2行 @UniInfo = <Funi> 花了约 6 秒 ==修改二== 同修改一, 另外在第5行的 regular expression 加上 modifier /g 程式执行花了 58 秒左右 ==修改三== 同原始程式, 另外在第5行的 regular expression 加上 modifier /g 程式执行花了 53 秒左右 ==粗略结论== 在不更改 regular expression、不增加任何 modifier 的条件下, foreach 直接对 FileHandle <Funi> 会比 @UniInfo = <Funi> 来得快但加上 modifier /g 之後, 情况整个相反, 即便 @UniInfo = <Funi> 会多花 6 秒但先将资料倒入记忆体的速度优势在後来的 matching 展现出来不过我一直对为何加上 /g 会提升速度感到好奇因为从字面上的意义 global matching 来看, 无法想到为何会对速度产生影响? --

※ 发信站: 批踢踢实业坊(ptt.cc) ◆ From: 61.216.35.194

1^F：推 david220:foreach( <Funi> )改成while( <Funi> ) 05/18 19:40

赞助商连结

您可能会有兴趣的文章

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称，例如：Tech_Job 或站内搜寻

TOP

WEB批踢踢(PTT)

Perl 板

Re: [问题] 读文字档及搜寻字串的效率

热门看板

赞助商连结