作者mejichoco (UoU)
看板Python
标题[问题] rugular expression
时间Sat Sep 25 11:18:36 2021
这里有一篇文章(不好意思,从简体网站下载的题目):
性能测试是 模拟 ```大量的客户端``` 大批量的发送请求消息 给 被测的服务器。
这个网址=后面的地址
https://www.AA.com/video/tv34106411/?p=99后33面可能
还有?内容
那么,其中每个 客户端的行为 是怎样的? 需要我们先定义好。
单个客户端行为定义好 以后, 我们在第3步只要指定产生 多少个 这样的客户端就可以
了。
这个网址=后面?的地址
https://www.AA.com/video/tv34106411/?p=9还有?内容
就可以修改该文件,把文件中所有的链接末尾数字都加上。
https://www.AA.com/video/tv34106411/?p=7 还有?内容
日志文件记录了 服务端对 各个请求处理
目前使用以下解法:
https:.*tv\d*[/=?p]*
https://www.AA.com/video/tv34106411/?p=
https:.*av\d*[/=?p]*\d*
https://www.AA.com/video/tv34106411/?p=99
\d*
=99
虽然有撷取到99,但是还有全部的数字部分,像是还撷取到后33面可能的33
想问一下,有没有办法可以只撷取到 p= 99, 9,7 这三个数字的语法?
谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 101.137.187.75 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1632539920.A.253.html
1F:推 TitanEric: url参数有专门的lib去处理 09/25 11:36
urllib.request? import urllib?
2F:→ TitanEric: /?p=是固定的 应该不用放方括弧 後面数字就用(\d+) 09/25 11:37
但是 使用 [/?p=]\d+ 实验结果都会多一个 = ,
https://regex101.com/
3F:→ TitanEric: 撷取 09/25 11:37
※ 编辑: mejichoco (101.137.187.75 台湾), 09/25/2021 12:12:40
4F:推 lycantrope: (https:.*tv\d*)(/\?p=)?(\d+)* 09/25 13:47
5F:推 aalexx: 找资料一律建议英文优先,中文除了少数私人部落格,基本上 09/27 01:55
6F:→ aalexx: 都是盗文或英文的文章不完整翻译。有能力的话建议用英文找 09/27 01:55