作者njpp (我要发大财)
看板Python
标题[问题] 将数字的部分复制贴上,并缩排?
时间Tue Nov 16 22:30:21 2021
想问一下各位大大
https://www.cnblogs.com/hanmk/p/12747093.html
目前想要将这个网页的程式码,拿到我的pycharm 翻译器做实验
但是,整篇文章开头都有卡数字,整篇复制贴上会变成如下:
整个排版大乱~
15 # print(response.text)
16 return response.text
17 else:
18 return None
19 except RequestException:
20 print("请求失败")
21 # return None
22
23
24 def parse_html(html_text):
25 html = etree.HTML(html_text)
26
27 if len(html) > 0:
28 img_src = html.xpath("//img[@class='photothumb
lazy']/@data-original") # 元素提取方法
29 # print(img_src)
30 return img_src
31
32 else:
33 print("解析页面元素失败")
python又是很重视排版的语言,所以必须要手动一个一个删除前面的数字
但是仍然会乱掉....
想问一下,有没有好一点的复制贴上方法,可以变成:
def parse_html(html_text):
html = etree.HTML(html_text)
if len(html) > 0:
img_src = html.xpath("//img[@class='photothumblazy']/@data-original") # 元素提取方法
# print(img_src)
比较符合以上快速又简洁符合python语法的排版? 谢谢!
先贴到 NotePad++ 再转到pycharm吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 101.137.155.79 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1637073023.A.77C.html
1F:→ cocoaswifty: shift+option 上下点选删整排数字 11/16 23:02
感谢大大,想问一下 option是? 有shift键但没有option!
我使用的是windows! 非苹果!
2F:推 lycantrope: 用regex findall 取代就好 ( *\d+) 11/16 23:20
※ 编辑: njpp (101.137.155.79 台湾), 11/16/2021 23:38:01
3F:推 cuteSquirrel: windows 可以用Alt+滑鼠左键选垂直的前几排删掉 11/17 00:11
4F:推 poototo: notepad手动几次搜寻取代即可,练习正规 11/17 08:29
6F:推 jennya: google 「pycharm column selection」就可以一次选取多行 11/19 23:59
7F:→ jennya: 的前几个字元&一键删除,notepad+貌似也有,你可google看 11/19 23:59
8F:→ jennya: 看 11/19 23:59
9F:→ jennya: 然後上面的regex全都不行,要是程式码里有数字不就很麻烦 11/20 00:01
10F:→ jennya: ,就算要用regex也是用这个「^...」,^是一行的开头的意 11/20 00:01
11F:→ jennya: 思,使用这个regex会找到每行前三个字元,再按replaceal 11/20 00:01
12F:→ jennya: l取代成空白即可。 11/20 00:01
13F:→ papple23g: 前三字元行数破百就不行了吧 11/20 02:37
14F:推 lycantrope: 上面regex可以增加条件吧, ^\s*\d+ 11/20 10:41