扫码关注官方订阅号
我要取 href里的链接 6个链接 前三个符合条件 正则怎么写(即链接中必须带有参数viewkey page viewtype category) 第二个和第三个链接相同 怎么去重复(python下)
我要取 href里的链接
6个链接 前三个符合条件 正则怎么写(即链接中必须带有参数viewkey page viewtype category)
第二个和第三个链接相同 怎么去重复(python下)
走同样的路,发现不同的人生
# python 2.7 import re a = '''<a target="blank"href="http://a.b.c.d/abc.php?viewkey=11111111111d5c2a51d1e2&page=1&viewtype=basic&category=rf"></a> <a target="blank"href="http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf"></a> <a target="blank"href="http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&page=1&viewtype=basic&category=rf"></a> <a target="blank"href="http://a.b.c.d/abc.php?viewkey=6d7a7f6a6e9c2a5191e2&"></a> <a target="blank"href="http://a.b.c.d/abc"></a> <a target="blank"href="http://a.b.c.d/123"></a>''' print set(re.findall('''(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=["']([^'"]+)''', a))
提取前三个链接:
links= re.findall(r'href=\"(.*?=rf)\"',l_string,re.S)
去重:
new_links=set(links)
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
提取前三个链接:
去重: