网页爬虫 - Python爬虫看到这个Javascript,如何从中找到我需要的URL?
PHPz
PHPz 2017-04-11 12:53:17
[JavaScript讨论组]

想下载http://www.manhuatai.com/doupocangqiong/191.html里面的图片。
看到这个,因为不会javascript,所以不懂imgpath的value那串E&3G&F7&:7&:8&F8&B1&C5&F9&9C&9E&F8&B:&C:&3G2:2&F9&BG&:ETN&3G是什么意思,其中有几话我发现是直接http://mhpic.zymk.cn/comic/+value+页数+.jpg-mht.middle就能得到图片的url,但是还有很多都不能这样来获取。

而我需要的url是http://mhpic.zymk.cn/comic/D%2F%E6%96%97%E7%A0%B4%E8%8B%8D%E7%A9%B9%2F191%E8%AF%9DSM%2F1.jpg-mht.middle

PHPz
PHPz

学习是最好的投资!

全部回复(1)
大家讲道理

使用selenium就可以很容易做到这件事情

from selenium import webdriver

browser = webdriver.Chrome()
browser.get('http://www.manhuatai.com/doupocangqiong/191.html')
img=browser.find_element_by_xpath('//img[@data-bd-imgshare-binded="1"]')
print img.get_attribute('src')
# 即打印出:
# http://mhpic.zymk.cn/comic/D%2F%E6%96%97%E7%A0%B4%E8%8B%8D%E7%A9%B9%2F191%E8%AF%9DSM%2F1.jpg-mht.middle

关于selenium可以看看Python爬虫利器五之Selenium的用法

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号