扫码关注官方订阅号
小弟想利用爬虫抓取东方财富网股吧的数据。股吧网页链接.
在获取'下一页'的链接时发现通过requests.get方法获得的源码中,部分能够在浏览器里显示的代码无法获得。
请问各位有什么好的解决方法。通过浏览器能看到的网页源码如下:
共 页
使用requests.get或者直接下载网页源代码只能看到:
requests.get
共有帖子数 49787752 篇
可以发现,中间的代码消失了,请问是什么原因,如何解决。万分感谢!
拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...
因为内容是用JS动态加载的。这种情况只能去找JS调用的API,然后直接去抓API。当然也可以用PhantomJS之类的工具。
PhantomJS
js动态加载的内容,这两份资料对你有帮助。https://www.zhihu.com/questio...https://zhuanlan.zhihu.com/p/...
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
因为内容是用JS动态加载的。这种情况只能去找JS调用的API,然后直接去抓API。当然也可以用
PhantomJS之类的工具。js动态加载的内容,这两份资料对你有帮助。
https://www.zhihu.com/questio...
https://zhuanlan.zhihu.com/p/...