网页爬虫 - java爬虫如何解析JavaScript
大家讲道理
大家讲道理 2017-04-17 17:29:23
[Java讨论组]

用java爬取JavaScript动态生成的页面,怎么解析js?用rhino?phantomjs?还是其他的什么?

大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

全部回复(6)
天蓬老师

phantomJS可以。

迷茫

除非是非常复杂的前端逻辑(比如说有一大堆逻辑去算token了) 否则不建议去模拟执行js
他如果是动态加载的数据 直接拿json不是更简单

怪我咯

有解析js脚本的jar包,具体包记不清了。

大家讲道理

就爬虫而言,直接模拟浏览器解析Javascript是不可取的。你可以直接抓取生成对应网页的json之类的来实现。

迷茫

如果用java可以试一下Selinium的WebDriver,如果用js写那就直接phantomjs

大家讲道理

参考下这个文档
如何爬取JS动态生成的数据?http://doc.shenjianshou.cn/de...

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号