扫码关注官方订阅号
如题,最近想试试用 nodeJS 做个爬虫,用了 cheerio 却发现 cheerio 做不到解析出 DOM 的一些特征信息,如尺寸大小和 DOM 元素结点的位置什么的,记得 phantom 可以当浏览器进行渲染?是否可以做到在 node 环境下采集外部链接,如百度首页的文档结构,获取其中的 DOM 属性信息?
cheerio
phantom
认证高级PHP讲师
可以用phantomjs做dom处理,不过如果是批量爬虫的话要考虑服务器性能具体用法见官网
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
可以用phantomjs做dom处理,不过如果是批量爬虫的话要考虑服务器性能
具体用法见官网