
如何用 scrapy xpath 获取指定标签下的完整 html 内容?
给定以下 html 片段:
<div class="contson">
这是文本
<p>aaaa</p>
这是文本2
<br>
这是文本3
</div>我们希望获取 div.contson 中的所有内容,包括 html 标签。
'这是文本<p>aaaa</p>这是文本2<br>这是文本3'
通常方法,如 string(.),只能获取纯文本。然而,node() 函数可以获取指定元素下的所有节点、元素和内容。
使用以下 xpath 表达式:
立即学习“前端免费学习笔记(深入)”;
xx.xpath('//div[@class="contson"]/node()').extract()然后将列表转换为字符串:
"".join(xx)
即可得到所需的完整 html 内容。
以上就是如何使用 Scrapy Xpath 获取 div 标签下的完整 HTML 内容?的详细内容,更多请关注php中文网其它相关文章!
HTML怎么学习?HTML怎么入门?HTML在哪学?HTML怎么学才快?不用担心,这里为大家提供了HTML速学教程(入门课程),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号