#-*- coding:utf-8 -*-
from bs4 import BeautifulSoup
html_doc = """
New Document
学校名
北京大学
联系人
路人甲
联系电话
13800138000
城市
北京
状态
正常
加入时间
0000-00-00
学生
(总数 / 正常)
5961 / 4761
学生B部
(总数 / 正常)
5961 / 4761
学生C部
(总数 / 正常)
0 / 0
"""
soup = BeautifulSoup(html_doc, 'lxml')
print(soup.prettify())
思路
这种是可以转换为json?
还是直接正则过滤出数字?
我需要5961 / 4761 分开输出
转换为str格式
5961
4761
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
直接正则好了,简单粗暴:
不是json,它解析HTML文档,并且类似浏览器一样构建了一个节点树,所以你可以使用CSS Selector语法,利用find_all/find 函数获得tag节点,然后在你要获取数据的节点上调用 get_text(),返回的应该是一个str,然后调用 split("/")。
个人思路。