如:在 www.baidu.com获取 baidu.com
a.baidu.com 获取 baidu.com
可能有很多人没有明白我的意思,这的难点是不可能用正则获取匹配截取获取根域名的
比如www.a.china.com.cn你怎么知道截取的是china.com.cn呢??
所以我感觉应该有个域名库然后在匹配吧。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
把 host 按
.分割,length 为 2,不用处理,大于 2 的去掉数组首位。哦,不对。我没有考虑到三级域名...还是需要一个特征库匹配。
判断这个显然需要额外知识。
应该有个域名库然后在匹配吧这个方向是对的。你想到的那个域名库叫做 public suffix list 。www.a.china.com.cn中的.com.cn是一个public suffix,那么网站自己的部分就是下一级的china.com.cn。里面有你想要的
如果用的是IP访问就有问题,三四级域名怎么办,要一个域名库了吗,哭死
正则表达式替换一下:
貌似有问题,如果这样呢:
还是有问题,这样吧:
不能直接获取啊,你获取当前链接然后截取吧。