file_get_contents函数在php中可以直接打开本地文件也可以直接抓取远程服务器文件,如果简单的采集我们可以使用file_get_contents直接来操作,如果有防采集我们可能需要代理来操作,下面我来介绍file_get_contents抓取页面示例。
例1,普通页面获取
例如,访问54master论坛,想抓取首页里 所有h3标记内的元素。
| 代码如下 | 复制代码 |
|
(.*?) /is",$contents,$content);preg_match_all("/ (.*?)/is",$contents,$content);print_r($content[0]); |
|
例2,设置代码IP去采集数据
使用file_get_contents 和 stream_context_create 即可。
代码如下:
| 代码如下 | 复制代码 |
|
$aContext = array( |
|
以上代码适用于正常情况,但是如果目标页面需要登录或需要认证信息才能访问的话,可以加多一句代码。
立即学习“PHP免费学习笔记(深入)”;
| 代码如下 | 复制代码 |
|
$auth = base64_encode('LOGIN:PASSWORD'); //LOGIN:PASSWORD 这里是你的账户名及密码 |
|
这样就可以使用代理来抓取页面或文件了
PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号