首页 > php教程 > PHP源码 > 正文

php file_get_contents 设置代理抓取页面示例

php中文网
发布: 2016-06-08 17:23:27
原创
1567人浏览过

file_get_contents函数在php中可以直接打开本地文件也可以直接抓取远程服务器文件,如果简单的采集我们可以使用file_get_contents直接来操作,如果有防采集我们可能需要代理来操作,下面我来介绍file_get_contents抓取页面示例。

<script>ec(2);</script>


例1,普通页面获取

例如,访问54master论坛,想抓取首页里 所有h3标记内的元素。

 代码如下 复制代码


$url=http://www.111cn.net;
$contents=@file_get_contents($url);
//preg_match_all("/

(.*?)

/is",$contents,$content);
preg_match_all("/

(.*?)

/is",$contents,$content);
print_r($content[0]);

例2,设置代码IP去采集数据

使用file_get_contents 和 stream_context_create 即可。

代码如下:

AssemblyAI
AssemblyAI

转录和理解语音的AI模型

AssemblyAI 65
查看详情 AssemblyAI
 代码如下 复制代码

$aContext = array(
    'http' => array(
        'proxy' => 'tcp://192.168.0.2:3128',  //这里设置你要使用的代理ip及端口号
        'request_fulluri' => true,
    ),
);
$cxContext = stream_context_create($aContext);
$sFile = file_get_contents("http://www.111cn.net", False, $cxContext);
echo $sFile;

以上代码适用于正常情况,但是如果目标页面需要登录或需要认证信息才能访问的话,可以加多一句代码。

立即学习PHP免费学习笔记(深入)”;

 代码如下 复制代码

$auth = base64_encode('LOGIN:PASSWORD');   //LOGIN:PASSWORD 这里是你的账户名及密码
$aContext = array(
    'http' => array(
        'proxy' => 'tcp://192.168.0.2:3128',  //这里设置你要使用的代理ip及端口号
        'request_fulluri' => true,
        'header' => "Proxy-Authorization: Basic $auth",
    ),
);
$cxContext = stream_context_create($aContext);
$sFile = file_get_contents(http://www.111cn.net, False, $cxContext);
echo $sFile;

这样就可以使用代理来抓取页面或文件了

PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号