找数据重复部分

php中文网
发布: 2016-08-31 08:54:53
原创
1006人浏览过

  1. 现在有一批通讯录数据(10000多个人的通讯录)需要找出每两个人的通讯录的重复部分(就是谁和谁的通讯录重复了多少条)要所有人的通讯录都两两比对一遍
    例如 有 abcde四个人的通讯录 找出 ab ac ad ae bc bd be cd ce de 之间的通讯录重复条数

    Julius AI
    Julius AI

    Julius AI是一款功能强大的AI数据分析工具,可以快速分析和可视化复杂数据。

    Julius AI 156
    查看详情 Julius AI

手机号重复 就认为这两条通讯录重复
这个是数据表,有10000多个人通讯录
找数据重复部分

找数据重复部分

list字段存的json就是通讯录的内容
一个人通讯录 100条到1000条不等
找数据重复部分

我目前尝试的做法是,一下取出所有人的通讯录,然后拿第一个人跟剩下所有人的进行比对(foreach这个数组,里面嵌套foreach) 然后拿第二个人的跟剩下所有人的比对,以此类推.
脚本部分代码
找数据重复部分
找数据重复部分
找数据重复部分

然后运行脚本 脚本跑了20多个小时 才跑了一半左右 内存,CPU占用也比较高 脚本效率太低了

请教一下,有没有更好方法来找出这批数据的重复部分,或者脚本怎么优化优化

谢谢大家

回复内容:

  1. 现在有一批通讯录数据(10000多个人的通讯录)需要找出每两个人的通讯录的重复部分(就是谁和谁的通讯录重复了多少条)要所有人的通讯录都两两比对一遍
    例如 有 abcde四个人的通讯录 找出 ab ac ad ae bc bd be cd ce de 之间的通讯录重复条数

手机号重复 就认为这两条通讯录重复
这个是数据表,有10000多个人通讯录
找数据重复部分

找数据重复部分

list字段存的json就是通讯录的内容
一个人通讯录 100条到1000条不等
找数据重复部分

我目前尝试的做法是,一下取出所有人的通讯录,然后拿第一个人跟剩下所有人的进行比对(foreach这个数组,里面嵌套foreach) 然后拿第二个人的跟剩下所有人的比对,以此类推.
脚本部分代码
找数据重复部分
找数据重复部分
找数据重复部分

然后运行脚本 脚本跑了20多个小时 才跑了一半左右 内存,CPU占用也比较高 脚本效率太低了

请教一下,有没有更好方法来找出这批数据的重复部分,或者脚本怎么优化优化

谢谢大家

<code class="php">$data = array(
    array('id'=>1,'name'=>1),
    array('id'=>2,'name'=>2),
    array('id'=>3,'name'=>3),
    array('id'=>1,'name'=>2)
);
$ret = array();
# 数据遍历一次,以计算重复key作为key新建数据,如果存在value +1,如果不存在设置为1
foreach($data as $k=>$v){
    $_id = $v['id'];
    $_name = $v['name'];
    if (array_key_exists($_id, $ret)) {
        $ret[$_id]++;
    }else{
        $ret[$_id] = 1;
    }
}
# 遍历结果
foreach($ret as $k=>$v){
    echo "{$k}出现{$v}次\n";
}
#print_r($id)
</code>
登录后复制

相关标签:
php
最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号