在内存小于文件大小的情况下，大文件中快速查找定位一行-php教程-PHP中文网

在内存小于文件大小的情况下，大文件中快速查找定位一行

php中文网

发布： 2016-06-23 14:18:56

原创

890人浏览过

内存大文件

比如有一个文件
ABC   56
DEF   100
RET   300
...

文件有2列，第一列都是不重复的，第2列表示次数（当成一个数字就行了）。

如果文件大小为2G或者更大，内存只有1G的情况，如何快速定位到“ABC  56” 这一行。

请大拿们给个清晰点的解决方法。

回复讨论(解决方案)

没明白您是什么意思？
如果是打开文件想快速找到某一行的话，可以使用vi或者more将文件打开；
然后输入: /ABC 回车就好了

fopen，再fscanf。
一次读一行就好啊。内存不会成为限制因素的。

有没有人知道啊？
如果是一行一行读，那效率就不行啦。
还有没有更快速的方法呢？
我的思路是建一张哈希表，然后根据哈希算法，再用那个哈希碰撞的原理去排重。
不知道各位有什么好的意见没

建hash表的话，岂不是要先对文件的内容进行hash？

可以用其他的工具来处理，未必一定要用算法。
比如awk：
awk '/ABC\t56/{ print NR}' file
可以获取匹配行的行号。

建议lz说下具体的需求，如果仅仅是获取行号的话，方案很多。
但是如果还有其他需求的话，类似awk这么做未必是最佳方案。

有没有人知道啊？
如果是一行一行读，那效率就不行啦。
还有没有更快速的方法呢？
我的思路是建一张哈希表，然后根据哈希算法，再用那个哈希碰撞的原理去排重。
不知道各位有什么好的意见没那你不也得先一行一行读出来再哈希吗？

嫌一行一行读太慢，可以一块一块读

有没有人知道啊？
如果是一行一行读，那效率就不行啦。
还有没有更快速的方法呢？
我的思路是建一张哈希表，然后根据哈希算法，再用那个哈希碰撞的原理去排重。
不知道各位有什么好的意见没那你不也得先一行一行读出来再哈希吗？

嫌一行一行读太慢，可以一块一块读

是的读块比较符合你的需求

楼主可参考：
http://www.fantxi.com/blog/archives/php-read-large-file/

http://sjolzy.cn/php-large-file-read-operation.html

有没有人知道啊？
如果是一行一行读，那效率就不行啦。
还有没有更快速的方法呢？
我的思路是建一张哈希表，然后根据哈希算法，再用那个哈希碰撞的原理去排重。
不知道各位有什么好的意见没那你不也得先一行一行读出来再哈希吗？

嫌一行一行读太慢，可以一块一块读

内存怎么一块一块读呢？能给个例子吗?

大家都在看：

PHP脚本执行时间与本地文件操作超时管理如何用PHP代码实现网站国际化功能_PHP网站国际化(i18n)功能实现教程 PHP多线程和异步有什么区别_PHP多线程与异步编程的核心区别解析解决PHP DocuSign SDK下载已签名文档为空的问题图像优化：在不显著损失质量的情况下有效压缩大量图片