GridFS:基于MongoDB的分布式文件存储系统

php中文网
发布: 2016-06-07 17:29:50
原创
1273人浏览过

GridFS是MongoDB之上的分布式文件系统,其利用了MongoDB的分布式存储机制并通过MongoDB来存储文件数据和文件元数据,兼具文档型数

gridfs是mongodb之上的分布式文件系统,其利用了mongodb的分布式存储机制并通过mongodb来存储文件数据和文件元数据,兼具文档型数据库和文件系统的优势。gridfs是当前大数据潮流和复杂数据分析需求的产物。
 
简单来说,gridfs通过将文件数据和文件元数据保存在mongodb里来实现文件系统,通过复制(replication)来应对故障切换,数据集成,还可以用来做读扩展,热备份或者作为离线批处理的数据源,通过分片来实现自动切分数据,实现大数据存储和负载均衡,通过数据库对集合中文档的管理和查询(包括mapreduce)实现轻量级文件系统接口和搜索与分析。
 
gridfs的一个基本思想是可以将大文件分成很多块,每一块作为一个单独的文档存储,则有就能存储大文件了。由于mongodb支持在文档中存储二进制数据,可以最大限度减小块的存储开销。gridfs使用mongodb的复制,分片等机制来实现分布式文件存储,使用mongodb进行管理和复杂分析。
 
gridfs使用两个文档来存储文件,一个用来存储文件本身的块,另外一个用来存储分块的信息和文件的元数据,默认对应的集合分别为fs.chunks和fs.files.
 
chunks集合:
 
{
 
“_id”:,
 
“files_id”: ,
 
“n”: ,
 
“data”:
 
}
 
块集合中文档包含以下属性:chunk_id:块id。chunks.files_id:对应files集合中文档的_id。chunks.n:块的编号,由gridfs管理,从0开始。chunks.data:文件数据,是bson二进制类型。
 
chunks集合使用files_id和n作为混合索引,files集合:
 
{
 
“_id”: ,
 
“length”: ,
 
“chunksize”:,
 
“uploaddate”: ,
 
“md5”: ,
 
“filename”: ,
 
“contenttype”: ,
 
“aliases”: ,
 
“metadata”:
 
}
 
files集合中的文档包含以下属性,应用还可以创建额外任意的属性:files_id:唯一的文件表示。mongodb的默认值是bosn objectid。files.length: 文件的字节数大小。files.chunksize:每个块的大小,默认为256kb,gridfs根据这个值将文件分成多个快,files.uploaddate:gridfs第一次存储此文件的时间,类型为isodate。files.md5: 文件的md5散列值,是字符串。 files.filename:可选。人类可读的文件名。files.contenttype: 可选。合法的文件mime类型。files.aliases:可选。别名的字符串数组。files.metadata:可选。自定义存储的文件元数据。
 
可以通过mongofiles工具或者mongodb驱动程序来使用gridfs,gridfs主要提供5种操作接口:
 
list:获取文件列表
 
get:获取文件
 
put:写入文件
 
search:根据文件名搜索文件
 
delete:删除文件
 
因为gridfs文件的元数据存储在files集合中,因此gridfs可以非常方便地进行文件管理,比如根据文件名,上传时间,文件大小或者自定义的文件元数据进行查询,还可以利用mapreduce做复杂数据分析。这是gridfs把传统文件系统和数据库相结合得到的众多好处之一。
 
对比传统文件系统的优势
 
分布式:gridfs是基于mongodb的分布式文件系统,可以直接使用mongodb replication和sharding机制,数据可靠性和水平扩展性都得到保证。gridfs不产生磁盘碎片,因为mongodb分配数据文件空间时以2gb为一块。
 
mapreduce:可以进行复杂管理和查询分析。
 
索引和缓存:元数据存储在mongodb中,非常方便索引,,并且可以对文件和文件元数据进行索引,能提高系统效率。
 
checksum: gridfs会为文件产生散列值,可用于校验文件以检查完整性。
 
开发者友好:利用grid可以简化需求,减小开发成本。要是已经用了mongodb,gridfs就可以不需要使用独立文件存储架构,并且使代码和数据真正分离,方便管理。
 
其他: gridfs可以避免用于存储用户上传内容的文件系统出现的某些问题。例如,gridfs在同一个目录下防止大量的文件是没有任何问题的。gridfs不产生磁盘碎片,因为mongodb分配数据文件空间时以2gb为一块。

linux

v1.2.1云EC电商系统
v1.2.1云EC电商系统

云EC电商系统(简称云EC)是由佛山市云迈电子商务有限公司自主开发的一套免费、开源的基于PHP+MYSQL电商系统软件。 云EC电商系统 1.2.1 更新日志:2018-08-10 1.修复部分环境下二维码不显示的问题; 2.商品列表增加多属性筛选支持; 3.修复更新优惠券状态时错将已使用的优惠券也更新为过期; 4.修复文章发布远程图片下载失败; 5.修复某些情况下运费计算出错导致

v1.2.1云EC电商系统 2595
查看详情 v1.2.1云EC电商系统

相关标签:
最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号