一.问题背景
经常碰到要同步数据的情况,而系统自带的复制功能又不能实现增量同步,每次都要做全量复制,发生异常情况后只能重头再来,非常麻烦,优其是对那种大文件的处理,更是耗时。
二.解決方案
1.计算源目录数据指纹
2.计算目标目录数据指纹
3.对比指纹数据,找出差异项,得到需要添加,删除或更新的文件列表,计算出需要更新的数据大小
4.挨个同步差异项,如果碰到大文件,则缓存其指纹数据到目标文件夹中,供下次同步数据时使用
三.数据指纹说明
数据指纹顾名思义,就是对某一文件夹或文件的唯一标识,其格式为:
文件相对路径+:(分隔符)+修改日期+:+数据长度+:+內容指纹
內容指纹是由多个内容块的md5组成
内容块就是对大文件进行分割处理,每次比较数据,最小的同步对象就是內容块,避免对整个文件做处理,也是实现增量同步的关健点
四.源码下载
源码:https://github.com/xxonehjh/file-sync
可执行文件:fileSync.jar
使用说明:java -jar fileSync.jar 源目录 目标目录
相关文章
- 【ClickHouse源码】ReplicatedMergeTree之数据同步流程
- 基于Python Django 的全国房价大数据可视化系统(附源码,部署)-系统模块
- 实战:利用决策树对波士顿房价数据集进行预测(附源码)
- 电子商务系统+java+web+完整项目+包含源码和数据库Java实用源码
- Java毕业设计-基于SSM框架的线上学习网站系统项目实战(附源码+论文)
- java Object和Map之间的转换(附完整源码)
- java:实现兑换货币(附完整源码)
- 计算机毕业设计Java养老院管理系统(源码+系统+mysql数据库+Lw文档)
- 计算机毕业设计Java小说阅读网站(源码+系统+mysql数据库+Lw文档)
- 计算机毕业设计Java小太阳游乐场管理(源码+系统+mysql数据库+Lw文档)