【文件属性】:
文件名称:HDFS关键运行机制--写文件流程-Hadoop技术讲解课件
文件大小:1.09MB
文件格式:PPT
更新时间:2021-04-26 10:17:24
Hadoop
HDFS关键运行机制
--写文件流程
客户端缓存
流水线复制
并发写控制
流程:
1.客户端把数据缓存到本地临时文件夹
2.临时文件夹数据超过64M,客户端联系NameNode, NameNode分配DataNode,DataNode依照客户端的位置被排列成一个有着最近物理距离和最小的序列
3.与序列的第一个数据服务器建立Socket连接,发送请求头,然后等待回应,依次下传,客户端得到回包,流水线建立成功,
4. 正式发送数据,以4K为大小传送
*