linux_shell_根据网站来源分桶

时间:2020-11-30 15:02:58

应用场景:

  3kw行url+\t+html记录 【网站混合】

  需要:按照网站来源分桶输出

执行shell

cat */*pack.html|awk -F '\t' '{
split($1,arr,"/");
site=arr[3];
print $0 > site
}'