用iconv批量转换文件编码

时间:2022-04-06 08:39:24
#!/bin/bash
# Convert abs-cn html files' charset to utf8,
# and add charset info of <meta> to every html document.
for i in *.html ;
do
echo $i
iconv -f gbk -t utf8 -c "$i" | sed "s/CONTENT=\"Modular DocBook HTML Stylesheet Version 1\.79\">/CONTENT=\"Modular DocBook HTML Stylesheet Version 1\.79\"><meta http-equiv=Content-Type content=\"text\/html;charset=utf-8\">/" > work/$i
done

---------------------

转化字符编码,根据abs-cn的HTML源码的特征,添加charset的meta信息。

每个转化后的新文件放到work目录内,以免重复处理。