列分隔符暂时没有使用上

时间:2022-05-22 08:30:10


一、应用场景:

① .我在做BI开发测试的时候,有可能面对source文件数GB的情况,如果使用一般的文本编纂器,则会卡死,或要等很久才华显示出来。

② .有时候,我们使用ascii(01)或ascii(02)作为行或列的分隔断绝分手符,这样的姑且文件用于导数据到DB,如果文件导入过程中有错误,,需要检察文件 的时候,普通的编纂器不撑持换行,则会很恐怖。

为解决这两个需求,我使用c#完成了一个简单的winform的应用措施。

成果列表:

1.按照配置的行数,写测试文件,指定行终止符,列分隔断绝分手符暂时没有使用上。

2.按照指定的行终止符,和pagesize,分页读取文件内容,而且可以在text和byte间转换。


二、实现代码:

主要的代码如下,使用了一个迭代器:


代码如下:

private IEnumerator<string> ReadLines(string filename)

{

/*

string line;

using (TextReader reader = File.OpenText(filename))

{

while ((line = reader.ReadLine()) != null)

yield return line;

}

*/

StringBuilder sb = new StringBuilder();

using (FileStream fs = File.OpenRead(filename))

{

int b = 0;

while ((b=fs.ReadByte())!=-1)

{

//textbox3 store the row terminator

if (b.ToString() == textBox3.Text.Trim())

{

yield return sb.ToString();

sb.Clear();

}

else

sb.Append(UnicodeEncoding.ASCII.GetString(new byte[] { byte.Parse(b.ToString()) }));

}

}

}

示例截图如下所示:

列分隔符暂时没有使用上

我测试了一次,生成了1个亿的数据行,在系统中显示占用6GB的空间,

我测验考试读写,无卡顿情况。

可以进一步更新:

按照列行分隔断绝分手符显示到gridview中,这样更清晰。

可以从后往前读文件。