SQL Server使用导入导出向导导入超过4000个字符的字段的数据

时间:2021-12-02 04:29:22
在使用SQL Server导入导出向导导入数据的时候,我们经常会碰到某个单元格的数据超长而被截断报错的情况。本文针对这种场景给出相应的解决方案。
 
环境描述:SQL Server 2012,文件源:文本文件(UTF-8编码)
 
问题描述:如下图所示,由于SQL Server 对字符长度的限制,当我们选择Unicode 字符串(DT_WSTR)时,最长的长队为4000。这个DataType对应着数据库中的nvarchar。这时如果文本文件中的列过长就会报出截断错误。
 
SQL Server使用导入导出向导导入超过4000个字符的字段的数据

 

但其实SQL Server中是有nvarchar(MAX)这个类型的,理论上可以装载2G的数据,所以即使是列的字符超长也是可以承载的。
 
解决方案如下:
 
1. 选择数据类型 : 文本流[DT_TEXT](该数据类型对应着数据库中的varchar(MAX),这里不能直接选择 “Unicode 文本流 [DT_NTEXT]”,因为当文件是UTF-8编码时会报出编码错误(报错信息:ANSI 文件不支持此数据类型。请改用 DT_TEXT))
 
SQL Server使用导入导出向导导入超过4000个字符的字段的数据

 

2. 点击编辑映射,将varchar改成nvarchar。

 

SQL Server使用导入导出向导导入超过4000个字符的字段的数据

SQL Server使用导入导出向导导入超过4000个字符的字段的数据

 

 点击确定进入下一步,如下图所示,可以默认的进入下一步并完成导入。

 

 SQL Server使用导入导出向导导入超过4000个字符的字段的数据

 

 导入之后可以看到,Column3是nvarchar(MAX)类型的数据。

 

SQL Server使用导入导出向导导入超过4000个字符的字段的数据

 

需要注意的是,这种做法其实是将原有的数据导入中间加了一层Data Convertion,所以效率上会有一定的损失。