温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

数据库中如何处理带有引号文本限定符的CVS

发布时间:2021-11-09 09:40:00 来源:亿速云 阅读:200 作者:小新 栏目:关系型数据库

这篇文章给大家分享的是有关数据库中如何处理带有引号文本限定符的CVS的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

公司需要导入数据到MSSQLSERVER,但是对方给出的奇葩cvs文件是这样的:

aa,bb,cc,dd,ee
1,"this 
is a",1,"this is a",1
2,"this is
" a",2,"this is a",2

普通的bcp处理会有悲催的错位,而且mssql个坑货也不能像mysql自动区分文本限定符的"
研究了一下,用这个方式处理:

1. 在DB里建立对应的表

此处)折叠或打开

  1. /*generaate thebcp fmt file*/

  2. exec xp_cmdshell 'bcp test.dbo.table_1 format nul -t "," -c -x -f C:\test\table_1.xml  -U****  -P****  '

  3. go

3,修改xml,请注意高亮部分。 这个你们用ie来打开的话也可以明确的看到"
此外还有这些特殊字符,大家先备着,万一哪天被不靠谱的猪队友坑了还能用。
单引号是' 
双引号是" 
&是&
>是>
<是&lt;
空格是&nbsp; 等

点击(此处)折叠或打开

  1. <?xml version="1.0"?>

  2. <BCPFORMAT xmlns="http://schemas.microsoft.com/sqlserver/2004/bulkload/format" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">

  3.  <RECORD>

  4.   <FIELD ID="1" xsi:type="CharTerm" TERMINATOR=",&quot;" MAX_LENGTH="12"/>

  5.   <FIELD ID="2" xsi:type="CharTerm" TERMINATOR="&quot;," MAX_LENGTH="50" COLLATION="Chinese_PRC_CI_AS"/>

  6.   <FIELD ID="3" xsi:type="CharTerm" TERMINATOR=",&quot;" MAX_LENGTH="12"/>

  7.   <FIELD ID="4" xsi:type="CharTerm" TERMINATOR="&quot;," MAX_LENGTH="50" COLLATION="Chinese_PRC_CI_AS"/>

  8.   <FIELD ID="5" xsi:type="CharTerm" TERMINATOR="\r\n" MAX_LENGTH="12"/>

  9.  </RECORD>

  10.  <ROW>

  11.   <COLUMN SOURCE="1" NAME="aa" xsi:type="SQLINT"/>

  12.   <COLUMN SOURCE="2" NAME="bb" xsi:type="SQLVARYCHAR"/>

  13.   <COLUMN SOURCE="3" NAME="cc" xsi:type="SQLINT"/>

  14.   <COLUMN SOURCE="4" NAME="dd" xsi:type="SQLVARYCHAR"/>

  15.   <COLUMN SOURCE="5" NAME="ee" xsi:type="SQLINT"/>

  16.  </ROW>

  17. </BCPFORMAT>

然后再把cvs的首列的标题去掉, 虽说微软说可以通过firstrow来指定第一行,但我之前用了firstrow=2居然是从第二行开始的。
如果不去掉,会报错,由于赶时间,报错测原因和具体原理暂时不考虑再去深入研究了,之后有时间慢慢测。

4. 从cvs里取值,这里我用了openrowset来做验证,其实这个时候也可以直接用bcp加指定 format file来进行导入操作了。

点击(此处)折叠或打开

  1. select * from

  2. openrowset(bulk 'C:\Booker\test.csv', --要读取的文件路径和名称

  3.     formatfile='C:\Booker\Table_1.xml', --格式化文件的路径和名称

  4.      --fieldterminator='","',

  5.     firstrow = 1,--要载入的第一行

  6.     --lastrow  = 1000, --要载入的最后一行,此值必须大于firstrow

  7.     maxerrors = 100, --在加载失败之前加载操作中最大的错误数

  8.     --errorfile ='c:\wc_error1.txt', --存放错误的文件

  9.     rows_per_batch = 10000 --每个批处理导入的行数

  10.     ) as t


你需要的结果有了
数据库中如何处理带有引号文本限定符的CVS
文本格式下就是这么个东东
aa          bb                                                 cc          dd                                                 ee
----------- -------------------------------------------------- ----------- -------------------------------------------------- -----------
1           this, 
is, a                                      1           this is a                                          1
2           this is
" a                                       2           this is a                                          2



感谢各位的阅读!关于“数据库中如何处理带有引号文本限定符的CVS”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI