我有一个批处理文件,使用BCP
将分隔的文本文件导入SQL Server,使用SQLCMD
运行一些处理,然后通过BCP
输出处理后的数据。它目前提供一串中文字符而不是分隔的文本表。奇怪的是,它在两天前工作,我没有改变任何东西。
我已确认输入BCP和SQL Server处理步骤有效;保存输出数据的SQL Server表是正确的。我还尝试使用-C
选项按建议here指定代码页,但没有任何更改。
这是有问题的BCP代码。为了便于阅读,我将线分开,实际代码正常在一行上。它使用union all
将列名放在文件的顶部。
bcp
"select
'MRN'
,'column name 2'
,[rest of the column names]
union all
select distinct
iif(r.MRN is not null, cast(r.MRN as varchar), '') as MRN
,[rest of the columns]
from DATA_MANAGEMENT.dbo.Daily_inpat_out as d
left join DATA_MANAGEMENT.dbo.Roster_all_match as r
on d.Subscriber_ID = r.SUB_ID
where
r.MO_DLGTN_STA_DESC = 'DELEGATED'"
queryout "L:\Data_Management\Import_data\Daily_inpat\inpat_out_%mydate%_%mytime%.txt"
-c -S [servername] -U [user] -P [password] -t "|"
这里是汉字输出的第一部分,完整的字符串要长得多:
前籎潇瑶偟潲牧浡䝼偒䥟籄䕍䉍剅也䵁籅䥂呒彈䅄䕔卼扵捳楲敢彲䑉呼彘䕓呔义彇䕄䍓
编辑添加:
如评论中所述,问题出现在记事本中,但在其他应用程序(Word,Excel,Notepad ++)中正确显示,因此这是一个编码问题。我仍然希望了解问题的原因以及如何解决问题。
答案 0 :(得分:3)
这是由文本文件前面的巧合字节排列引起的,这使得记事本相信数据实际上是一个Unicode双字节文本文件。从理论上讲,你可以放置一组字符来说服解析器数据实际上是ASCII,但这会改变输出的格式。
按照易于实施的顺序,你最好的赌注是:
使用记事本查看文本文件时,无法保证可以防止这种情况发生。您可以做的最好是尽量减少问题,或者使用不同的格式进行最终输出。