mssql处理行返回相当笨拙

时间:2008-12-10 05:10:49

标签: java python sql-server formatting jython

问题在于:

供您参考:

http://i.stack.imgur.com/mmrNH.jpg

使用jdbc1.2使用jython 2.2.1创建数据库条目1,2和3。 数据库条目4使用vb使用旧的替换程序使用odbc。

我们发现,如果我直接从该SQL Server企业管理器软件将jython和vb MailBody条目复制并粘贴到wordpad,它会正确地输出格式并返回正确的行。如果我用十六进制编辑器或KDiff3比较每个文件的字节,它们的二进制相同。

有第三方程序使用此数据。遗憾的是,第三方程序读取数据,对于条目1到3,它显示没有换行的数据。虽然对于条目4,它正确地格式化文本。作为我们在图片中可以看到的进一步证明,数据库中的数据以不同方式显示。 不知何故,行返回在数据库中保留为vb条目,但是它们被忽略的jython条目。如果我点击条目4的“MailBody”字段,我可以按下,我可以看到电子邮件的其余部分。而jython的数据显示在一行中。

给出了什么,我缺少什么,以及如何处理这个问题? 以下是我实际将其发送到数据库的代码片段。

编辑:仅供参考:请忽略“已处理”栏中的差异,这是无关紧要的。 编辑:我想做的是让jython程序以与vb程序相同的方式输入数据。这样第三方程序就会出现并正确显示数据。 所以它看起来就像'MailBody'中的每个条目都会显示“这只是一个测试!”然后下一行“等等”,所以如果我要做一个screendump所有条目都类似于数据库条目4。

已解决

将_force_CRLF添加到混音中:

def _force_CRLF(self, data):
    '''Make sure data uses CRLF for line termination.
    Nicked the regex from smtplib.quotedata. '''
    print data
    newdata = re.sub(r'(?:\r\n|\n|\r(?!\n))', "\r\n", data)
    print newdata
    return newdata

def _execute_insert(self):
    try:
        self._stmt=self._con.prepareStatement(\
            "INSERT INTO EmailHdr (EntryID, MailSubject, MailFrom, MailTo, MailReceive, MailSent, AttachNo, MailBody)\
             VALUES (?, ?, ?, ?, ?, ?, ?, cast(? as varchar (" + str(BODY_FIELD_DATABASE) + ")))")
        self._stmt.setString(1,self._emailEntryId)
        self._stmt.setString(2,self._subject)
        self._stmt.setString(3,self._fromWho)
        self._stmt.setString(4,self._toWho)
        self._stmt.setString(5,self._format_date(self._emailRecv))
        self._stmt.setString(6,self._format_date(self._emailSent))
        self._stmt.setString(7,str(self._attachmentCount))
        self._stmt.setString(8,self._force_CRLF(self._format_email_body()))
        self._stmt.execute()
        self._prepare_inserting_attachment_data()
        self._insert_attachment_data()
    except:
        raise

def _format_email_body(self):
    if not self._emailBody:
        return "could not extract email body"
    if len(self._emailBody) > BODY_TRUNCATE_LENGTH:
        return self._clean_body(self._emailBody[:BODY_TRUNCATE_LENGTH])
    else:
        return self._clean_body(self._emailBody)

def _clean_body(self,dirty):
    '''this method simply deletes any occurrence of an '=20' that plagues my output after much testing this is not related to the line return issue, even if i comment it out I still have the problem.''' 
    dirty=str(dirty)
    dirty=dirty.replace(r"=20","")
    return r"%s"%dirty

2 个答案:

答案 0 :(得分:1)

我建议在程序中添加调试输出,在插入DB之前转储字符代码。 Jython有可能用单个字符替换CrLf对,并且在写入DB时不会恢复它。

答案 1 :(得分:1)

您应该查看quopri模块(以及其他有关电子邮件的模块),这样您就不必使用肮脏的技巧_clean_body