在Python中将易失性字符串写入文件

时间:2014-01-19 21:17:01

标签: python string io tuples

我有很多字符串:元组列表中大约有14,000个字符串。 很多字符串都有逗号和换行符,甚至可能是unicode分隔符 - 不是100%肯定。

我需要将元组写入文件,最好以某种格式打开excel或数字。我尝试了CSV,但字符串中的所有逗号都搞乱了文件。

如何将我的元组列表写入文件,该文件应采用何种格式,以便字符串中的奇怪内容不会影响文件的格式

3 个答案:

答案 0 :(得分:1)

在python csv模块中,您可以定义除逗号以外的delimiter

csv.writer(file, delimiter=':')

答案 1 :(得分:1)

如果目标是Excel,那么您可以使用Excel文件编写模块,例如XlsxWriterxlwt

这样可以避免CSV分隔符的任何问题。

答案 2 :(得分:0)

不要改变任何东西。

由于“我的推文样本几乎涵盖了每个unicode char”,因此没有合理的安全分隔符可供选择。

但CSV有办法解决这个问题:转义特殊字符,引用带有特殊字符的字段,或两者兼而有之。有许多选项可供选择,您可以在Dialects and Formatting Parameters中看到。

但是,默认方言专门设计用于Excel。而且,由于您的目标是将数据放入Excel可以打开的某种格式,因此您可以按原样使用默认值。除非您想在文本编辑器中使其更具可读性和可编辑性,否则没有问题。