我有一个配置文件,其中包含一个以制表符分隔的字符串。我想检索该字符串,然后将其转换为一个很好的列表。但是,我看到一些有趣的东西,当我在iPython上直接进行时,我看不到。
[myvars]
myString = "a\tb\tc\td"
.....
.....<many more variables>
我的Python代码有:
param_dict = dict(config.items(myvars))
str1 = param_dict["myString"]
print str1
print str1.split()
它打印出来:
"a\tb\tc\td"
['"a\\tb\\tc\\td"']
但是,当我在我的python控制台上做同样的事情时,我得到了我期望的结果:
Python 2.7.6 (default, Mar 22 2014, 22:59:38)
[GCC 4.8.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> "a\tb\tc\td".split()
['a', 'b', 'c', 'd']
>>> k = "a\tb\tc\td"
>>> k.split()
['a', 'b', 'c', 'd']
这里发生了什么?有人可以帮我吗?我无法更改配置文件变量的格式。而且,我想把变量拿出来并剥离成一个很好的列表。
感谢。
答案 0 :(得分:6)
这里正在读取反斜杠,你在打印普通字符串时没有看到这个,但是如果你打印了repr就行了。
In [11]: myString = "a\\tb\\tc\\td"
In [12]: print(myString)
a\tb\tc\td
In [13]: print(repr(myString))
'a\\tb\\tc\\td'
您可以使用解码将\\t
转换为\t
:
In [14]: myString.decode('string_escape')
Out[14]: 'a\tb\tc\td'
一旦它们成为标签,您就可以拆分它们:
In [15]: myString.split()
Out[15]: ['a\\tb\\tc\\td']
In [16]: myString.decode('string_escape').split()
Out[16]: ['a', 'b', 'c', 'd']
答案 1 :(得分:3)
发生这种情况是因为在你的“脚本”中你没有"a\tb\tc\td"
你真的有"a\\tb\\tc\\td"
但是如果你打印"a\\tb\\tc\\td"
它会输出"a\tb\tc\td"
< / p>
print myString
Output: 'a\tb\tc\td'
print repr(myString)
Output: 'a\\tb\\tc\\td'
您可以使用功能decode
将字符串从'a\\tb\\tc\\td'
转换为'a\tb\tc\td'
然后拆分或任何您需要的
import re
myString = "a\\tb\\tc\\td"
# I prefer to use regular expressions to deal with strings:
myString = re.sub(r'\W','', myString.decode('string_escape'))
print myString
Output: 'abcd'
# Or you can use split also
myString = myString.decode('string_escape').split()
print myString
Output: ['a', 'b', 'c', 'd']
答案 2 :(得分:3)
从我看到的情况来看,你错误地认为你的字符串是在你的文件中用制表符分隔的,它用两个字符“\”和“t”分隔,它是一个制表符的表示。这是通过带有转义反斜杠的表示来显示的:“a \\ tb”而不是“a \ tb”
由于没有间距字符,sort不知道如何拆分字符串。
您可以在拆分中指定不同的分隔符,这里是两个字符\ t:
str1.split("\\t")