Python从配置文件中删除一个字符串

时间:2015-04-09 06:44:45

标签: python split

我有一个配置文件,其中包含一个以制表符分隔的字符串。我想检索该字符串,然后将其转换为一个很好的列表。但是,我看到一些有趣的东西,当我在iPython上直接进行时,我看不到。

[myvars]
myString = "a\tb\tc\td"
.....
.....<many more variables>

我的Python代码有:

param_dict = dict(config.items(myvars))
str1 = param_dict["myString"]
print str1
print str1.split()

它打印出来:

"a\tb\tc\td"
['"a\\tb\\tc\\td"']

但是,当我在我的python控制台上做同样的事情时,我得到了我期望的结果:

Python 2.7.6 (default, Mar 22 2014, 22:59:38) 
[GCC 4.8.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> "a\tb\tc\td".split()
['a', 'b', 'c', 'd']
>>> k = "a\tb\tc\td"
>>> k.split()
['a', 'b', 'c', 'd']

这里发生了什么?有人可以帮我吗?我无法更改配置文件变量的格式。而且,我想把变量拿出来并剥离成一个很好的列表。

感谢。

3 个答案:

答案 0 :(得分:6)

这里正在读取反斜杠,你在打印普通字符串时没有看到这个,但是如果你打印了repr就行了。

In [11]: myString = "a\\tb\\tc\\td"

In [12]: print(myString)
a\tb\tc\td

In [13]: print(repr(myString))
'a\\tb\\tc\\td'

您可以使用解码将\\t转换为\t

In [14]: myString.decode('string_escape')
Out[14]: 'a\tb\tc\td'

一旦它们成为标签,您就可以拆分它们:

In [15]: myString.split()
Out[15]: ['a\\tb\\tc\\td']

In [16]: myString.decode('string_escape').split()
Out[16]: ['a', 'b', 'c', 'd']

答案 1 :(得分:3)

发生这种情况是因为在你的“脚本”中你没有"a\tb\tc\td"你真的有"a\\tb\\tc\\td"但是如果你打印"a\\tb\\tc\\td"它会输出"a\tb\tc\td" < / p>

print myString
Output: 'a\tb\tc\td'
print repr(myString)
Output: 'a\\tb\\tc\\td'

您可以使用功能decode将字符串从'a\\tb\\tc\\td'转换为'a\tb\tc\td'然后拆分或任何您需要的

import re
myString = "a\\tb\\tc\\td"

# I prefer to use regular expressions to deal with strings:
myString = re.sub(r'\W','', myString.decode('string_escape'))
print myString
Output: 'abcd'

# Or you can use split also
myString = myString.decode('string_escape').split()
print myString
Output: ['a', 'b', 'c', 'd']

答案 2 :(得分:3)

从我看到的情况来看,你错误地认为你的字符串是在你的文件中用制表符分隔的,它用两个字符“\”和“t”分隔,它是一个制表符的表示。这是通过带有转义反斜杠的表示来显示的:“a \\ tb”而不是“a \ tb”

由于没有间距字符,sort不知道如何拆分字符串。

您可以在拆分中指定不同的分隔符,这里是两个字符\ t:

str1.split("\\t")