我有一个包含以下内容的文本文件:
1:PAPER TOWNS,TOMORROWLAND
2:ENTOURAGE,JUPITER ASCENDING
我计划将它们读入一个输出列表:
[[1,'PAPERTOWNS','TOMORROWLAND'],[2,'ENTOURAGE','JUPITERASCENDING']]
我写道:
def read_file():
fileName = "testing.txt"
testFile = open(fileName)
table = []
for line in testFile:
contents = line.strip().split(':')
contents[0] = int(contents[0])
contents[1] = contents[1].replace(' ','')
table.append(contents)
print(table)
我几乎设法得到我想要的输出但我无法找到一种方法来分离字符串:
[[1,'PAPERTOWNS,TOMORROWLAND'],[2,'ENTOURAGE,JUPITERASCENDING']]
到
[[1,'PAPERTOWNS','TOMORROWLAND'],[2,'ENTOURAGE','JUPITERASCENDING']]
答案 0 :(得分:1)
您可以用逗号分割第二个元素。
<强>演示强>
def read_file():
fileName = "testing.txt"
testFile = open(fileName)
table = []
for line in testFile:
contents = line.strip().split(':')
table.append([int(contents[0])] + contents[1].split(","))
print(table)
<强>输出:强>
[[1, 'PAPER TOWNS', 'TOMORROWLAND'], [2, 'ENTOURAGE', 'JUPITER ASCENDING']]
使用Regex:
import re
def read_file():
fileName = "testing.txt"
testFile = open(fileName)
table = []
for line in testFile:
contents = re.split("[,:]+", line.strip())
table.append(contents)
print(table)
<强>输出:强>
[['1', 'PAPER TOWNS', 'TOMORROWLAND'], ['2', 'ENTOURAGE', 'JUPITER ASCENDING']]
答案 1 :(得分:0)
这是一只带有熊猫的单行。你的文件就像一个CSV文件,只是分隔符可以是冒号或逗号,所以我们使用正则表达式:
import pandas as pd
df = pd.read_csv('file.txt', header=None, sep=r'[:,]')
答案 2 :(得分:0)
您可以使用多个分隔符拆分字符串:
import re
print([[int(re.split(':|,', line.strip())[0])]+re.split(':|,', line.strip())[1:] for line in open('text_file','r')])
输出:
[[1, 'PAPER TOWNS', 'TOMORROWLAND'], [2, 'ENTOURAGE', 'JUPITER ASCENDING']]