我有一个文本文件,我需要附加才能导入到我的数据库中。文本文件中有大约4800个奇数行。数据在。有人可以用python脚本帮助我:
请注意,NDC有一段时间是XXXX-XXXX-XX格式,有时是XXXXX-XXXX-XX格式。
以下是一些数据:
NDC,0065-0795-50
5.25667
48320,2
NDC,0517-2650-25
0.0411
NDC,51079-190-20
0.1582
NDC,0603-5450-21
0.7924
答案 0 :(得分:2)
with open(inpath, 'r') as infile, open(outpath, 'w') as outfile:
for line in infile:
if 'NDC,' in line:
outfile.write(line)
这做了一些假设:
'NDC,'
之外永远不会有任何随机文字。如果不是这样,您可能需要编写更智能的测试,可能使用regular expressions。'NDC,'
,您想要写整行,而不仅仅是该行的那一部分。如果这不是真的,那么应该很容易调整 - 特别是如果你已经完成了上述操作(因为那样你只需要编写,例如re
匹配而不是行。)由于你的问题是如此模糊,除了做出类似的猜测之外别无选择,而且至少其中一个可能是错误的。
但是这会告诉你程序的结构是什么样的,你应该能够自己填补空白。试试吧,如果你遇到困难,请回来寻求帮助。