我正在开发一个Python(3.6)项目,我需要从目录结构中解析一些文本文件。
目录结构为:
- easy(root dir)
---- sub_dir
------- another_sub_dir
-----------描述(另一个子目录)
------------------ description.txt(file)
我需要遍历子目录中的所有descript.txt文件,然后将它们解析到数据库中。
description.txt文件的格式为标准格式:
从文本段落开始,然后我们有输入,输出,约束,示例>输入,输出和说明标题。我们需要将description.txt文件保存在数据库中,因为这些标题将转换为数据库表格列。
我试图遍历目录结构,找到所有description.txt文件:
import os
for root, dirs, files in os.walk(os.path.join('easy')):
for file in files:
if file.endswith('description.txt'):
print(os.path.join(root, file))
通过这种方式,我们可以获取所有的description.txt文件,但是我们如何使用该文本文件中的标题解析它们并将它们保存到数据库中。
我们怎样才能做到这一点? 请叫我!
提前致谢!
答案 0 :(得分:0)
您可以将标题保存为列表,然后再将其拆分: -
with open(description.txt) as desc_file:
Heading1 = "keep reading until you get 2 blank lines in a row"
Heading2 = "keep reading until you get 2 blank lines in a row"
.
.
Last_ Heading = ditto
现在,您可以将这些标题映射到表格列。
编辑: - 打开时你可能想要指定什么样的编码文件,它会在系统之间推迟。