寻求一些帮助。我试图从表中提取文本并将数据组织成列表列表的字典。 该表的结构如下:
Date Clock In Clock Out JobCode Job
Monday 2/3/14 - - - -
Tuesday 2/4/14 16:00 17:30 5 Server
17:45 20:00 5 Server
Wednesday 2/5/14 - - - -
Thursday 2/6/14 - - - -
Friday 2/7/14 13:30 18:00 3 Cook
Saturday 2/8/14 - - - -
Sunday 2/9/14 - - - -
我需要的是返回此表格中的数据:
MyDict = {"Monday 2/3/14":[[]],
"Tuesday 2/4/14":[[16:00, 17:30, "5", "server"],
[17:45, 20:00, "5", "server"]],
"Wednesday 2/5/14":[[]],
"Thursady 2/6/14":[[]],
"Friday 2/7/14":[[13:30, 18:00, 3, cook]],
"Saturday 2/8/14":[[]],
"Sunday 2/9/14":[[]]
}
各个时间卡需要将其数据组织到一个列表中,然后在各个日期下进一步列入列表。 我将拍摄这些数据的快照,生成一个新的时间卡,然后使用新的快照与旧的快照进行比较,以使用正确的数据验证新的时间卡是否在正确的位置。对此有任何帮助将非常感激。
由于
答案 0 :(得分:2)
看看pandas。它非常适合处理任何表格数据。使用read_csv
功能将其读入。
你会遇到一些麻烦,因为你没有一个清晰的分隔符(我们不能使用空格作为分隔符,因为你的日期和标题有空格)。您可能需要稍微修改输入格式才能使用它(例如,使用逗号作为分隔符)。