如何根据某些条件有效地附加文件

时间:2018-07-21 17:41:33

标签: python pandas file dataframe coding-efficiency

这是我的数据框

            Clinic Number  6month   file_name                 date
1             09060083     1     09060083-blah-2015-05-05     2015-05-05
2             494383       4     494383-blah-2015-05-05       2015-05-05
3             494383       4     494383-blah-2015-05-05       2015-05-05
4             494383       1     494383-blah-2015-05-05       2015-05-05
5             494383       4     494383-blah-2015-05-05       2015-05-05
6             494380       9     494380-blah-2016-05-05       2016-05-05
7             494380       4     494380-blah-2017-01-01       2017-01-01

file_name列包含保存在路径中的某些文件的文件名。

source_path= '/path to files'

(诊所编号是文件名的前8个字符,date也是从文件名中提取的。)

我想要的是具有相同Clinic Numberdate的文件名的内容。(组合意味着必须将它们附加到第一个文件中,然后将文件副本附加到新路径中)。

例如:对于此诊所编号09060083,无需与任何文件合并,因为与其他诊所编号不匹配。

为此494383,必须附加所有4 files的内容,因为它们的Clinic Numberdate相同。

对于494380,尽管有两个诊所编号与此编号,但是由于date不同,因此不应将它们合并。

感谢您的帮助和时间:)

如果有人有主意,第二部分只是一个选择:)

第二次:在添加了这些文件之后,我需要根据6month列将这些文件复制到另一个路径(我的意思是在其1中带有6month column的文件将被移动到folder_12中带有6month column的文件将被移动到folder_2并... 有没有什么方法可以以最有效的方式同时完成这两项任务? 我已经完成了基于6month column的文件的复制工作,但是我想知道是否可以一步一步地集成这两个任务,而不是先附加相似的文件然后根据6month column复制它们。

0 个答案:

没有答案