这是我的数据框
Clinic Number 6month file_name date
1 09060083 1 09060083-blah-2015-05-05 2015-05-05
2 494383 4 494383-blah-2015-05-05 2015-05-05
3 494383 4 494383-blah-2015-05-05 2015-05-05
4 494383 1 494383-blah-2015-05-05 2015-05-05
5 494383 4 494383-blah-2015-05-05 2015-05-05
6 494380 9 494380-blah-2016-05-05 2016-05-05
7 494380 4 494380-blah-2017-01-01 2017-01-01
file_name
列包含保存在路径中的某些文件的文件名。
source_path= '/path to files'
(诊所编号是文件名的前8个字符,date
也是从文件名中提取的。)
我想要的是具有相同Clinic Number
和date
的文件名的内容。(组合意味着必须将它们附加到第一个文件中,然后将文件副本附加到新路径中)。
例如:对于此诊所编号09060083
,无需与任何文件合并,因为与其他诊所编号不匹配。
为此494383
,必须附加所有4 files
的内容,因为它们的Clinic Number
和date
相同。
对于494380
,尽管有两个诊所编号与此编号,但是由于date
不同,因此不应将它们合并。
感谢您的帮助和时间:)
如果有人有主意,第二部分只是一个选择:)
第二次:在添加了这些文件之后,我需要根据6month
列将这些文件复制到另一个路径(我的意思是在其1
中带有6month column
的文件将被移动到folder_1
,2
中带有6month column
的文件将被移动到folder_2
并...
有没有什么方法可以以最有效的方式同时完成这两项任务?
我已经完成了基于6month column
的文件的复制工作,但是我想知道是否可以一步一步地集成这两个任务,而不是先附加相似的文件然后根据6month column
复制它们。