我正在用Python做一个项目,我必须使用Weka,所以我必须使用我可以从csv获得的arff文件,我正在创建包含分子描述符的文件。
这样的事情:
Name nAcid ALogP ... WPOL XLogP Zagreb
0 AUTOGEN_bumex 1 -1.4399 ... 37.0 1.220 124.0
1 AUTOGEN_cenestin 0 0.3269 ... 44.0 0.247 140.0
2 AUTOGEN_clozapine 0 1.6380 ... 41.0 2.583 126.0
3 AUTOGEN_diovan 3 0.5202 ... 49.0 4.409 160.0
4 AUTOGEN_evista 0 0.7973 ... 54.0 2.720 182.0
5 AUTOGEN_folic acid 2 -3.5377 ... 48.0 -3.972 162.0
6 AUTOGEN_forteo 5 -35.1594 ... 430.0 -13.601 1374.0
7 AUTOGEN_hydroxyzine 0 2.2387 ... 37.0 0.800 128.0
8 AUTOGEN_nexium 0 -0.5219 ... 39.0 -0.882 126.0
9 AUTOGEN_paxil 0 -0.2902 ... 35.0 2.271 128.0
10 AUTOGEN_potassium 0 NaN ... 0.0 0.000 0.0
11 AUTOGEN_prednisone 0 -0.7488 ... 59.0 0.608 154.0
12 AUTOGEN_provera 0 0.5736 ... 62.0 4.279 164.0
13 AUTOGEN_cimetidine 0 0.5736 ... 62.0 4.279 164.0
14 AUTOGEN_irinotecan 0 0.5736 ... 62.0 4.279 164.0`
我需要查看这些化合物之间已知相互作用的列表,如果我发现一些相互作用(例如西咪替丁和伊立替康之间),我必须附加创建一个新行,其中有'西咪替丁'行和'伊立替康'排在它前面,像这样:
Name nAcid ALogP ... WPOL XLogP Zagreb Name2 nAcid2 ALogP2 ... WPOL2 XLogP2 Zagreb2
AUTOGEN_cimetidine 0 0.5736 ... 62.0 4.279 164.0 AUTOGEN_irinotecan 0 0.5736 ... 62.0 4.279 164.0
如果我找不到该givin化合物的任何相互作用,我只需要一个含有化合物和属性的行,然后用于第二个化合物属性的列只是空白或0。
我只是不知道我怎么能这样做,如果有人可以帮助我那将是伟大的! :)