如何创建两个文件的组合组合

时间:2018-11-05 09:52:47

标签: python-2.7 combinations

我做了一些研究,但是我很难找到答案。 到目前为止,我正在使用python 2.7和pandas,但我仍在学习。 我有两个CSV,可以说是一个字母A-Z,第二个数字是0-100。 我想合并两个文件,以使Z到A0到A100。 有关信息,这两个文件具有DNA序列,所以我认为它们是字符串。 我试图用numpy创建数组并创建一个矩阵,但没有可用。 这是文件的预览:

    barcode
0   GGAAGAA
1   CCAAGAA
2   GAGAGAA
3   AGGAGAA
4   TCGAGAA
5   CTGAGAA
6   CACAGAA
7   TGCAGAA
8   ACCAGAA
9   GTCAGAA
10  CGTAGAA
11  GCTAGAA
12  GAAGGAA
13  AGAGGAA
14  TCAGGAA
659
     barcode
0   CGGAAGAA
1   GCGAAGAA
2   GGCAAGAA
3   GGAGAGAA
4   CCAGAGAA
5   GAGGAGAA
6   ACGGAGAA
7   CTGGAGAA
8   CACGAGAA
9   AGCGAGAA
10  TCCGAGAA
11  GTCGAGAA
12  CGTGAGAA
13  GCTGAGAA
14  CGACAGAA
1995

1 个答案:

答案 0 :(得分:0)

我将按照我发现的方式放置在这里,可能会有更性感的方式:

index = pd.MultiIndex.from_product([df8.barcode, df7.barcode], names = ["df8", "df7"])
df = pd.DataFrame(index = index).reset_index()
def concat_BC(x):#concatenate the two sequences into one new column
    return str(x["df8"]) + str(x["df7"])
df["BC"] = df.apply(concat_BC, axis=1)

–斯蒂芬·凯伦(Stephane Chiron)