我做了一些研究,但是我很难找到答案。 到目前为止,我正在使用python 2.7和pandas,但我仍在学习。 我有两个CSV,可以说是一个字母A-Z,第二个数字是0-100。 我想合并两个文件,以使Z到A0到A100。 有关信息,这两个文件具有DNA序列,所以我认为它们是字符串。 我试图用numpy创建数组并创建一个矩阵,但没有可用。 这是文件的预览:
barcode 0 GGAAGAA 1 CCAAGAA 2 GAGAGAA 3 AGGAGAA 4 TCGAGAA 5 CTGAGAA 6 CACAGAA 7 TGCAGAA 8 ACCAGAA 9 GTCAGAA 10 CGTAGAA 11 GCTAGAA 12 GAAGGAA 13 AGAGGAA 14 TCAGGAA 659 barcode 0 CGGAAGAA 1 GCGAAGAA 2 GGCAAGAA 3 GGAGAGAA 4 CCAGAGAA 5 GAGGAGAA 6 ACGGAGAA 7 CTGGAGAA 8 CACGAGAA 9 AGCGAGAA 10 TCCGAGAA 11 GTCGAGAA 12 CGTGAGAA 13 GCTGAGAA 14 CGACAGAA 1995
答案 0 :(得分:0)
我将按照我发现的方式放置在这里,可能会有更性感的方式:
index = pd.MultiIndex.from_product([df8.barcode, df7.barcode], names = ["df8", "df7"])
df = pd.DataFrame(index = index).reset_index()
def concat_BC(x):#concatenate the two sequences into one new column
return str(x["df8"]) + str(x["df7"])
df["BC"] = df.apply(concat_BC, axis=1)
–斯蒂芬·凯伦(Stephane Chiron)