满足特定条件后如何捕获一些非结构化数据?

时间:2019-02-07 14:52:52

标签: python pandas

我正在将调查数据从一个Excel文件导出到另一个文件,并使用一些结构不良的数据,因此我需要针对给定的问题找到一种解决方法:

假设我有一个df1,看起来像这样:

Reference Code     Original Text         Translation
RUSSIA_PRES        How do you like       Как вам нравится президент Трамп?
                   President Trump?
1                  Love him              Люблю его     
2                  Hate him              Ненавижу его

RUSSIA_ECON        Is the economy good?  Хороша ли экономика?
1                  Yes                   да
2                  No                    нет

我需要做的是使用另一个数据框,如果参考代码相关,则进行交叉比较-我已经弄清楚了这部分。我的问题是秤(即1、2)。例如,假设Russia_Pres在我要合并的其他数据框中,而Russia_Econ不是。我能够拉出Russia_PresOriginal TextTranslation,但是我很难弄清楚-“好吧,俄罗斯压力机在那儿,我又如何得到秤本质上,我的问题是:如果我发现Russia_Econ并提取那一行数据,我该如何提取其余部分数据,然后再找到可能对我们没有用的其他参考代码?

0 个答案:

没有答案