你能把变量传递给pandas.Series.str.extract吗?

时间:2015-09-02 09:18:02

标签: python pandas

我有两个数据帧,我想在两者之间查找一些值。我正在使用pd.Series.str.extract执行此操作,但似乎我无法通过已编译的模式进行提取。

第一个df就像这样:

In [91]: df.head()
Out[91]:

       text     lemma   pos  multiwordexpr   txp
0       ch'       che     c              0  CCHE
1  Politica  Politica   npt              0   SPN
2        l'        lo  rdms              0    RS
3        la        la  rdfs              0    RS
4    grandi    grande  a2mp              0    AP

第二个df看起来像这样:

In [90]: mt.tail()
Out[90]: 

          form   lemma    morpho
505069   élite   élite  NOUN-F:p
505070   élite   élite  NOUN-F:s
505071  élites   élite  NOUN-F:p
505072  équipe  équipe  NOUN-F:p
505073  équipe  équipe  NOUN-F:s

现在,对于txp =' X',如果文本匹配mt.form并且引理匹配mt.lemma,那么我想要txp = mt.morpho。

我正在尝试执行以下操作(嵌入在函数中,因此我可以在迭代时调用它):

word = re.compile(df.text[i])
lemma = re.compile(df.lemma[i])
mt.form.str.extract(word).dropna().index

但是我收到以下错误:

ValueError: This pattern contains no groups to capture.

0 个答案:

没有答案