我的下列句子是加泰罗尼亚语:
en aquest sentit,la llei preveu que quanl'administraciós'hagiabstingut d' actuar per sancionar una determinada conducta,comaconcunciènciad'unprocéspancen,i aquest procediment acabiensentència absolutòria,podràiniciaro continuar el corresponent procediment administratiu。
在对句子进行标记并将其变为单词列表之后,我需要找到单词“精算”的索引,但indexof()不会工作。此外,我根本不懂加泰罗尼亚语,但我看到像“l”这样的案例也可以在我需要的词之前。
有没有简单的方法来解决这个问题?
答案 0 :(得分:1)
你可以试试这个:
>>> sen = "en aquest sentit, la llei preveu que quan l'administració s'hagi abstingut d'actuar per sancionar una determinada conducta, com a conseqüència d'un procés penal, i aquest procediment acabi en sentència absolutòria, podrà iniciar o continuar el corresponent procediment administratiu."
>>> tokens = sen.split()
>>> tokens
['en', 'aquest', 'sentit,', 'la', 'llei', 'preveu', 'que', 'quan', "l'administraci\xc3\xb3", "s'hagi", 'abstingut', "d'actuar", 'per', 'sancionar', 'una', 'determinada', 'conducta,', 'com', 'a', 'conseq\xc3\xbc\xc3\xa8ncia', "d'un", 'proc\xc3\xa9s', 'penal,', 'i', 'aquest', 'procediment', 'acabi', 'en', 'sent\xc3\xa8ncia', 'absolut\xc3\xb2ria,', 'podr\xc3\xa0', 'iniciar', 'o', 'continuar', 'el', 'corresponent', 'procediment', 'administratiu.']
>>> def get_index(tokens, substr):
... for i, tk in enumerate(tokens):
... if substr in tk: return i
...
>>> get_index(tokens, "actuar")
11