免责声明:在编码方面,我仍然是新手。
我正在使用Python编辑词典。现在说我有以下标记:
<ab n="7" ana="lg11" lang="grk"><anchor id="lg11_7"/><link type="gnoo" targets="aGNO_25_t" n="g25_t_126_18" id="SuperfluousIdlgo_03_0004_30"><hi rend="b">25</hi>,126,18</link> (häufig verneint:) nicht erlauben, nicht gestatten: οὐκ ἐᾷ κατ᾽ αὐτῶν δυναστεύειν μέχρι ϑανάτου τὴν νόσον</ab>
我需要将希腊语中的德语文本分开,并将其放在自己的<ab>
标记中。然后我需要在轨迹和希腊文本前面加上德语文本。我该如何做到这一点?我搜索过Regex和ElementTree,但我还没有找到任何东西。
答案 0 :(得分:0)
Define Greek letters in a list.
Find first Greek letter in the lexicon entry.
Split the lexicon entry with string.split(position or letter)
Split the lexicon entry at the first '<' afterwards (i.e in </ab>)
Split the lexicon entry at the first '>' beforehand (i.e. in </link>)
Insert your new tag names.
Put the different strings together.
这不是最好的,但却是一个非常简单的解决方案。