我尝试从文本中提取信息,但是我的一些示例无法通过测试。
测试数据:
Д. Большая Пустынь
ДНП "Залесье"
ДНП "Косулинские дачи"
ДНП "Лесные дачи"
ДНП "Мешков Лог"
ДНП "Подкова"
х. Каширинский
село Куяново
с.Черемисское
并使用表达式
re.search(r"""^(?:[Дд]еревня|[Сс]ело|[ДдСсПпXx]|[Дд]ер|[Пп]ос[eё]лок|ДНП)\.?\s?"?[\w\s\.]+"?
|[\w\s]+[Сс]ельсовет""", test_str)