从警方报告中提取地址

时间:2016-02-21 21:49:55

标签: c# extract geocoding

我目前正在开发一个程序,它将搜索中大字符串并提取地址,以便对它们进行地理编码。

我的一个例子是:

private void cardCheck()            
{
    cardCount = mobjEntity.CardCount;
    for (int i = 0; i < cardCount; i++)
    {
        card = mobjEntity.Card[i];
        if (card.Text.Contains(" STREET ") || 
        card.Text.Contains(" Street") ||
        card.Text.Contains(" street") ||
        card.Text.Contains(" ST ") ||
        card.Text.Contains(" St ") ||
        card.Text.Contains(" st "))
        {

        }
    }
}

我不是很擅长正则表达式而且我希望你们中的一个正则表达式可以向我展示一个测试/学习正则表达式的有用链接。

我已经为每种街道类型写了上面的内容,而且非常乏味,我甚至不知道该怎么做。

这是理想的输入输出:

输入: 2010年4月9日星期五上午9:45,我,Janice Ruiz军官被派往鲍威尔街2170号调查爆窃案。我遇到了报告入室盗窃的房主弗兰克盖恩斯。

输出: 鲍威尔街2170号

1 个答案:

答案 0 :(得分:0)

您是否尝试使用正则表达式搜索文本?快速Google search会返回几个可能对您有用的RE。这是一个例子:

\d{1,3}.?\d{0,3}\s[a-zA-Z]{2,30}\s[a-zA-Z]{2,15}

以下是概念验证:https://regex101.com/r/dH3jJ8/1