SQL查询差异很小的实体名称

时间:2018-07-24 06:12:54

标签: sql dirty-data

我必须从一个包含成千上万个脏数据条目的大城市中查询一个非常大的.csv数据集,如以下示例所示。

我将如何进行SQL查询以捕获与以下公司名称排列匹配的所有记录实例?在导出到SQL之前,我是否必须以某种方式清除.csv数据?预先感谢。

'UFS INDUSTRIES INC. DBA SALLY SHERMAN FOODS',
'UFS INDUSTRIES INC. DBA SALLY SHERMAN FOODS.',
'UFS INDUSTRIES INC., DBA SALLY SHERMAN FOODS',
'UFS INDUSTRIES INC., DBA, SALLY SHERMAN FOODS',
'UFS INDUSTRIES INCORPORATED',
'UFS INDUSTRIES INCORPORATED DBA SALLY SHERMAN FOOD',
'UFS INDUSTRIES INCORPORATED DBA SALLY SHERMAN FOODS', 

1 个答案:

答案 0 :(得分:0)

我将其添加到此处,因为由于声誉我无法发表评论,我认为您会发现它很重要。

Cleaning Messy data in SQL