我有一张从excel导入的表。所有内容都以字符串形式导入,以便逐步修复数据类型。
我现在正在进行规范化过程,并开始在给定行上完成一个select distinct,以提取出重复到另一个具有id的表的列。
现在我试图用原始表中的每个字符串替换,并在另一个表中替换相应字符串的id。
我可以用这样的东西一个接一个地做到这一点......
UPDATE myTable
SET myCol = REPLACE(myCol, 'String', 'Num')
然后将myCol转换为int。
但是必须运行它,并且系统中每个字符串的各种变化都非常容易出错。
例如,如果我意外地使用相同的数字两次,替换每个字符串...我不能再告诉哪个记录集最初属于第一次更新,哪些是新的。当数据集与我的一样大时,这是一个问题。
我是否可以通过某种方式将其与表上的联接相结合,让系统为我自动化流程。我可以想象,在过去的30年或更长时间里,正常化是如此重要,现在这个问题必须得到解决和解决。
任何帮助都将不胜感激。