我有一个mysql数据库新闻,其中有一个名为links的表。其中一个列叫做link_title,它会有这样的内容而没有引号" neil-degrasse-tyson-why-you-will-levitate"。该表中大约有40,000行。
我有一个名为topUrls.txt的txt文件来自Google Analytics,它显示了我网站上访问量最大的1500个网址。一行,一个URL。并且已清理URL以匹配DB中link_title的内容。
有人可以指导我使用mysql脚本来基本清理所有行的链接表,这些行没有与文本文件中的1500个URL之一匹配的link_title。或者我需要在php或其他东西编程吗?
答案 0 :(得分:0)
将topUrls.txt加载到表中。我们将其称为topUrls并调用该表Url的单列。然后将link_title与topUrls匹配,并在不匹配时删除
delete links
where link_title not in (
select Url from topUrls)
仅当Google文件完全的内容与现有数据库行匹配时才有效。否则,您将不得不在子选择中使用另一个WHERE
子句,其中包含一些字符串操作。