我正在用c#创建一个时间机器。时间机器是一种以我可以访问特定文件的方式创建文件备份的方式,就像在特定时间一样。无论如何,我这样做的方法是查找目录中的所有文件,并将这些文件信息存储在名为table1的表中。因此,如果我第一次扫描计算机时假设我只有3个文件,因此我的表格看起来像:
ID FullName DateModified DateInsertedToDatabase
1 C:\A 456588731 0
2 C:\B 955588762 0
3 C:\C 854587783 0
让我们说下次执行备份时我有相同的3个文件,但我创建了一个新文件和修改过的文件C.结果我的表现在应该是这样的:
ID FullName DateModified DateInsertedToDatabase
1 C:\A 456588731 0
2 C:\B 955588762 0
3 C:\C 854587783 0
4 C:\A 456588731 1
5 C:\B 955588762 1
6 C:\C 111122212 1
7 C:\X 123212321 1
现在我想复制文件C和文件X,因为这些是已更改或创建的文件。我怎么能建立一个查询,我可以获得文件X和文件C?换句话说,我想得到所有DateInsertedToDatabase = 1且与DateInsertedToDatabase小于1的文件不匹配的文件。
如果我不清楚这是继续我的例子: 让我说我继续我的例子,我删除文件:B和C,我修改文件X,我创建一个新文件Z.我的表应该是这样的:
ID FullName DateModified DateInsertedToDatabase
1 C:\A 456588731 0
2 C:\B 955588762 0
3 C:\C 854587783 0
4 C:\A 456588731 1
5 C:\B 955588762 1
6 C:\C 111122212 1
7 C:\X 123212321 1
8 C:\A 456588731 2
9 C:\X 898989898 2
10 C:\Z 789564545 2
这里我想获取文件X和Z,因为修改了文件X并创建了文件Z.我不想获取文件A,因为该文件已存在,具有相同的DateModified。我该如何构建该查询?
答案 0 :(得分:2)
你想做我称之为“反向内部联接”的事情。基本上是一个左连接,用于过滤掉在内连接中成功匹配的任何内容。还有其他方法可以完成(例如使用子查询)。
这是在T-SQL中:
CREATE TABLE #mytemp
(
[ID] [int] IDENTITY(1,1) NOT NULL,
[FullName] [nvarchar](50) NOT NULL,
DateModified [nvarchar](9) NOT NULL,
DateInsertedToDatabase [int] NOT NULL
)
INSERT INTO #mytemp VALUES ('C:\A', '456588731', '0')
INSERT INTO #mytemp VALUES ('C:\B', '955588762', '0')
INSERT INTO #mytemp VALUES ('C:\C', '854587783', '0')
INSERT INTO #mytemp VALUES ('C:\A', '456588731', '1')
INSERT INTO #mytemp VALUES ('C:\B', '955588762', '1')
INSERT INTO #mytemp VALUES ('C:\C', '111122212', '1')
INSERT INTO #mytemp VALUES ('C:\X', '123212321', '1')
INSERT INTO #mytemp VALUES ('C:\A', '456588731', '2')
INSERT INTO #mytemp VALUES ('C:\X', '898989898', '2')
INSERT INTO #mytemp VALUES ('C:\Z', '789564545', '2')
SELECT
temp1.*
FROM
#mytemp temp1
LEFT JOIN #mytemp temp2 ON
temp1.ID != temp2.ID --don't match on the same two rows
AND temp1.FullName = temp2.FullName --match based on full name
AND temp1.DateModified = temp2.DateModified --and date modified
WHERE
temp1.DateInsertedToDatabase = (SELECT MAX(DateInsertedToDatabase) FROM #mytemp)
AND temp2.ID IS NULL --filter out rows that would have matched on an INNER JOIN
DROP TABLE #mytemp
答案 1 :(得分:0)
我不知道SqlLite,但我希望无论如何都会这样。它没有使用任何花哨的东西。
Select t1.*
From Table1 t1
Left join Table1 t2
On t1.FullName = t2.FullName
And t1.DateInsertedToDatabase = t2.DateInsertedToDatabase + 1
Where t1.DateInsertedToDatabase = (select max(DateInsertedToDatabase) from Table1)
And (t1.DateModified <> t2.DateModified or t2.FullName is null)
加入DateInsertedToDatabase + 1将与之前的记录一起加入。然后筛选最高的DateInsertedToDatabase并包含没有匹配的记录(它们是新的)或修改的日期不匹配的记录。
答案 2 :(得分:0)
Phil Sandler的answer有效。这也是的:
SELECT FullName
FROM table1
INNER JOIN (SELECT FullName, DateModified
FROM table1
WHERE DateInsertedToDatabase = (SELECT MAX(DateInsertedToDatabase) FROM table1)) d
USING (FullName, DateModified)
GROUP BY FullName
HAVING COUNT(1) = 1
答案 3 :(得分:0)
我对它进行了修改,因为我正在使用大量文件,因此解决方案效果很好但不适用于处理大量记录的查询。这是我的成果。
我假设到目前为止我有这些记录:
Select * from table1 WHERE DateInserted = 4
and Path not in(
select Path from table1 t1
where
DateInserted = 4 AND
Path IN (Select Path from table1 where DateInserted<4) AND
DateModified IN (Select DateModified from table1 where DateInserted<4)
)
然后返回:
这个查询的速度要快得多。我显然必须在代码中为变量更改4,但这只是为了说明我所做的更改。