我正在尝试从两个完全不同的来源加入数据。一个来源包含员工的日程安排信息,另一个来源跟踪他们实际工作的内容(比如他们实际上吃午饭或休息的时间)。问题是,计划程序给出的时间为BREAK1,BREAK2,BREAK3和LUNCH,而跟踪程序只是将它们列为午餐和休息时间。我可以加入数据并获得午餐,但休息时间让我失望。如果我将BREAK1,BREAK2和BREAK3转换为“Break”,我最终会得到太多的段,因为它将每个实例与每个其他实例匹配。有没有人可以想到加入这两条信息?谢谢。
修改的 根据您的要求,这里有一些示例数据:
这是预定时间:
EMP_ID NOM_DATE SEG_CODE START_MOMENT STOP_MOMENT
626009 26-Sep-13 BREAK2 9/26/13 5:00 PM 9/26/13 5:15 PM
625650 26-Sep-13 BREAK2 9/26/13 4:30 PM 9/26/13 4:45 PM
638815 26-Sep-13 BREAK2 9/26/13 4:00 PM 9/26/13 4:15 PM
621649 26-Sep-13 BREAK2 9/26/13 3:30 PM 9/26/13 3:45 PM
567005 26-Sep-13 BREAK2 9/26/13 3:30 PM 9/26/13 3:45 PM
626009 26-Sep-13 LUNCH 9/26/13 2:30 PM 9/26/13 3:30 PM
625650 26-Sep-13 LUNCH 9/26/13 1:30 PM 9/26/13 2:30 PM
638815 26-Sep-13 LUNCH 9/26/13 1:30 PM 9/26/13 2:30 PM
621649 26-Sep-13 LUNCH 9/26/13 12:30 PM 9/26/13 1:30 PM
567005 26-Sep-13 LUNCH 9/26/13 12:30 PM 9/26/13 1:30 PM
626009 26-Sep-13 BREAK1 9/26/13 11:45 AM 9/26/13 12:00 PM
625650 26-Sep-13 BREAK1 9/26/13 11:30 AM 9/26/13 11:45 AM
638815 26-Sep-13 BREAK1 9/26/13 11:45 AM 9/26/13 12:00 PM
621649 26-Sep-13 BREAK1 9/26/13 9:30 AM 9/26/13 9:45 AM
567005 26-Sep-13 BREAK1 9/26/13 9:30 AM 9/26/13 9:45 AM
这是实际时间
EMP_ID Seg_Code Start_Time Stop_Time
625650 Break 9/26/2013 17:54 9/26/2013 17:55
567005 Break 9/26/2013 14:56 9/26/2013 14:59
567005 Break 9/26/2013 15:32 9/26/2013 15:44
638815 Break 9/26/2013 16:34 9/26/2013 16:47
567005 Break 9/26/2013 10:08 9/26/2013 10:21
626009 Break 9/26/2013 17:01 9/26/2013 17:15
625650 Break 9/26/2013 11:31 9/26/2013 11:45
626009 Break 9/26/2013 11:52 9/26/2013 12:07
621649 Break 9/26/2013 9:34 9/26/2013 9:48
621649 Break 9/26/2013 15:31 9/26/2013 15:45
638815 Break 9/26/2013 11:46 9/26/2013 12:02
625650 Break 9/26/2013 16:35 9/26/2013 16:51
567005 Lunch 9/26/2013 12:31 9/26/2013 13:29
625650 Lunch 9/26/2013 13:31 9/26/2013 14:30
626009 Lunch 9/26/2013 14:31 9/26/2013 15:30
638815 Lunch 9/26/2013 13:31 9/26/2013 14:30
621649 Lunch 9/26/2013 12:31 9/26/2013 13:30
我试图在他们的预定时间和实际休息时间之间得到差异(以分钟为单位)。一个正确的例子是:
Badge Seg_Code Scheduled Start Scheduled Stop Actual Start Actual Stop Difference Seg_Duration
192329 Lunch 9/26/13 8:15 AM 9/26/13 9:15 AM 9/26/2013 8:18:27 AM 9/26/2013 9:17:59 AM 3 0:00:59:32
再次感谢您
答案 0 :(得分:0)
虽然在经常运行的查询中通常不是一个好主意,但您可以在连接条件中使用字符串函数。例如在MySQL中,它看起来像这样:
CREATE TABLE test1 (
worktype VARCHAR(20)
);
INSERT INTO test1 VALUES ('BREAK1');
INSERT INTO test1 VALUES ('BREAK2');
CREATE TABLE test2 (
worktype VARCHAR(20)
);
INSERT INTO test2 VALUES ('Break');
SELECT t1.worktype 't1', t2.worktype 't2'
FROM test1 t1
JOIN test2 t2 ON LEFT(t1.worktype, LENGTH(t2.worktype)) = LOWER(t2.worktype);
根据您的应用程序,这可能是合理的 - 例如,如果您在批处理作业中每周运行一次,以复制来自您无法控制的来源的数据。
至于你的第二个问题:如果表中没有可以在连接中使用的其他数据,则无法解决“Break”与“BREAK1”,和<连接的问题/ em>“BREAK2”等 - 换句话说,熵或信息密度只是低。您必须自己想出一个“打破”,以决定要显示哪一行(“BREAK1”,“BREAK2”)。例如,您可以使用此规则:“始终在BREAK2上使用BREAK1”。您的帖子中没有足够的信息为您制定规则。
答案 1 :(得分:0)
假设SQL Server:
;WITH Actual_Ranked AS
(
SELECT
ROWNUM = CASE Seg_Code
WHEN 'Break' THEN CAST(ROW_NUMBER() OVER (PARTITION BY EMP_ID, Seg_Code, CAST(Start_Time AS DATE) ORDER BY Start_Time) AS VARCHAR(1))
ELSE ''
END,
EMP_ID,
Seg_Code,
Start_Time,
Stop_Time
FROM
#Actual
)
SELECT
ISNULL(sched.EMP_ID, act.EMP_ID) AS Badge,
ISNULL(sched.SEG_CODE, (act.SEG_CODE + ROWNUM)) AS Seg_Code,
CONVERT(VARCHAR, sched.START_MOMENT, 22) AS [Scheduled Start],
CONVERT(VARCHAR, sched.STOP_MOMENT, 22) AS [Scheduled Stop],
CONVERT(VARCHAR, act.Start_Time, 22) AS [Actual Start],
CONVERT(VARCHAR, act.Stop_Time, 22) AS [Actual Stop],
DATEDIFF(minute, sched.START_MOMENT, act.Start_Time) AS [Difference]
FROM
#Scheduled sched
FULL JOIN Actual_Ranked act ON sched.EMP_ID = act.EMP_ID
AND sched.SEG_CODE = (act.SEG_CODE + ROWNUM);
根据需要替换表名。
关键是我得到了休息时间的行号并附加了该号码以使联接起作用。
我没有提供Seg_Duration
来简化答案,但您可以通过查看this question的答案,以首选格式显示持续时间。
SQL小提琴here。