使用FirstOrDefault和ToArray进行LINQ查询

时间:2016-11-25 18:13:37

标签: mysql sql .net performance linq

使用MySQL 5.6和下表结构:

CREATE TABLE `dataitem` (
  `AI` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `ID` binary(16) NOT NULL,
  `OwnerID` binary(16) NOT NULL,
  `DataItemTimeUtc` datetime NOT NULL,
  `DataItemTimeLocal` datetime NOT NULL,
  `DataItemTimeMicroSeconds` int(11) NOT NULL,
  `DataItemArrivalTimeUtc` datetime NOT NULL DEFAULT '0001-01-01 00:00:00',
  `DataItemTimeTimeZoneID` binary(16) NOT NULL,
  `QuestionID` binary(16) NOT NULL,
  `QuestionHistoryID` binary(16) DEFAULT NULL,
  `QuestionAbsolutePositionID` varchar(1000) COLLATE utf8_unicode_ci DEFAULT NULL,
  `GroupSessionIDString` varchar(250) COLLATE utf8_unicode_ci DEFAULT NULL,
  `DataItemType` int(11) NOT NULL,
  `DataEntryDevice` varchar(250) COLLATE utf8_unicode_ci DEFAULT NULL,
  `DataEntryDeviceCradle` varchar(250) COLLATE utf8_unicode_ci DEFAULT NULL,
  `DataItemXml` longtext COLLATE utf8_unicode_ci NOT NULL,
  PRIMARY KEY (`AI`),
  UNIQUE KEY `dataitem_ID_UQ_Idx` (`ID`),
  KEY `dataitem_OwnerID_Idx` (`OwnerID`),
  KEY `dataitem_DataItemTimeUtc_Idx` (`DataItemTimeUtc`),
  KEY `dataitem_QuestionID_Idx` (`QuestionID`),
  KEY `dataitem_QuestionHistoryID_Idx` (`QuestionHistoryID`),
  KEY `dataitem_QuestionAbsolutePositionID_Idx` (`QuestionAbsolutePositionID`(255)),
  KEY `dataitem_DataItemType_Idx` (`DataItemType`)
) ENGINE=InnoDB AUTO_INCREMENT=23467 DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;

我正在经历一些我难以理解的事情。以下查询会导致致命错误,因为它将永远执行:

        Guid patientid = new Guid("cfed2acf-acbd-4ab2-8c23-7ab0b3a8cfa3");
        var latestRecord = (from f in QueryHelper.GetEntityTable<DataItem>()
                              where
                              f.OwnerID == patientid
                              && f.QuestionAbsolutePositionID == "5867FF5EC08B9C0422EFD1359B2802B29A8E167952D381EC70AE53CE6D4C9318"
                              orderby f.DataItemTimeUtc descending
                              select f.ID).FirstOrDefault();

但是,如果我将.FirstOrDefault()更改为.ToArray(),则查询会像闪存一样运行并重新生成2个结果。有人可以解释一下吗?

从.ToArray()生成的SQL查询:

SELECT t0.`ID`
FROM `DataItem` AS t0
WHERE ((t0.`OwnerID` = @p0) AND (t0.`QuestionAbsolutePositionID` = @p1))
ORDER BY t0.`DataItemTimeUtc` DESC
-- p0 = [cfed2acf-acbd-4ab2-8c23-7ab0b3a8cfa3]
-- p1 = [5867FF5EC08B9C0422EFD1359B2802B29A8E167952D381EC70AE53CE6D4C9318]

从.FirstOrDefault()生成的SQL查询:

SELECT t0.`ID`
FROM `DataItem` AS t0
WHERE ((t0.`OwnerID` = @p0) AND (t0.`QuestionAbsolutePositionID` = @p1))
ORDER BY t0.`DataItemTimeUtc` DESC
LIMIT 0, 1
-- p0 = [cfed2acf-acbd-4ab2-8c23-7ab0b3a8cfa3]
-- p1 = [5867FF5EC08B9C0422EFD1359B2802B29A8E167952D381EC70AE53CE6D4C9318]

1 个答案:

答案 0 :(得分:0)

首先,弄清楚为什么QuestionAbsolutePositionID需要1000个字符长。它可以小于256,这样做。如果不是,那么问问自己是否可以将其更改为CHARACTER SET ascii。它看起来像十六进制,适用于ascii。 (很少“ids”包括重音字母,西里尔语,日语等)如果这两种“修复”都不可能,你可以升级到MySQL 5.7吗?

一旦解决了索引大小问题(上图),添加这个'复合'(和'覆盖')索引;它应该加快查询速度:

INDEX(OwnerID, QuestionAbsolutePositionID, DataItemTimeUtc, ID)

(前两列可以按任意顺序排列。)

如果它没有帮助,那么我们需要讨论@variables。