如何在LINQ to SQL中编写和优化具有一对多关系的三表连接?

时间:2013-01-15 23:43:56

标签: c# sql-server linq-to-sql

理想的班级结构

游戏中有很多玩家,每个玩家都有很多统计数据。换句话说,每个List<Game>包含List<Player>,每个Player包含List<Statistic>

Game -> Player1 -> Statistic1
                   ....
                   Statistic30
        ....
        Player10 -> Statistic1
                    ....
                    Statistic30

基本表格模式

Game
----
GameId (int)
Region (nvarchar(4))

Player
------
GameId (int)
Region (nvarchar(4))
AccountId (int)

Statistic
---------
GameId (int)
Region (nvarchar(4))
AccountId (int)

我的尝试

var b = (from g in db.Games
         select new GameDTO()
         {
             GameId = g.GameId,
             Players = (from p in db.PlayerGames
                        where p.GameId == g.GameId && p.Region.Equals(g.Region)
                        select new PlayerGameDTO()
                        {
                            AccountId = p.AccountId,
                            GameId = p.GameId,
                            Region = p.Region,
                            Statistics = (from r in db.Statistics
                                          where r.AccountId == p.AccountId && r.GameId == p.GameId && r.Region.Equals(p.Region)
                                        select r).ToList()
                        }).ToList()
         });

此解决方案(显然)不使用Join,主要是因为我不确定如何以正确的顺序执行Join以获得所需的结果。

我应该提到的是,每天我们聚合约10万个新游戏,约1M个玩家,以及~30M统计数据。当前查询可以选择每秒约1.4个游戏,并使用99%的超线程四核CPU。

如果有什么东西是泥泞的,请随时要求澄清。

更新#1

var d = (from g in db.Games
         join p in db.PlayerGames on new { g.GameId, g.Region } equals new { p.GameId, p.Region }
         join r in db.Statistics on new { p.GameId, p.Region, p.AccountId } equals new { r.GameId, r.Region, r.AccountId }
         select new StatisticsDTO()
         {
             GameId = r.GameId, 
             AccountId = r.AccountId, 
             StatType = r.StatType,
             Value = r.Value
         });

这个简单的事情就是每秒产生~9K(比原来快22倍)。 SQL Server显然正在完成所有工作,使用~90%的CPU。但是,我没有使用嵌套对象,而是留下了一维查询。

如果您对此更新有任何建议,我很乐意听到。

2 个答案:

答案 0 :(得分:0)

听起来让数据库处理这些工作负载可能更合适,特别是如果您只是简单地运行查询而不是写入数据库。考虑在数据库中创建实现连接的View。然后,您可以查询视图并避免加入您的客户端计算机。您仍然可以使用实体数据模型和LINQ来对视图运行查询。通过这种方法,您应该会看到相当不错的性能提升。

//Possible SQL for creating the view
CREATE VIEW vw_GameData AS 
SELECT g.GameId, g.Region, p.AccountId, etc...
FROM Game g JOIN Player p ON (g.GameId = p.GameId AND g.Region = p.Region)
JOIN Statistic s ON (s.GameId = p.GameId AND s.RegionId = p.RegionId AND s.AccountId = p.AccountId)

答案 1 :(得分:0)

首先尝试一个简单的linq连接。

Game
----
GameId (int)
Region (nvarchar(4))

Player
------
GameId (int)
Region (nvarchar(4))
AccountId (int)

Statistic
---------
GameId (int)
Region (nvarchar(4))
AccountId (int)
var b = (from t in db.Games
         join t1 in t.Player on t.GameId equals t1.GameId
         join t2 in t.Statistic on t.GameId equals t2.GameId
         select new PlayerGameDTO
         {
            AccountId = t1.AccountId,
            GameId = t1.GameId,
            Region = t1.Region,
            //RawStats <-- what are you trying to do here?
            //RawStats = (from r in db.RawStats
            //where r.AccountId == p.AccountId && r.GameId == p.GameId && r.Region.Equals(p.Region) select r).ToList()
         }).ToList();