我试图找到X的t分布的双尾逆。它可以在Excel中使用TINV函数找到,但我需要在SQL Sever中实现它。请建议我的想法。
TINV函数语法具有以下参数:
概率:与双尾学生的t分布相关的概率。
Deg_freedom :表征分布的自由度数。
前:
select tinv( 0.054645, 60);
-- -----------------
-- 1.9599994129833
-- (1 row returned)
答案 0 :(得分:5)
SQL-Server没有包含很多统计功能。
SQL Server中不存在tinv
。
添加tinv功能的唯一方法是使用CLR-Function。
因此,问题本身减少为“如何使用SQL-Server中允许的C#子集来计算tinv?”。
如果您使用的是.NET 4.0,则可以使用System.Web.DataVisualization.dll
e.g。
var someChart = new System.Web.UI.DataVisualization.Charting.Chart();
double res = someChart.DataManipulator.Statistics.InverseTDistribution(.05, 15);
//2.131449546
但是,您可能不希望这种开销。 所以你必须从Math.NET的SourceCode(MIT / X11许可证)中删除它。
StudentT dist = new StudentT(0.0,1.0,7.0);
double prob = dist.CumulativeDistribution(1.8946);
哪个应该导致0.95
由于你需要逆,你需要
StudentT.InvCDF(double location, double scale, double freedom, double p)
位置:分布的位置(μ)。
scale:分布的比例(σ)。范围:σ> 0.
自由:分配的自由度(ν)。范围:ν> 0
p:计算反向累积密度的位置。
[Microsoft.SqlServer.Server.SqlFunction]
public static System.Data.SqlTypes.SqlDouble TInv(double probability, int degFreedom)
{
double result = 0.00;
try
{
result = fnInverseTDistribution(degFreedom, probability);
}
catch
{
// throw; // Optionally throw/log/ignore/whatever
}
return result;
}
使用DataVisualization,如下所示:
[Microsoft.SqlServer.Server.SqlFunction]
public static System.Data.SqlTypes.SqlDouble TInv(double probability, int degFreedom)
{
double result = 0.00;
try
{
var someChart = new System.Web.UI.DataVisualization.Charting.Chart();
result = someChart.DataManipulator.Statistics.InverseTDistribution( probability, degFreedom);
}
catch
{
// throw; // Optionally throw/log/ignore/whatever
}
return result;
}
然而,DataVisualization技巧不适用于SQL-Server,因为您需要添加对System.Web的引用,而这在SQL-Server中是无法做到的。
另外,excel有很多类似的功能,tinv,t.inv,T.INV.2S等,所以一定要选择合适的功能。
找到更多信息: http://numerics.mathdotnet.com/api/MathNet.Numerics/ExcelFunctions.htm#TIn
Math.NET中有一个名为ExcelFunctions的特殊类,您可以实际使用它:
MathNet.Numerics.ExcelFunctions.TInv (1.1, 55);
您可以在OpenOffice.org上找到有关TINV和TDIST的更多信息,以及by category
下的功能列表所以问题的解决方案是
[Microsoft.SqlServer.Server.SqlFunction]
public static System.Data.SqlTypes.SqlDouble TInv(double probability, int degFreedom)
{
double result = 0.00;
try
{
result = MathNet.Numerics.ExcelFunctions.TInv (probability, degFreedom);
}
catch
{
// throw; // Optionally throw/log/ignore/whatever
}
return result;
}
实际上与
相同[Microsoft.SqlServer.Server.SqlFunction]
public static System.Data.SqlTypes.SqlDouble TInv(double probability, int degFreedom)
{
double result = 0.00;
try
{
result = -StudentT.InvCDF(0d, 1d, degFreedom, probability/2);
}
catch
{
// throw; // Optionally throw/log/ignore/whatever
}
return result;
}
所以现在你从中获取Math.Net的源代码 https://github.com/mathnet/mathnet-numerics 然后使用CRL-Function将mathnet-numerics / src / Numerics /(或其中所需的部分)的内容拖放到项目中,并完成。
当你拥有你的CLR dll时,你会进入SSMS并执行:
EXEC dbo.sp_configure 'clr enabled',1 RECONFIGURE WITH
CREATE ASSEMBLY SQLServerStatistics from 'C:\SQLServerStatistics.dll' WITH PERMISSION_SET = SAFE
在成功之后,您仍然需要使用SQL-Server注册该函数。
CREATE FUNCTION [dbo].[tinv](@prob float, @degFreedom int)
RETURNS float WITH EXECUTE AS CALLER
AS
EXTERNAL NAME [SQLServerStatistics].[Functions].[TInv]
有关详细信息,请参阅this文章。
如果要将Dll带到高效的服务器上,则需要从字节数组字符串创建程序集,如下所示:
CREATE ASSEMBLY [MyFunctions]
AUTHORIZATION [dbo]
FROM 0x4D5A90000[very long string here...];
您可以从字节数组中创建十六进制字符串,如下所示:
byte[] bytes = System.IO.File.ReadAllBytes(@"C:\SQLServerStatistics.dll");
"0x" + BitConverter.ToString(bytes).Replace("-", "")
我已经在github上传了整个解决方案here。
然后你可以运行这样的功能:
SELECT dbo.tinv(0.54645, 60)
==> 0.606531559343638
Script-Generator工具会自动为您构建安装脚本。 看起来像这样:
> sp_configure 'show advanced options', 1; GO RECONFIGURE; GO
> sp_configure 'clr enabled', 1; GO RECONFIGURE; GO
>
>
> DECLARE @sql nvarchar(MAX) SET @sql = 'ALTER DATABASE ' +
> QUOTENAME(DB_NAME()) + ' SET TRUSTWORTHY ON;'
> -- PRINT @sql; EXECUTE(@sql); GO
>
>
> -- Restore sid when db restored from backup... DECLARE @Command NVARCHAR(MAX) = N'ALTER AUTHORIZATION ON DATABASE::<<DatabaseName>> TO
> [<<LoginName>>]' SELECT @Command = REPLACE ( REPLACE(@Command,
> N'<<DatabaseName>>', SD.Name) , N'<<LoginName>>' , SL.Name ) FROM
> master..sysdatabases AS SD JOIN master..syslogins AS SL ON SD.SID
> = SL.SID
>
> WHERE SD.Name = DB_NAME()
>
> -- PRINT @command EXECUTE(@command) GO
>
> IF EXISTS (SELECT * FROM sys.objects WHERE object_id = OBJECT_ID(N'[dbo].[TDist]') AND type in (N'FN', N'IF', N'TF', N'FS',
> N'FT')) DROP FUNCTION [dbo].[TDist] GO
>
> IF EXISTS (SELECT * FROM sys.objects WHERE object_id = OBJECT_ID(N'[dbo].[TInv]') AND type in (N'FN', N'IF', N'TF', N'FS',
> N'FT')) DROP FUNCTION [dbo].[TInv] GO
>
>
>
> IF EXISTS (SELECT * FROM sys.assemblies asms WHERE asms.name =
> N'SQLServerStatistics' and is_user_defined = 1) DROP ASSEMBLY
> [SQLServerStatistics] GO
>
>
> CREATE ASSEMBLY SQLServerStatistics AUTHORIZATION [dbo]
> FROM 'c:\users\administrator\documents\visual studio 2013\Projects\SqlServerStatistics\ClrCreationScriptGenerator\bin\Debug\SqlServerStatistics.dll'
> WITH PERMISSION_SET = UNSAFE GO
>
>
> CREATE FUNCTION [dbo].[TDist](@x AS float, @degFreedom AS int, @tails
> AS int)
> RETURNS float WITH EXECUTE AS CALLER AS EXTERNAL NAME [SQLServerStatistics].[SqlServerStatistics.ExcelFunctions].[TDist] GO
>
>
>
> CREATE FUNCTION [dbo].[TInv](@probability AS float, @degFreedom AS
> int)
> RETURNS float WITH EXECUTE AS CALLER AS EXTERNAL NAME [SQLServerStatistics].[SqlServerStatistics.ExcelFunctions].[TInv] GO
答案 1 :(得分:2)
您可以将自己的实现编写为SQL函数,也可以使用CLR并在C#中编写。
我的建议是使用CLR并包含Accord库(我推荐这个,因为它们仍然具有SQL 3.5 CLR所需的.NET 3.5版本)来实现统计功能。我过去做过其他的统计计算,它就像魅力一样。
答案 2 :(得分:0)
您可以在R中使用qt函数。这是一个代码片段:
angular.module