我遇到了一家做预测性建模的公司,他们说
因为我们的预测模型是 专注于您独特的业务 他们的要求和情况 可以适用于各种各样的 预测和预测活动 跨越众多问题类型和 域
我想知道Predicive模型是否针对每项任务进行了唯一编程,或者它们是一次编程并在任何地方使用。我有点困惑
答案 0 :(得分:1)
它有所不同:您可以拥有一个高度优化的预测模型,通过利用专门了解数据的内容,可以很好地执行特定数据集。例如,如果您正在对URL进行分析,并且每个URL都是一个字符串(最多255个字符),则每个(UTF 8)字符为8位或1个字节,因此您需要255个字节来存储每个URL。您可以使用像CityHash64这样的散列函数来散列每个URL,如果您现在能够存储8个字节而不是255个字节的URL。这可以内置到算法中,以使其使用更少的内存,这将允许它将更多的数据放入RAM中,并且可以使计算更快,但是这种类型的优化不能用于旨在支持各种各样的系统。数据类型。在一般情况下,您没有足够的领域知识来进行此类优化。
在该公司似乎所在的“对面”端,您将提供一个通用系统,该系统以特定格式接收数据并对数据应用预定义算法。您可能有一些参数允许您调整系统,以防您获得更多的域知识,但它将远远不能像获取URL的哈希值来减少3000%的内存使用量。提供这类服务的公司通常应用DRY principle,他们编码一次,他们尽可能多地重复使用代码(以节省资金和最大化利润)。他们可能会在他们的设置中做一些小的优化或调整,但他们通常会避免为特定客户编码算法。
这绝不能准确反映您所看到的公司正在做什么,但根据您的报价,这似乎是一个有效的假设。只是让人们明白,我没有通过判断:如果该公司正在推广,那么这是完全合理的,如果我的业务依赖于我为尽可能多的客户提供服务,那么我也会推广。