就今天的技术而言,这些对数据规模的关注是否有意义?

时间:2009-06-22 18:59:58

标签: optimization premature-optimization

我们正在向现有数据库记录添加额外的登录信息,每次登录的顺序为3.85KB。

有两个问题:

1)每次登录是否增加了线上数据?

2)我们每次登录时是否存储了太多的额外数据?

鉴于今天的技术,这些有效的问题是什么?

背景:

我们没有具体的使用数据,但我们平均每月约5,000次登录。我们希望扩大到更大的客户,仍然是每月1000的10,而不是每秒1000。

在美国(我们的市场),宽带有60%的市场采用率。

5 个答案:

答案 0 :(得分:4)

假设您每月有大约80,000次登录,那么您每年会向数据库表中添加~3.75 GB。

如果您正在使用像MySQL,PostgreSQL,SQLServer,Oracle等一样不错的RDBMS ......这是一个可笑的数据量和流量。几年后,可能想要开始查看其中一些存档。但到那时,谁知道应用程序会是什么样子?

考虑如何查询这些数据始终很重要,这样您就不会遇到性能瓶颈。没有这些细节,我无法就这方面发表非常有用的评论。

但要回答你的担忧,不要担心。只是一直在思考。

答案 1 :(得分:1)

你有多少用户?他们多久登录一次?它们可能是快速连接还是潮湿的弦线?你的意思是你真的每次有人登录或每个用户帐户添加3.85K?您需要多长时间存储数据?它给你带来了什么好处?它与您已经存储的数据量相比如何? (即你的大部分数据是由于这个新部分造成的,还是海洋中的一滴?)

简而言之 - 这是一个非常情境敏感的问题:)

答案 2 :(得分:1)

鉴于存储和硬件现在很便宜(当然相对而言),这不应该是一个问题。显然,如果您需要数据,那么您需要数据!您可以将复制用于多个位置,以便添加的数据不需要在线路上移动(例如西海岸和东海岸的服务器)。您可以通过按状态分隔数据来管理数据,以最小化表的大小(类似于银行的操作,选择状态作为登录过程的一部分,以便它们查找正确的数据存储)。您可以使用水平分区来最小化每个表的数量或记录,以便快速查询您的查询。有很多方法可以保持大数据的优化。如果您打算对此数据进行大量读取,请检查Lucene。

答案 3 :(得分:0)

就今天的平均服务器技术而言,这不是问题。就您的服务器技术而言,这可能是一个问题。您需要提供更多信息。

答案 4 :(得分:0)

在存储方面,这是花生,虽然你想最终存档或丢弃旧数据。

就网络(?)流量而言,这在服务器端并不多,但它会影响您的网站加载和运行大部分客户的速度。虽然许多人都有宽带,有人会在边缘或调制解调器上尝试它,或者在使用大量的洪流时,你的网站会显得缓慢或完全失灵,你会在整个网络上得到大声抱怨。有关系吗?如果您的用户真的需要您的服务,他们肯定会等待,如果您正在开发新的Twitter,页面加载时间增加是难以接受的。