我需要将用户上传的文件存储到数据库中(文件系统不是一个选项)。
上传的文件是不同类型(例如PDF,EXCEL等)。
我在决定是否使用MEDIUMBLOB
作为类型将这些文件存储为二进制数据时遇到问题。
由于这些文件的大小差别很大,因此产生了混淆。像一些文件是几百KiloBytes(例如114 KB),但其他一些文件高达1.5兆字节。
所以我真的需要使用MEDIUMBLOB
作为列类型。但我没有什么困惑,因为实际占用的内存取决于上传文件本身的大小或文件大小本身被忽略而内存只是根据数据类型分配 。这非常重要,因为每天上传的大部分文件(其中很多都是非常小的)和磁盘中可用的内存(空间)都是有限的。
当我阅读MySql doc的以下部分时:
10.5. Data Type Storage Requirements
L表示给定字符串值的实际长度(以字节为单位)。
Data type Storage Required
========================================================
TINYBLOB, TINYTEXT L + 1 bytes, where L < 2 ^ 8
BLOB, TEXT L + 2 bytes, where L < 2 ^ 16
MEDIUMBLOB, MEDIUMTEXT L + 3 bytes, where L < 2 ^ 24
LONGBLOB, LONGTEXT L + 4 bytes, where L < 2 ^ 32
我认为使用的内存取决于上传的实际文件的大小。即如果我将列类型设置为MEDIUMBLOB
,并且如果我上传的文件大小为114 KB,则将使用唯一的114 KBytes + 3 Bytes
磁盘内存,而不是(2 ^ 24) Bytes + 3 Bytes
。
我在想什么?或者我会通过在MEDIUMBLOB
字段中存储大量文件(大小为100到300 KB)来浪费大量磁盘内存。
答案 0 :(得分:4)
MySQL将使用SHOW TABLE STATUS为您提供每个表的大小。因此,如果您上传一些测试文件,您应该能够估计他们将在数据库中占用的实际大小。每个表都有一些开销,所以我会使用尽可能多的文件进行测试。