我尝试将1.4G mysql文件导入到aws rds中。我尝试了2 cpu和4G mem选项。我仍然有错误:Lost connection to MySQL server during query
。我的问题是如何将大型mysql文件导入rds。
答案 0 :(得分:2)
MySQL服务器和MySQL客户端都有一个参数max_allowed_packet
。
这被设计为安全检查,以防止在数据损坏导致连接的接收端认为数据包¹非常大的情况下可能发生的大量内存的无用和破坏性分配。
当传输查询和结果集时,客户端和服务器都不允许发送大于max_allowed_packet
的任何单个“事物”(通常是查询或列的值) - 发送方将抛出如果你尝试,一个错误并拒绝发送它,接收方将抛出一个错误,然后关闭你的连接(所以客户端可能会或可能不会实际报告错误抛出 - 它可能只是报告连接丢失)。
不幸的是,此相同参数的客户端设置和服务器设置是两个独立的设置,并且它们是不协调的。 技术上没有要求它们是相同的,但只有当它们都没有超过另一个限制时,差异值才有效。
更糟糕的是,他们的默认值实际上是不同的。在最近的版本中,服务器默认为4 MiB,而客户端默认为16 MiB。
查找服务器的值(SELECT @@MAX_ALLOWED_PACKET
)然后将客户端设置为与服务器匹配(mysql --max-allowed-packet=max_size_in_bytes
)将通过使客户端执行此操作来“修复”神秘的Lost connection to MySQL server during query
错误消息Right Thing™并且不会尝试发送服务器不接受的数据包。但是你仍然会收到一个错误 - 只是一个更具信息量的错误。
因此,我们需要将双方重新配置为更合适的东西......但我们如何知道正确的价值呢?
您必须知道您的数据。任何列中最大可能的值是多少?如果这是一个延伸(在很多情况下,它是),你可以根据转储文件中最长的行开始一个相当大的值。
使用此单行查找:
$ perl -ne '$max = length($_) > $max ? length($_) : $max; END { print "$max\n" }' dumpfile.sql
输出将是文件中最长行的长度(以字节为单位)。
您可能希望将其四舍五入到下一个2的幂,或者至少下一个1024的增量(1024是服务器接受的粒度 - 值被舍入)或者您喜欢的任何内容,但是这个结果应该为您提供一个值,允许您无问题地加载转储文件。
现在我们已经建立了一个应该有效的新值,将服务器上的max_allowed_packet
更改为您刚刚发现的新值。在RDS中,这是在参数组中完成的。确保该值已应用于您的服务器(SELECT @@GLOBAL.MAX_ALLOWED_PACKET;
)。
然后,您需要将相同的值传递给您的客户端程序,例如mysql --max-allowed-packet=33554432
如果此值小于默认客户端值。您可以使用以下命令找到默认客户端值:
$ mysql --help --verbose | grep '^max.allowed.packet'
max-allowed-packet 16777216
客户端还允许您以SI为单位指定值,例如--max-allowed-packet=32M
为32 MiB(33554432字节)。
这个参数 - 以及其中两个,一个用于客户端,一个用于服务器 - 这一事实导致了很多混乱并导致一些不良信息的传播:你会找到人互联网告诉你将它设置为像1G(1073741824,这是可能的最大值)这样的荒谬值,但这不是一个非常好的策略,因为如上所述,这是一种保护机制。如果一个数据包碰巧在网络上以错误的方式被破坏,服务器可能会断定它实际上需要分配大量的内存,以便这个数据包可以成功加载到缓冲区 - 这可能导致通过使系统缺乏可用内存来减少系统损坏或拒绝服务。
服务器通常为从线路读取数据包分配的实际内存量为net_buffer_length
。数据包中指示的大小实际上并未分配,除非它大于net_buffer_length
。
¹数据包是指MySQL客户端/服务器协议意义上的第7层数据包。不要与IP数据包或数据报混淆。
答案 1 :(得分:1)
如果从本地计算机或笔记本电脑或与RDS实例不在同一区域的计算机导入,则连接可能会超时。
尝试从可以访问此RDS的EC2实例导入。您需要将文件上传到S3,将ssh上传到EC2实例并运行导入RDS。