Question

我在R中使用带有DBI包的RMySQL包当我运行代码时，

dbReadTable(con, "data")

这是永远的。

我认为这张表是非常大的数据。关于如何加快这一过程的任何想法？

谢谢，

Answer 1

尝试让数据库尽可能多地进行过滤和放大处理尽可能。数据库有比R更多优化操作的方法，并且不受RAM严重限制。它还减少了必须通过网络传输的数量。

常见的策略是

我认为RMySQL应该比新的odbc包更快，但是值得尝试。

什么是'永远'？ 5分钟还是5个小时？一旦数据到达R，事情仍然缓慢吗？如果事情仍然太慢而不可行，请考虑升级到类似sparklyr的内容。