我想知道的是,当我通过R上传数据时,到底发生了什么呢?它比MySQL Workbench或KNIME快得多?
我处理数据,每天都将数据上传到MySQL服务器。我以前使用KNIME上载数据,因为它比使用MySQL Workbench上载要快得多(选择表->“导入数据”)。
一些信息:CSV具有4000行和15列。我在R中使用的库是RMySQL。我在KNIME中使用的节点是数据库编写器。
<video oncanplay="this.muted=true" id="video" width="640px" height="350px" autoplay="autoplay" loop="loop" controls="controls">
<source src="intouchables.f4v" type="video/mp4">
Your browser does not support the video tag.
</video>
因此,要测试,我使用相同的文件执行了完全相同的过程。在KNIME中花了2分钟,在R中只花了几秒钟。
答案 0 :(得分:0)
一切都在幕后发生!数据上载到数据库取决于参数,例如数据库和工具之间的接口,网络连接,批处理大小设置,可用于工具和工具数据处理的内存本身的速度等等。在您的情况下,RMySQL软件包默认使用500的批处理大小,而KNIME仅使用1的批处理大小,因此这可能是差异所在。尝试在KNIME中将其设置为500,然后进行比较。不知道MySQL Workbench是如何工作的...