我生成文件,让我们调用.dwrf文件,其中包含大量数据。目前我们将它们导出到.CSV,结果文件很大(2GB +)。我想删除导出过程并直接从Excel或其他应用程序查询.dwrf文件的内容。
我想要做的是写一个实用程序/服务 - 让我们称之为dwrfMiner - 从文件中提取数据并将其作为数据源传递,并以某种方式将dwrfMiner链接到.dwrf文件,以便Excel将其识别为外部数据源。
有什么想法吗?
答案 0 :(得分:3)
虽然为此编写ODBC驱动程序可能有点过分,但如果您正在使用的文件格式是预先知道的并且不太难以翻译(听起来好像没有考虑到您已经在创建CSV),那么使用ODBC DSN听起来是你最好的选择。
Windows中已经内置了很多ODBC驱动程序(.txt,.csv,.mdb,.xl *,。dbf,Paradox .db等),您可以从网上获取其他驱动程序很多常见的格式。
如果您导出的现有格式的大小过于繁琐(CSV),则启动的逻辑点是将数据转换为具有ODBC支持的更具空间意识的内容。
如果失败了,你的最后一个选项是过度杀伤选项(编写ODBC驱动程序)。
答案 1 :(得分:1)
Excel可以查询外部数据源,但要注意Excel(所有版本)对每个工作簿可显示的行数有硬性限制。我认为在Excel 2003中的限制是~65k。它在其他版本中更高。
请参阅我的问题:reporting tool/viewer for large datasets(而且我的差不多大于2GB)。
答案 2 :(得分:0)
我使用PHP FlatFile DB 查询过去的平面文件
答案 3 :(得分:0)
我得出gcc并为自己写一个完整的ODBC驱动程序。然后你可以坐下来使用SQL。
你知道,如果你很无聊。 ;)
答案 4 :(得分:0)
使用具有多线程的odbc驱动程序