Question

我试图读取存储为单行文本文件的大型html表。文字是约。长8180万字，大小约80mb。我已经尝试过下面的代码，但它只是挂了很长时间，太久了，无法使用它。里面的数据是标准的html表结构。 <table><tr><td>sometext</td></tr></table>

我无法在源头更改文件的结构，因此坚持这一点。数据将被解析为表格。新行上的<tr>和下一个单元格中的<td>等会在将文本读入MSHTML.Document变量后发生。

有没有人建议如何处理这个？

myFile = "C:\xxx\xxx\xxx\xxx.txt"
Open myFile For Input As #1
Line Input #1, textline
Close #1

Answer 1

我提出的最佳解决方案是将数据操作为CSV文件，并让excel / VBA从那里开始工作。转换后没有问题。