我试图读取存储为单行文本文件的大型html表。文字是约。长8180万字,大小约80mb。我已经尝试过下面的代码,但它只是挂了很长时间,太久了,无法使用它。
里面的数据是标准的html表结构。 <table><tr><td>sometext</td></tr></table>
我无法在源头更改文件的结构,因此坚持这一点。数据将被解析为表格。新行上的<tr>
和下一个单元格中的<td>
等会在将文本读入MSHTML.Document
变量后发生。
有没有人建议如何处理这个?
myFile = "C:\xxx\xxx\xxx\xxx.txt"
Open myFile For Input As #1
Line Input #1, textline
Close #1
答案 0 :(得分:1)
我提出的最佳解决方案是将数据操作为CSV文件,并让excel / VBA从那里开始工作。转换后没有问题。