清理大文本文件 - 修复自由文本字段

时间:2012-04-06 10:50:20

标签: database excel ms-access ms-access-2007

这个问题在前一篇文章中继续存在。这篇文章是为了重新提出问题并尝试另一种方法。

早些时候发布:

Cleaning a large text file

问题:

大文本文件包含由管道(|)分隔的记录。

一个字段包含自由文本。某些记录包含回车符或换行符(这些特殊特征中的一个或多个)。

提出的删除各种特殊字符组合的方法并未成功解决所有问题。

建议的解决方案:

运行VB脚本以按记录到达文件记录。将每个字段存储在一个数组中。清理问题字段。然后输出到新文件。

对于字段1 - 只需存储在数组中。 (起始位置是从最后一个记录到第一个管道的+1)

对于字段2 - 删除任何特殊字符。 (起始位置是从最后一个字段到下一个管道的+1)。 在小情况下,此字段可能包含管道 - 因此解决方案可能需要允许解决方法。

对于字段3 - 存储在数组中。 (起始位置是从最后一个字段到(回车)的+1)

示例文件 (方括号代表特殊字符 - 换行符或回车符)

FIELD_NAME1 |    FREE_TEXT1                          |    FIELD_NAME3
 John       |    He likes food                       |    1002
 Jake       |    He eats food and [][] likes swimming|    1003
 Jake       |    He eats food and [][] likes swimming|    1003
 Jake       |    He eats food and                    |    1006
 John       |    He likes [] food                    |    1007

0 个答案:

没有答案