我正在处理从CSV文件导入数据的应用程序。我被告知CSV文件中的数据来自SAP,我对此完全不熟悉。
我的客户表示存在问题。 CSV文件中的一列数据包含邮政地址。有时,系统没有看到有效的地址。这是一个略带虚构的例子:
1234 MAIN ST A&#C HOUSTON
如您所见,街道号码,街道名称和城市都是大写字母。没有指定州或邮政编码。在CSV文件中,假定所有地址都处于相同的状态。
通常情况下,如果街道名称和城市之间有文字,则为公寓号码或字母。在上面的示例中,当我们尝试将地址与其他服务(例如Google地理位置)一起使用时,我们会收到错误。一个建议的解决方法是简单地删除特殊字符,但我相信必须有更好的方法。
我想知道这个A&#C
意味着什么。它看起来像某种逃脱序列,但它并不是我所熟悉的格式。请告诉我这些奇怪的字符序列意味着什么。
答案 0 :(得分:1)
我不完全确定,但我怀疑是否有"规范"转义序列看起来像这样。在ABAP环境中,#
用于替换不可打印的字符。可能是在首次导入SAP系统时数据未正确清理,并且在写入输出文件时,某些不可打印的字符被#
替换。另一种解释可能是其中一个字段包含非ASCII unicode字符(如 ),并且导出程序无法将其转换为选定的目标代码页。如果不检查实际的源数据集,很难说清楚。当然,它也可能是一些编程错误或奇怪的自定义字段分隔符...