我需要使用haven()(包含类型,标签和所有结尾的数据)将包含日志数据的.json文件处理为R中的.dta文件。该文件本身包含少量超过5000个字符和更多字符的字符串变量。不幸的是,Haven()似乎无法编写此长度的字符串。例如:
CURLOPT_HTTPHEADER => array(
"Authorization: Bearer XXX",
),
产生以下错误:
write_dta_(数据,normalizePath(路径,mustWork = FALSE), 版本= stata_file_format(version)): 写入失败:提供的字符串值长于指定列的可用存储大小。
此线程部分与Save .dta files with long strings in R重复,但是此时建议不要使用切换到readstata13 :: save.dta13()的解决方案。
将字符串拆分为不同的列也不是最好的选择,因为它们的长度可能会变化很大,这可能导致数据集中列的爆炸式增长。此外,定义一个合理的分界点绝非易事。
由于Stata(从13版开始)支持长字符串变量(strL变量),我想问一下是否有可能用避风港写strL变量?
最佳