我正在使用Sparklyr
的函数spark_read_csv
将CSV文件解析为Spark。
我有一个csv文件,但是某些列的值是逗号,并用引号引起来:
这是我的数据的快照:
100005870186,B,C,01NOV05,1,0,1,0,23,5.5,217876.2,1,"BANK OF AMERICA, N.A.",5.5,"223,000.00",
您可以想象,如果我使用spark_read_csv()
读入并且逗号被当作定界符,那么"BANK OF AMERICA, N.A."
将被解析为两个字段,"223,000.00".
也会被解析吗这个正确吗?