我正在做一个将python代码转换为C ++的项目,以提高性能。那个python项目的名称是Advanced EAST,现在,我在.csv文件中获得了nms函数的输入数据,如下所示:
"[ 5.9358170e-04 5.2773970e-01 5.0061589e-01 -1.3098677e+00
-2.7747922e+00 1.5079222e+00 -3.4586751e+00]","[ 3.8175487e-05 6.3440394e-01 7.0218205e-01 -1.5393494e+00
-5.1545496e+00 4.2795391e+00 -3.4941311e+00]","[ 4.6003381e-05 5.9677261e-01 6.6983813e-01 -1.6515008e+00
-5.1606908e+00 5.2009044e+00 -3.0518508e+00]","[ 5.5172237e-05 5.8421570e-01 5.9929764e-01 -1.8425952e+00
-5.2444854e+00 4.5013981e+00 -2.7876694e+00]","[ 5.2929961e-05 5.4777789e-01 6.4851379e-01 -1.3151239e+00
-5.1559062e+00 5.2229333e+00 -2.4008298e+00]","[ 8.0250458e-05 6.1284608e-01 6.1014801e-01 -1.8556541e+00
-5.0002270e+00 5.2796564e+00 -2.2154367e+00]","[ 8.1256607e-05 6.1321974e-01 5.9887391e-01 -2.2241254e+00
-4.7920742e+00 5.4237065e+00 -2.2534993e+00]
一个单位是7个数字,但是前四个数字后面是'\ n', 我想将此csv文件读入我的C ++项目, 这样我就可以用C ++进行数学运算,使其变得更快。
using namespace std;
void read_csv(const string &filename)
{
//File pointer
fstream fin;
//open an existing file
fin.open(filename, ios::in);
vector<vector<vector<double>>> predict;
string line;
while (getline(fin, line))
{
std::istringstream sin(line);
vector<double> preds;
double pred;
while (getline(sin, pred, ']'))
{
preds.push_back(preds);
}
}
}
暂时...我的代码emmmmmm无法正常工作, 我完全不知道这个... 请帮助我将csv数据读取到我的代码中。 谢谢
答案 0 :(得分:2)
不幸的是,在C ++中,解析字符串(因此是文件)非常繁琐。
我强烈建议您使用一种库,最好是仅使用标头的库like this one。
如果您坚持要自己编写,也许可以从this StackOverflow question中汲取灵感,了解如何使用C ++解析常规CSV文件。
答案 1 :(得分:0)
您可以看一下getdelim(',', fin, line)
但是另一个问题是那些引号,除非您/ know /始终以这种方式格式化文件,否则将变得很困难。
我过去使用的一种技巧并不完美,如果第一个字符是引号,那么逗号前的最后一个字符也必须是匹配的引号,并且不能转义。
如果它不是引号,则另外getdelim()
,但是getdelim的自动分配功能意味着您必须使用另一个缓冲区。在C ++中,我最终得到了所有getdelim
结果的向量,然后需要将它们连接起来以制成最终的字符串:
std::vector<char*> gotLine;
gotLine.push_back(malloc(2));
*gotLine.back() = fgetch();
gotLine.back()[1] = 0;
bool gotquote = *gotLine.back() == '"'; // perhaps different classes of quote
if (*gotLine.back() != ',')
for(;;)
{
char* gotSub= nullptr;
gotSub=getdelim(',');
gotLine.push_back(gotSub);
if (!gotquote) break;
auto subLen = strlen(gotSub);
if (subLen>1 && *(gotSub-1)=='"') // again different classes of quote
if (sublen==2 || *(gotSub-2)!='\\') // needs to be a while loop
break;
}
然后将所有这些字符串段重新连接在一起。
请注意,getdelim支持空字节。如果您希望内容中包含空字节,而不用字符序列\000
或\@
表示,则需要存储getdelim返回的实际长度,并使用memcpy对其进行串联。
哦,如果您允许utf-8扩展引号,那就太乱了!
这种情况不包括以\\"
或\\\\"
结尾的字符串。理想情况下,您需要对前导反斜杠的数量进行计数,如果计数为偶数,则接受报价。
请注意,这留下了对引号内容进行转义的问题,即将任何\"
转换为"
,将\\
转换为\
,依此类推。还丢弃了引号
最后,如果您需要处理完全任意的内容,则库可能会更容易。但是,如果内容是“已知的”,那么您可以没有。