删除缺少值c ++的整个行

时间:2016-02-23 23:39:05

标签: c++ fstream

我正在通过以下代码读取具有不同变量的数据,目前当程序接触到缺失值时(在数据中用字符串&#34表示; NA",它会将它们更改为零。或者,我想知道是否我们如何在程序触摸时删除整行" NA"。我试图寻找相同的问题,但它们都是R,而不是C ++。请,如果你能给我一些建议。谢谢

 #include <iostream>
 #include <fstream>
 #include <string>
 #include <vector>
 using namespace std;

struct Data {
vector<double> cow_id;
vector<double> age_obs;
vector<double> dim_obs;
vector<double> my_obs;
vector<double> mcf_obs;
vector<double> mcp_obs;
vector<double> mcl_obs;
vector<double> bw_obs;
vector<double> bcs_obs;
double get_number (string value)
 {
   if (value == "NA")
    {return 0.0;}
   else
    {
    istringstream iss (value);
    double val;
    iss>>val;
    return val;
    }
 }
void read_input (const string filepath)

{
ifstream data_in (filepath.c_str());
if (!data_in)
{cout<<"Failed to open"<<endl;}
else
{
  // Read tokens as strings.
  string id, age, dim, my, mcf, mcp, mcl, bw, bcs;
  string dummy_line;
  getline(data_in, dummy_line);
  string line;

  while (data_in >> id >> age >> dim >> my >> mcf >> mcp >> mcl >> bw  >>    bcs)
  {
     // Get the number from the string and add to the vectors.
     cow_id.push_back(get_number(id));
     age_obs.push_back(get_number(age));
     dim_obs.push_back(get_number(dim));
     my_obs.push_back(get_number(my));
     mcf_obs.push_back(get_number(mcf));
     mcp_obs.push_back(get_number(mcp));
     mcl_obs.push_back(get_number(mcl));
     bw_obs.push_back(get_number(bw));
     bcs_obs.push_back(get_number(bcs));

  }
  data_in.close();
 }

size_t size=age_obs.size();
for (size_t i=0; i<size; i++)
{
  cout<<cow_id[i]<<'\t'<<age_obs[i]<<'\t'<<dim_obs[i]<<'\t'<<my_obs[i] <<'\t'<<mcf_obs[i]<<'\t'<<mcp_obs[i]<<'\t'<<mcl_obs[i]<<'\t'<<bw_obs[i] <<'\t'<<bcs_obs[i]<<endl;
}
};


int main()
{
Data input;
input.read_input("C:\\Data\\C++\\learncpp\\data.txt");

}

1 个答案:

答案 0 :(得分:2)

我们这里的谈话桌。

表是记录(行)的容器。您从输入文件中捕获的数据已经组织成记录。因此,显而易见的模型是使用与文件数据记录匹配的结构。

struct Record
{
  unsigned int cow_id;
  unsigned int age_obs;
  unsigned int dim_obs;
  // ...
};

您的表格可以表示为:

std::vector<record> my_table;

因此,要从表中删除记录,可以使用std::vector::erase()方法。简单。此外,您可以使用std::find()功能搜索表格。

通过介绍从文件中加载其成员的记录概念,让我们用您现有的代码解除一些读者的头痛。

最好通过重载流提取operator>>

来从文件中读取记录
struct Record
{
  //...
  friend std::istream& operator>>(std::istream& input, Record& r);
};

std::istream&
operator>>(std::istream& input, Record& r)
{
  std::string record_text;
  std::getline(input, record_text);
  // Extract a field from the record text and check for NA,
  // Assign fields of r to those values:
  r.cow_id = value;
  // Etc.
  return input;
}

使用重载运算符,您的输入如下:

Record r;
while (input_file >> r)
{
  table.push_back(r);
}

优雅而简单(减少缺陷注入)。