C ++通过目录中的文件循环并写入不同的目录

时间:2012-07-02 19:05:57

标签: c++ io

我正在尝试修改一些现有的C ++代码以满足我的需求,但之前从未使用过C ++,我遇到了一些困难。

我的目标是:

--> time and memory-intensive processes for preparation

for each file in directory:
    open file;
    generate a tagged representation; //the current code just does this
    write file; //different directory but same filename

我不想仅为每个文件调用C ++程序(例如,使用shell脚本)的原因是在下面的代码运行之前,执行时间和内存密集的预处理步骤。 (这些大约需要45-60秒。而代码只需要大约2-5秒即可运行。)

我已粘贴以下代码部分。我想从命令行中读取参数。

int main(int argc, char** argv) {
  /*
  pre-processing stuff
  */

  /* for each file */
  HANDLE hFind = INVALID_HANDLE_VALUE;
  string path = argv[1];
  string outpath = argv[2];
  WIN32_FIND_DATA ffd;

  //EDIT 2:
  cout << "Path: " << path << '\n'; 
  cout << "Outpath: " << outpath << '\n';

  hFind = FindFirstFile(path.c_str(), &ffd);
  if (hFind == INVALID_HANDLE_VALUE) {
    cout << "error searching directory\n";
    return false;
  }

  do {
    //istream *is(&std::cin);
    string filePath = path + ffd.cFileName;
    ifstream in( filePath.c_str() );
    if (in) {
      /* for each line */
      string line;
      int n = 1;
      string str;
      string fullOutpath = outpath + ffd.cFileName;
      ofstream File;
      File.open(fullOutpath);
      while (getline(in, line)) {
        if (line.size() > 1024) {
          cerr << "warning: the sentence seems to be too long at line " << n;
          cerr << " (please note that the input should be one-sentence-per-line)." << endl;
        }

        string postagged = bidir_postag(line, vme, vme_chunking, dont_tokenize);

        /* output to file */
        File << postagged << endl;
        //cout << postagged << endl;

        /* increment counter */
        n++;
      }
      File.close();
    } else {
      cout << "Problem opening file " << ffd.cFileName << "\n";
    }
  } while (FindNextFile(hFind, &ffd) != 0);

  if (GetLastError() != ERROR_NO_MORE_FILES) {
    cout << "Something went wrong during searching\n"; 
  }
  return true;
}

目前,我收到编译错误:编辑:编译错误已修复,感谢Blood!,但请参见下文...

error: no matching function for call to 'std::basic_ofstream<char>::open<std::string&>

有什么想法?如果您需要更多代码/信息,请与我们联系。另外,我应该补充一点,我正在使用命令提示符在Windows XP上运行它们。

感谢。

修改

它现在编译(感谢Blood),但是当它运行时它只是试图打开目录,而不是目录中的文件。

Problem opening file directory_name.

ifstream应该打开teh目录中的文件,而不是目录本身。

编辑2:

我从命令行运行可执行文件,并带有以下提示:

.\tag.exe C:\indir C:\outdir

我也尝试过:

.\tag.exe C:\indir\* C:\outdir\

这枚举了所有文件,但我如何捕获它们?另外,有一种更简单的方法来修改我的代码/输入吗?

我也尝试过:

.\tag.exe C:\indir\ C:\outdir\

这给出了:错误搜索目录。

编辑3:

使用:

.\tag.exe "C:\indir\*" C:\outdir\

我得到了输出:

Problem opening file .

Problem opening file ..

Problem opening file 2967

Problem opening file 2966

Problem opening file 4707

etc. (100s)

解决方案:

以下是代码的主要更改(感谢Nate Kohl!):

string path = argv[1];
path += "\\*";

hFind = FindFirstFile(path.c_str(),&ffd);

    // in the 'do-while' loop
    string filePath = argv[1];
    filePath += "\\";
    filePath += ffd.cFileName;

    ifstream in(filePath.c_str());

    //regarding the outpath
    fullOutpath = outpath + "\\";
    fullOutpath += ffd.cFileName;
    File.open(fullOutpath.c_str());

并从命令行:

.\tag.exe C:\indir C:\outdir

非常感谢帮助。

1 个答案:

答案 0 :(得分:4)

确保您将正确的path格式传递给FindFirstFile

来自the documentation

  

要检查不是根目录的目录,请使用路径to   该目录,没有尾部反斜杠。例如,一个论点   “C:\ Windows”返回有关目录“C:\ Windows”的信息,   不是关于“C:\ Windows”中的目录或文件。 检查文件   和“C:\ Windows”中的目录,使用lpFileName“C:\ Windows \ * ”。


修改

我现在不在Windows框附近(所以这可能无法编译!)但我想“循环遍历目录中的每个文件”看起来像这样:

// argv[1] is the input path with no trailing characters, e.g. "c:\indir"

// add a wildcard because FindFirstFile expects e.g. "c:\indir\*"
TCHAR wildcard_path[MAX_PATH];
PathCombine(wildcard_path, argv[1], "*"); 

// iterate over each file
WIN32_FIND_DATA ffd;
HANDLE hFind = FindFirstFile(wildcard_path, &ffd);
if (hFind == INVALID_HANDLE_VALUE) { } // error

do {
   // ignore directories
   if (!(ffd.dwFileAttributes & FILE_ATTRIBUTE_DIRECTORY)) {

      // create a full path for each file we find, e.g. "c:\indir\foo.txt"
      TCHAR file_path[MAX_PATH];
      PathCombine(file_path, argv[1], ffd.cFileName);

      // ...and do something with file_path.
   }
} while (FindNextFile(hFind, &ffd) != 0);

FindClose(hFind);