C ++(VC)文本输出用0d 0d 0a而不是0d 0a打破行 - 如何修复?

时间:2015-06-29 19:35:46

标签: c++ text clipboard clipboarddata

编辑这个问题的解决方案由Ulrich Eckhardt在下​​面的评论中提供。此外:这个问题的原因和解决方案完全不同于可能重复。再次,请参阅Ulrich Eckhardt的评论以获取详细信息。

在这里的专家的帮助下,我设法组装了一个程序,将Windows剪贴板的内容写入指定代码页中的文本文件。它现在似乎工作得很好,除了文本文件中的换行符是三个字节 - 0d 0d 0a - 而不是0d 0a - 当我将文本导入文字处理器时,这会导致问题(附加行)。

有没有一种简单的方法可以在文本流中用0d 0a替换0d 0d 0a,或者我的代码中应该做些什么?我在其他地方找不到这样的东西。这是代码:

#include <stdafx.h>
#include <windows.h>
#include <iostream>
#include <fstream>
#include <codecvt> // for wstring_convert
#include <locale>  // for codecvt_byname
using namespace std;

void BailOut(char *msg)
{
    fprintf(stderr, "Exiting: %s\n", msg);
    exit(1);
}

string ExePath()
{
    char buffer[MAX_PATH];
    GetModuleFileNameA(NULL, buffer, MAX_PATH);
    string::size_type pos = string(buffer).find_last_of("\\/");
    return string(buffer).substr(0, pos);
}

// get output code page from command-line argument; use 1252 by default
int main(int argc, char *argv[])
{
    string codepage = ".1252";

    if (argc > 1) {
        string cpnum = argv[1];
        codepage = "." + cpnum;
    }

    // HANDLE clip;
    string clip_text = "";

    // exit if clipboard not available
    if (!OpenClipboard(NULL))
    { BailOut("Can't open clipboard"); }

    if (IsClipboardFormatAvailable(CF_TEXT)) {
        HGLOBAL hglb = GetClipboardData(CF_TEXT);

        if (hglb != NULL) {
            LPSTR lptstr = (LPSTR)GlobalLock(hglb);

            if (lptstr != NULL) {
                // read the contents of lptstr which just a pointer to the string:
                clip_text = (char *)hglb;
                // release the lock after you're done:
                GlobalUnlock(hglb);
            }
        }
    }

    CloseClipboard();

    // create conversion routines
    typedef std::codecvt_byname<wchar_t, char, std::mbstate_t> codecvt;
    std::wstring_convert<codecvt> cp1252(new codecvt(".1252"));
    std::wstring_convert<codecvt> outpage(new codecvt(codepage));

    std::string OutFile = ExePath() + "\\#clip.txt"; // output file name

    ofstream OutStream;  // open an output stream
    OutStream.open(OutFile, ios::out | ios::trunc);

    // make sure file is successfully opened
    if (!OutStream) {
        cout << "Error opening file " << OutFile << " for writing.\n";
        return 1;
    }

    // convert to DOS/Win codepage number in "outpage"
    OutStream << outpage.to_bytes(cp1252.from_bytes(clip_text)).c_str();
    //OutStream << endl;
    OutStream.close(); // close output stream
    return 0;
}

1 个答案:

答案 0 :(得分:2)

这里的评论是正确的,但让我提供更多背景信息并指出一个挥之不去的问题。

有各种行终止符/分隔符约定。许多Unix派生系统在每一行的末尾都使用换行符。在ASCII中,那是'\x0A'。其他系统,如Windows和许多网络协议,使用回车符,然后在行之间进行换行。在ASCII中,那是'\x0D' '\x0A'。 (还有其他方案,但它们更为罕见。)

用于读取和写入文本的C和C ++输入/输出库可以隐藏这些约定,以便您能够以正确的方式编写正确的代码#34;无论底层平台是什么。

编程约定是使用'\n',如果您的底层平台使用ASCII或Unicode,则几乎肯定等同于换行符(但如果它使用的EBCDIC没有换行符则不会字符)。写入文件时,库将截取'\n'并放置平台所需的任何约定。例如,如果您使用的是Linux计算机,它会输出换行符(并且由于'\n'与换行符具有相同的值,因此这基本上是无操作)。在Windows上,库将拦截'\n'并输出回车符和换行符。事情的输入方面恰恰相反。

当您从Windows上的剪贴板获取文本时,您并不真正知道它使用的是哪种约定。由于它是Windows,你可能期望CR + LF,但许多可能在剪贴板上放置文本的程序在Windows上可能无法正常运行。

在你的情况下,似乎剪贴板中的文本确实同时具有回车符和行之间的换行符。然后在文本模式下输出时,i / o库输出回车符,然后它会看到换行符(它认为是'\n'),因此它输出另一个回车符后跟一行饲料。这就是为什么你看到回车率增加一倍的原因。

将输出切换为二进制模式会告诉图书馆&#34;不要转换'\n'。&#34;所以,这解决了你当前的问题。

但仍有问题是剪贴板文本有时可能只在行之间(或在行尾)进行换行。如果以二进制模式输出,则无法获得回车,并且该文件在技术上不符合您的平台所需的格式。有些程序会处理这个问题,但其他程序,例如记事本,则不会。

More information