如何打开一个巨大的HTML文件或将其拆分为可管理的块?

时间:2013-02-21 15:22:27

标签: c# html

因此,我创建了一个应用程序,它交叉检查数据库中的信息,将其与excel表进行比较,最终结果是一个巨大的html文件。以前我将每个HTML文件分开,但是当我尝试将它们全部打印出来(双面)时,它不会在批处理中正确打印,所以我不得不手动实现它。

HTML代码如下:

<html>
<head></head>
<body>
....random form crap
</body>
</html>
<html>
<head></head>
<body>
.... etc
</body>
</html>

并且有成千上万的这些。我要么需要:只需打开这个文件(它是84mb并且每次尝试过这个浏览器都崩溃了)并打印整个文件。或者将它分成5mb左右的小块,这样我就可以打印出来了。

我感谢你们对我如何能够做到这一点的任何建议!

2 个答案:

答案 0 :(得分:1)

答案 1 :(得分:1)

由于这是标记为C#,我将假设您要在Windows上完成此操作。

如果你这样做一次并想要一个实用的解决方案,请安装Cygwin并使用split -p "<html>"

如果您需要C#中的可重复解决方案,请打开文件并逐行读取,将每行输出到新文件(不要忘记添加CRLF字符!)。每次遇到<html>时,请关闭要输出的文件,然后打开一个新文件,将输出重定向到。