所以我的任务是将rtfd文件转换为tiffs。
首先要做的事情。我们获取了文件夹中的附件(在Mac上的“rtfd”)并对其进行了成像。
我的问题在于将RTFD拆分为多个rtf文件。 一位同事建议通过我们有限访问权限的mac将文件转换为html。他在一天内转换了文件,但输出不像他想的那样,而是一个.webarchive。
根据我的阅读,这两种格式都是mac格式。我拒绝接受......
RTFD包含一个名为TXT.rtf的文件,该文件是一个富文本文件,但具有不可显示的字符和奇怪的格式。
我可以轻松进入rtf文件并使用脚本在分页符处拆分文件,但随后会出现奇怪的格式和不可显示的字符。当处于.webarchive格式时,文件内联到文本,因此无法呈现(至少我能看到)
目前我不知所措,我还没有尝试过的唯一选择就是将网页邮件从safari打印成PDF格式。
任何人都有在linux环境中使用这些文件的经验吗?
答案 0 :(得分:0)
我不知道为什么要将可搜索的文本转换为巨大的图像。除此之外,RTFD是Mac格式,因此您应该使用它:
答案 1 :(得分:0)
PC-BSD approaches to reading application/x-webarchive .webarchive (web archive) files(2015-07-21) - 我将交叉引用此答案,如果找到解决方案,我会在此处发布。
由于2008年Cross-Platform Way of Creating Safari Webarchives已经接受了答案,所以我想在2015年可以/应该有一种阅读格式的方法......