我有一些带表格的RTF文件。有没有办法将表的内容放入数据表中?或者有没有办法将表转换为csv?
答案 0 :(得分:0)
我将此作为部分答案发布,因为它不完整,但可用于解决您遇到的问题。
从document specified in my comment我发现了这个细节...
表格定义
没有RTF表组;相反,表被指定为段落属性。表格表示为一系列表格行。表行是分隔成单元格的连续系列段落。表格行以 \ trowd 控制字开头,以 \ row 控制字结束。表格行中包含的每个段落必须具有指定或继承自上一段的 \ intbl 控制字。一个单元格中可能包含多个段落;单元格由单元格标记( \ cell 控制字)终止,行以行标记( \ row 控制字)终止。表行也可以定位。在这种情况下,表行中的每个段落必须具有相同的定位控件(请参阅本规范的定位对象和框架子部分上的控件。表属性可以从前一行继承;因此,一系列表行可能是由一个人介绍。
您可以从第93页开始查找此详细信息,但似乎确实提供了您需要知道的大部分内容。
从这一点开始,您应该将文件读入一个字符串,然后搜索每个后续出现的\trowd
(允许关闭\row
命令)。这应该允许遍历RTF文档中的所有表。使用此方法,并通过分析表格中的数据,您应该能够确定哪些对您的要求很重要。