Question

您好我将PDF转换为Ruby 1.9.3中的txt文件

以下是txt文件的一部分：

    [["Rate", "Card", "February", "29,", "2012"]]
    [["Termination", "Color", "Test", "No", "Rate", "Currency", "Notes"]]
    [["x", "A", "CAMEL", "56731973573", "$", "0.1400", "USD", "30/45/100%"]]
    ["y", "A", "CARDINAL", "56731972501", "$", "0.1400", "USD", "30/45/100%"]]
    [["z", "A", "CARNELIAN", "56731971654", "$", "0.1400", "USD", "30/45/100%"]]
    .....
    ....
    [["Rate", "Card", "February", "29,", "2012"]]
    [["Termination", "Color", "Test", "No", "Rate", "Currency", "Notes"]]

我将每一行存储在不同的数组中，但问题是我不想读取在我的txt文件中出现很多次的两行，因为这些行是pdf上每页的标题。有关如何做到这一点的任何想法？谢谢！

Answer 1

您可以将文件读入数组并拒绝不需要的行：

rejected = [
  '[["Rate", "Card", "February", "29,", "2012"]]',
  '[["Termination", "Color", "Test", "No", "Rate", "Currency", "Notes"]]',
]
lines = File.readlines('/path/to/file').reject { |line| rejected.include? line }

阅读文本文件Ruby的特定部分

1 个答案: