如何检测RTF特定字符并从文件内容中删除特殊的RTF调味料

时间:2019-05-22 01:58:30

标签: python parsing rtf

我有一个python应用程序,该应用程序使用简单的python文件I / O库从文件读取并将文件中的配置内容应用于路由器。

我遇到一个极端的情况,即用户放置一个.rtf文件,其内容如下-content1:

{\rtf1\ansi\ansicpg1252\cocoartf1504\cocoasubrtf830
{\fonttbl\f0\fswiss\fcharset0 Helvetica;}
{\colortbl;\red255\green255\blue255;}
{\*\expandedcolortbl;;}
\margl1440\margr1440\vieww10800\viewh8400\viewkind0
\pard\tx720\tx1440\tx2160\tx2880\tx3600\tx4320\tx5040\tx5760\tx6480\tx7200\tx7920\tx8640\pardirnatural\partightenfactor0

\f0\fs24 \cf0 hostname astest<AUTOSCALE_INSTANCE_NUMBER>\
ip vrf vpn-dmvpn-a-dmvpn-Tun-3\

这在MACbook的textedit中显示得很好,如下所示-content2:

hostname astest<AUTOSCALE_INSTANCE_NUMBER>
ip vrf vpn-dmvpn-a-dmvpn-Tun-3

但是,当python读取文件时,它会以-{\ rtf1 \ ansi \ ansicpg1252 \ cocoartf1504 \ cocoasubrtf830作为第一个,{\ fonttbl \ f0 \ fswiss \ fcharset0 Helvetica;}作为第二个,依此类推。

我如何聪明地检测到该行包含.rtf字符并从文件内容中删除.rtf专用调味酱。

0 个答案:

没有答案