用于标签浏览的Firefox或类似应用程序UTF-16

时间:2016-10-25 13:20:36

标签: xml utf-16

我使用一组UTF-16加密的xml文件。 示例文件在这里 http://tipitaka.org/sinh/cscd/

我想要做的是从所有这些文件中搜索关键字并使用给定的关键字打开所有文件。

我使用的脚本就是这个。

#!/bin/sh
grep $1 *.xml | sed 's/ *:.*//' | uniq > list.dat

while read line; do
    gedit "$line"
done < list.dat

到目前为止,我已经使用过了;

  1. Firefox - 显示文件正常(firefox -new-tab选项)但未正确打开选项卡。关闭当前选项卡后,只会弹出第二个选项卡
  2. chrome - 按预期弹出选项卡但不显示XML文件
  3. gedit- pops并在选项卡中显示内容,但不会将文本格式化为浏览器。
  4. 是否有任何应用程序或修复程序打开包含选项卡表单中所有格式的xml文件列表?

    其次有一种方法可以在打开选项卡后突出显示此搜索文本。

    非常感谢。

1 个答案:

答案 0 :(得分:1)

这可能会显示您需要的一种或两种技术。

import requests
import webbrowser

URLtemplate = 'http://tipitaka.org/sinh/cscd/abh02m.mul%s.xml'

unencodedWord = 'වත්‌ථු'
word = bytearray(unencodedWord.encode('utf-16be'))

for k in range(0,18):
    URL = URLtemplate % k
    r = requests.get(URL)
    print ( r. apparent_encoding, end = '' )
    if r. apparent_encoding != 'UTF-16BE':
        print ( "can't process" )
        continue
    else:
        print ()
    if r.content.find(word) > -1:
        webbrowser.open(URL)
        input ('tap enter when ready for next page (if any):')