从X剪贴板获取HTML源或富文本

时间:2010-07-16 01:45:07

标签: html linux browser clipboard xorg

如何从X剪贴板获取富文本或HTML源代码?例如,如果您从Web浏览器复制一些文本并将其粘贴到kompozer中,它会粘贴为HTML,并保留链接等。但是,相同选择的xclip -o只输出纯文本,以类似于elinks -dump的方式重新格式化。我想将HTML拉出来并进入文本编辑器(特别是vim)。

我问the same question on superuser.com,因为我希望有一个实用工具可以做到这一点,但我没有得到任何信息反应。 X剪贴板API对我来说还是一个神秘的野兽;任何有关黑客攻击的提示都非常受欢迎。这些天我选择的语言是Python,但几乎任何事情都可以。

3 个答案:

答案 0 :(得分:39)

为了补充@rkhayrov's answer,已存在一个命令:xclip。或者更确切地说,有一个patch to xclip added to xclip later on in 2010,但尚未发布那样做。因此,假设您的操作系统像Debian一样带有xclip的颠覆头:

列出CLIPBOARD选择的目标:

$ xclip -selection clipboard -o -t TARGETS
TIMESTAMP
TARGETS
MULTIPLE
SAVE_TARGETS
text/html
text/_moz_htmlcontext
text/_moz_htmlinfo
UTF8_STRING
COMPOUND_TEXT
TEXT
STRING
text/x-moz-url-priv

选择特定目标:

$ xclip -selection clipboard -o -t text/html
 <a href="https://stackoverflow.com/users/200540/rkhayrov" title="3017 reputation" class="comment-user">rkhayrov</a>
$ xclip -selection clipboard -o -t UTF8_STRING
 rkhayrov
$ xclip -selection clipboard -o -t TIMESTAMP
684176350

xclip也可以设置并拥有一个选择(-i而不是-o)。

答案 1 :(得分:24)

在X11中,您必须与选择所有者通信,询问支持的格式,然后以特定格式请求数据。我认为最简单的方法是使用现有的窗口工具包。例如。使用Python和GTK:

#!/usr/bin/python

import glib, gtk

def test_clipboard():
    clipboard = gtk.Clipboard()
    targets = clipboard.wait_for_targets()
    print "Targets available:", ", ".join(map(str, targets))
    for target in targets:
        print "Trying '%s'..." % str(target)
        contents = clipboard.wait_for_contents(target)
        if contents:
            print contents.data

def main():
    mainloop = glib.MainLoop()
    def cb():
        test_clipboard()
        mainloop.quit()
    glib.idle_add(cb)
    mainloop.run()

if __name__ == "__main__":
    main()

输出将如下所示:

$ ./clipboard.py 
Targets available: TIMESTAMP, TARGETS, MULTIPLE, text/html, text/_moz_htmlcontext, text/_moz_htmlinfo, UTF8_STRING, COMPOUND_TEXT, TEXT, STRING, text/x-moz-url-priv
...
Trying 'text/html'...
I asked <a href="http://superuser.com/questions/144185/getting-html-source-or-rich-text-from-the-x-clipboard">the same question on superuser.com</a>, because I was hoping there was a utility to do this, but I didn't get any informative responses.
Trying 'text/_moz_htmlcontext'...
<html><body class="question-page"><div class="container"><div id="content"><div id="mainbar"><div id="question"><table><tbody><tr><td class="postcell"><div><div class="post-text"><p></p></div></div></td></tr></tbody></table></div></div></div></div></body></html>
...
Trying 'STRING'...
I asked the same question on superuser.com, because I was hoping there was a utility to do this, but I didn't get any informative responses.
Trying 'text/x-moz-url-priv'...
http://stackoverflow.com/questions/3261379/getting-html-source-or-rich-text-from-the-x-clipboard

答案 2 :(得分:2)

扩展 Stephane Chazelas 的想法,您可以:

  • 从格式化的源中复制。
  • 运行此命令从剪贴板中提取内容,转换为 HTML,然后(使用管道 |)将该 HTML 放回剪贴板,再次使用相同的 xclip
xclip -selection clipboard -o -t text/html | xclip -selection clipboard
  • 接下来,当您使用 Ctrl+v 粘贴时,它将粘贴 HTML 源代码。

更进一步,您可以将其设为快捷方式,这样您就不必每次都打开终端并运行确切的命令。 ✨

这样做:

  • 打开您的操作系统的设置(在我的例子中是 Ubuntu)
  • 找到键盘部分
  • 然后找到快捷方式部分
  • 创建一个新的快捷方式
  • 设置名称,例如:Copy as HTML
  • 然后作为快捷方式的命令,输入:
bash -c "xclip -selection clipboard -o -t text/html | xclip -selection clipboard"

注意:注意它与上面的命令相同,但放在内联 Bash 脚本中。这对于能够使用 |(管道)将一个命令的输出作为输入发送到下一个命令是必要的。

  • 将快捷方式设置为您想要的任何组合,最好不要覆盖您使用的其他快捷方式。就我而言,我将其设置为:Ctrl+Shift+c

  • 之后,您可以像往常一样复制一些格式化文本:Ctrl+c
  • 然后,在粘贴之前,使用以下命令将其转换为 HTML:Ctrl+Shift+c
  • 接下来,当您使用 Ctrl+v 粘贴它时,它会将内容粘贴为 HTML。 ?✨

Shortcut edition window