我想在Python中读取用户输入以获取URL(例如http://www.google.com),然后以HTML格式(仅文本)将网页打印到终端。我尝试使用pexpect.spawn('elinks')
,但elinks似乎没有写入stdout。我还查看了HTMLParser模块,但我不知道如何将生成的文本格式化为类似于网页的内容。有什么建议吗?
答案 0 :(得分:1)
这是一个不小的挑战。你想要产生elinks
的事实让我想知道为什么你不只是使用它。查看它具有的扩展性/插件/插件选项,或尝试重写它以满足您的特定需求。
最终,您需要使用curses后端编写自己的浏览器布局引擎。如果你正在使用python,urwid
是curses布局的流行选择。
答案 1 :(得分:0)
使用python urllib
输入网址 - > urllib - >页面 - >在控制台中打印
# example in the python urllib page
import urllib
opener = urllib.FancyURLopener({})
f = opener.open("http://www.python.org/")
f.read()
# modify:
html = f.read()
# add:
print html
# to print in terminal
类似于unix中的“curl”
答案 2 :(得分:-3)
import requests
r = requests.get('http://www.google.com/')
print(r.content)