我正在制作一个简单的命令行程序,用于使用Python中的Twill模块从网站收集和解析信息(非常通用)。我想使用Twill的show()命令将HTML输出分配给变量,以通过我的解析命令运行页面,但每次我将它分配给变量...
htmlString = twill.commands.show()
我在命令行上获得了大量的HTML(和IDLE一样)。为什么是这样?我不是要求打印变量,它附近没有打印命令。我只是想分配进一步的操作。为什么变量赋值会导致打印?这不是致命的错误或任何事情,只是真的,非常不方便。我使用的是Python 2.6,Twill 0.9和Ubuntu,如果这与任何事情有关。
答案 0 :(得分:3)
我建议使用lxml
或BeautifulSoup
来解析HTML,从不面对twill
。但是我看到你调用了.show()
方法,也许这个方法里面有print
语句。
答案 1 :(得分:1)
斜纹是一个奇怪的,并向终端输出大量输出。这不是导致打印出来的变量赋值,而是show()
方法。它将打印(而不是返回)输出。