如何使用Python Tornado在HTTP上实现“tail”?

时间:2013-01-09 22:49:28

标签: python tornado

我正在尝试使用Python在HTTP上实现类似“tail -f”的东西。目前,我正在尝试使用Tornado,但它只是一次处理一个连接,即使我做异步请求。

import socket
import subprocess

import tornado.gen as gen
import tornado.httpserver
import tornado.ioloop
import tornado.iostream
import tornado.options
import tornado.web

from tornado.options import define, options

define("port", default=8888, help="run on the given port", type=int)
define(
    "inputfile",
    default="test.txt",
    help="the path to the file which we will 'tail'",
    type=str)


class MainHandler(tornado.web.RequestHandler):
    @tornado.web.asynchronous
    @gen.engine
    def get(self):
        print "GOT REQUEST"
        inputfile = open(options.inputfile)
        p = subprocess.Popen(
            "./nettail.py",
            stdin=inputfile,
            stdout=subprocess.PIPE)
        port_number = int(p.stdout.readline().strip())

        self.write("<pre>")
        self.write("Hello, world\n")
        self.flush()

        s = socket.socket(socket.AF_INET, socket.SOCK_STREAM, 0)
        stream = tornado.iostream.IOStream(s)
        yield gen.Task(stream.connect, ("127.0.0.1", port_number))
        while True:
            data = yield gen.Task(stream.read_until, "\n")
            self.write(data)
            self.flush()

def main():
    tornado.options.parse_command_line()
    application = tornado.web.Application([
        (r"/", MainHandler),
    ])
    http_server = tornado.httpserver.HTTPServer(application)
    http_server.listen(options.port)
    tornado.ioloop.IOLoop.instance().start()


if __name__ == "__main__":
    main()

我开始的过程是一个简单的“尾部”,输出到套接字。

import random
import socket
import sys
import time

#create an INET, STREAMing socket
s = socket.socket(
    socket.AF_INET, socket.SOCK_STREAM)

# Open the connection.
try:
    for attempt_number in xrange(5):
        port_number = random.randint(9000, 65000)
        try:
            s.bind(("localhost", port_number))
        except socket.error:
            continue
        # We successfully bound!
        sys.stdout.write("{0}".format(port_number))
        sys.stdout.write("\n")
        sys.stdout.flush()
        break

    #become a server socket
    s.listen(5)

    # Accept a connection.
    try:
        (clientsocket, address) = s.accept()

        while True:
            line = sys.stdin.readline()
            if not line:
                time.sleep(1)
                continue
            clientsocket.sendall(line)
    finally:
        clientsocket.close()

finally:
    s.close()

./ nettail.py按预期工作,但Tornado HTTP服务器一次只处理一个请求。

我想使用长时间运行的持久HTTP连接来执行此操作,因为它与旧版浏览器兼容。我知道Web套接字是在现代浏览器中完成的。

编辑: 我在Linux和Solaris上运行它,而不是Windows。这意味着我可以在文件上使用tornado.iostream,而不是通过套接字程序。尽管如此,这不是一个记录的功能,所以我为每个连接启动了一个套接字程序。

3 个答案:

答案 0 :(得分:4)

经过一些调试后,事实证明这个尾部服务器并没有阻塞。

我试图测试两个Firefox打开的窗口的并发连接,但Firefox在第一个窗口被手动停止之前不会开始获取第二个窗口。我猜Firefox不喜欢有两个并发的HTTP连接来获取相同的资源。

打开Firefox窗口和Chromium窗口,我可以看到“tail”输出被推送到两个标签页。

感谢您的帮助。 @ abarnert的评论特别有帮助。

编辑:

在Tornado即将发布的2.4.2版本中,"Pipe" IOStream is implemented。使用这个和常规的“尾部”简化了代码。

import subprocess

import tornado.httpserver
import tornado.ioloop
import tornado.iostream
import tornado.options
import tornado.web

from tornado.options import define, options

define("port", default=8888, help="run on the given port", type=int)
define(
    "inputfile",
    default="test.txt",
    help="the path to the file which we will 'tail'",
    type=str)


class MainHandler(tornado.web.RequestHandler):
    @tornado.web.asynchronous
    def get(self):
        print "GOT REQUEST"
        self.p = subprocess.Popen(
            ["tail", "-f", options.inputfile, "-n+1"],
            stdout=subprocess.PIPE)

        self.write("<pre>")
        self.write("Hello, world\n")
        self.flush()

        self.stream = tornado.iostream.PipeIOStream(self.p.stdout.fileno())
        self.stream.read_until("\n", self.line_from_nettail)

    def on_connection_close(self, *args, **kwargs):
        """Clean up the nettail process when the connection is closed.
        """
        print "CONNECTION CLOSED!!!!"
        self.p.terminate()
        tornado.web.RequestHandler.on_connection_close(self, *args, **kwargs)

    def line_from_nettail(self, data):
        self.write(data)
        self.flush()
        self.stream.read_until("\n", self.line_from_nettail)

def main():
    tornado.options.parse_command_line()
    application = tornado.web.Application([
        (r"/", MainHandler),
    ])
    http_server = tornado.httpserver.HTTPServer(application)
    http_server.listen(options.port)
    tornado.ioloop.IOLoop.instance().start()


if __name__ == "__main__":
    main()

答案 1 :(得分:1)

我最近创建了这个实验。有多个连接为我工作是否有用?

class TailHandler(BaseHandler):
    @asynchronous
    def get(self):
        self.file = open('data/to_read.txt', 'r')
        self.pos = self.file.tell()

        def _read_file():
            line = self.file.read()
            last_pos = self.file.tell()
            if not line:
                self.file.close()
                self.file = open('data/to_read.txt', 'r')
                self.file.seek(last_pos)
                pass
            else:
                self.write(line)
                self.flush()

            IOLoop.instance().add_timeout(time.time() + 1, _read_file)
        _read_file()

答案 2 :(得分:-1)

你不应该在处理程序中有这样的阻塞调用。

    port_number = int(p.stdout.readline().strip())

您需要使用select或类似机制才能避免阻止呼叫

编辑:好的,我去检查了文档。您应该使用他们的iostream来阅读p