我正在使用Python开发一个小项目。它分为两部分。
第一部分负责抓取网络并提取一些信息并将其插入数据库。
第二部分可以使用数据库来呈现这些信息。 两个部分共享数据库。在第二部分中,我使用Flask框架将信息显示为带有一些格式,样式等的html,以使其看起来更清晰。
两个部分的源文件都在同一个包中,但要正确运行此程序,用户必须单独运行crawler和结果展示器,如下所示:
python crawler.py
然后
python presenter.py
除了一件事,一切都很好。主持人要做的是以html格式创建结果并打开带有用户默认浏览器结果的页面,但它总是打开两次,可能是由于run()方法的存在,它在新线程中启动Flask并且对我来说,事情变得多云。我不知道我应该做些什么才能让我的presenter.py在运行后只打开一个标签/窗口。
以下是我的代码片段:
from flask import Flask, render_template
import os
import sqlite3
# configuration
DEBUG = True
DATABASE = os.getcwd() + '/database/database.db'
app = Flask(__name__)
app.config.from_object(__name__)
app.config.from_envvar('CRAWLER_SETTINGS', silent=True)
def connect_db():
"""Returns a new connection to the database."""
try:
conn = sqlite3.connect(app.config['DATABASE'])
return conn
except sqlite3.Error:
print 'Unable to connect to the database'
return False
@app.route('/')
def show_entries():
u"""Loads pages information and emails from the database and
inserts results into show_entires template. If there is a database
problem returns error page.
"""
conn = connect_db()
if conn:
try:
cur = connect_db().cursor()
results = cur.execute('SELECT url, title, doctype, pagesize FROM pages')
pages = [dict(url=row[0], title=row[1].encode('utf-8'), pageType=row[2], pageSize=row[3]) for row in results.fetchall()]
results = cur.execute('SELECT url, email from emails')
emails = {}
for row in results.fetchall():
emails.setdefault(row[0], []).append(row[1])
return render_template('show_entries.html', pages=pages, emails=emails)
except sqlite3.Error, e:
print ' Exception message %s ' % e
print 'Could not load data from the database!'
return render_template('show_error_page.html')
else:
return render_template('show_error_page.html')
if __name__ == '__main__':
url = 'http://127.0.0.1:5000'
webbrowser.open_new(url)
app.run()
答案 0 :(得分:21)
我在Mac OS X(使用Safari,Firefox和Chrome浏览器)上一直使用类似的代码,运行正常。猜猜你可能会遇到Flask的自动重装功能。设置debug=False
,它不会尝试自动重新加载。
根据我的经验提出的其他建议:
threading.Timer
。这是我的代码:
import random, threading, webbrowser
port = 5000 + random.randint(0, 999)
url = "http://127.0.0.1:{0}".format(port)
threading.Timer(1.25, lambda: webbrowser.open(url) ).start()
app.run(port=port, debug=False)
(如果您愿意,这些都在if __name__ == '__main__':
下,或在单独的"启动应用"功能下。)