我基本上有这个url,它有一堆信息,我希望使用python保存到MySQL的数据库中。我会发布我的代码以显示我的位置,但说实话,我真的不知道从哪里开始如何将其保存到数据库表。如果这令人困惑,请告诉我,我会尽力清理它。
由于
答案 0 :(得分:2)
从http://zetcode.com/databases/mysqlpythontutorial/尝试此示例。当然,您应该首先安装MySQL DB和MySQLdb库。
import MySQLdb as mdb
import sys
con = mdb.connect('localhost', 'testuser', 'test623', 'testdb');
with con:
cur = con.cursor()
cur.execute("CREATE TABLE IF NOT EXISTS \
Writers(Id INT PRIMARY KEY AUTO_INCREMENT, Name VARCHAR(25))")
cur.execute("INSERT INTO Writers(Name) VALUES('Jack London')")
cur.execute("INSERT INTO Writers(Name) VALUES('Honore de Balzac')")
cur.execute("INSERT INTO Writers(Name) VALUES('Lion Feuchtwanger')")
cur.execute("INSERT INTO Writers(Name) VALUES('Emile Zola')")
cur.execute("INSERT INTO Writers(Name) VALUES('Truman Capote')")
要从网址加载html文件,您可以使用urllib2:
import urllib2
f = urllib2.urlopen('http://www.python.org/')
html = f.read()
要解析html并提取数据,您可以使用BeautifulSoup
from bs4 import BeautifulSoup
soup = BeautifulSoup(html)
for a in soup.find_all('a'):
# add to mysql