我正在尝试从网站读取数据并将数据存储到变量中。 例如:
http://www.example.com/example-info.php - >
姓名:Bob
地址:1234 Street
电话:000-000-0000
电子邮件:Bobs-email@nothing.com
我想要做的是从名称“名称”获取值,该值是Bob并将其存储到诸如“用户名”之类的变量中。或“电话”并将值存储到名为“Phone”的变量中。有人能指出我正确的方向。也许我需要使用Mechanize?
答案 0 :(得分:0)
您是否正在尝试screen scrape该网站?如果是这样,使用requests或BeautifulSoup是值得关注的好事。
import requests
x = requests.get('http://www.google.com')
if x.status_code == 200:
print x.content
上述场景中的 x.content
将保存您发送请求的页面中的data / html。然后,您可以使用BeautifulSoup或regex来提取您需要的特定信息。
答案 1 :(得分:0)
您可以使用dict
来存储您的键和值,以及翻译的映射字典
mapping = {"Telephone": "Phone", "Name": "Username"}
details = {}
details[mapping.get(web_key, web_key)] = web_value
所以例如
>>> web_dict = {"Name": "Bob", "Address": "1234 Street", "Telephone": "000-000-0000", "Email": "Bobs-email@nothing.com"}
>>>
>>> for web_key, web_value in web_dict.iteritems():
... details[mapping.get(web_key, web_key)] = web_value
...
>>> print details
{'Username': 'Bob', 'Phone': '000-000-0000', 'Email': 'Bobs-email@nothing.com', 'Address': '1234 Street'}
当然这只是答案的一半,你需要一些东西来解析html到词典中开始。