从属性广告网站创建数据库

时间:2015-08-11 16:10:51

标签: database web

我需要跟踪房地产销售价格,在希腊这里有一个房地产广告网站,系统地展示了数以千计的广告:

http://1drv.ms/1gwJhRe

每个广告都有一个标题,然后是区域和一个小描述,最后是右边的区域和销售价格。

我知道他们有一个存储所有内容的数据库,但这不能直接访问。

尝试通过逐个提取数据来制作电子表格需要数年时间。

我怎样才能创建一个软件,最终会从每个广告中创建一个包含表格数据(区域,区域,售价等)的文本文件?

我愿意努力学习,以了解这需要做些什么。

1 个答案:

答案 0 :(得分:0)

为此,您需要执行一项名为Web Scraping的操作。查看Scrapy.org

抓取工具是一种程序,可以读取HTML文档并以您需要的格式对其进行解释。