标签: database web
我需要跟踪房地产销售价格,在希腊这里有一个房地产广告网站,系统地展示了数以千计的广告:
http://1drv.ms/1gwJhRe
每个广告都有一个标题,然后是区域和一个小描述,最后是右边的区域和销售价格。
我知道他们有一个存储所有内容的数据库,但这不能直接访问。
尝试通过逐个提取数据来制作电子表格需要数年时间。
我怎样才能创建一个软件,最终会从每个广告中创建一个包含表格数据(区域,区域,售价等)的文本文件?
我愿意努力学习,以了解这需要做些什么。
答案 0 :(得分:0)
为此,您需要执行一项名为Web Scraping的操作。查看Scrapy.org
抓取工具是一种程序,可以读取HTML文档并以您需要的格式对其进行解释。