使用javascript

时间:2017-07-05 06:02:45

标签: python python-3.x web-crawler

我是抓取数据的新手。我想抓取此网站的数据:[http://kbbi.web.id/][ enter image description here

我希望通过.csv文件的输入抓取数据,并使抓取数据像上面的图片一样为每个csv单行工作,并仅从红色框中获取数据,例如。 mengabadi,mengabadikan,pengabadian,keabadian并将其保存在新的.csv文件中,如下所示:

enter image description here

那么,我可以做些什么来抓取它(可能使用python)?我认为网页使用javascript来加载/渲染数据。

1 个答案:

答案 0 :(得分:3)

使用requestsbs4 示例代码:(自己阅读和实现,这只是为了给你一个想法!)

from bs4 import BeautifulSoup

import requests

url = "http://kbbi.web.id/"

r  = requests.get(url)

data = r.text

soup = BeautifulSoup(data)

现在,使用检查工具挖掘网站,并且.. CODE !!

可以使用pip安装BeautifulSoup和Requests:

$ pip install requests

$ pip install beautifulsoup4