我想从Udemy.com上的课程页面记录课程信息(课程名称,摘要,价格等)并将信息推送到数据库。 (例如:https://www.udemy.com/davinciediting/)
如果可能的话,我希望能够编写一个脚本,以便我可以粘贴一个课程URL并将信息提取并自动记录到数据库中。
所有课程页面都具有相同的类,脚本将在每个URL的指定类中查找数据。
答案 0 :(得分:1)
您可以使用requests和BeautifulSoup抓取您想要的网页。
然后您可以将数据添加到数据库,您可以使用SQLAlchemy或peewee之类的ORM。