页面刮刀解析器错误?

时间:2016-12-03 20:56:15

标签: python

大家好,这里有新的Python用户我在构建一个非常基本的页面抓取工具时遇到了一个奇怪的错误。

我正在使用BeautifulSoup4来帮助我,当我执行我的代码时,我收到此错误

“UserWarning:没有明确指定解析器,所以我使用了最好的HTML解析器(”html.parser“)。这通常不是问题,但是如果你在另一个系统上运行这个代码,或者在不同的虚拟环境中,它可能使用不同的解析器,行为也不同。

导致此警告的代码位于文件C:/ Users / *** / PycharmProjects / untitled1 / s.py的第13行。要摆脱此警告,请更改如下所示的代码:“

 BeautifulSoup([your markup])

to this:

  BeautifulSoup([your markup], "html.parser")

  markup_type=markup_type))

如果有人有任何帮助来解决这个问题,我将不胜感激!

代码遵循

import requests
from bs4 import BeautifulSoup

def trade_spider():
    url = 'http://buckysroom.org/trade/search.php?page=' # Could add a + pls str(pagesomething) to add on to the url so that it would update
    source_code = requests.get(url) #requests the data from the site
    plain_text = source_code.text #imports all of the data gathered
    soup = BeautifulSoup(plain_text) #This hold all of the data, and allows you to sort through all of the data, converts it
    for link in soup.find_all( 'a', {'class' : 'item-name'}):
        href = link.get('href')
        print(href)

trade_spider()

1 个答案:

答案 0 :(得分:0)

您可以尝试将以下行更改为:

self.uploadFile = function(){
   var file = self.myFile;

   // console.log('file is ' );
   // console.dir(file);

   var uploadUrl = "http://111.11.11.11/api/upload/";

   fileUpload.uploadFileToUrl(file, uploadUrl).then(function(data) {

    console.log('test data ->', data);

   });

   console.log(dataInfo.image);

};

或您需要使用的其他parser ...