我想抓取新内容并将其写入文件,但它正在提供“无类型”和“#”;对象没有属性'编码'
#!/usr/bin/python
# -*- coding: utf-8 -*-
import urllib2 as urllib
from bs4 import BeautifulSoup
import codecs
link = 'http://www.hindustantimes.com/delhi-news/delhi-man-shoots- girlfriend-in-leg-after-argument-blames-snatchers/story- CzA8JmgafX7tNUroilovoO.html'
reqlink = urllib.Request(link)
page = urllib.urlopen(reqlink)
soup = BeautifulSoup(page,'html.parser')
fw = codecs.open('hlink7.txt','w')
var = soup.findAll('p')
for i in var:
fw.write(i.string.encode('utf-8'))
如何解决?
答案 0 :(得分:0)
如果您想对p
代码的内容进行编码,则可能需要使用text
代替string
。
像这样,
for i in var:
fw.write(i.text.encode('utf-8'))
答案 1 :(得分:0)
该异常表示您正在encode
的对象上调用方法None
。因此,在调用方法之前,应首先检查对象。修改您的代码如下:
for i in var:
if i.string:
fw.write(i.string.encode('utf-8'))