AttributeError:模块'sys'没有属性'setdefaultencoding'

时间:2017-07-22 08:17:16

标签: python python-3.x encoding web-scraping

我原来的代码就是这个。

#py3.6, windows10   
import time
from selenium import webdriver
import codecs
import sys

reload(sys)
sys.setdefaultencoding('utf-8')

不支持重新加载。它被修复了。

Import importlib
Importlib.reload (sys)

但也有错误。

  

AttributeError:模块'sys'没有属性'setdefaultencoding'

我该如何解决这个问题?我很感激你的帮助。

我还附上了我的整个代码。

import time
from selenium import webdriver
import codecs
import sys

reload(sys)
sys.setdefaultencoding('utf-8')

browser = webdriver.PhantomJS('C:\phantomjs-2.1.1-windows/bin/phantomjs')
url = u'https://twitter.com/search?f=tweets&vertical=default&q=%EB%B0%B0%EA%B3%A0%ED%8C%8C%20since%3A2017-07-19%20until%3A2017-07-20&l=ko&src=typd&lang=ko'

browser.get(url)
time.sleep(1)

body = browser.find_element_by_tag_name('body')
browser.execute_script("window.scrollTo(0,document.body.scrollHeight);")

start = time.time()
for _ in range(500):
    now = time.time()
    browser.execute_script("window.scrollTo(0, 
    document.body.scrollHeight);")
    print str(_) + "    seconds: " + str(now - start) 
    time.sleep(0.2)

tweets=browser.find_elements_by_class_name('tweet-text')

with codecs.open("test.txt", "w","utf-8") as f:
    i = 1
    for i, tweet in enumerate(tweets):
        data = tweet.text
        data = data.encode('utf-8')
        print i, ":", data
        msg = (str(data) +'\n')
        f.write(msg)
        i += 1

end = time.time()
print(end - start)
browser.quit()

1 个答案:

答案 0 :(得分:6)

您应该删除sys.setdefaultencoding。请注意,这在Python 2中也一直滥用sys.setdefaultencodingFrom Python 2 documentation

  

sys.setdefaultencoding(name)

     

设置Unicode实现使用的当前默认字符串编码。如果name与任何可用的编码都不匹配,则引发LookupError。 此功能仅供site模块实施使用,并在需要时由sitecustomize使用。在site模块使用后,它将从sys模块的命名空间中删除。

     

2.0版中的新功能。

这为Python 2中的8位字符串设置了编码。由于字节串在Python 3中有 no 编码,而unicode字符串(str)都没有(它们是Unicode,但是使用不透明的内部编码),这个函数在Python 3上没有意义 - nothing 设置默认编码。