我目前正在使用Python中的inscriptis模块将HTML从网站提取为文本。一切正常,我能够运行并打印我的代码。但是,我似乎无法将数据导出到Excel。
我尝试导出CSV和XLSX,但没有任何结果。
这是我的代码:
import urllib.request
from inscriptis import get_text
url = "https://www.alayacare.com/about-alayacare/"
html = urllib.request.urlopen(url).read().decode('utf-8')
text = get_text(html)
print(text)
export_alayacare = text.to_csv(r'C:\Users\Kev\PycharmProjects\extraction_
alayacare\alayacare\alayacare2.csv', header=True)
这是错误:
Traceback (most recent call last):
File "C:/Users/Kev/PycharmProjects/extraction_alayacare/alayacare/test_
alayacare.py", line 12, in <module>
export_alayacare = text.to_csv(r'C:\Users\Kev\PycharmProjects\extraction_
alayacare\alayacare\alayacare2.csv', header=True)
AttributeError: 'str' object has no attribute 'to_csv'
我试图导入大熊猫并以某种方式将其添加到代码中,但是我一直遇到相同类型的错误。如果有人可以帮助我解决此问题,我们将不胜感激。
谢谢。