我收到此警告WARNING: C:\Users\diodi\AppData\Local\Programs\Python\Python37-32\lib\site-packages\xlsxwriter\worksheet.py:923: UserWarning: Ignoring URL 'https://www.google.com/search?q=hello+world' since it exceeds Excel's limit of 65,530 URLS per worksheet.
"65,530 URLS per worksheet." % force_unicode(url))
我用来写抓取数据的输出
#spider.found_items is a list of dictionary
df = pd.DataFrame(spider.found_items)[ordered_list] #ordered_list is the order of dictiornary outputed
df.to_excel("{}.xlsx".format(file_name),sheet_name='All Products')
我检查了此Number of URLS is over Excel's limit of 65,530 URLS per worksheet.,但这将链接设置为字符串格式(不可单击)。如果我可以写多个工作表或任何其他建议,是否可以保留URL(作为链接)?
答案 0 :(得分:1)
从根本上来说,这是Excel的限制。每个工作表仅允许65,530个唯一* URL。对此没有任何解决方法。
(*)如果将非唯一URL连续分组,Excel确实允许超过65,530个非唯一URL。例如,单元格A1到A100中的相同url将仅计为65,530限制内的一个url。但是,XlsxWriter不支持对URL进行分组以利用这一点(即使这样,如果所有URL都是唯一或不连续的也无济于事)。
答案 1 :(得分:0)
如果可能,请改用 EXCEL HYPERLINK 函数。使用 HYPERLINK 函数不应遇到此限制。