我有一个使用WebClient
从远程服务器下载文件的程序。我使用DownloadData
而不是DownloadFile
因为我不需要物理文件。我只是将字节数组转换为base64字符串,以便通过API作为有效负载的一部分进行提交。对于某些文件,我会将它们下载为RTF,但在我通过API发送之前,需要将它们转换为可搜索的PDF。我宁愿只使用内存中的字节数组来处理这种转换,而不是将文件保存到磁盘,然后进行转换。有没有办法让我采用RTF字节数组并将其转换为(可搜索的)PDF字节数组?
我尝试将rtf字节数组保存为pdf,但这不起作用。这是我的代码:
System.IO.File.WriteAllBytes(@"C:\temp\pdfTest.pdf", fileBytes);
答案 0 :(得分:0)
以下解决方案需要Telerik订阅,但我使用它将rtf字节数组转换为pdf字节数组:
df = pd.DataFrame({"y": [1,2,3], 'col': pd.to_datetime(["2000-03-31 00:00:00", "2000-05-31 00:00:00", "2000-08-31 00:00:00"])})
df['col'] = df['col'].dt.to_period("Q")
df
# col y
#0 2000Q1 1
#1 2000Q2 2
#2 2000Q3 3