如何从PDF提取音乐符号?

时间:2019-07-22 20:57:52

标签: pdf extract ghostscript music-notation

我正在尝试使用另一种嵌入字体的PDF呈现音乐符号,但我不知道该怎么做。

我试图栅格化PDF中的音乐人员,但我意识到PDF由于嵌入的字体而使音乐符号变坏。然后,我想尝试另一种字体。

我使用ghostscript提取文本,或将PDF转换为PS并编辑.ps,但我相信,如果我能理解如何重新将PDF重新呈现...

gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=Betlem_pdf.txt Betlem.pdf

iconv.exe -f MACROMAN -t UTF-8 Betlem_pdf.txt > Betlem_pdf_txt_utf8.txt

enscript.exe -f Petrucci40 Betlem_pdf_txt_utf8.txt -o Betlem_pdf_txt_utf8.ps

gs -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -sOutputFile=Betlem_2.pdf Betlem_pdf_txt_utf8.ps

预期结果是看到与原始PDF相同的谱图,但使用另一种字体。但是我不知道我在做什么...

http://www.xn--estudiantladolaina-lvb.com/partitures/baixa/pdf/26

1 个答案:

答案 0 :(得分:1)

您链接的PDF没有音符字体。音乐笔记是PDF形状/图像对象。最好的办法是对PDF使用OCR(光学字符识别),并希望OCR支持音符。