我需要一个epub到Python的文本解决方案

时间:2019-03-15 10:25:50

标签: python epub

我需要从epub获得文本

from epub_conversion.utils import open_book, convert_epub_to_lines

f = open("demofile.txt", "a")
book = open_book("razvansividra.epub")
lines = convert_epub_to_lines(book)

我使用这个,但是如果我使用print(lines),它只会打印一行。图书馆有6年历史了。你们知道一个好方法吗?

2 个答案:

答案 0 :(得分:0)

https://github.com/aerkalov/ebooklib

  

EbookLib是用于管理EPUB2 / EPUB3和Kindle的Python库   文件。它能够以编程方式读取和写入EPUB文件   (Kindle支持正在开发中。)

     

API被设计为尽可能简单,同时   也使复杂的事情成为可能。它支持封面,   目录,书脊,指南,元数据等。

import ebooklib
from ebooklib import epub

book = epub.read_epub('test.epub')

for doc in book.get_items_of_type(ebooklib.ITEM_DOCUMENT):
    print doc

答案 1 :(得分:0)

convert_epub_to_lines返回行的迭代器,您需要逐行迭代才能获得。

相反,您可以使用“转换”来获取所有行,请参见库的文档:

https://pypi.org/project/epub-conversion/