我需要从epub获得文本
from epub_conversion.utils import open_book, convert_epub_to_lines
f = open("demofile.txt", "a")
book = open_book("razvansividra.epub")
lines = convert_epub_to_lines(book)
我使用这个,但是如果我使用print(lines),它只会打印一行。图书馆有6年历史了。你们知道一个好方法吗?
答案 0 :(得分:0)
https://github.com/aerkalov/ebooklib
EbookLib是用于管理EPUB2 / EPUB3和Kindle的Python库 文件。它能够以编程方式读取和写入EPUB文件 (Kindle支持正在开发中。)
API被设计为尽可能简单,同时 也使复杂的事情成为可能。它支持封面, 目录,书脊,指南,元数据等。
import ebooklib
from ebooklib import epub
book = epub.read_epub('test.epub')
for doc in book.get_items_of_type(ebooklib.ITEM_DOCUMENT):
print doc
答案 1 :(得分:0)
convert_epub_to_lines返回行的迭代器,您需要逐行迭代才能获得。
相反,您可以使用“转换”来获取所有行,请参见库的文档: