我正在制作一个框架,以便轻松“申请”书籍。 该框架将需要自动检测章节和标题以制作目录。我们的想法是能够轻松搜索文本并找到您要查找的内容。
现在我还需要弄清楚的是:
存储的文本需要格式化,所以我认为我会将它们存储为HTML或Markdown(将被翻译为HTML)。如果文本是HTML格式,我不认为它是非常容易搜索的。
P.S。如果有其他更有效的方式来格式化文本,则不必是HTML。
答案 0 :(得分:1)
你真的想在设备上做这样的事吗?
我建议你为每本书使用单独的sqlite数据库。使用单独的目录,章节,章节的总结关键词(用于更快的搜索)和其他服务信息。
另外here you can find full text search example
另外,我建议您使用自己的应用程序自带sqlite版本。
现在让我们谈谈你的主要问题 - 书籍刮擦。 我在这里没有能力,我相信这个问题和网站的搜索是一样的。
UPD: 请不要将书籍内容存储为HTML,您可以将其存储为markdown,例如,它需要的存储量更少,更容易消毒,以后您可以随时应用您的样式