我有许多记录(=< 100),其中包含大量的文本块,需要在存储可重用之前进行标记(语义:列表,标题,表格,链接,引用等...)文件格式。
存储后,可能会在未来多年内保持或多或少不变。
它包含一些非ascii,因此需要UTF-8。我开始使用HTML,然后考虑Markdown ......但是想知道人们认为长期存储的最具前瞻性的标记格式?内容最初是针对(主要是静态的)网站,但可以用作其他输出的内容。
最后,关于存储选择的长期使用意见 - 数据库,单独的文件......?对记录的更改很少见,只有1-3人编辑,读取访问权限会随着时间的推移而增加。
我最终选择MultiMarkdown,PHP Markdown Extra和Kramdown之间的常用功能(例如表格)作为文本格式(Markdown省略了太多HTML标记),并且正在转换使用Kramdown将结果文件转换为html。现在我正在尝试iOS Markdown editors,它可以处理扩展的Markdown并通过Dropbox同步到我的桌面/笔记本电脑。
答案 0 :(得分:1)
任何未设计用于长期归档的存储都将中断。
这不是数据库与文件系统的问题,而是如何确保不发生(静默)数据损坏,以及如何迁移数据。我没有给你明确的答案,因为它取决于很多因素(包括成本),但这里有一些资源:
我对格式问题没有真正的答案,但我认为HTML + UTF-8即使在几十年内也应该是可读的,但请记录下来。