建立一个有文章,政策,法律和文字内容的网站。我在MSSql 2008数据库中存储所有数据(在某些情况下,文章超过8000个字符)。我读了一些他们说文本数据不应该存储在数据库中的文章。它们应该存放在哪里?在.txt文件或什么?我也想搜索数据。如果它们存储在DB中,我可以使用存储过程等。如果存储在docs中,我需要使用像Lucene这样的工具。我对吗?我在这个项目中使用DB的方法是错误的吗?请赐教。
答案 0 :(得分:0)
无论您如何看待它,您将使用该项目的某些描述的数据库,无论是: 1)一个老式的平面文件数据库(txt文档,不推荐用于大型项目imho) 2)传统的文本存储数据库 3)文件数据库
是否使用文本数据库或文档数据库的论据取决于您拥有或可能获得(或协助)的技能/知识。听起来我觉得你对文本数据库感觉更舒服,而且在我看来这并没有什么问题 - 最糟糕的情况是如果真的需要长期使用文档而不是直接文本存储您应该能够从文本数据库自动生成文档 - 我怀疑反过来会更加棘手(将大量专有文档转换为文本以进行存储和插入)。从文本数据库生成纯文本文件是微不足道的,大多数供应商文档格式支持导入纯文本文档以供后续格式化。
对于像这样的大型项目,你真的需要花一些时间来考虑你的文件可能用于什么以及由谁使用,以及哪种方法最适合他们。如果您为大量使用MS Word且想要下载数据的人提供数据库,则可能需要考虑使用文档数据库。如果只是您想要提供的信息(以及基于网络的工具),您想要考虑如何操纵自己的数据。
这显然是所有意见,但我最后的建议是确保你从一开始就使用utf-8文本,如果你沿着文本路线(痛苦经历)。