创建研究数据库

时间:2015-09-15 01:31:19

标签: database-design document-storage

我想创建一个研究数据库,我可以存储和检索文章(PDF文件)。有什么建议吗?

我查看了几个关系数据库教程,但没有一个参考文档的存储和检索,只有原始数据。

2 个答案:

答案 0 :(得分:1)

我会考虑使用像Elasticsearch,Solr或Lucene这样的东西,而不是传统的数据库方法。您可以索引,搜索和访问元数据。

这是通过附件插件的Elasticsearch方式: https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-attachment-type.html 以及如何举例:
http://www.hashcode.eti.br/?p=420

的Solr:
https://gist.github.com/nichtich/429904

和Lucene:
https://wiki.apache.org/lucene-java/LuceneFAQ#How_can_I_index_PDF_documents.3F

答案 1 :(得分:0)

要在本地计算机上构建它:将所有文件放在一个文件夹/目录中,唯一地命名它们。使用任何数据库(Postgres,mysql,sqlite,mongo等)按名称存储元数据和参考PDF文件。即使你将它放入数据库 - 你也无能为力。

要在互联网上构建它,同样使用像Amazon S3这样的东西来存储PDF文件。如果您设想其他人与您合作,您可能决定为其构建Web UI:例如添加或评论文章。