我想创建一个研究数据库,我可以存储和检索文章(PDF文件)。有什么建议吗?
我查看了几个关系数据库教程,但没有一个参考文档的存储和检索,只有原始数据。
答案 0 :(得分:1)
我会考虑使用像Elasticsearch,Solr或Lucene这样的东西,而不是传统的数据库方法。您可以索引,搜索和访问元数据。
这是通过附件插件的Elasticsearch方式:
https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-attachment-type.html
以及如何举例:
http://www.hashcode.eti.br/?p=420
的Solr:
https://gist.github.com/nichtich/429904
和Lucene:
https://wiki.apache.org/lucene-java/LuceneFAQ#How_can_I_index_PDF_documents.3F
答案 1 :(得分:0)
要在本地计算机上构建它:将所有文件放在一个文件夹/目录中,唯一地命名它们。使用任何数据库(Postgres,mysql,sqlite,mongo等)按名称存储元数据和参考PDF文件。即使你将它放入数据库 - 你也无能为力。
要在互联网上构建它,同样使用像Amazon S3这样的东西来存储PDF文件。如果您设想其他人与您合作,您可能决定为其构建Web UI:例如添加或评论文章。