我正在开始一个信息检索项目。我将分析大量的信息(数百万个文本文档)。
以下是我的想法:
以下是人们在建议Python时所说的内容:
它应该用Java完成,因为Java适用于真正的工程师而Python适用于黑客。
你的想法是什么?
答案 0 :(得分:4)
我在大学的几个信息检索项目中使用了Java,我可以为此推荐它。以下是一些想法:
请注意,其中一些参数并非特定于Java,并且可能适用于类似的语言,如C#,以及在某种程度上也适用于C ++。
答案 1 :(得分:1)
嗯,用于某事的最好的语言总是一个品味,个人经验,你正在处理的问题等问题。例如,即使它非常用于IR,我到目前为止,我们没有积极的Java经验,因此语言不会出现在我的偏好或推荐中。那个,我最近在大学的一个课程中在IR工作,这里是我用过的东西:
我没有时间使用的另一件事是 Scrapy ,一个用于网页抓取的 Python模块。我的谷歌搜索给我的印象是,这个用途非常广泛,而且文档非常好。看起来非常可配置,专门用于聚焦网络爬行。面向对象也是如此。我计划在未来进入这个目标。
这些是我的想法。
答案 2 :(得分:0)
如果你需要使用文本,Perl在这方面也非常好,也很快。 Perl有一个非常现代和干净的OOP系统叫做Moose。
答案 3 :(得分:0)
SQL - 结构化查询语言。
为了记录,我没有看到任何地方写的“编程语言”。
至于真正的工程师的黑客和Java的Python,让我说使用Java的工程师倾向于做一些大的混乱,从纠正这些工程师的经验说。
Python更加现代化,如果你足够了解它,可以通过很多方法使代码具有高性能,同时保持其简洁明了。
不,我不喜欢,也不使用Python。实际上,我比Java更精通Java ......