到目前为止,我已经评估了几个众所周知的Java解析器,但是没有一个实际上是以某种方式免费用于商业用途。像OpenNLP一样免费,但使用的培训数据不能用于商业用途。 Morphadorner在那里,但似乎最后更新于2009年.Stanford NLP是完整的GPL,而LingPipe提供付费许可。
目前作为一家非资助创业公司,我真的不可能支付很高的许可费。我必须为我的要求实施一个基于规则的解析器,这是行业标准解决方案无法比拟的。
尽管如此,我并不是一个自由狂,而且我不需要世界上只有少数人使用的东西。我坚信,像NLP这样的东西越来越受欢迎,再次实施POS Tagger就像重新发明一个重新发明的轮子。对此真的没有行业标准的解决方案吗?
更新:心态似乎符合行业标准意味着付费的东西。那么为什么几个HTML解析器库(以及其他东西)免费提供。 Html解析器比NLP使用得多,但仍然需要相当大的NLP任务。
更新:问题已结束。我很快就会很高兴发布我的小型库,用于关键字提取,利用Wordnet和各种漂亮的规则。 谢谢 AB
答案 0 :(得分:4)
您已经找到了解决方案:
斯坦福NLP是完整的GPL ......
没有禁止将GPL用于商业项目。
问题在于,如果以二进制形式分发代码,您还必须提供源代码。这意味着您的业务模式需要基于向您的客户提供付费支持和/或服务(而不是销售软件许可证)......但是有许多公司基于类似的模型赚取了不错的收入。
这是另一个Q&关于这一主题的A与其他一些潜在的潜在客户:
这种心态似乎符合行业标准意味着付出的代价。那么为什么几个HTML解析器库(以及其他东西)免费提供。 Html解析器比NLP使用得多,但仍然需要相当大的NLP任务。
团队(或组织或公司)需要开发类似的东西来决定他们如何授权。似乎现有的NLP产品都不像啤酒那样“免费”。这是他们的选择。而你没有权利抱怨......鉴于你也选择不提供“啤酒免费”的申请。
正如我所指出的那样,斯坦福大学的NLP是“自由在自由中”。只是你不准备承担GPL的义务。
没有人欠你一个免费为你做事的责任。作为一名潜在的企业家,你不应该期待它。
(FWIW,啤酒中存在免费的HTML解析器以及许多其他东西的原因通常是问题比NLP更容易,或者有公司/组织在那里谁有捐赠大量资源来开发代码。)