使用java连接不同语言的连字符

时间:2015-12-08 07:35:26

标签: java internationalization hyphenation

问题:给定一个字符串(可以使用不同的语言),我们必须将其连字。

我尝试了什么hypenator-j但这似乎只适用于英语,我不知道如何连字符其他语言,找不到不同语言的免费tex文件

我们有什么选择来解决java中不同语言的连字符?

2 个答案:

答案 0 :(得分:3)

hyphenator-j或分叉variant的实现可以使用原始的.tex连字表。

可以找到这些表

  • 在本地计算机上,如果您已安装了MiKTeX等TeX环境。在这种情况下,可以在.tex
  • 中找到\tex\generic\hyphen连字表
  • 在TeX用户组的网页和相应的SVN上:here

获得感兴趣的.tex后,您可以使用hyphenator-j提供的API加载它们。

答案 1 :(得分:2)

如果有足够的时间和意志力,你可以根据这篇论文自己实现连字符,例如http://www.tug.org/docs/liang/。 自己实现连字不是一件容易的事,因此您可能希望选择其他解决方案。

Hyphenator.js

是的,这是一个javascript项目。但是可以从java调用javascript函数。您可以在此处找到有关此内容的更多信息:http://docs.oracle.com/javase/6/docs/technotes/guides/scripting/programmer_guide/index.html

这提供了对各种语言的支持。

Scrape dictionaries

许多词典提供连字规则。你可以在网上找到这些,但它会涉及一些搜索。接下来你可以为连字符规则抓取这些,但这可能比从Java调用javascript更加丑陋。

无论哪种方式,连字都不是一个容易的问题,自己实现它似乎是一个非常烦人的任务,所以也许javascript项目是你最好的选择。或者,您可以基于hyphenator.js实现自己的Java实现。至少你不会从头开始。