问题:给定一个字符串(可以使用不同的语言),我们必须将其连字。
我尝试了什么:hypenator-j但这似乎只适用于英语,我不知道如何连字符其他语言,找不到不同语言的免费tex文件
我们有什么选择来解决java中不同语言的连字符?
答案 0 :(得分:3)
hyphenator-j
或分叉variant的实现可以使用原始的.tex
连字表。
可以找到这些表
MiKTeX
等TeX环境。在这种情况下,可以在.tex
\tex\generic\hyphen
连字表
获得感兴趣的.tex
后,您可以使用hyphenator-j
提供的API加载它们。
答案 1 :(得分:2)
如果有足够的时间和意志力,你可以根据这篇论文自己实现连字符,例如http://www.tug.org/docs/liang/。 自己实现连字不是一件容易的事,因此您可能希望选择其他解决方案。
是的,这是一个javascript项目。但是可以从java调用javascript函数。您可以在此处找到有关此内容的更多信息:http://docs.oracle.com/javase/6/docs/technotes/guides/scripting/programmer_guide/index.html。
这提供了对各种语言的支持。
许多词典提供连字规则。你可以在网上找到这些,但它会涉及一些搜索。接下来你可以为连字符规则抓取这些,但这可能比从Java调用javascript更加丑陋。
无论哪种方式,连字都不是一个容易的问题,自己实现它似乎是一个非常烦人的任务,所以也许javascript项目是你最好的选择。或者,您可以基于hyphenator.js实现自己的Java实现。至少你不会从头开始。