最近我在面试中被要求设计一种算法,将左对齐的输入字符串(每行末尾有空格)转换为Justify(在完整行的末尾没有空格),类似在MS Word中。 我向他提出了一些基本的解决方案,包括计算每行的单词数和空格数,然后在所有空间中平均分配它们(他让我假设小数空间可以在单词之间分配)。但后来他让我考虑整个段落然后修改文本,这样当文字之间的空格分配不均是不可避免时,文本的美感就不会丢失。
那时我无法想到任何适当的解决方案。后来他告诉我这是由动态编程完成的。 我不确定是否已经有一些标准算法。如果是,请分享一些有用的链接。
PS:我提出的解决方案是非常抽象的想法,因此我没有任何代码来展示我已经尝试过的所有内容。 理由:http://en.wikipedia.org/wiki/Justification_(typesetting)
答案 0 :(得分:4)
用于将段落分成行的标准算法可能仍然是Knuth& amp;的算法。 Plass,由Knuth的排版系统TeX
使用。 '通过明智地使用动态编程技术来避免回溯'的算法在
Donald E. Knuth和Michael F. Plass, Software - Practice and Experience 11(1981)1119-1184 DOI: 10.1002/spe.4380111102, 也可以在 Digital Typography ,Ch。 3,pp.67-155。
该算法基于考虑每个可能的换行符,开始 从该段的开头,并为每一个发现 前面换行的顺序给出了最好的结果 那么远。由于整个序列由最后一个换行符决定 在序列中,只有当前的潜在起点 当一个新的潜在断点时,必须考虑这条线 添加,导致有效的算法。
算法的简化版本(不带例如连字符)可以 这样描述:
Add start of paragraph to list of active breakpoints
For each possible breakpoint (space) B_n, starting from the beginning:
For each breakpoint in active list as B_a:
If B_a is too far away from B_n:
Delete B_a from active list
else
Calculate badness of line from B_a to B_n
Add B_n to active list
If using B_a minimizes cumulative badness from start to B_n:
Record B_a and cumulative badness as best path to B_n
The result is a linked list of breakpoints to use.
The badness of lines under consideration can be calculated like this:
Each space is assigned a nominal width, a strechability, and a shrinkability.
The badness is then calculated as the ratio of stretching or shrinking used,
relative to what is allowed, raised e.g. to the third power (in order to
ensure that several slightly bad lines are prefered over one really bad one)
可以在http://defoe.sourceforge.net/folio/knuth-plass.html
找到说明性描述网上提供各种语言的实现,例如 Bram Stein在Javascript中的实现:http://www.bramstein.com/projects/typeset/
答案 1 :(得分:0)
我制作了太空插入器功能:)
但只需插入一个空格,直到线宽小于所需的宽度。
MATCH (p:Person)-[r:ACTED_IN]-(movie:Movie)
WHERE 'Joe Banks' in (r.roles)
RETURN p,movie,r.roles;
希望它有所帮助!
答案 2 :(得分:0)
答案 3 :(得分:0)