在InDesign中,我将文本从xml文件中拉出并将其放在textFrame中。由于textFrame不支持某些标记,因此我必须在textFrame中替换粗体,斜体和boldItalic标记,并以编程方式应用格式。我最初使用Adobe的GREP搜索/替换进行此操作,但如果标记位于另一个标记内,则它无法正常工作(例如,&#39; <b>a<i>b</i>c</b>
&#39;)。所以我决定使用蛮力并通过标签分割字符串,然后遍历每个项目。我提出的代码是有效的,但我很好奇是否有更好,更有效的方法来做到这一点?
目前,它存储字体和文本位置以添加该字体。标签也被移除。
注意:有一种单独的字体可以将文本设置为粗体和斜体。如果我对<bi>
标签造成任何混淆,我表示歉意。它本来是一个需要粗体和斜体的角色的标签。 <b><i>text</i></b>
可能是更好的解决方案。无论如何,它绝对需要作为适当角色的单独样式。
var TAGSOBJ = {'<b>': 'Arial\tBold',
'<i>': 'Arial\tItalic',
'<bi>': 'Arial\tBold Italic',
'</b>': 'Arial\tBold',
'</i>': 'Arial\tItalic',
'</bi>': 'Arial\tBold Italic'};
var BGNTAGSOBJ = {'<b>': null, '<i>': null, '<bi>': null};
var ENDTAGSOBJ = {'</b>': null, '</i>': null, '</bi>': null};
var txt = 'This is some <b>really important <i>text</i></b> with <i>some <b>very <bi>very <br> very</bi> important</b> things</i> in it.';
var n = 0;
var prevTag = '';
var noTagTxt = '';
var dataArray = [['none']];
var txtArray = txt.split(/(<\/?(?:b|i|bi)>)/);
for (var i = 0; i < txtArray.length; i++) {
var iTxt = txtArray[i];
if (iTxt in BGNTAGSOBJ) {
dataArray.push([TAGSOBJ[iTxt]]);
prevTag = iTxt;
} else if (iTxt in ENDTAGSOBJ) {
if (prevTag in ENDTAGSOBJ) {
dataArray[dataArray.length - 1][0] = TAGSOBJ[iTxt];
}
dataArray.push(['none']);
prevTag = iTxt;
} else if (iTxt.length > 0) {
var iTxtLen = iTxt.length;
dataArray[dataArray.length - 1].push([n, n + (iTxtLen - 1)]);
noTagTxt += iTxt;
n += iTxtLen;
} else {
dataArray[dataArray.length - 1][0] = 'none';
}
}
for (var i = 0; i < dataArray.length; i++) {
$.writeln(dataArray[i]); // print to console in extendscript
}
$.writeln(noTagTxt);
/* Outputs to console in extendscript:
none,0,12
Arial Bold,13,29
Arial Italic,30,33
Arial Bold
none,34,39
Arial Italic,40,44
Arial Bold,45,49
Arial Bold Italic,50,63
Arial Bold,64,73
Arial Italic,74,80
none,81,87
This is some really important text with some very very <br> very important things in it.
Result: undefined
*/
答案 0 :(得分:0)
我正在等待<bi>
标签的解释,但与此同时,这里有一些代码可以删除标签并收集您需要的信息。我也不是100%清楚字体的东西。 TAGSOBJ中的值是实际应用格式化所需的值吗?
var
content = 'This is some <b>really important <i>text</i></b> with <i>some <b>very very <br>very important</b> things</i> in it.',
tagPattern = /<\/?(i|b)\b[^>]*>/ig,
stack = [],
tags = [],
offset = 0,
match,
tag;
while (match = tagPattern.exec(content)) {
if (match[0].substr(1, 1) !== '/') {
stack.push(match.index - offset);
} else {
tags.push({
tag: match[1],
from: stack.splice(-1, 1)[0],
to: match.index - offset
});
}
offset += match[0].length;
}
content = content.replace(tagPattern, '');
// now use tags array and perform needed actions.
这是a fiddle demonstrating this。
最后,对于它的价值,我不认为在javascript中使用大写标识符是标准做法。