我找到了一个角落案例,其中处理藏语的Unicode系统存在根本缺陷。我不想提交票证,而是想了解Unicode的工作原理,看看我是否可以自己制定解决方案。我认为尝试找到问题的解决方案并提交问题会更好,而不仅仅指出一个缺陷并要求修复它。
我正在阅读我在官方网页和ICU网页上找到的文档。我读的越多,问题就越多。
对我来说最紧迫的问题是,我可以找到处理如何将多个字符渲染为单个字形的逻辑。
例如:字符U + 0f62呈现为ར(ra),但当与字符U + 0f99(子连接的nya)结合时,它变为རྙ。这实际上是规则的一个例外,因为如果与任何其他有效字符结合,例如U +0f97ཇ(子连接ja),ra字符会将字形更改为རྗ。
用于渲染字符的字体可能有点小,但您可以增加浏览器的字体大小以获得更好的外观。基本上,当nya字符与其相连时,第一种情况使ra字符几乎与其常见形式相同。在大多数情况下,当另一个角色加入其中时,ra字符会变成'T'形状。
我想知道这个逻辑在哪里实现,所以我可以开始攻击它并自学这项技术。
书籍和文章的任何其他建议也非常感谢。
编辑:我已经能够进行更多测试并阅读Unicode规范。我的首次声明是无效的,因为Unicode确实考虑了西藏的梵文音译。即使是高度复杂的字形。似乎我正在寻找的逻辑嵌入到字体中。感谢所有帮助我寻找知识的人。