应用错误收集

我找到了一个角落案例，其中处理藏语的Unicode系统存在根本缺陷。我不想提交票证，而是想了解Unicode的工作原理，看看我是否可以自己制定解决方案。我认为尝试找到问题的解决方案并提交问题会更好，而不仅仅指出一个缺陷并要求修复它。

我正在阅读我在官方网页和ICU网页上找到的文档。我读的越多，问题就越多。

对我来说最紧迫的问题是，我可以找到处理如何将多个字符渲染为单个字形的逻辑。

例如：字符U + 0f62呈现为ར（ra），但当与字符U + 0f99（子连接的nya）结合时，它变为རྙ。这实际上是规则的一个例外，因为如果与任何其他有效字符结合，例如U +0f97ཇ（子连接ja），ra字符会将字形更改为རྗ。
用于渲染字符的字体可能有点小，但您可以增加浏览器的字体大小以获得更好的外观。基本上，当nya字符与其相连时，第一种情况使ra字符几乎与其常见形式相同。在大多数情况下，当另一个角色加入其中时，ra字符会变成'T'形状。

我想知道这个逻辑在哪里实现，所以我可以开始攻击它并自学这项技术。

书籍和文章的任何其他建议也非常感谢。

编辑：我已经能够进行更多测试并阅读Unicode规范。我的首次声明是无效的，因为Unicode确实考虑了西藏的梵文音译。即使是高度复杂的字形。似乎我正在寻找的逻辑嵌入到字体中。感谢所有帮助我寻找知识的人。

处理Unicode的逻辑在哪里实现？

0 个答案: