Jawi这里不是指Djawi language,而是指马来语的Jawi script。
Jawi是马来语的编写脚本的旧标准,它基于阿拉伯语,在标准被基于拉丁语的Rumi脚本替换之前。然而,Jawi仍然在马来西亚和文莱广泛使用。
在文莱,Jawi与Rumi(拉丁语)共同编写马来文本,并且所有公共道路名称和建筑名称招牌都必须用Jawi和Rumi编写。
在马来西亚,Jawi不再是官方剧本,但政府认可的所有中小学伊斯兰教育官方教科书完全用Jawi脚本化的马来语写成,另外一些私立幼儿园和大学也使用Jawi作为同一主题。 Jawi仍然在伊斯兰教育课上教授。伊斯兰教育的所有国家考试论文都用Jawi和Rumi编写,答案可以用脚本编写。除此之外,马来语主题本身的国家试卷也可以用Jawi脚本回答,即使这个问题只是在Rumi剧本中。
我正在制作一个用Rumi和Jawi马来语(以及其他一些语言)编写的网站,点击“Bahasa Melayu(Rumi)”的人只会阅读Rumi脚本中的网站,而那些点击“بهاسملايو(جاوي)”只会阅读Jawi脚本中的网站,(点击“英文”的人只会阅读英文网站,而日文会“日本语”)。所有页面都是手写的,而不是使用任何机器翻译。
我打算在HTML语言属性中包含正确的语言标记,以便在线机器人(例如爬虫)不会在两个不同的脚本之间混淆,但我找不到Jawi脚本马来语的确切语言代码语言。我知道代码ms
用于Malay,但它通常仅用于Rumi脚本化的马来语,并且机器人可能认为Jawi脚本页面实际上是用Rumi脚本编写的,如果我只使用通用{{ 1}}作为Jawi页面上的语言属性。
有些人建议将标签写为ms
,这实际上是Kelantan-Pattani Malay dialect的代码,因为方言通常只用Jawi编写,但这会产生误导,因为我将编写我的网站标准马来语的Rumi和Jawi剧本(如马来西亚 - 文莱马来语中立),而不是吉兰丹 - 北大年马来方言。
有些人还建议将Rumi脚本马来语写为mfa
(使用马来西亚国家代码参考)和Jawi脚本马来语ms-MY
(使用文莱国家代码参考)但这仍然会误导,因为文莱使用Rumi和Jawi都不是单独使用Jawi。
注意:该网站也将使用Kedah Malay方言ms-BN
编写,这是我的实际母语,将来也会在Jawi和Rumi中使用。但就目前而言,我关注的是标准的马来语。
meo
参考文献中wiktionary字词的链接:air,udara,kereta,nyahpepijat,pengaturcaraan 如果有任何你不知道的事情,请自己搜索这个词,因为这个网站要求我有10个声誉才能链接8个以上的链接。
这就是让我提出这个问题的原因,用于HTML属性的Jawi脚本化马来语的语言代码是什么?
答案 0 :(得分:0)
在全面阅读和查找信息后,包括阅读HTML W3C Recommendations,我再次回答我的问题,因为它现在显然已经回答了。
区分Rumi脚本化的马来语(使用拉丁文字)和Jawi脚本化的马来语(使用自定义阿拉伯语脚本),同时仍然保留它供多个国家使用。我们可以在HTML中使用更完整版的IETF Language Code。
Rumi脚本基于拉丁字母表,使用代码Latn
,Jawi脚本基于阿拉伯字母表,使用ISO 15924下的代码Arab
,这是标准的脚本代码,可用作为HTML语言代码的一部分。
如果我们需要区分基于国家/地区的特定区域设置,我们还可以将国家/地区的ISO 3166-1 alpha-2代码作为HTML语言代码的一部分附加。
这意味着HTML lang
属性的语言代码可以这样写:
ms
ms-Latn
ms-Arab
ms-MY
ms-Latn-MY
ms-Arab-MY
ms-BN
ms-Latn-BN
ms-Arab-BN
另外,对于方言吉打马来语和Pattani Malay,我们可以写如下:
meo
(来自ISO 639-3)meo-Latn
meo-Arab
meo-MY
meo-Latn-MY
meo-Arab-MY
meo-TH
meo-Latn-TH
泰国的吉打马来语(Jawi剧本) - meo-Arab-TH
Pattani Malay(普通) - mfa
(来自ISO 639-3)
mfa-Latn
mfa-Arab
mfa-MY
mfa-Latn-MY
mfa-Arab-MY
mfa-TH
mfa-Latn-TH
mfa-Arab-TH