用于HTML属性的Jawi脚本化马来语的语言代码是什么?

时间:2018-04-20 08:28:01

标签: html lang

一般信息

Jawi这里不是指Djawi language,而是指马来语的Jawi script

Jawi是马来语的编写脚本的旧标准,它基于阿拉伯语,在标准被基于拉丁语的Rumi脚本替换之前。然而,Jawi仍然在马来西亚和文莱广泛使用。

在文莱,Jawi与Rumi(拉丁语)共同编写马来文本,并且所有公共道路名称和建筑名称招牌都必须用Jawi和Rumi编写。

在马来西亚,Jawi不再是官方剧本,但政府认可的所有中小学伊斯兰教育官方教科书完全用Jawi脚本化的马来语写成,另外一些私立幼儿园和大学也使用Jawi作为同一主题。 Jawi仍然在伊斯兰教育课上教授。伊斯兰教育的所有国家考试论文都用Jawi和Rumi编写,答案可以用脚本编写。除此之外,马来语主题本身的国家试卷也可以用Jawi脚本回答,即使这个问题只是在Rumi剧本中。

我的问题

我正在制作一个用Rumi和Jawi马来语(以及其他一些语言)编写的网站,点击“Bahasa Melayu(Rumi)”的人只会阅读Rumi脚本中的网站,而那些点击“بهاسملايو(جاوي)”只会阅读Jawi脚本中的网站,(点击“英文”的人只会阅读英文网站,而日文会“日本语”)。所有页面都是手写的,而不是使用任何机器翻译。

我打算在HTML语言属性中包含正确的语言标记,以便在线机器人(例如爬虫)不会在两个不同的脚本之间混淆,但我找不到Jawi脚本马来语的确切语言代码语言。我知道代码ms用于Malay,但它通常仅用于Rumi脚本化的马来语,并且机器人可能认为Jawi脚本页面实际上是用Rumi脚本编写的,如果我只使用通用{{ 1}}作为Jawi页面上的语言属性。

有些人建议将标签写为ms,这实际上是Kelantan-Pattani Malay dialect的代码,因为方言通常只用Jawi编写,但这会产生误导,因为我将编写我的网站标准马来语的Rumi和Jawi剧本(如马来西亚 - 文莱马来语中立),而不是吉兰丹 - 北大年马来方言。

有些人还建议将Rumi脚本马来语写为mfa(使用马来西亚国家代码参考)和Jawi脚本马来语ms-MY(使用文莱国家代码参考)但这仍然会误导,因为文莱使用Rumi和Jawi都不是单独使用Jawi。

注意:该网站也将使用Kedah Malay方言ms-BN编写,这是我的实际母语,将来也会在Jawi和Rumi中使用。但就目前而言,我关注的是标准的马来语。

马来人的样子

meo

参考文献中wiktionary字词的链接:airudarakeretanyahpepijatpengaturcaraan 如果有任何你不知道的事情,请自己搜索这个词,因为这个网站要求我有10个声誉才能链接8个以上的链接。

问题

这就是让我提出这个问题的原因,用于HTML属性的Jawi脚本化马来语的语言代码是什么?

1 个答案:

答案 0 :(得分:0)

在全面阅读和查找信息后,包括阅读HTML W3C Recommendations,我再次回答我的问题,因为它现在显然已经回答了。

区分Rumi脚本化的马来语(使用拉丁文字)和Jawi脚本化的马来语(使用自定义阿拉伯语脚本),同时仍然保留它供多个国家使用。我们可以在HTML中使用更完整版的IETF Language Code

Rumi脚本基于拉丁字母表,使用代码Latn,Jawi脚本基于阿拉伯字母表,使用ISO 15924下的代码Arab,这是标准的脚本代码,可用作为HTML语言代码的一部分。

如果我们需要区分基于国家/地区的特定区域设置,我们还可以将国家/地区的ISO 3166-1 alpha-2代码作为HTML语言代码的一部分附加。

这意味着HTML lang属性的语言代码可以这样写:

  • 马来语(一般) - ms
  • 马来语(Rumi剧本) - ms-Latn
  • 马来语(Jawi剧本) - ms-Arab
  • 马来西亚(普通) - ms-MY
  • 马来西亚(Rumi剧本) - ms-Latn-MY
  • 马来西亚(Jawi剧本) - ms-Arab-MY
  • 文莱(普通) - ms-BN
  • 文莱(Rumi剧本) - ms-Latn-BN
  • 文莱(Jawi剧本) - ms-Arab-BN

另外,对于方言吉打马来语和Pattani Malay,我们可以写如下:

  • Kedah Malay(普通) - meo(来自ISO 639-3
  • Kedah Malay(Rumi剧本) - meo-Latn
  • Kedah Malay(Jawi剧本) - meo-Arab
  • Kedah Malay用于马来西亚吉打(一般) - meo-MY
  • 马来西亚的吉打马来语(Rumi剧本) - meo-Latn-MY
  • 马来西亚的吉打马来语(Jawi剧本) - meo-Arab-MY
  • 泰国土星使用的吉打马来语(一般) - meo-TH
  • 泰国的吉打马来语(Rumi剧本) - meo-Latn-TH
  • 泰国的吉打马来语(Jawi剧本) - meo-Arab-TH

  • Pattani Malay(普通) - mfa(来自ISO 639-3

  • Pattani Malay(Rumi剧本) - mfa-Latn
  • Pattani Malay(Jawi剧本) - mfa-Arab
  • Pattani Malay用于马来西亚吉兰丹(一般) - mfa-MY
  • 马来西亚的Pattani Malay(Rumi剧本) - mfa-Latn-MY
  • 马来西亚的Pattani Malay(Jawi剧本) - mfa-Arab-MY
  • Pattani Malay,用于泰国北大年(普通) - mfa-TH
  • 泰国的Pattani Malay(Rumi剧本) - mfa-Latn-TH
  • 泰国的Pattani Malay(Jawi剧本) - mfa-Arab-TH