从句子或单词中提取阿拉伯语字母

时间:2011-02-10 11:03:58

标签: vb.net vb6 arabic find-occurrences

我正在使用vb6开发一个小程序,它将使用阿拉伯文档,我想计算每个阿拉伯字母出现在文档中的次数

基本的阿拉伯字符

أإآ.............................................................................................................................................................................................................................................................................................................................................................................................................................

例句

البيتالكسزاللتيلالزجاجالست。

我不懂阿拉伯语,甚至不知道如何阅读。

如果vb6不起作用,我可以使用vb.net

2 个答案:

答案 0 :(得分:2)

使用VB.Net会容易得多。

  • VB6对Unicode有patchy支持。
  • 在VB6中,您需要probably need将您的PC系统代码页更改为阿拉伯语才能阅读该文档。

编辑:VB.Net中的航空代码解决方案,部分基于this answer。它需要异常处理。

''# You may need a different character encoding here, this is UTF-8
Using sr As New IO.StreamReader("Test.txt", Text.Encoding.UTF8)
  Dim c As Char
  Dim dict As New Dictionary(Of String, Integer)

  Do Until sr.EndOfStream
   c = ChrW(sr.Read)

   If (dict.ContainsKey(c))
     dict(c)+=1
   Else
     dict(c) = 1
   End If
  Loop
End Using

答案 1 :(得分:1)

最简单的方法是与所有阿拉伯字符的数组进行比较。 http://en.wikipedia.org/wiki/Arabic_alphabet