如何在Perl中处理俄语文本?

时间:2009-04-27 21:20:17

标签: perl utf-8

我不熟悉任何非英语的语言。到目前为止,我所做过的唯一编程就是输入基本的英文字母+数字并输出。现在我必须操纵俄语中的一些文本(特别是来自俄罗斯维基百科页面),但我不知道从哪里开始。我谷歌和谷歌,但我得到的结果是谈论unicode,UTF-8和其他东西,但那些对我没有意义,因为我不确定那些指的是什么。维基百科条目本身似乎是为已经了解这些内容的人编写的。

有人能指出我一个好的起点吗?

1 个答案:

答案 0 :(得分:7)

看起来你应该首先了解Unicode是什么。乔尔·斯波尔斯基的文章The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)可能是一个很好的起点(对于有经验的人来说,这是非常缺乏信息的。)

之后你应该看看Perl如何处理Unicode,比如看看Perl Unicode Tutorial