我想学习编码,字符和文字的基础。了解这些对于处理大量文本非常重要,无论是日志文件还是用于构建集体智慧算法的文本源。我目前的知识非常基础:“只要我使用UTF-8,我就没事。”
我不是说我需要马上学习高级主题。但我需要知道:
我还需要理解数学和语料库语言学。当前和未来的Web(语义,智能,实时Web)需要处理,解析和分析大文本。
我正在寻找一些资源(也许是书籍?)让我开始使用一些子弹。 (我在Stack Overflow上找到了很多关于正则表达式的有用讨论。所以,你不需要就该主题建议资源。)
答案 0 :(得分:3)
答案 1 :(得分:0)
对于大多数一般“我想学习X主题”的问题,维基百科是一个很好的起点: