我是R的新手。我一直试图读取这样的CSV文件。
tweets <- read.csv("tweets.csv")
我需要能够删除所有标点,转换为小写,删除数字和&amp;停止言语和数据框中的空格&#39;推文&#39;无需将其转换为语料库或其他内容。没有什么可以直接删除它。是否有任何库/功能可以帮助解决这个问题?
答案 0 :(得分:0)
阅读csv的一部分是你已经定义的
tweets <- read.csv("tweets.csv")
然而,对于处理标点符号,除了使用语料库之外,其他方法的空白是使用正则表达式,但由于它不是通用的,所以应用程序有限
这就是为什么我们更喜欢语料库,因为它可以更容易地应用于不同的来源