我想在R内存中加载我下载的文本文件中的数据。 zip文件与rStudio项目的文件夹相同,它有两个子级别,其中有三个我感兴趣的文件,位于temp.zip/final/en_US
。
我经历了zip function documentation和this辉煌的帖子,发财了。
请在这里找到我的最后一次尝试。
temp <- tempfile()
download.file("https://d396qusza40orc.cloudfront.net/dsscapstone/dataset/Coursera-SwiftKey.zip", temp)
temp.zip
文件有10个子文件夹。
[1] "./final/de_DE/de_DE.twitter.txt" "./final/de_DE/de_DE.blogs.txt"
[3] "./final/de_DE/de_DE.news.txt" "./final/ru_RU/ru_RU.blogs.txt"
[5] "./final/ru_RU/ru_RU.news.txt" "./final/ru_RU/ru_RU.twitter.txt"
[7] "./final/en_US/en_US.twitter.txt" "./final/en_US/en_US.news.txt"
[9] "./final/en_US/en_US.blogs.txt" "./final/fi_FI/fi_FI.news.txt"
[11] "./final/fi_FI/fi_FI.blogs.txt" "./final/fi_FI/fi_FI.twitter.txt"
由于temp.zip
非常大,我想打开连接或仅从第7,第8和第9个元素中提取数据,而不解压缩/加载整个temp.zip
。