我在data.frame列中有以下非结构化数据:
<a href="https://bitcoin.org/" target="_blank">Website</a>
<a href="https://www.bitcoin.com/" target="_blank">Website 2</a>
<a href="http://blockchain.info" target="_blank">Explorer</a>
<a href="https://blockexplorer.com/" target="_blank">Explorer 2</a>
<a href="https://bitcointalk.org" target="_blank">Message Board</a>
<a href="https://forum.bitcoin.com/" target="_blank">Message Board 2</a>
<small><span class="label label-success"> Rank 1</span></small>
<small><span class="label label-warning">Mineable</span></small>
<small><span class="label label-warning">Currency</span></small>
我的目标是为每一行创建一个新列。
有任何建议如何做到这一点?我目前对此问题一无所知。
答案 0 :(得分:1)
您只需将文本复制并粘贴到.txt文件中即可。
然后致电:
library(tidyverse)
a <- readLines("test.txt") %>%
# Convert to df
as.data.frame(stringsAsFactors = FALSE) %>%
# Filter empty rows
filter(nchar(.) != 0)
科林