将非结构化数据(每行)放入新列中

时间:2017-07-01 21:21:05

标签: html r statistics

我在data.frame列中有以下非结构化数据:

<a href="https://bitcoin.org/" target="_blank">Website</a>
<a href="https://www.bitcoin.com/" target="_blank">Website 2</a>
<a href="http://blockchain.info" target="_blank">Explorer</a>
<a href="https://blockexplorer.com/" target="_blank">Explorer 2</a>

<a href="https://bitcointalk.org" target="_blank">Message Board</a>
<a href="https://forum.bitcoin.com/" target="_blank">Message Board 2</a>


<small><span class="label label-success"> Rank 1</span></small>
<small><span class="label label-warning">Mineable</span></small>
<small><span class="label label-warning">Currency</span></small>

我的目标是为每一行创建一个新列。

有任何建议如何做到这一点?我目前对此问题一无所知。

1 个答案:

答案 0 :(得分:1)

您只需将文本复制并粘贴到.txt文件中即可。

然后致电:

library(tidyverse)
a <- readLines("test.txt") %>%
  # Convert to df
  as.data.frame(stringsAsFactors = FALSE) %>%
  # Filter empty rows
  filter(nchar(.) != 0)

科林