在数据帧的每一行上应用函数并返回一个数据帧

时间:2017-03-31 04:24:37

标签: r nlp

我想使用jiebar来分割一些中文句子,这些句子存储在数据框中。一种方法是将数据框转换为列表,然后使用apply_list。

library(jiebar)
mixseg = worker()
c <- apply_list(as.list(weibo$weibo), mixseg)

数据集:weibo $ weibo

[1] "诸丽娜Kitty 打卡第天运动只为更好的自己运动就是坚持快来加入打卡社区吧"                
[2] "今天的高尔夫球课高尔夫️教练可是全美排名前的教练哦\U0001f3cc AmericanNew Jersey Hudson"
[3] "鼓掌鼓掌第一次滑雪居然是在美国体验在雪上的激情与速度过瘾酷 Mount Peter"              
[4] "伪装幸福学着让自己更坚强  我正在使用假面女孩封面图好漂亮你们都快来试试封面图预览"    
[5] "抢到啦大家元宵节快乐顺心如意鲜花鲜花 AmericanNew York Queens"                        
[6] " Happy Chinese New Year 美国City of New York Central Park Conservancy"  

但是,如果我这样做,返回列表的大小是原始数据集的3倍。因此,我想使用ldply / laply将结果作为数据帧返回,但是我遇到了这个错误

b<- ldply(weibo2, segment(mixseg))
Error in match(x, table, nomatch = 0L) : 
  argument "jiebar" is missing, with no default

0 个答案:

没有答案