我想使用jiebar来分割一些中文句子,这些句子存储在数据框中。一种方法是将数据框转换为列表,然后使用apply_list。
library(jiebar)
mixseg = worker()
c <- apply_list(as.list(weibo$weibo), mixseg)
数据集:weibo $ weibo
[1] "诸丽娜Kitty 打卡第天运动只为更好的自己运动就是坚持快来加入打卡社区吧"
[2] "今天的高尔夫球课高尔夫️教练可是全美排名前的教练哦\U0001f3cc AmericanNew Jersey Hudson"
[3] "鼓掌鼓掌第一次滑雪居然是在美国体验在雪上的激情与速度过瘾酷 Mount Peter"
[4] "伪装幸福学着让自己更坚强 我正在使用假面女孩封面图好漂亮你们都快来试试封面图预览"
[5] "抢到啦大家元宵节快乐顺心如意鲜花鲜花 AmericanNew York Queens"
[6] " Happy Chinese New Year 美国City of New York Central Park Conservancy"
但是,如果我这样做,返回列表的大小是原始数据集的3倍。因此,我想使用ldply / laply将结果作为数据帧返回,但是我遇到了这个错误
b<- ldply(weibo2, segment(mixseg))
Error in match(x, table, nomatch = 0L) :
argument "jiebar" is missing, with no default