这是我的字符串,我想从这里删除所有情感字符串/字符,搜索一段时间但没有运气,我根本不擅长正则表达式。
我试过:((> |< | q)?[=:8;] {1}(')?( - )?[><)(/ cdopsx:^ ] )但只设法删除了几个 情感特征::),:(,:D,(酷),:o,:,:P,:$,:^),, | - ),| - (,(inlove) ]:)(yn)(打哈欠) (呕吐)(doh) (生气)(wasntme)(派对) (担心)(mm)(书呆子):x(波) (facepalm)(devi l)(天使) (嫉妒)(等)(拥抱)(化妆)(轻笑)(鼓掌)
:) how :( fgdfg :D ghjgh
(cool) dfgdf :o dfd :* dsfdf
:P dsf :$ dfv :^) dfgd g |-)
dfg |-( dfgd g (inlove) dfd
]:) d f s (yn) dsf (yawn) fg
(puke) fggf (doh ) fgg
(angry) (wasntme) (party)
(worry) (mm) (nerd) :x (wave)
(facepalm) (devi l) (angel)
(envy) (wait) (hug) (makeup) (chuckle) (clap)
http://rubular.com/r/PGgnlYRrhQ 1
任何帮助将不胜感激。
答案 0 :(得分:1)
我认为正则表达式不是这里的方式。你可能应该在空格和字典或“情感字符”列表上做一个string.split。然后你翻阅每个单词并删除不好的单词。然后你再把琴弦放回原处。或者你使用一大堆或正则表达式替换\ b作为单词边界的开头并替换每个单独的术语。