使用特定的解析字符获取令牌数

时间:2018-06-27 12:06:36

标签: stata

请考虑以下玩具绳子:

  

我的名字是Pearly,我的名字是Spencer

Stata(是否包括mata)中是否有一种开箱即用的方式来根据用户指定的解析字符来获取令牌数量?在此特定示例中,两个令牌之间用逗号分隔。

诸如用于解析word count的宏扩展函数之类的解决方案使用空格 而且我想避免为此编写程序。

1 个答案:

答案 0 :(得分:2)

令牌数量是解析字符的数量加1。

就是这样,以逗号作为示例解析字符,

gen ntokens = 1 + strlen(strvar) - strlen(subinstr(strvar, ",", "", .))  

请参见https://www.stata-journal.com/sjpdf.html?articlenum=dm0056,以了解此简单技巧的内容。