说我有姓名,地理和性别信息。我想创建名称和地理特征来预测一个人的性别。
名称功能如下:
2个字母,3个字母和4个字母的子字符串,即:Susan into' su',' us',' sa', ' a',' sus',' usa' ...
全名实体,即:Susan Hay进入' susan'和' hay'
总名称长度,即:Susan Hay进入' 8'
非ASCII字符,即:Susan Hay进入' 0'
元音与总长度的比例,即:苏珊·海伊进入' 3/8'
居住地点,即:Susan Hay进入'纽约,美国'
我想使用朴素贝叶斯分类器将功能1-6完全合并为一个功能集,但是我应该使用多项还是伯努利朴素贝叶斯?