性别检测算法如何运作?

时间:2016-07-18 22:39:08

标签: algorithm web scripting automation text-analysis

性别检测算法如何检测名称的性别。例如,在以下网站上:

  1. http://genderchecker.com/
  2. https://gender-api.com/
  3. https://genderize.io/
  4. http://www.genderguesser.com/
  5. 我对如何实现其API或数据感兴趣,但对算法的工作方式不感兴趣。他们如何根据文本字符串(名字)分析,计算,估计性别,而且他们如何确定该名称的来源国和他们的猜测概率?

2 个答案:

答案 0 :(得分:1)

我碰巧点击了你的一个链接,加载的第一件事是他们明确地说明算法...

  

要猜测名称的性别,我们会进行网络搜索。我们抬头看   查询如“先生[姓名]”,“夫人[姓名]”或“[姓名]和他的妻子”,   “[姓名]和她的丈夫”并比较决定的点击次数   该名称是男性还是女性名称。

其他我肯定是相似的。如果你有500,000名名叫Sam的人,250,000名是男性,250,000名是女性,那么Sam是男性的50%,Sam是女性的50%。

答案 1 :(得分:0)

实际上它很简单,因为他们有一个充满名字及其相关性别的数据库 - 我不认为有任何方法来计算任何给定名称的性别。如果您查看您提供的第一个链接,它会指出"数据库中当前的全局名称:102,142"。当您键入名称时,它实际上会检查您为其数据库输入的内容并为您提供结果。