如何使用genderize包for python与大数据集?

时间:2016-06-28 23:27:01

标签: python api packages

我使用genderize package for python来推断姓名的性别。我有一个超过7千个名字的csv文件。在我的代码中,csv文件被传递到genderize函数。我希望函数返回文件中所有名称的性别,但是,它只返回csv文件中前10个名称的性别。无论如何通过调用函数一次来推断文件中的名称性别?这是我的代码:

from genderize import Genderize
import csv
with open('.csv', 'rb') as f:
    reader = csv.reader(f)
    your_list = list(reader)
print(Genderize().get(your_list))

2 个答案:

答案 0 :(得分:1)

API限制为每个请求最多10个名称。拆分列表并进行多次通话。并阅读手册:https://genderize.io/

答案 1 :(得分:0)

您也可以尝试https://gender-api.com。 Gender API允许您直接上传CSV和Excel文件,并下载丰富的性别文件。

https://gender-api.com/en/frequently-asked-questions/i-have-a-huge-amount-of-data-can-i-bulk-upload-a-csv-file

要上传CSV文件,请点击“我的帐户”,然后选择“ CSV上传”。根据文件的大小,可以在几分钟之内从Gender API下载丰富的文件。

Gender API CSV Upload

您还可以使用简单的实现API来将名称性别化:

https://gender-api.com/get?name=elizabeth&key=yourkey

{"name":"elizabeth", "gender":"female", "samples":355, "accuracy":100, "duration":"34ms"}

编码示例可以在这里找到: https://gender-api.com/en/clients