伪造者从哪里获得伪造数据?

时间:2019-01-14 06:42:36

标签: python faker

我需要能够说服我的雇主,并确保我使用faker模块生成的数据永远不会是某些真实人的可识别个人身份的信息

所以,我真正的问题是: faker从哪里获得姓名,电子邮件地址,雇主姓名等?它们的来源是什么?谢谢。

2 个答案:

答案 0 :(得分:2)

更具体地说,所有静态数据都存在于其仓库中:https://github.com/stympy/faker/tree/38f04369bfa11e17cc34f13de3468b6ace371820/lib/locales/en

例如,name.yml包含用于创建新名称的名字,中间名和姓氏:

https://github.com/stympy/faker/blob/38f04369bfa11e17cc34f13de3468b6ace371820/lib/locales/en/name.yml

答案 1 :(得分:1)

如有疑问,您可以随时查看source code

基本上,Faker拥有名字和姓氏之类的表,并使用随机函数将它们组合在一起。这些表的源代码也在源代码中列出。在上面链接的示例中,数据来自指定区域的通用名称的维基百科列表。

从条目列表中检索数据的code看起来像这样:

  def name(self):
        """
        :example 'John Doe'
        """
        pattern = self.random_element(self.formats)
        return self.generator.parse(pattern)

    def first_name(self):
        return self.random_element(self.first_names)

    def last_name(self):
return self.random_element(self.last_names)