我想用正则表达式生成随机数据集。
因此我有一个像[a-z] {10}这样的表达式。 我想生成200,000个数据 - 可能更多(它应该是通用的),每个数据都应该是唯一的。
我该如何实现? 目前我有一个生成随机字符串的算法,然后在存储值的数组中搜索,如果字符串已经在那里,则重复该过程。否则它将字符串存储在数组中。
但是当我有200,000个可能的数据并且我想要200,000个不同的数据时,需要很长时间 1)每次迭代搜索整个数组... 2)需要大量的迭代,因为“击中”的可能性较小
答案 0 :(得分:1)
听起来,每次要存储值时,您都在搜索整个数组。您是否考虑过将Hash Table与键/值对一起使用?
答案 1 :(得分:1)
听起来你真正需要的是一种生成200.000个[a-z]{10}
唯一字符串的方法,然后是shuffle。