标签: r encoding character-encoding id
我目前正在用R编写一个函数,该函数创建的ID越短越好,因为我处理的数据非常大(几百万个案例),并且这些ID不需要太长,这会占用很大的空间。我正在使用包combinations中的函数arrangements,为此,我想使用尽可能多的唯一字符。当然,letters,LETTERS和0:9,但我也想使用其他一些字符。是否有任何字符对此有问题?例如用于编码还是因为它们是特殊字母?我只会使用!,§,$,%,&,/,(,)或=之类的“常用”字符。
combinations
arrangements
letters
LETTERS
0:9