我已经下载了很多带有不同哈希值的Android APK,在进行了逆向工程后,我发现很多APK的API调用完全相同,在Android Level 17中的145个调用中。(就个人而言,我认为两个不同的样本几乎没有机会进行相同的API调用)
我使用机器学习方法对APK样本进行分类,但我不知道如何处理上面提到的“duplicates”。
我应该将这些APK视为不同的样本吗?或删除“重复”,然后进行分类?使用“重复”,结果会更好。
在Android或Cybersecurity领域是否有“重复”Android APK示例的定义? 不同的哈希值是否意味着不同的样本?
非常感谢你的帮助!