标签: text-mining data-analysis data-cleaning
我有一组电子邮件,我需要匿名化才能对其进行任何分析。由于敏感数据可能会在电子邮件中披露,例如提及人,或提供电子邮件等。
到目前为止我找到的工具,只使用表格,并掩盖这个,这是我自己很直接,但它并没有解决我的问题。
所以我正在寻找一个可以帮助我解决这个问题的工具或库。我认为它需要做一些自然语言处理,以分析文本是如何建立的,以及提到人们的反馈。我还要感谢这个领域的任何好文章