处理具有多个数据分析值的pandas列

时间:2018-06-03 11:06:30

标签: python pandas data-science

我有一个带有'流派'的数据框。作为专栏。在此列中,每个条目都有多个值。例如,电影'哈利波特'在流派专栏中可能有幻想,冒险。在进行数据分析和探索时,我不知道如何用多个值来表示此列,以显示电影和/或流派之间的任何关系。

我曾想过使用图表分析来展示这种关系,但我想探讨一下我可以考虑的其他方法吗?

1 个答案:

答案 0 :(得分:3)

您可以按类型使用str.get_dummies作为新指标列:

    public String refreshApiToken() {
    AuthAPI auth = new AuthAPI(System.getenv(EnvVars.AUTH0_DOMAIN.name()), System.getenv(EnvVars.AUTH0_CLIENT_ID.name()), System.getenv(EnvVars.AUTH0_CLIENT_SECRET.name()));

    try {
        String apiToken = auth.requestToken(System.getenv(EnvVars.AUTH0_AUDIENCE.name())).execute().getAccessToken();

        // TODO: Get Cache from DB and store it again
        Cache cache = new Cache();
        cache.setApiToken(apiToken);

        if (apiToken != null)
            logger.log("Refreshed api token");
        else
            logger.warning("Api token is empty");

        return apiToken;
    } catch (Auth0Exception e) {
        logger.error(e.getMessage());
        e.printStackTrace();
    }

    return null;
}