Python中的文本关联

时间:2018-06-07 20:57:28

标签: python

我正在分析一项有“是”或“否”问题的调查。我想找到问题和答案之间最强的相关性。例如,如果某人对问题1回答“是”,那么他们对问题2也会回答“是”的相关性是什么?是否可以像将每个答案分配给数值(0 + 1)一样简单?我希望我说得够清楚。

谢谢!

1 个答案:

答案 0 :(得分:0)

如果你想计算概率,我认为你有一群体面的人参加了调查。您可以使用此数据和简单的条件概率公式来获取您寻找的信息。

假设P(A)>我们知道P(B | A)= P(A ^ B)/ P(A)

也就是说,给定A的B的概率等于A和B的概率超过A的概率。如果10%的调查者对问题1和问题2(A ^ B)回答为是,则50%的调查者对问题1(A)回答“是”,然后是随机的人对问题2回答“是”的概率,因为他们对问题1 = .1 / .5 = .2或20%回答“是”。这一切都假设您确切地知道在问题1中回答“是”的比例是多少,以及在问题1和问题2中,有多少人回答“是”。