一组文本文件之间的文档相似性

时间:2019-02-05 10:32:05

标签: python

我需要执行以下算法:

  1. 读取一组文本文件

  2. 在文件中搜索单词

  3. 打印一个二进制矩阵,如果单词存在,则该矩阵为1,如果单词不存在,则为0。
  4. 问题在于阅读文本文件

代码:

import os 
fileList = os.listdir('C:\Users\user\Desktop\Documents') 
for eachFile in fileList: 
    with open(eachFile, 'rb') as _fp:
        fileData = _fp.read()
        print("FILE DATA (%s):\n\n%s\n\n"%(_fp.name, fileData) 

0 个答案:

没有答案