如何打印文件夹中的所有单词?

时间:2018-05-23 09:42:52

标签: python python-2.7

我是python的新手并且需要帮助。 我有一个文件夹中的txt文件列表(大约600个文件),并希望打印所有单词列表 下面是我的代码,但它不起作用。

import string
import re
import nltk
import pandas as pd
import os
from sklearn.cluster import KMeans
from sklearn import cluster, datasets
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.feature_extraction.text import CountVectorizer
from wordcloud import WordCloud 
from wordcloud import WordCloud, STOPWORDS
import numpy as np
import matplotlib.pyplot as plt
from nltk.corpus import wordnet
from collections import defaultdict

FILE_PATH = "C:\Users\hp\Desktop\me"

def load_words():
#Returns a list 
print("Loading word list from file...")
for filename in os.listdir(FILE_PATH):
wordlist = []

print("  ", len(wordlist), "words loaded.")



output: ('  ', 0, 'words loaded.')

2 个答案:

答案 0 :(得分:0)

使用pandas或csv读取文件并将其打印出来。

import glob
import pandas as pd

file_dir = 'D:/test/'
file_mask = "*.txt"

all_files = glob.glob(file_dir + file_mask)
file_list =[]

for files in all_files:
    df=pd.read_csv(files,index_col = None,)
    file_list.append(df)
df = pd.concat(file_list)

print(df)
  

专栏:[这里有更多的话,有一些话]       指数:[]

答案 1 :(得分:0)

这是一个有趣的问题!我只是尝试了一些事情并让它发挥作用。

import glob   
path = 'C:/Users/Excel/Desktop/test/*.txt'   
files=glob.glob(path)   
for file in files:     
    f=open(file, 'r')  
    print('%s' % f.readlines())   
    f.close()