我是python的新手并且需要帮助。 我有一个文件夹中的txt文件列表(大约600个文件),并希望打印所有单词列表 下面是我的代码,但它不起作用。
import string
import re
import nltk
import pandas as pd
import os
from sklearn.cluster import KMeans
from sklearn import cluster, datasets
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.feature_extraction.text import CountVectorizer
from wordcloud import WordCloud
from wordcloud import WordCloud, STOPWORDS
import numpy as np
import matplotlib.pyplot as plt
from nltk.corpus import wordnet
from collections import defaultdict
FILE_PATH = "C:\Users\hp\Desktop\me"
def load_words():
#Returns a list
print("Loading word list from file...")
for filename in os.listdir(FILE_PATH):
wordlist = []
print(" ", len(wordlist), "words loaded.")
output: (' ', 0, 'words loaded.')
答案 0 :(得分:0)
使用pandas或csv读取文件并将其打印出来。
import glob
import pandas as pd
file_dir = 'D:/test/'
file_mask = "*.txt"
all_files = glob.glob(file_dir + file_mask)
file_list =[]
for files in all_files:
df=pd.read_csv(files,index_col = None,)
file_list.append(df)
df = pd.concat(file_list)
print(df)
专栏:[这里有更多的话,有一些话] 指数:[]
答案 1 :(得分:0)
这是一个有趣的问题!我只是尝试了一些事情并让它发挥作用。
import glob
path = 'C:/Users/Excel/Desktop/test/*.txt'
files=glob.glob(path)
for file in files:
f=open(file, 'r')
print('%s' % f.readlines())
f.close()