我开发了一个代码来读取所有特定文件并保存为numpy格式,例如
[[1 2]
[3 4]
[5 6]]
但是在我的代码中,numpy数组返回空,有人可以帮我解决吗?感谢。
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import GaussianNB
import numpy as np
list1=np.array([])
for x in range(101563,103807):
try:
x=str(x)
X=open("auto"+x)
count_vect = CountVectorizer()
X_train_counts = count_vect.fit_transform(X)
X=X_train_counts.shape
X=np.array([[X[0],X[1]]])
list1=np.append(list1,X, axis=0)
except:
y=x
答案 0 :(得分:0)
最好在列表中累积值:
alist = []
for ... in range:
....
alist.append(new_array)
arr = np.array(alist)
您已在X=np.array([[X[0],X[1]]])
行中执行此操作 - 为array
提供了一系列列表。
np.append
很难正确使用。 np.array([])
不是正确的起点。它很慢,因为它每次都在构建一个新阵列。在正面你使用的是axis参数,并没有尝试在线使用它。
请使用开放式try/except
。它隐藏了编码错误。您可能会得到原始的list1
,因为append
会抛出错误,并且循环中没有任何内容被执行。