Question

我开发了一个代码来读取所有特定文件并保存为numpy格式，例如

     [[1 2]
      [3 4]
      [5 6]]

但是在我的代码中，numpy数组返回空，有人可以帮我解决吗？感谢。

from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import GaussianNB
import numpy as np
list1=np.array([])
for x in range(101563,103807):
try:
    x=str(x)
    X=open("auto"+x)
    count_vect = CountVectorizer()
    X_train_counts = count_vect.fit_transform(X)
    X=X_train_counts.shape
    X=np.array([[X[0],X[1]]])
    list1=np.append(list1,X, axis=0)
except:
    y=x

Answer 1

最好在列表中累积值：

alist = []
for ... in range:
   ....
   alist.append(new_array)
arr = np.array(alist)

您已在X=np.array([[X[0],X[1]]])行中执行此操作 - 为array提供了一系列列表。

np.append很难正确使用。 np.array([])不是正确的起点。它很慢，因为它每次都在构建一个新阵列。在正面你使用的是axis参数，并没有尝试在线使用它。

请使用开放式try/except。它隐藏了编码错误。您可能会得到原始的list1，因为append会抛出错误，并且循环中没有任何内容被执行。

Python追加/连接numpy数组

1 个答案: