我正在尝试创建一个基于我所拥有的临床数据库的scikit-learn的Logistic回归模型,但是我得到了一个TypeError,而我似乎没有做任何修复。
我收到了这个错误:
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix
import numpy as np
import csv
target = []
data = []
with open('TABAK_SCORE_BINS.csv', 'r')as f:
提前感谢您的帮助!
reader = csv.reader(f, delimiter=',')
next(reader, None)
for line in reader:
if(line[1] == 'A'):
此文件包含一堆医疗记录。基本上他们' A'幸存下来,或者' E'死了,有很多不同的临床变量。
target.append(0)
if(line[1] == 'E'):
target.append(1)
行[1]包含' A'或者' E'告诉我们患者是否存活
data.append(line[55:])
data_arr = np.asarray(data)
行[55:]是我关心的所有变量,它们都是1或0
x_train, x_test, y_train, y_test = train_test_split(data, target, train_size=0.7, random_state=0)
log_reg = LogisticRegression()
log_reg.fit(x_train, y_train)
print(data_arr.shape)
print(data_arr.dtype)
拆分模型
for i in range(0, 10):
print(log_reg.predict(data_arr[i].reshape(1, -1)))
形状输出为(295359,105) 并且dtype是(小于符号)U1
当我尝试使用经过训练的模型进行预测时,所有代码都会编译完成。
function my_assets() {
wp_register_script( 'div-area-linker', get_stylesheet_directory_uri() . '/divlinker.js', array( 'jquery' ) );
wp_enqueue_script( 'div-area-linker' );