我试图了解在使用Pandas读入时是否有办法将整个数据帧转换为浮点数,还是我需要创建一个在读入数据后执行此操作的函数?
我正在使用的数据是从Facebook广告帐户导出。我只读取包含数字的列,文件中唯一的字符串是标题。
import pandas as pd
import seaborn as sns
import numpy as np
from sklearn import preprocessing
from sklearn.manifold import TSNE
data = pd.read_csv("12776828-all-engage.csv", header=None, usecols=[4,6,7,8,11,14,15,16,17,18,19,20,21,22,23,25])
答案 0 :(得分:1)
您可以指定pd.read_csv
参数dtype=np.float64
(或np.float16
或np.float32
,如果数据适合),则可以指定。
但是,通常,熊猫可以推断出这一点。我注意到你提到文件中有标题。将header
参数保留为默认值infer
也应该导致将内容转换为数值数据类型。