在Python 3和Pandas中,我具有以下数据框:
prop_selec_cleaned.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 146322 entries, 0 to 146321
Data columns (total 2 columns):
codigo_unico 146322 non-null object
words_array 146322 non-null object
dtypes: object(2)
memory usage: 3.3+ MB
prop_selec_cleaned.reset_index().head()
index codigo_unico words_array
0 0 MSC 36/2010 - 465465 [comunica, o, excelentíssimo, senhor, presiden...
1 1 MPV 480/2010 - 465466 [abre, crédito, extraordinário, em, favor, da,...
2 2 MSC 38/2010 - 465467 [comunica, o, excelentíssimo, senhor, presiden...
3 3 MSC 42/2010 - 465469 [submete, à, deliberação, do, congresso, nacio...
4 4 PL 6720/2010 - 465470 [concede, auxílio, especial, e, bolsa, especia...
我需要创建一个新的数据框,其中的列为“ codigo_unico”行。并且每一列中的行将是“ words_array”的行
类似的东西:
MSC 36/2010 - 465465 MPV 480/2010 - 465466 MSC 38/2010 - 465467
[comunica, o, excelentíssimo, senhor, presiden... [abre, crédito, extraordinário, em, favor, da,... [comunica, o, excelentíssimo, senhor, presiden...
因此,它将是一个具有146,322列(“ codigo_unico”)和仅一行(由“ words_array”填充)的数据框
请,有人知道我该怎么做吗?
答案 0 :(得分:1)
使用am i logged in Observable {_isScalar: false, source: BehaviorSubject}
source: BehaviorSubject {_isScalar: false, observers:
Array(0), closed: false, isStopped: false, hasError:
false, …}
_isScalar: false ...
构造函数,并通过values
将列转换为DataFrame
numpy数组:
1d
df = pd.DataFrame([prop_selec_cleaned['words_array'].values],
columns=prop_selec_cleaned['codigo_unico'])
或者通过set_index
创建索引,通过to_frame
将df = pd.DataFrame(prop_selec_cleaned['words_array'].values[None,:],
columns=prop_selec_cleaned['codigo_unico'])
转换为1列Series
并最后转置:
DataFrame