我有一个DataFrame(df),我从输入中获取(使用SQL获取数据):
--conf 'spark.executor.extraJavaOptions=-Ddb2.jcc.charsetDecoderEncoder=3'
--conf 'spark.driver.extraJavaOptions=-Ddb2.jcc.charsetDecoderEncoder=3'
它只会是一行。
如何将Summary列中的值转换为稍后使用的变量,即我不想要列标题,我想要出现这种情况:
aVar = foobar
道歉,如果这是一个简单的问题,但由于某种原因,我的大脑今天早上没有工作。谢谢
答案 0 :(得分:1)
最简单的是按Series.iat
选择列的第一个值:
aVar = df['Summary'].iat[0]
iloc
的解决方案,
loc
,因为ix indexer is deprecated:
iloc
用于按位置选择,因此需要按get_loc
列Summary
列的位置:
aVar = df.iloc[0, df.columns.get_loc('Summary')]
loc
按名称选择,因此请使用:
#default index - first value is 0
aVar = df.loc[0, 'Summary']
#general solution with unique index - seelct first value by `[0]`
aVar = df.loc[df.index[0], 'Summary']