我正在尝试使用seaborn绘制图表
sns.lmplot(x="when_start", y="how_long",hue= 'state',
data=apps_pd.loc[(apps_pd['user'] == 'xavi')],lowess=True);
apps_pd 是数据框。 apps_pd ['when_start'] 中的文件类似于1499963856220,同样适用于 how_long 。
脚本结果
但是,如果我不改变数据的格式,我会得到一个非常混乱的图表。
无论如何我可以将x轴的单位改为'yyyy-mm-dd'吗?我想在日级别对所有数据进行分组。
我还可以将y轴的单位改为小时 - 分 - 秒吗?
这是我的数据帧的前5行。
答案 0 :(得分:4)
首先,当您发布数据时,以文本格式发布,而不是图像。
您可以将col when_start
转换为日期时间格式,如下所示:
apps_pd['when_start'] = pd.to_datetime(apps_pd['when_start'], unit='ms')
然而散点图是lmplot does not support datetime格式的调用之一。您必须在绘图之后替换xtick标记,如下例所示:
import pandas as pd
import seaborn as sns
import matplotlib.pylab as plt
cols = ['how_long', 'state', 'user', 'when_start']
data = [[62297, 'FINISHED', 'xavi', 1499963793923],
[25761, 'FINISHED', 'xavi', 1499963446385],
[20082, 'FINISHED', 'xavi', 1499963221203],
[20508, 'FINISHED', 'xavi', 1499963156760],
[580975, 'FINISHED', 'xavi', 1499962435293]]
apps_pd = pd.DataFrame(data, columns = cols)
# convert ms timestamps of dataframe to date time format by pandas
#apps_pd['when_start'] = pd.to_datetime(apps_pd['when_start'], unit='ms')
print (apps_pd)
sns.lmplot(x='when_start', y='how_long', hue= 'state',
data=apps_pd[(apps_pd['user'] == 'xavi')],lowess=True)
# get current axis
ax = plt.gca()
# get current xtick labels
xticks = ax.get_xticks()
# convert all xtick labels to selected format from ms timestamp
ax.set_xticklabels([pd.to_datetime(tm, unit='ms').strftime('%Y-%m-%d\n %H:%M:%S') for tm in xticks],
rotation=50)
plt.show()