我有一大堆数据,我试图在3D中表示希望发现一个模式。我花了很长一段时间的阅读,研究和编码,但后来我意识到我的主要问题是不是编程,但实际上选择一种可视化的数据
Matplotlib的mplot3d提供了很多选项(线框,轮廓,填充轮廓等),MayaVi也是如此。但是有很多选择(每个都有自己的学习曲线),我几乎迷失了,不知道从哪里开始!所以我的问题基本上是你必须处理这些数据时使用哪种绘图方法?
我的数据是基于日期的。对于每个时间点,我绘制一个值(列表'Actual')。
但是对于每个时间点,我也有一个上限,一个下限和一个中间点。这些限制和中点基于不同平面的种子。
我希望在我的“实际”阅读中发生重大变化时或之前发现该点或识别模式。是在所有飞机的上限都满足时?或者彼此接近?当实际值接触上/中/下限时?是在一个平面上的Uppers碰到另一个平面的降落时吗?
在我粘贴的代码中,我将数据集简化为几个元素。我只是用简单的分散和线图,但由于数据集的大小(与mplot3d?也许限制)的,我不能用它来发现我要找的趋势。
dates = [20110101,20110104,20110105,20110106,20110107,20110108,20110111,20110112]
zAxis0= [ 0, 0, 0, 0, 0, 0, 0, 0]
Actual= [ 1132, 1184, 1177, 950, 1066, 1098, 1116, 1211]
zAxis1= [ 1, 1, 1, 1, 1, 1, 1, 1]
Tops1 = [ 1156, 1250, 1156, 1187, 1187, 1187, 1156, 1156]
Mids1 = [ 1125, 1187, 1125, 1156, 1156, 1156, 1140, 1140]
Lows1 = [ 1093, 1125, 1093, 1125, 1125, 1125, 1125, 1125]
zAxis2= [ 2, 2, 2, 2, 2, 2, 2, 2]
Tops2 = [ 1125, 1125, 1125, 1125, 1125, 1250, 1062, 1250]
Mids2 = [ 1062, 1062, 1062, 1062, 1062, 1125, 1000, 1125]
Lows2 = [ 1000, 1000, 1000, 1000, 1000, 1000, 937, 1000]
zAxis3= [ 3, 3, 3, 3, 3, 3, 3, 3]
Tops3 = [ 1250, 1250, 1250, 1250, 1250, 1250, 1250, 1250]
Mids3 = [ 1187, 1187, 1187, 1187, 1187, 1187, 1187, 1187]
Lows3 = [ 1125, 1125, 1000, 1125, 1125, 1093, 1093, 1000]
import matplotlib.pyplot
from mpl_toolkits.mplot3d import Axes3D
fig = matplotlib.pyplot.figure()
ax = fig.add_subplot(111, projection = '3d')
#actual values
ax.scatter(dates, zAxis0, Actual, color = 'c', marker = 'o')
#Upper limits, Lower limts, and Mid-range for the FIRST plane
ax.plot(dates, zAxis1, Tops1, color = 'r')
ax.plot(dates, zAxis1, Mids1, color = 'y')
ax.plot(dates, zAxis1, Lows1, color = 'b')
#Upper limits, Lower limts, and Mid-range for the SECOND plane
ax.plot(dates, zAxis2, Tops2, color = 'r')
ax.plot(dates, zAxis2, Mids2, color = 'y')
ax.plot(dates, zAxis2, Lows2, color = 'b')
#Upper limits, Lower limts, and Mid-range for the THIRD plane
ax.plot(dates, zAxis3, Tops3, color = 'r')
ax.plot(dates, zAxis3, Mids3, color = 'y')
ax.plot(dates, zAxis3, Lows3, color = 'b')
#These two lines are just dummy data that plots transparent circles that
#occpuy the "wall" behind my actual plots, so that the last plane appears
#floating in 3D rather than being pasted to the plot's background
zAxis4= [ 4, 4, 4, 4, 4, 4, 4, 4]
ax.scatter(dates, zAxis4, Actual, color = 'w', marker = 'o', alpha=0)
matplotlib.pyplot.show()
我得到了这个情节,但它并没有帮助我看到任何共同关系。
我不是数学家或科学家,所以我真正需要的是帮助选择FORMAT来可视化我的数据。有没有一种有效的方法在mplot3d中显示这个?或者你会使用MayaVis吗?在任何一种情况下,您将使用哪个库和类?
提前致谢。
答案 0 :(得分:7)
为了评论您的问题的可视化部分(而不是编程),我已经模拟了一些示例分面图,以建议您可能想要用来探索数据的替代方案。
library("lubridate")
library("ggplot2")
library("reshape2")
dates <- c("2011-01-01","2011-01-04","2011-01-05",
"2011-01-06","2011-01-07","2011-01-08",
"2011-01-11","2011-01-12")
dates <- ymd(dates)
Actual<- c( 1132, 1184, 1177, 950, 1066, 1098, 1116, 1211,
1132, 1184, 1177, 950, 1066, 1098, 1116, 1211,
1132, 1184, 1177, 950, 1066, 1098, 1116, 1211)
z <- c( 1, 1, 1, 1, 1, 1, 1, 1,
2, 2, 2, 2, 2, 2, 2, 2,
3, 3, 3, 3, 3, 3, 3, 3)
Tops <- c( 1156, 1250, 1156, 1187, 1187, 1187, 1156, 1156,
1125, 1125, 1125, 1125, 1125, 1250, 1062, 1250,
1250, 1250, 1250, 1250, 1250, 1250, 1250, 1250)
Mids <- c( 1125, 1187, 1125, 1156, 1156, 1156, 1140, 1140,
1062, 1062, 1062, 1062, 1062, 1125, 1000, 1125,
1187, 1187, 1187, 1187, 1187, 1187, 1187, 1187)
Lows <- c( 1093, 1125, 1093, 1125, 1125, 1125, 1125, 1125,
1000, 1000, 1000, 1000, 1000, 1000, 937, 1000,
1125, 1125, 1000, 1125, 1125, 1093, 1093, 1000)
df <- data.frame( cbind(z, dates, Actual, Tops, Mids, Lows))
dfm <- melt(df, id.vars=c("z", "dates", "Actual"))
在第一个例子中,细蓝线是叠加在每个z轴上所有三个等级上的实际值。
p <- ggplot(data = dfm,
aes(x = dates,
y = value,
group = variable,
colour = variable)
) + geom_line(size = 3) +
facet_grid(variable ~ z) +
geom_point(aes(x = dates,
y = Actual),
colour = "steelblue",
size = 3) +
geom_line(aes(x = dates,
y = Actual),
colour = "steelblue",
size = 1) +
theme_bw()
p
在第二组中,每个面板都有一个实际值的散点图,相对于每个z轴的三个级别(顶部,中间,低)。
p <- ggplot(data = dfm,
aes(x = Actual,
y = value,
group = variable,
colour = variable)
) + geom_point(size = 3) +
geom_smooth() +
facet_grid(variable ~ z) +
theme_bw()
p
答案 1 :(得分:2)
谢谢你,高登。 R实际上是我研究的一部分,我已经安装了但是对于教程来说还不够。除非它违反StackOverFlow规则,否则我会很高兴看到你的R代码。
我已经尝试过2D表示,但在很多情况下,Tops1 / Tops2 / Tops3(以及类似于Lows)的值会相等,因此这些行最终会重叠并相互遮挡。这就是我正在尝试3D选项的原因。您对3个2D图表的想法是一个很好的建议,我没有探索过。
我会尝试一下,但我会认为3D绘图会给我一个更清晰的画面,特别是线框/网格图会显示会聚的值,我会看到蓝点浮在3D空间中线框上的线开始形成高峰或低谷时的点。我无法让它发挥作用。
我尝试过调整matplotlib's Wireframe example,但我得到的情节看起来并不像线框。
这是我从下面的代码中获得的,只有两个数据元素(Tops1和Tops2):
dates = [20110101,20110104,20110105,20110106,20110107,20110108,20110111,20110112]
zAxis0= [ 0, 0, 0, 0, 0, 0, 0, 0]
Actual= [ 1132, 1184, 1177, 950, 1066, 1098, 1116, 1211]
zAxis1= [ 1, 1, 1, 1, 1, 1, 1, 1]
Tops1 = [ 1156, 1250, 1156, 1187, 1187, 1187, 1156, 1156]
Mids1 = [ 1125, 1187, 1125, 1156, 1156, 1156, 1140, 1140]
Lows1 = [ 1093, 1125, 1093, 1125, 1125, 1125, 1125, 1125]
zAxis2= [ 2, 2, 2, 2, 2, 2, 2, 2]
Tops2 = [ 1125, 1125, 1125, 1125, 1125, 1250, 1062, 1250]
Mids2 = [ 1062, 1062, 1062, 1062, 1062, 1125, 1000, 1125]
Lows2 = [ 1000, 1000, 1000, 1000, 1000, 1000, 937, 1000]
zAxis3= [ 3, 3, 3, 3, 3, 3, 3, 3]
Tops3 = [ 1250, 1250, 1250, 1250, 1250, 1250, 1250, 1250]
Mids3 = [ 1187, 1187, 1187, 1187, 1187, 1187, 1187, 1187]
Lows3 = [ 1125, 1125, 1000, 1125, 1125, 1093, 1093, 1000]
import matplotlib.pyplot
from mpl_toolkits.mplot3d import Axes3D
fig = matplotlib.pyplot.figure()
ax = fig.add_subplot(111, projection = '3d')
####example code from: http://matplotlib.sourceforge.net/mpl_toolkits/mplot3d/tutorial.html#wireframe-plots
#from mpl_toolkits.mplot3d import axes3d
#import matplotlib.pyplot as plt
#import numpy as np
#fig = plt.figure()
#ax = fig.add_subplot(111, projection='3d')
#X, Y, Z = axes3d.get_test_data(0.05)
#ax.plot_wireframe(X, Y, Z, rstride=10, cstride=10)
#plt.show()
X, Y, Z = dates, Tops1, Tops2
ax.plot_wireframe(X, Y, Z, rstride=1, cstride=1, color = 'g')
matplotlib.pyplot.show()