我试图弄清楚如何在Spotfire(在线版本)中使用变量来建立评分机制,并使用最终结果填充计算所得的列。
我在列中存储了几个值,这些值可用于评估和分配这样的分数:
如果column1 <10,则segment1 = segment1 + 1
如果column1> 10,则segment2 = segment2 + 1
... ETC ...
最后,每个“段”都应该有一个分数,我想简单地显示得分最高的段的名称。
例如:
Segment1的最终值为10
Segment2的最终值为22
Segment3的最终值为122
我将显示细分3作为计算列的值
仅使用“ IF”会导致我遇到一个复杂的IF结构,因此我正在寻找更像脚本的内容。
是否可以通过Spotfire实现此目标?
谢谢 洛朗(Laurent)
答案 0 :(得分:1)
要在数据行之间循环并计算运行得分,可以使用IronPython脚本。下面的脚本正在从名为“数据表”的数据表的Col1和Col2中读取数字数据。它计算每一行的得分值,并将其写入制表符分隔的文本字符串中。完成后,它将使用“添加列”功能将其添加到Spotfire表中。注意,现有数据需要具有唯一的标识符。如果没有,则可以使用RowId()函数为唯一的行ID创建一个计算列。
from Spotfire.Dxp.Data import *
from System.IO import StringReader, StreamReader, StreamWriter, MemoryStream, SeekOrigin
from Spotfire.Dxp.Data.Import import *
from System import Array
def add_column(table, text, col_name):
# read the text data into memory
mem_stream = MemoryStream()
writer = StreamWriter(mem_stream)
writer.Write(text)
writer.Flush()
mem_stream.Seek(0, SeekOrigin.Begin)
# define the structure of the text data
settings = TextDataReaderSettings()
settings.Separator = "\t"
settings.SetDataType(0, DataType.Integer)
settings.SetColumnName(0, 'ID')
settings.SetDataType(1, DataType.Real)
settings.SetColumnName(1, col_name)
# create a data source from the in memory text data
data = TextFileDataSource(mem_stream, settings)
# define the relationship between the existing table (left) and the new data (right)
leftColumnSignature = DataColumnSignature("Store ID", DataType.Integer)
rightColumnSignature = DataColumnSignature("ID", DataType.Integer)
columnMap = {leftColumnSignature:rightColumnSignature}
ignoredColumns = []
columnSettings = AddColumnsSettings(columnMap, JoinType.LeftOuterJoin, ignoredColumns)
# now add the column(s)
table.AddColumns(data, columnSettings)
#get the data table
table=Document.Data.Tables["Data Table"]
#place data cursor on a specific column
cursorCol1 = DataValueCursor.CreateFormatted(table.Columns["Col1"])
cursorCol2 = DataValueCursor.CreateFormatted(table.Columns["Col2"])
cursorColId = DataValueCursor.CreateFormatted(table.Columns["ID"])
cursorsList = Array[DataValueCursor]([cursorCol1, cursorCol2, cursorColId])
text = ""
rowsToInclude = IndexSet(table.RowCount,True)
#iterate through table column rows to retrieve the values
for row in table.GetRows(rowsToInclude, cursorsList):
score = 0
# get the current values from the cursors
col1Val = cursorCol1.CurrentDataValue.ValidValue
col2Val = cursorCol2.CurrentDataValue.ValidValue
id = cursorColId.CurrentDataValue.ValidValue
# now apply rules for scoring
if col1Val <= 3:
score -= 3
elif col1Val > 3 and col2Val > 50:
score += 10
else:
score += 5
text += "%d\t%f\r\n" % (id, score)
add_column(table, text, 'Score_Result')
对于既无脚本又无累积的方法,可以使用计算列。 要获得分数,您可以将计算列与case语句一起使用。对于细分1,您可能会:
case
when [Col1] > 100 then 10
when [Col1] < 100 and [Col2] > 600 then 20
end
一旦获得分数,就可以创建一个计算列,例如[MaxSegment]。此表达式将为Max([Segment1],[Segment2],[Segment3] ...)。然后显示[MaxSegment]的值。
在这种情况下,max函数充当行表达式,并在给定列的行中计算最大值。