Spotfire:如何增加变量以建立评分机制?

时间:2019-06-26 09:20:29

标签: spotfire spotfire-webplayer

我试图弄清楚如何在Spotfire(在线版本)中使用变量来建立评分机制,并使用最终结果填充计算所得的列。

我在列中存储了几个值,这些值可用于评估和分配这样的分数:

如果column1 <10,则segment1 = segment1 + 1

如果column1> 10,则segment2 = segment2 + 1

... ETC ...

最后,每个“段”都应该有一个分数,我想简单地显示得分最高的段的名称。

例如:

Segment1的最终值为10

Segment2的最终值为22

Segment3的最终值为122

我将显示细分3作为计算列的值

仅使用“ IF”会导致我遇到一个复杂的IF结构,因此我正在寻找更像脚本的内容。

是否可以通过Spotfire实现此目标?

谢谢 洛朗(Laurent)

1 个答案:

答案 0 :(得分:1)

要在数据行之间循环并计算运行得分,可以使用IronPython脚本。下面的脚本正在从名为“数据表”的数据表的Col1和Col2中读取数字数据。它计算每一行的得分值,并将其写入制表符分隔的文本字符串中。完成后,它将使用“添加列”功能将其添加到Spotfire表中。注意,现有数据需要具有唯一的标识符。如果没有,则可以使用RowId()函数为唯一的行ID创建一个计算列。

from Spotfire.Dxp.Data import *
from System.IO import StringReader, StreamReader, StreamWriter, MemoryStream, SeekOrigin
from Spotfire.Dxp.Data.Import import *
from System import Array

def add_column(table, text, col_name):
    # read the text data into memory
    mem_stream = MemoryStream()
    writer = StreamWriter(mem_stream)
    writer.Write(text)
    writer.Flush()
    mem_stream.Seek(0, SeekOrigin.Begin)

    # define the structure of the text data
    settings = TextDataReaderSettings()
    settings.Separator = "\t"
    settings.SetDataType(0, DataType.Integer)
    settings.SetColumnName(0, 'ID')
    settings.SetDataType(1, DataType.Real)
    settings.SetColumnName(1, col_name)

    # create a data source from the in memory text data
    data = TextFileDataSource(mem_stream, settings)

    # define the relationship between the existing table (left) and the new data (right)
    leftColumnSignature = DataColumnSignature("Store ID", DataType.Integer)
    rightColumnSignature = DataColumnSignature("ID", DataType.Integer)
    columnMap = {leftColumnSignature:rightColumnSignature}
    ignoredColumns = []
    columnSettings = AddColumnsSettings(columnMap, JoinType.LeftOuterJoin, ignoredColumns)

    # now add the column(s)
    table.AddColumns(data, columnSettings)

#get the data table
table=Document.Data.Tables["Data Table"]

#place data cursor on a specific column
cursorCol1 = DataValueCursor.CreateFormatted(table.Columns["Col1"])
cursorCol2 = DataValueCursor.CreateFormatted(table.Columns["Col2"])
cursorColId = DataValueCursor.CreateFormatted(table.Columns["ID"])
cursorsList = Array[DataValueCursor]([cursorCol1, cursorCol2, cursorColId])

text = ""
rowsToInclude = IndexSet(table.RowCount,True)
#iterate through table column rows to retrieve the values
for row in table.GetRows(rowsToInclude, cursorsList):
    score = 0
    # get the current values from the cursors
    col1Val = cursorCol1.CurrentDataValue.ValidValue
    col2Val = cursorCol2.CurrentDataValue.ValidValue
    id = cursorColId.CurrentDataValue.ValidValue
    # now apply rules for scoring
    if col1Val <= 3:
        score -= 3
    elif col1Val > 3 and col2Val > 50:
        score += 10
    else:
        score += 5
    text += "%d\t%f\r\n" % (id, score)

add_column(table, text, 'Score_Result')

对于既无脚本又无累积的方法,可以使用计算列。 要获得分数,您可以将计算列与case语句一起使用。对于细分1,您可能会:

case 
when [Col1] > 100 then 10
when [Col1] < 100 and [Col2] > 600 then 20
end

一旦获得分数,就可以创建一个计算列,例如[MaxSegment]。此表达式将为Max([Segment1],[Segment2],[Segment3] ...)。然后显示[MaxSegment]的值。

在这种情况下,max函数充当行表达式,并在给定列的行中计算最大值。