您知道Azure Machine Learning Studio中的哪个模块允许添加新列吗?我不是指来自不同数据集的“复制粘贴”列,而是基于给定逻辑的新列,例如IF声明?我想一种方法只是执行自定义R / Python脚本,但是有没有专用模块?
答案 0 :(得分:1)
您可以使用Panda的Execute Python Script
操作来使用模块DataFrame
:
import pandas as pd
# The entry point function can contain up to two input arguments:
# Param<dataframe1>: a pandas.DataFrame
# Param<dataframe2>: a pandas.DataFrame
def azureml_main(dataframe1 = None, dataframe2 = None):
# Execution logic goes here
print('Input pandas.DataFrame #1:\r\n\r\n{0}'.format(dataframe1))
dataframe1['new_column'] = dataframe1.apply(lambda row: extractValue(row), axis=1)
# Return value must be of a sequence of pandas.DataFrame
return dataframe1,
def extractValue(row):
return 1 if row['column1'] == 'something else 2
您还可以使用Execute Python Script
创建包含新列的新数据集,并使用Add Columns
模块合并它们。
答案 1 :(得分:-1)
&#34;应用数学运算&#34;是模块, 以及&#34;应用SQL转换&#34;模块。
设置输出模式=追加