我们目前运行SQL报告来提取测试执行输出,以便我们可以查看测试的成功程度,然后对有哪些测试添加到回归套件进行有根据的猜测。
然而,这是耗时的,因为它需要有人通过所有数据并作出某些假设。
我的任务是调查使用人工智能来筛选数据的可能性,并想知道是否有人尝试过这些以及它们是如何实现的。
答案 0 :(得分:0)
我不确定这是否可行,但你可以使用开箱即用的Python的scikit-learn
这很简单:
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.neural_network import MLPClassifier
from sklearn.pipeline import Pipeline
import pandas as pd
####DATA PREP##
data = pd.read_csv('filepath')
#Forgot the target xD
# target = pd.read_csv('target_data_filepath')
target = data.target #If target is in data
other_data = pd.read_csv('filepath_other')
###MAKE MODEL##
tfidf_vect = TfidfVectorizer()
mpl_class = MLPClassifier()
pipe = Pipeline([('Tfidf Vectorizer', tfidf_vect),('MLP Classifier', mlp_class)]
pipe.fit(data, target) #remove target from data beforehand if applies
####PREDICT###
pipe.predict(other_data)
data
是单独条目中的文本,每个记录的整个输出
target
是你事先发现的,它应该包含在某处或不包含
other_data
是您要测试的内容
但请注意,上面只是一个模型,我不保证我的所有方法名称都是正确的。阅读只需按照scikit-learn's doku,非常昂贵但广泛的书籍,如Building Machine Learning Systems with Python on Packt和许多其他免费blogs like this machinelearningmastery.com