如何在python上创建训练模型以从网站获取数据?

时间:2018-10-23 15:15:29

标签: python machine-learning

有什么方法可以创建训练模型,使用python进行机器学习以从网站中用户的交互中获取数据吗? 我只了解python的基础知识,我需要创建一个机器学习模型,该模型将从用户的反应中获取数据并将其保存到mysql数据库中。之后,我希望机器决定基于mysql向用户呈现内容的方式。

1 个答案:

答案 0 :(得分:1)

我不确定我是否完全理解您的问题。 无论如何,可以采用不同的方法,这取决于模型的训练是实时的还是可以进行批量训练。

在第一种情况下,您应该使用在线训练(https://en.wikipedia.org/wiki/Online_machine_learning)训练模型。这意味着对于每个条目,用户都可以训练模型并显示结果。这对于模型的漂移或对抗攻击可能具有潜在的危险。

在第二种情况下,任何ML模型都可以。您将存储数据,直到拥有一批为止。您检查数据是否在所需的分发中并更新模型。同时,该模型的预测是在旧的训练数据集上进行的。

以上两种方法均基于您可以访问网站数据库的事实。如果您打算从头开始构建网站,则Django可能是集成以Python开发的ML工具的不错选择。

如果您无权访问网站数据集,则可以使用刮板检索数据。 Python有几个库,可让您进行网络抓取(beatifoulsoup或selenium)。在这种情况下,您可以检索的数据是Web界面(blog-post,ecc ...)中可用的数据

有关更多详细信息,我可以尝试更加具体。 希望对您有所帮助。