我是机器学习的初学者。我看过一些教机器学习的视频。但是我的问题是我们如何建模数据。
大多数情况下,我们会得到非结构化数据。如何将非结构化数据转换为结构化格式,这是最佳方式。这样我们就可以从数据中找到最有用的信息。
任何对书籍或链接的帮助都非常感谢。
答案 0 :(得分:0)
作为一名机器学习工程师,您将负责以可接受的方式预处理您的数据。根据模型。
没有最好的方法来做到这一点,这取决于您拥有哪种数据类型,例如1. csv数据集,2。文本数据集,文件(图像和音频)。
答案 1 :(得分:0)
在现实世界中,所有数据都不会采用结构化形式。当我们获得数据时,首先发现的是 1.什么是数据。 2.它的功能和输出是什么。 例如:用于预测一个人身高的数据集,您可以获得以下所有信息,例如来自哪个国家/地区,体重,性别,头发颜色等。这些是我们在机器学习中通常所说的功能。 3.然后,我们需要查看数据特征。如文本数据或数字等。我们需要对数据进行预处理,然后再对数据进行任何分析。例如:如果您的数据是功能,而功能仅与评论有关,那么您需要删除所有特殊功能并使数据实体化。 4.您需要了解模型接受数据的方式和模型所具有的参数,我们如何才能改善数据。(我们可以进行一些特征工程以改进模型等。)
您无需以同样的方式来做硬性规定。
答案 2 :(得分:0)
首先,您需要了解预处理和特征提取。如果您使用Python建立模型,那么Pandas或Scikit之类的库将非常有用。第一步,尝试创建诸如“当x出现时,我的输出y变成...”的句子。