如何将txt文件处理成监督学习训练数据?

时间:2021-05-12 18:56:06

标签: supervised-learning

我从 Scratch https://nnfs.io 购买了神经网络,概念很有意义,数学变得更容易了。在尝试了解如何使用真实数据迈出监督学习的第一步时,大多数(如果现在是全部)示例都是非二进制的,过于复杂,它们使用计算机视觉或不显示数据。

它们要么是具有多个 [0.23,0.24,0.19] 等的广义(虹膜)数据集,要么是不适用于我的用例的计算机视觉示例。

作为一名学生,我试图将我熟悉的事物联系起来(多项选择测验)并将其扩展到我不知道的事物(监督学习)

从简单的多项选择测验中创建监督学习模型是可能的,或者是一个很好的例子。

示例训练数据

  1. 内布拉斯加州的首府是什么? A. 特伦顿 B.林肯 C. 普罗维登斯 D. 博伊西

示例答案 B

这个训练集会像这样吗。

  1. 输入“内布拉斯加州的首都是什么”= [0,0,0,0] 或 Nebraska_Capital = [0,0,0,0]
  2. 输出 = [0,1,0,0]

现在我有数百个问题和答案可以在这里https://github.com/shashankch292/Random-Quiz-Generator使用。如何将这些问题文件夹转移到训练数据中?

这是否是教授模型地理的监督学习的一个很好的例子?随着时间的推移,我可以添加更多数据,如纬度和经度。也许每个城市的顶级食物是什么等等。我想从简单开始,然后逐步提高。

0 个答案:

没有答案