在机器学习中查找包含字符串值的数据集

时间:2017-05-31 07:17:25

标签: machine-learning tensorflow dataset

我用Tensorflow学习机器学习。我使用过像Iris花数据和波士顿之家这样的数据集,但所有这些数据的值都是浮点数。 是的我正在寻找包含数据值的数据集以字符串格式进行练习。你能给我一些建议吗? 感谢

2 个答案:

答案 0 :(得分:1)

我为您提供了两个易于入手的地方:

  1. Tensorflow网站有三个非常好的教程来处理单词嵌入,语言建模和序列到序列模型。我没有足够的声誉直接链接它们,但您可以轻松找到它们here。它们为您提供了一些处理人类语言的张量流代码
  2. 此外,如果您想从头开始构建模型,并且只需要数据集,请尝试ntlk corpora。它们很容易直接从代码中下载。

答案 1 :(得分:0)

Facebook的ParlAI项目为自然语言处理任务列出了大量数据集

IMDB's reviews数据集也是一个典型的例子,也是情感分析的Amazon's reviews。如果您查看Kaggle上发布的内核,您将获得有关数据集和任务的大量见解。