神经网络项目的想法

时间:2011-10-18 10:07:04

标签: artificial-intelligence neural-network

我是AI专业的计算机学生。我现在正在研究我的最后一年项目的主题,我对神经网络很感兴趣,虽然我几乎不了解它。

我现在正在考虑的主题是语言和音乐,所以我正在寻找有关神经网络语言和音乐可以做些什么有趣或受欢迎的建议。随意为不同的领域提供建议。

任何输入,建议,链接,建议或指针将不胜感激。谢谢! :)

更新:所以我缩小了我最有可能做的话题:

  1. 使用NN的音乐流派分类
  2. 使用NN进行文本挖掘
  3. 我的问题是两者是否过于先进而无法由本科生完成?

5 个答案:

答案 0 :(得分:10)

查看http://archive.ics.uci.edu/ml/datasets.html 看看你是否找到了一些你喜欢的主题。

如果您有使用C ++和C的经验,那么学习Matlab就不会有很多问题。

关于您要使用的主题,我建议您查看上面的链接,并尝试找到您喜欢的内容,可以应用于NN,搜索acm,ieee或其他存储库以获取有关NN的论文,看看是否也可以找到关于您可能正在寻找的主题的研究或报告。

祝你好运。

答案 1 :(得分:2)

对不起,我会过分简化一些事情,但我希望稍微分散一下雾气。简单的神经网络是一种近似函数的方法,称之为f,从(通常)R ^ n(维数n的实向量空间)到R ^ m等。假设m = 1。不是寻找基于一组样本(p,f(p))近似函数的多项式P(x_1,..,x_n),而是寻找a(i_1 * s(s)中的参数a_i,b_ij。 b_11 * x_1 + b_n1 * x_n)+ ... + a_t * s(b_1t * x_1 + b_nt * x_n))其中s例如是“sigmoid”函数,因此这个奇怪的函数可以很好地匹配你的样本。 / p>

动机被认为是生物学的。 “训练算法”包括连续调整上面的a_i,b_ij的值,使得样本点p处的结果函数的值通过最速下降的某种变体“平均”接近f(p),其中,据称,在某些情况下有良好的行为。 NN在90年代被大量的炒作所包围,但考虑到它的真实目标是基于其样本近似未知函数(与“模仿人类大脑”或类似的东西的炒作目标相反) ,许多其他的近似方案被建议用于相同的范围 - 例如SVM(“支持向量机”),它具有更具吸引力的理由(在你看到寻找“正确内核”的黑魔法之后,通常也会产生误导)研究文章中的工作)。

然而,重点是,只要您为作业选择正确的“功能”(即找到将音乐样本转换为100维点的好方法,比如说, 矢量空间),以便类型X的点将“接近”类型X的其他点,并且类型Y的点将“接近”类型Y的点,并且类型X的点将远离类型Y的点,您可以使用NN,SVM,决策树或任何您喜欢的其他类型来分离类型(但精度和效率可能会有所不同)。重点是找到正确的功能集 - 至少如果我们在这个意义上理解AI(但如果这是唯一的意义,我认为IBM Watson是不可能的......)

答案 2 :(得分:2)

关于神经网络,有一个非常好的Google Tech Talk。

youtube.com/watch?v=AyzOUbkUf3M

如果您认真使用神经网络为您最终实现项目,那么值得花时间。

至于文字与音乐。神经网络是很好的分类器。使用具有真/假,开/关分类的静态数据,它们相当容易教。当网络需要将输入分类为集合时,会更具挑战性。

神经网络在流数据方面遇到的问题最多。有一些众所周知的技术可以让它发挥作用,但你对哪种方法运作良好的直觉是不够的。你需要看看其他科学家做了什么,并复制他们的技术。否则你冒着创造问题空间的巨大风险NN不适合学习。

我认为你不会通过神经网络获得有趣的结果来传播音乐的波形。您需要将数据预处理为可用格式。

您需要的最后一件事是很多数据。越多越好。您需要烘焙数据及其分类。数十万。您将无法手动对某些内容进行分类以创建学习数据集。

因此,考虑到所有这些文本分类比音乐更可行。

神经网络需要庞大的数据语料库。维基百科是巨大的,并且有很多关于每个页面的元信息(流行度,质量,编辑计数等)。谷歌还可以获得大量具有特定分类的数据,例如“快乐的狗”与“悲伤的狗”,或者只是“狗”,谷歌的等级是它的分类。

答案 3 :(得分:2)

根据我的经验,音乐流派分类对于本科项目来说太难了。问题是,在你开始应用神经网络分类器的“有趣的东西”之前,你需要做各种信号处理基础工作,为网络生成有意义的特征向量。考虑每分钟节拍:它对于某些类型的音乐是可靠的,但远非所有。如果您仍想继续,请查看使用libxtract之类的东西作为基础工具。

答案 4 :(得分:0)

http://www.heatonresearch.com/encog 这是我学习有关神经网络的AI算法的全部内容。这个API是一个非常好的方式来了解您需要什么,以了解最新情况。我已经为自己创建了一个API,我在模拟Boid选择时经常使用它。没有必要,但它确实有效。