如何分析twitters消息? (改进我的算法)

时间:2011-12-05 23:32:10

标签: iphone facebook algorithm twitter nlp

我有个好主意实施。我称之为

  

FixTheUnFixed

这个想法是这样的,想象你是在世界各地开车或旅行,当你看到一些障碍或损坏 - 破碎的灯光,垃圾覆盖所有的街道或任何其他问题,你希望负责的权威将修复它

你需要做的就是推特这样的东西,你可以使用twitter或Facebook应用程序的继承位置服务添加照片,当然还有位置。

这样推文:

@FixTheUnFixed there is a broken fire hydrant here
@FixTheUnFixed my cellular company charged me 18,572$
  for using my iPhone aboard.

我想了很多关于如何处理消息的事情。 将出现的大多数问题都是市政当局关注的问题,我希望获得相关市政府的位置和重新推文或向他们发送电子邮件。

获取此地址的两个想法是google it(使用谷歌API)。

伪算法是:

1. get the location the Twitter's or Facebook's status sent from.
2. look for key words such as trash, cats, animals etc.
3. finding the relevant authority e-mail , twitter or Facebook account.
4. send the message to the authority account and re-tweet it to the public
     world so they can follow if there is any change.
  • 在3. @ algo有没有聪明的方法来实现它?
  • 我不想向当局发送垃圾邮件,也不想发布垃圾邮件 偷偷摸摸的人。
  • 如何改进上述算法?
  • 如何搜索relvent的通信资源 当局?

4 个答案:

答案 0 :(得分:8)

我的建议是首先使用Amazon Mechanical Turk - 为他们处理的每条推文向真人付费。他们需要确定它是否是垃圾邮件,然后,如果合法,他们将搜索正确的市政联系信息。同时,收集每个处理过的推文的详细统计信息,您可以从中构建数据库。例如,您可以看到所有包含“垃圾”和“芝加哥”的推文都会生成带有特定电话号码的回复。一旦你获得足够的数据,你就可以用它来自动化普通/指定的传入推文,并从那里逐步构建,不断完善你的数据和数据。使用土耳其工人进行研究的协会。

还建议只开始有限区域的服务 - 比如纽约或伦敦。 (或者您附近最大的城市)这样开始所需的信息要小得多。

答案 1 :(得分:4)

作为解决方案的第一步,我建议将纬度/经度插入SimpleGeo(他们有一个iOS库):http://simplegeo.com

使用“查找某个位置周围的边界”之类的内容,您可以检索有关县,市,立法区等的信息,这些信息可能会为您提供支持元数据以及一些搜索联系信息的渠道:

https://simplegeo.com/docs/api-endpoints/simplegeo-context#find-boundaries-surrounding-location

例如,我相信你可以通过一些公开的网站/ API将立法区变成国会议员的电子邮件地址。也许可以向他们的办公室发送每周或每月批量发送的所有报告问题的电子邮件,并对当选官员施加压力以制定适当的变更?

另一种选择可能是在公开网站上显示您报告的问题数据库,并通过众包收集相应的联系信息。允许网站成员添加/更新可用于当前报告的问题的电子邮件地址以及将来可能会在同一位置收到的问题。

答案 2 :(得分:2)

ifttt.com可能会用于此吗? 它是一项根据您的自定义标准自动执行操作的服务。

也许你可以和他们联系?

答案 3 :(得分:0)

我认为正确的做法是使用现有的NLP库,例如Stanford nlp library

其中包括:

  • Stanford CoreNLP
  • Stanford Parser
  • 斯坦福分类器

或者,您可以使用opennlpnltk。如果NLP框架在java中,并且您希望使用python或ruby作为OP,则需要检查jrubyjython