在python中使用拉丁文脚本编写的urdu语言的情感分析

时间:2017-06-09 06:14:12

标签: python machine-learning nlp recurrent-neural-network supervised-learning

我一直在使用python的 TextBlob 库来获得英语的情感极性。 现在我想得到用拉丁文写的urdu语言的情感分析(极性)。
 例如
 英语句子:“你叫什么名字”
它的等效乌尔都语用拉丁文写成  乌尔都语句子(用拉丁文写成):“Tumhara kia name hai”
我想要建议,我遵循哪个程序,在两种情况下都使用机器学习来实现所需的语言 监督学习    通过使用具有预先人类标记数据集的递归神经网络

“或”任何无监督学习算法?

1 个答案:

答案 0 :(得分:0)

您可以使用下面的html / javascript脚本或python代码

为html / javascript尝试此脚本(信用转到Mr.awaisathar)

https://github.com/awaisathar/urdu-sentiment-lexicon

演示代码

http://awaisathar.github.io/urdu-sentiment-lexicon/

或者如果你想使用其他语言然后使用这些正面和负面的关键字列表(在链接下面),如果这将存在/包含在你的字符串文本中,那么你将其标记为正面,否则为负面。(如果发生的话更多则一个然后选择更多发生的情绪)

以下是关键字列表

肯定关键字列表

https://github.com/awaisathar/urdu-sentiment-lexicon/blob/master/poisitive-words.ur.txt

否定关键字列表

https://raw.githubusercontent.com/awaisathar/urdu-sentiment-lexicon/master/negative-words.ur.txt

Python的

使用此脚本(感谢Mr.awaisathar关于urdu否定和肯定关键字txt文件)

https://github.com/ch-hassansaeed/urdu_sentiment_NLP_analysis

from urdu_sentiment_NLP_analysis_lib import get_urdu_sentiment
urdu_input_sentence="""
آپ جیسا اچھا بندہ نہیں دیکھا میں نے   
"""
urdu_sentiment_output=get_urdu_sentiment(urdu_input_sentence)
print(urdu_sentiment_output)

---------------------------------------输出:postive / nautral / non多愁善感---------------------------------------

另一个例子: -

urdu_input_sentence="""
آپ بہت باتمیز انسان ہو    
"""

---------------------------------------输出:否定----- ----------------------------------