我一直在使用python的 TextBlob 库来获得英语的情感极性。
现在我想得到用拉丁文写的urdu语言的情感分析(极性)。
例如
英语句子:“你叫什么名字”
它的等效乌尔都语用拉丁文写成
乌尔都语句子(用拉丁文写成):“Tumhara kia name hai”
我想要建议,我遵循哪个程序,在两种情况下都使用机器学习来实现所需的语言
监督学习
通过使用具有预先人类标记数据集的递归神经网络
“或”任何无监督学习算法?
答案 0 :(得分:0)
您可以使用下面的html / javascript脚本或python代码
为html / javascript尝试此脚本(信用转到Mr.awaisathar)
https://github.com/awaisathar/urdu-sentiment-lexicon
演示代码
http://awaisathar.github.io/urdu-sentiment-lexicon/
或者如果你想使用其他语言然后使用这些正面和负面的关键字列表(在链接下面),如果这将存在/包含在你的字符串文本中,那么你将其标记为正面,否则为负面。(如果发生的话更多则一个然后选择更多发生的情绪)
以下是关键字列表
肯定关键字列表
https://github.com/awaisathar/urdu-sentiment-lexicon/blob/master/poisitive-words.ur.txt
否定关键字列表
https://raw.githubusercontent.com/awaisathar/urdu-sentiment-lexicon/master/negative-words.ur.txt
Python的使用此脚本(感谢Mr.awaisathar关于urdu否定和肯定关键字txt文件)
https://github.com/ch-hassansaeed/urdu_sentiment_NLP_analysis
from urdu_sentiment_NLP_analysis_lib import get_urdu_sentiment
urdu_input_sentence="""
آپ جیسا اچھا بندہ نہیں دیکھا میں نے
"""
urdu_sentiment_output=get_urdu_sentiment(urdu_input_sentence)
print(urdu_sentiment_output)
---------------------------------------输出:postive / nautral / non多愁善感---------------------------------------
另一个例子: -
urdu_input_sentence="""
آپ بہت باتمیز انسان ہو
"""
---------------------------------------输出:否定----- ----------------------------------