我目前正致力于一个解决方案,根据他们的描述,在拥有10k家餐馆的数据库中提供食物类型。我正在使用关键字列表来决定提供哪种食物。
我读了一些关于机器学习的内容,但我根本没有实际经验。任何人都可以向我解释是否/为什么它会更好地解决这样一个简单的问题?我觉得准确性比表现更重要!
简化示例:
["China", "Chinese", "Rice", "Noodles", "Soybeans"]
["Belgium", "Belgian", "Fries", "Waffles", "Waterzooi"]
可能的描述可能是:
“Hong's Garden Restaurant为我们的顾客提供咸味,价格合理的中文。如果您发现您突然渴望 星期六晚上8点米,面条或大豆,不用担心!我们每周七天开放,并提供结转服务。您也可以在这里获得薯条!“
答案 0 :(得分:57)
您确实在描述分类问题,可以通过机器学习解决。
在此问题中,您的功能是说明中的字词。您应该使用Bag Of Words模型 - 它基本上表示每个单词的单词及其出现次数对分类过程至关重要。
要解决您的问题,请执行以下步骤:
<强>评价为:强> 您可以使用cross-validation对算法进行评估,或者从标记示例中分离测试集,这些测试集仅用于评估算法的准确程度。
<强>优化:强>
从个人经验来看 - 这里有一些我认为对特征提取有帮助的优化:
<强>库:强>
不幸的是,我对python不够流利,但是这里有一些可能有用的库: