寻找文本正文中的公司符号

时间:2016-07-19 20:42:42

标签: python python-3.x nlp finance stocks

我目前正在使用Python,我正在尝试对财务文章进行一些语言处理。但是,我所知道的查询股票信息的方法都是通过它的股票代码。 所以,我的问题是,你知道一种从一般公司名称(不仅仅是公司的官方名称)查找股票代码的方法,还是以其他方式查找公司名称的股票代码? 就像一个简单的例子,如果我要查询"亨廷顿银行"在雅虎的API或任何其他我知道的方法将不会返回结果(因为该股票是官方的" Huntington Bancshares")。可能我可能必须找到初始查询的母公司,以便我查询正确的公司。

1 个答案:

答案 0 :(得分:0)

听起来很酷。您可以尝试为每个公司创建一个元组,并使值成为公司的股票代码和所有可能的昵称。然后,您可以将元组存储在列表中并遍历它们以执行搜索所需的股票代码。

例如,

google = ('GOOG', 'Google', 'Alphabet', 'Alphabet Inc.')
apple = ('AAPL', 'Apple', 'Apple Inc.')
netflix = ('NFLX', 'Netflix', 'Netflix Inc.')
huntington = ('HBAN', 'Huntington Bancshares', 'Huntington Bancshares Incorporated', 'Huntington Bank', 'Huntington')

companies = [google, apple, netflix, huntington]

def getTicker( str ):
    for company in companies:
        if str in company:
            return x[0]  # returns the corresponding ticker

可能有更好的方法来动态填充您的元组和公司列表(即从其他网站或API获取代码和公司昵称),但我认为这是组织它们的好方法。

显然,您必须为“银行”等常见搜索做准备。这将返回列表中的第一家公司,其关键字元组包括“银行”。