我即将盲目主演这个问题,所以我不得不问:
我有一条线索:重新排列代码,使错误信息不同:
我收到错误:min_analyzer = SpaceSeparatedTokenizer()| LowercaseFilter()| mitt_filter() TypeError: _ 调用 _ ()只需要2个参数(给定1个)
从这段代码:
import sqlite3
from whoosh.fields import Schema, TEXT, ID
from whoosh.index import create_in
from whoosh.analysis import SpaceSeparatedTokenizer
from whoosh.analysis import StopFilter
from whoosh.analysis import LowercaseFilter
mitt_filter = StopFilter(stoplist=frozenset(['and', 'is', 'it', 'an', 'as', 'at', 'have', 'in', 'yet', 'if', 'from', 'for', 'when', 'by', 'to', 'you', 'be', 'we', 'that', 'may', 'not', 'with', 'a', 'on', 'your', 'this', 'of', 'us', 'will', 'can', 'the', 'or', 'are', u'og', u'i', u'-', u'\\xa0', u'for', u'av', u'til', u'p\\xe5', u'the', u'and', u'as', u'med', u'er', u'en', u'of', u'to', u'har', u'Vi', u'kontakt', u'som', u'\\xe5', u'v\\xe5re', u'vi', u'in', u'oss', u'a', u'det', u'at', u'is', u'\\u2013', u'/', u'\\xbb', u'kan', u'by', u'skal', 'fra', u'ut', u'with', u'be', u'v\\xe5rt', u'mer', u'du', u'\\xa9', u'us', u'on', u'hopp', u'ogs\\xe5', u'Hopp']), minsize=2, maxsize=None, renumber=False)
min_analyzer = SpaceSeparatedTokenizer() | LowercaseFilter() | mitt_filter()
schema = Schema(Hoveddomene=ID, innhold=TEXT (stored=True, analyzer=min_analyzer(removestops=False, positions=True)), webadresse=ID)
ix = create_in('/Users/Sverdrup/virtualenv-1.6.1/whoosh/whoosh directory/', schema)
如果我像这样重新安排代码:
import sqlite3
from whoosh.fields import Schema, TEXT, ID
from whoosh.index import create_in
from whoosh.analysis import SpaceSeparatedTokenizer
from whoosh.analysis import StopFilter
from whoosh.analysis import LowercaseFilter
min_analyzer = SpaceSeparatedTokenizer() | LowercaseFilter() | StopFilter(stoplist=frozenset(['and', 'is', 'it', 'an', 'as', 'at', 'have', 'in', 'yet', 'if', 'from', 'for', 'when', 'by', 'to', 'you', 'be', 'we', 'that', 'may', 'not', 'with', 'a', 'on', 'your', 'this', 'of', 'us', 'will', 'can', 'the', 'or', 'are', u'og', u'i', u'-', u'\\xa0', u'for', u'av', u'til', u'p\\xe5', u'the', u'and', u'as', u'med', u'er', u'en', u'of', u'to', u'har', u'Vi', u'kontakt', u'som', u'\\xe5', u'v\\xe5re', u'vi', u'in', u'oss', u'a', u'det', u'at', u'is', u'\\u2013', u'/', u'\\xbb', u'kan', u'by', u'skal', 'fra', u'ut', u'with', u'be', u'v\\xe5rt', u'mer', u'du', u'\\xa9', u'us', u'on', u'hopp', u'ogs\\xe5', u'Hopp']), minsize=2, maxsize=None, renumber=False)
schema = Schema(Hoveddomene=ID, innhold=TEXT (stored=True, analyzer=min_analyzer(removestops=False, positions=True)), webadresse=ID)
ix = create_in('/Users/Sverdrup/virtualenv-1.6.1/whoosh/whoosh directory/', schema)
这个线索让我相信它是stopFilter函数的声明是错误的,但我看不出它是什么?
非常感谢任何帮助!
我收到以下错误:schema = Schema(Hoveddomene = ID,innhold = TEXT(stored = True,analyzer = min_analyzer(removestops = False,positions = True)),webadresse = ID) TypeError: _ 调用 _ ()至少需要2个参数(给定1个)
答案 0 :(得分:1)
analyzer
Schem
构造函数的__call__
参数不正确。分析器必须是具有call
方法的函数或类,因此您的错误为{{1}}。
答案 1 :(得分:1)
您可能只想要mitt_filter
,否则您在实例化对象上执行__call__
,这与您的第二个示例不同。
min_analyzer = SpaceSeparatedTokenizer() | LowercaseFilter() | mitt_filter
由于您的第二个示例更正确,该错误表示您在向min_analyzer
构造函数发送参数时可能不应将参数传递给Schema
。我基本上说analyzer=min_analyzer
可能更正确,removestops
和positions
参数应该在其他地方提供。