我的任务是在Python中创建一个搜索CSV文件的程序;学术论文清单(作者,年份,标题,期刊 - 实际上是TSV)。
使用我当前的代码,我可以实现正确的输出(如信息中的正确),但格式不正确。
我得到的是什么;
['Albers; Bergman','1995','the audible Web','Proc。 ACM CHI']
我需要的是这种格式;
作者/秒。 (年)。标题。日志。
所以逗号会更改为句号(句点)。 如果有两位作者,那么作者之间的; 也应该更改& 符号,或者应该有逗号后跟& 三位或更多作者。 即
格伦& FREG。 (1995年)。很酷的书名。史诗期刊标题。
或
佩里,史密斯@琼斯。 (1998)。冷却器书名。无聊的期刊名称。我不完全确定如何做到这一点。我已经在Stackoverflow上搜索了python引用,google和这里,但是没有遇到任何东西(至少我理解)。这里有很多关于完全删除标点符号的内容,但这不是我追求的内容。
我首先想到替换功能会起作用,但它给了我这个错误。 (我将保留代码以显示我正在尝试的内容,但注释掉了)
str.replace(',', '.')
TypeError: replace() takes at least 2 arguments (1 given)
它不会完全解决我的问题,但我认为这是一个可以摆脱的问题。我认为str.replace()不会采用标点符号吗?
无论如何,下面是我的代码。有人还有其他想法吗?
import csv
def TitleSearch():
titleSearch = input("Please enter the Title (or part of the title). \n")
for row in everything:
title = row[2]
if title.find(titleSearch) != -1:
print (row)
def AuthorSearch():
authorSearch = input("Please type Author name (or part of the author name). \n")
for row in everything:
author = row[0]
if author.find(authorSearch) != -1:
#str.replace(',', '.')
print (row)
def JournalSearch():
journalSearch = input("Please type in a Journal (or part of the journal name). \n")
for row in everything:
journal = row[3]
if journal.find(journalSearch) != -1:
print (row)
def YearSearch():
yearSearch = input("Please type in the Year you wish to search. If you wish to search a decade, simply enter the first three numbers of the decade; i.e entering '199' will search for papers released in the 1990's.\n")
for row in everything:
year = row[1]
if year.find(yearSearch) != -1:
print (row)
data = csv.reader (open('List.txt', 'rt'), delimiter='\t')
everything = []
for row in data:
everything.append(row)
while True:
searchOption = input("Enter A to search by Author. \nEnter J to search by Journal name.\nEnter T to search by Title name.\nEnter Y to search by Year.\nOr enter any other letter to exit.\nIf there are no matches, or you made a mistake at any point, you will simply be prompted to search again. \n" )
if searchOption == 'A' or searchOption =='a':
AuthorSearch()
print('\n')
elif searchOption == 'J' or searchOption =='j':
JournalSearch()
print('\n')
elif searchOption == 'T' or searchOption =='t':
TitleSearch()
print('\n')
elif searchOption == 'Y' or searchOption =='y':
YearSearch()
print('\n')
else:
exit()
感谢任何可以提供帮助的人,非常感谢!
答案 0 :(得分:1)
到目前为止你所获得的是一个很好的开始;你只需要进一步处理它。将print(row)
替换为PrettyPrintCitation(row)
,然后添加以下功能。
基本上,您似乎需要使用开关格式化作者,最好将其作为函数实现。然后,您可以使用一个很好的格式字符串来处理其余的。假设您的参考rows
如下所示:
references = [
['Albers', '1994', 'The audible Internet', 'Proc. ACM CHI'],
['Albers;Bergman', '1995', 'The audible Web', 'Proc. ACM CHI'],
['Glenn;Freg', '1995', 'Cool book title', 'Epic journal title'],
['Perry;Smith;Jones', '1998', 'Cooler book title', 'Boring journal name']
]
然后以下内容将为您提供我认为您正在寻找的内容:
def PrettyPrintCitation(row) :
def adjustauthors(s):
authorlist = s[0].split(';')
if(len(authorlist)<2) :
s[0] = authorlist[0]
elif(len(authorlist)==2) :
s[0] = '{0} & {1}'.format(*authorlist)
else :
s[0] = ', '.join(authorlist[:-1]) + ', & ' + authorlist[-1]
return s
print('{0}. ({1}). {2}. {3}.'.format(*adjustauthors(row)))
适用于上面的引文,这给你
Albers. (1994). The audible Internet. Proc. ACM CHI.
Albers & Bergman. (1995). The audible Web. Proc. ACM CHI.
Glenn & Freg. (1995). Cool book title. Epic journal title.
Perry, Smith, & Jones. (1998). Cooler book title. Boring journal name.
(我假设您提出的输出中的“@”是一个错误...)
答案 1 :(得分:0)
你需要处理你的python语法。
尝试以下几点:
authorlist=row[0].split(';') # split the multiple authors on semicolon
authors=" & ".join(ahthorlist) # now join them together with ampersand
print"""%s. (%s) %s.""" % (authorlist,row[1],row[2]) # print with pretty brackets etc.