所以在我之前提出的问题之后,(Replacing special patterns in a string, reading from a file)我似乎在那里解决了问题。但现在我几乎坚持这个问题一个月了。
所以使用那里的代码,它从文件中读取数据,解析它(因此它用字符串划分字段)但现在我希望程序识别数据(所以它需要在这个例子中识别作者,发布年份,isbn)并且必须将该数据重新排列为特定的形式/模式,例如:
INPUT DATA: Aubrecht, Christoph; Özceylan, Aubrecht Dilek; Klerx, Joachim; Freire, Sérgio (2013) “Future-oriented activities as a concept for improved disaster risk management. Disaster Advances”, 6(12), 1-10. (IF = 2.272) E-ISSN 2278-4543. REVISTA INDEXADA NO WEB OF SCIENCE
AUTHORS:Aubrecht, Christoph; Özceylan, Aubrecht Dilek; Klerx, Joachim; Freire, Sérgio
YEAR: 2013
ISBN: 2278-4543
TEMPLATE 1: AUTHOR YEAR ISSN (Aubrecht, Christoph || 2013 || 2278-4543 )
TEMPLATE 2: YEAR ISSN AUTHOR (2013 || 2278-4543 || Aubrecht, Christoph )
TEMPLATE 3: ISSN YEAR AUTHOR (2278-4543 || 2013 || Aubrecht, Christoph )
此目标是将此数据导入/导出到Excel,然后导入SQL数据库。我做了我的研究,我得出的结论(不确定是否正确)是Django似乎是一个很好的方法,因为它可以创建模板(https://docs.djangoproject.com/en/dev/ref/templates/api/)甚至是使用pandas数据帧的数据框({{3} },How to rearrange some elements as a data frame),但我不确定如何实现它们,或者它是否是最好的方法(或者如果它甚至可以让程序识别这些元素并重新排列它们)。
我搜索的类似问题是: Rearrange data for pandas dataframe?(没有帮助) using a key to rearrange string