我需要在Python中创建一个脚本,用于基于json字典替换json文件中的字符串。该文件包含有关专利的信息,看起来像这样:
{
"US-8163793-B2": {
"publication_date": "20120424",
"priority_date": "20090420",
"family_id": "42261969",
"country_code": "US",
"ipc_code": "C07D417/14",
"cpc_code": "C07D471/04",
"assignee_name": "Hoffman-La Roche Inc.",
"title": "Proline derivatives",
"abstract": "The invention relates to a compound of formula (I) wherein A, R 1 -R 6 are as defined in the description and in the claims. The compound of formula (I) can be used as a medicament."
}
}
最初,我使用的是一种基于实体(例如COMPANY)的软件,该软件可以识别所有书写方式不同但相同的单词。例如,公司“ BMW”可以称为“ BMW Ag”,也可以称为“ BMW Group”。而且该字典具有这样的结构(仅部分表示,否则会很长):
{
"RESP_META" : {
,"RESP_WARNINGS" : null
,"RESP_PAYLOAD":
{
"BIOCHEM": [
{
"hitID": "D011392",
"name": "L-Proline",
"frag_vector_array": [
"16#{!Proline!} derivatives"
],
...,
"sectionMeta": {
"8": "$.US-8163793-B2.title|"
}
},
{
(next hit...)
},
...
]
}
考虑到"sectionMeta"
键为我提供了专利ID,例如abstract
,title
或assignee_name
,我想使用此信息查找要在哪个专利中进行替换,然后基于【{1】}键,找到要替换的单词,该单词始终在"frag_vector_array"
之间,例如{!!}
,并且例如,该单词应替换为{! Proline!}
。 "name"
。
我尝试了一些替换公司名称的方法,但我认为我走错了路。这是我开始的代码:
L-Proline
欢迎任何帮助。