从正文内容获取PDF文件的标题

时间:2018-08-01 09:28:21

标签: python python-3.x

皮肤科 皮肤科医生是在皮肤,头发和指甲以及粘膜疾病的诊断和医学/外科管理方面受过训练和专业知识的医师。

妇科 一名妇产科医生专注于孕妇在怀孕之前,期间和之后的健康,诊断和治疗生殖系统疾病和相关疾病

请考虑以上信息存在于PDF文件中。我的工作是根据诸如(皮肤,怀孕)之类的字段来检索专科(皮肤科/妇科)。任何建议。谢谢。

1 个答案:

答案 0 :(得分:0)

分别创建2个针对皮肤科,妇科的单词列表,如下所示:

!!set {a , b}: value

$validationArray = []; foreach ($request->file('file_field') as $key => $file) { $validationArray['file_field.'.$key.'.size'] => 'The ' . $file->getClientOriginalName() . ' must be 1024 kilobytes.'; } $messages = [ 'file_field.*.mimes' => 'File(s) must be of type: :values.', $validationArray ]; $this->validate( $request, [ 'file_field' => 'bail|required|array', 'file_field.*' => 'mimes:gif,jpg,jpeg,png|size:1024' ], $messages); 开始,如果单词在“皮肤科列表” dermatology_list = ["skin", "hair", "nails"] gynecology_list = ["women", "pregnancy", "reproductive"] 中,则一次解析一个单词,如果该单词在“妇科列表” score = 0中。最后,如果得分为阳性,则您的答案为皮肤病;如果得分为 阴性 ,则答案为是 妇科 answer应该可以帮助您解析PDF和提取数据。