标签: python
我有一个Django项目,我希望用户上传一个包含MCQ /填充空白类型问题的docx文件。我想提取这些问题并将个别问题存储在数据库中。
我已经设置了数据库,但找不到从docx文件中提取问题的任何内容。
我可以使用textract(https://textract.readthedocs.io/en/stable/)读取docx文件,它给出了一个字符串列表。但是如何检查字符串是问题还是选项还是仅仅是指令?我是否必须制定具体规则来提取问题,或者Python中是否有任何可以帮助我解决此问题的库?