我希望能够区分docx文件并发现使用以下代码我们能够从docx文件中提取文本。
unzip -p some.docx word/document.xml | sed -e 's/<[^>]\{1,\}>//g; s/[^[:print:]]\{1,\}//g' | fold -w 80
但是,我很难将其包含在gitattribute文件中。 有人可以评论如何修改此行,以便git使用当前文件而不是docx文件的硬链接
我在git config中尝试过以下操作,但它会导致错误:
[diff "word"]
textconv= unzip -p $LOCAL | sed -e 's/<[^>]\{1,\}>//g; s/[^[:print:]]\{1,\}//g' |