我正在进行一些文本文档处理,以便使用apache-tika
将大型文档文件读入字符串。示例:
content = data_manipulate.read_by_tika(document_url)
有些情况我需要使用content.lower()和其他一些案例content
。由于它是一个大字符串,有效使用此字符串进行最大代码优化的最佳做法是什么?
使用两个字符串content
和content_lower=content.lower()
并在需要的地方使用它们是否正确?