如何从文本获取信息并将其安全保存在python中

时间:2020-04-12 13:14:11

标签: python-3.x text python-textprocessing

因此,我尝试制作脱机词典,并使用.txt文件作为单词的来源。我对此有一些疑问。如何在文本文件中找到特定单词并将其保存在变量中?文件的长度也很重要,会影响速度吗?那只是我的.txt文件的一部分:

Abendhimmel mвечернонебе。|-| ||| Abendkasse f Theat剧院。 Abendkleid nвечернарокля。|-| 阿本兰郡gehЗападът。|-|

我想要保存的是麦芽汁,例如Abendkasse和其他所有东西,直到这个符号|-|为止。在一个变量中。感谢您的帮助!

1 个答案:

答案 0 :(得分:1)

我建议您查看python的标准库函数(在打开的文件上),称为realines()和read()。我不知道您的文件有多大,但是您通常可以将整个内容读入ram(带有读取或读取行),然后搜索您得到的字符串。 Searchin可以使用正则表达式或仅通过简单的循环即可完成。

文件的长度很重要,因为打开较大的文件将花费更长的时间。尽管通常这仍然是相当快的,即使对于大型文本文件也是如此。实际上,我认为在许多情况下,首先读取整个文件会更快,因为一旦将其读入ram,对其进行的所有操作都会更快。

一个例子:


with open("yourlargetextfile.txt", f):
    contents = f.readlines()
    for line in contents:
        # split every line into parts from |-| to the next |-|
        parts = line.split("|-|")