我尝试创建一个脚本,允许我指定一个输入文件并从该文件中取出行并将它们复制到一个separetly指定的目标文件中。到目前为止,我已经能够非常接近我的目标但是我遇到的问题以及我似乎无法找到答案(我至少可以理解)是当我搜索我的数据字符串时单词“not”或“is”或任何其他脚本术语在我的字符串中就像它一样,这意味着如果我搜索“这不是我想要的”这样的东西,它会将not运算符置于行动中并且不会复制任何内容。所以我想我的问题是我能做些什么才能阻止这种情况发生(我已将我的脚本添加到底部,这是我的第一次尝试=)
我的第二个问题可能是要求程序稍微多一点,但无论如何我都会问。就像上面说的那样,我有一个包含1000行内容的txt文件(单个行不像一个段落),其中250个以“这是我要复制的行”开头,但后面每个人都说出一个个别原因(这是我要复制的线因为它真棒,导致它的紫色。等等)因为它现在坐在我的脚本将只拉第一个“这是我要复制的部分”并留下它,是否有一个让它从所有线中抓取其余的字符串?
同样,这可能是一件容易的事情,但由于我尝试通过试验和错误进行自我教育,我在故障排除中遇到的一些术语与我遇到的问题一样令人困惑=)
#This will let you search for a string in a file and transfer it to another file
#It will search for texts or numbers
print "This is a tool to search one file and transfer information to another."
print
#select source file
a=open(raw_input("Enter full path of source file using using \\ instead of \: "), "r")
#select destination file
b=open(raw_input("Enter full path of destination file using \\ instead of \: "), "a")
a
b
#actual copy command
copy=raw_input("What are you searching for: ")
for line in a.readlines():
if copy in line:
b.write(copy + '\n')
yes='y'
for again in raw_input("Would you like to search for another line? y/n: "):
if again in yes:
copy=raw_input("What are you searching for: ")
if copy in line:
b.write(copy + '\n')
b.close
a.close
答案 0 :(得分:1)
如果我搜索“这不是我想要的”这样的东西,它就会使非操作符动作并且不会复制任何内容。
那是不可能的。事实上,我只是尝试过,而且没有这样的事情。必须有别的东西你做错了。
是否可以从所有线中抓取其余的字符串?
替换
b.write(copy + '\n')
与
b.write(line)
答案 1 :(得分:0)
您刚刚使用input
切换到raw_input
吗?您正在描述的问题(以及您认为需要在路径中加倍反斜杠的事实)将来自使用python 2下的input()从终端读取。 raw_input
不应该有这样的问题。
你的第二个问题很清楚:不要做b.write(copy + '\n')
,做
b.write(line)
(line
已经包含换行符,正如@lars刚刚指出的那样)
答案 2 :(得分:0)
也许使用python的re模块在这里会更有帮助。例如:
#All your existing code to retrieve input and output file names, etc.
#Convert the user's search string into a raw string
copy = eval("r'%s'" % (raw_input("What are you searching for?: "),))
import re
searchRegEx = re.compile(copy)
for line in a:
matched = searchRegEx.search(line)
if matched != None:
b.write(line)
其次,不是让嵌套循环询问用户是否想要搜索另一行(当你已经在搜索其中一行时),而是包装整个“获取搜索字符串输入并执行搜索逻辑”可能更为谨慎。进入一个函数并在用户仍想继续搜索时重复调用它(即使用布尔值控制流向它的流量,只要用户在询问时输入'y'就设置为True。)
干杯!