我有一个mapper.py脚本,我有一个使用排序管道的reducer.py脚本。
mapper.py
#!/usr/bin/env python
import sys
import re
import fileinput
# Read pairs as lines of input from STDIN
for line in fileinput.input():
filename = fileinput.filename()
filename = filename.replace("source_text/", "")
print filename
分选器/减速器
#!/usr/bin/env python
import sys
for line in sys.stdin:
print line
然后我在我的控制台中运行它
cat source_text/* | ./mapper.py | sort | ./reducer.py
问题是,当映射器中的文件名在传递给reducer脚本时正确显示文件名时,它会替换为<stdin>
我的问题是如何将真实文件名传递给第二个脚本?