我有一个要求,如果给定DataInputStream
,我会将句柄返回到另一个DataInputstream
,我可以过滤掉具有特定文本模式的内容(模糊内容与正则表达式。)
根据建议编辑。
我想在org.apache.hadoop.fs.FSDataInputStream上构建一个过滤流。此类(FSDataInputStream)是Apache Hadoop-common项目的一部分。目的是提供FSDataInputStream的句柄,该句柄还将正则表达式应用于流。我知道FSDataInputStream是字节流(如果不是这样,请纠正我),我们需要在应用过滤器之前转换为字符流。
答案 0 :(得分:2)
标准库提供FilterInputStream(请参阅https://docs.oracle.com/javase/7/docs/api/java/io/FilterInputStream.html)
我们的想法是继承此类并重写方法并在将数据返回给调用者之前过滤掉正则表达式。
由于它扩展了InputStream,因此可以在任何需要InputStream的地方使用它。