如何在DataInputStream上有效地进行正则表达式匹配

时间:2015-05-08 20:44:52

标签: java regex datainputstream

我有一个要求,如果给定DataInputStream,我会将句柄返回到另一个DataInputstream,我可以过滤掉具有特定文本模式的内容(模糊内容与正则表达式。)

有人可以向我提供有关如何解决问题的任何指示吗?有没有图书馆可以做到这一点?

根据建议编辑。

我想在org.apache.hadoop.fs.FSDataInputStream上构建一个过滤流。此类(FSDataInputStream)是Apache Hadoop-common项目的一部分。目的是提供FSDataInputStream的句柄,该句柄还将正则表达式应用于流。我知道FSDataInputStream是字节流(如果不是这样,请纠正我),我们需要在应用过滤器之前转换为字符流。

1 个答案:

答案 0 :(得分:2)

标准库提供FilterInputStream(请参阅https://docs.oracle.com/javase/7/docs/api/java/io/FilterInputStream.html

我们的想法是继承此类并重写方法并在将数据返回给调用者之前过滤掉正则表达式。

由于它扩展了InputStream,因此可以在任何需要InputStream的地方使用它。