如果我有以下列表:
List<String> list = Arrays.asList("hello", "world", "hello");
我应用以下内容(Java8):
list.stream().distinct().collect(Collectors.toString());
然后我会得到一个列表&#34;你好&#34;和&#34;世界&#34;。
但是,在我的情况下,我有一个类型的列表(来自外部api)我想要&#34;绕过&#34;等于方法,理想情况下是比较器,因为它没有涵盖我需要的东西。
假设这个类看起来像这样:
public class Point {
float x;
float y;
//getters and setters omitted
}
在这种情况下,我想要将两个要点定义为相等的标准,例如(30,20)和(30.0001,19.999)。
自定义比较器可以做到这一点,但我发现没有API能够执行Java8 Stream中的distinct(),而是使用比较器(或类似的模式)。
有什么想法?我知道我可以编写这样的函数,但我更喜欢使用现有apis的优雅方式...我对外部库没有限制(如果他们有一个舒适的做法,guava,apache-commons等是受欢迎的我需要的是什么。
答案 0 :(得分:4)
HashingStrategy是您正在寻找的概念。它是一个策略接口,允许您定义equals和hashcode的自定义实现。
public interface HashingStrategy<E>
{
int computeHashCode(E object);
boolean equals(E object1, E object2);
}
Streams不支持哈希策略,但Eclipse Collections支持哈希策略。它具有支持散列策略的集合和映射,以及采用散列策略的distinct()
等方法的重载。
这对字符串很有用。例如,在这里我们可以如何让所有不同的字符串忽略大小写。
MutableList<String> strings = Lists.mutable.with("Hello", "world", "HELLO", "World");
assertThat(
strings.distinct(HashingStrategies.fromFunction(String::toLowerCase)),
is(equalTo(Lists.immutable.with("Hello", "world"))));
或者您可以手动编写散列策略以避免垃圾创建。
HashingStrategy<String> caseInsensitive = new HashingStrategy<String>()
{
@Override
public int computeHashCode(String string)
{
int hashCode = 0;
for (int i = 0; i < string.length(); i++)
{
hashCode = 31 * hashCode + Character.toLowerCase(string.charAt(i));
}
return hashCode;
}
@Override
public boolean equals(String string1, String string2)
{
return string1.equalsIgnoreCase(string2);
}
};
assertThat(
strings.distinct(caseInsensitive),
is(equalTo(Lists.immutable.with("Hello", "world"))));
这也适用于Points,但前提是您可以将非重叠区域内的所有点分组以具有相同的哈希码。如果您使用定义的比较器在两个点足够接近时返回0,那么您可能会遇到传递性问题。例如,点A,B和C可以沿A线和C线下降,它们都接近B但彼此相距很远。不过,如果这对您来说是一个有用的概念,我们欢迎向API添加ListIterable.distinct(Comparator)
的拉取请求。
注意:我是Eclipse Collections的提交者。