我正在用Java编写一个带有HtmlUnit的机器人,它从两个不同的电子商务网站A和B获取数据(名称和价格)。
一旦我收集了csv文件中的所有项目(名称;价格),我会尝试比较它们以了解哪些项目相同。
A项的名称很少等于B项的名称,但通常它们有一些相似之处,例如型号名称或品牌名称。
有人有想法或知道一种机制来比较这些项目并知道它们是否是同一个项目?
编辑:
至少有82,000个itemA和2000个itemB,我需要一个分配它的内射函数。
itemA由以下组成:品牌名称和型号名称。 (结构 - >好)。
itemB由以下内容组成:描述性文本,其中包含品牌名称和型号名称,没有任何结构。
答案 0 :(得分:1)
为什么不使用String equals() Method
。此方法将此字符串与指定的对象进行比较。当且仅当参数不为null并且是表示与此对象相同的字符序列的String对象时,结果才为真。以下是工作代码的示例:
String Str1 = new String("This is really not immutable!!");
String Str2 = Str1;
String Str3 = new String("This is really not immutable!!");
boolean retVal;
retVal = Str1.equals( Str2 );
System.out.println("Returned Value = " + retVal );
retVal = Str1.equals( Str3 );
System.out.println("Returned Value = " + retVal );
如果String相等,则此方法返回true;否则就是假的。