找第一个单词重复(匹配相似的姓氏)

时间:2013-03-06 07:58:36

标签: regex

我有一份作者名单。它们可能被列为

  • LASTNAME, FIRSTNAME
  • LASTNAME, F.
  • LASTNAME, F

查找具有相同LASTNAME的所有记录的正则表达式是什么?这样我可以决定是否合并记录,或者如果他们是具有不同名字的作者,则将它们分开。

1 个答案:

答案 0 :(得分:0)

这将始终匹配行开头的第一个单词,该单词应该是姓氏:

/^\w+/

使用此命令查找姓氏。然后做这样的事情:

  • 将姓氏和全名存储在关联数组或编程语言中提供的等效结构中。
  • 每当您到达新行时,请检查列表中是否已存在姓氏。
    • 如果存在,请比较全名并确定要保留的名称。
    • 如果它不存在,请添加它。