在openrefine中对单元格中的年份列表进行排序

时间:2018-10-17 15:27:17

标签: sorting openrefine

就像标题一样,我有一个包含日记的数据集。对于每本日记,我都有一个带有这些混合日期的单元格:

1690-1686-1716-1726-1683-1730-1684-1715-1693-1712-1695-1688-1724-1685-1692-1707- -1702-1731-1710-1709-1704-1696-1687-1699-1708-1703-1691-1697-1720-1694-1714-1729-1721 -1713-1725-1705-1727-1711-1719-1728-1723-1717-1718-1700-1689-1722-1701-1698-1706

我该如何对日期进行排序并仅获取第一个和最后一个发布日期?

预先感谢

1 个答案:

答案 0 :(得分:2)

我不确定您需要什么,但是如果我没看错的话,应该这样做:

value.split(' -- ').sort()[0]
value.split(' -- ').sort()[-1]

第一个给您最小值,第二个给您最大值。对于此数据,您将获得1683和1731。

您可以两次使用“基于此列添加列”来获取不同单元格中的开始和结束年份,也可以使用“ +”再次连接值,如下所示:

value.split(' -- ').sort()[0] + "-" + value.split(' -- ').sort()[-1]