在第一个数字

时间:2017-07-09 03:05:36

标签: python xpath split scrapy

我在使用xpath后出现了这个文字:

',\n                             31.05.2017,\n        20h10\n'

我已经能够通过使用split(',')[1]来获得这个:

'\n                             31.05.2017'

但我想要的只是约会。事情是日期一直在变化,这取决于我正在抓取的页面。所以我需要的是摆脱/ n和出现的第一个数字之前的空格。

如果你能提供帮助,那就太棒了,谢谢你:)。

2 个答案:

答案 0 :(得分:3)

以下是您原始文字的替代方案:

BeanListProcessor<Car> carProcessor = new BeanListProcessor<Car>(Car.class){
    @Override
    public Car createBean(String[] row, Context context) {
        //analyze the row here to determine whether to return an existing instance
        //if you need a new instance, call super.createBean(row, context);
    }
};

In [893]: text = ',\n 31.05.2017,\n 20h10\n' In [898]: text.split(',\n')[1].strip() Out[898]: '31.05.2017' 拆分并从该拆分列表中取出第一项,然后调用,\n并删除前导空格。

答案 1 :(得分:1)

您只需剥离字符串即可删除前导空格和尾随空格;新行字符'\n'也是空格:

>>> '\n                             31.05.2017'.strip()
'31.05.2017'