Python数据刮擦差异化 - 数百万与之对比

时间:2017-09-02 02:55:03

标签: python pandas csv web-scraping python-requests

我正在搜索互联网上的一些表格,其中数字以不同的数字格式发布:

Animal - Left in Wild
Tigers - 18
Deer - 18m
Pigs - 180000

我设法将m从数字中删除了,但我想知道是否/如何使用if语句允许一些操作以确保我准确记录数字:

if animal.strip("m") == animal.strip("m"):
    left_in_wild = left_in_wild * 1000000

显然代码不起作用,但我想到如何解决这个问题是一个粗略的思考。如果有人可以提供他们认为有用的任何内容,请告诉我。

谢谢!

2 个答案:

答案 0 :(得分:1)

简单的IF声明可以帮助您寻找:

animal = "18m"

if 'm' in animal:
    print animal.strip('m') + ",000,000"

if 'k' in animal:
    print animal.strip('k') + ",000"

返回:

18,000,000

答案 1 :(得分:0)

类似的东西:

import re

def get_number(s):
    try: 
        i=int(re.match('(\d+)', s).group(1))
        if "m" in s:
            i*=1000000
        return i
    except:
        print "No Number"

get_numbers("18m")返回18000000

如果你有成千上万的东西,你甚至可以将它扩展为elif "k" in s块。