抓取工作在本地但不在线

时间:2015-03-11 11:13:14

标签: python web-scraping beautifulsoup vps debian-7.6.0

我有这段代码:

    soup = BeautifulSoup(urllib2.urlopen('http://zse.hr/default.aspx?id=17560&dionica=CROBEX'))

    table = soup.find('table', attrs = { "id" : "dnevna_trgovanja"})

    rows = []

    for row in table.find_all('tr'):
        rows.append([val.text.encode('utf8') for val in row.find_all('td')])



    with open(simbol + 'update.csv', 'wb') as f:
        writer = csv.writer(f)
        writer.writerows(row for row in rows if row)

本地我得到了很好的格式化的csv,看起来像这样

日期,开盘价,最高价,最低价,最后价,变动百分比,指数成交量 2015年3月10日," 1.027,02"" 1.027,02"" 1.018,63"" 1.023,85"&# 34; - 0,16%"," 2.324.383,80" 2015年9月3日," 1.027,19"" 1.028,71"" 1.024,05"" 1.025,48"&# 34; - 0,28%"," 4.914.327,14" 2015年3月6日," 1.025,77"" 1.028,33"" 1.018,96"" 1.028,33"&# 34; 0,30%"" 5.760.747,46" 2015年3月5日," 1.018,19"" 1.026,40"" 1.018,19"" 1.025,21"&# 34; 0,77%"" 10.529.834,80" 2015年3月4日," 1.015,10"" 1.020,23"" 1.013,48"" 1.017,37"&# 34; 0,04%"" 2.529.082,23" 2015年3月3日," 1.016,76"" 1.020,55"" 1.014,03"" 1.016,98"&# 34; 0.01%"" 6.967.830,37" 2015年3月2日," 1.018,68"" 1.019,79"" 1.015,49"" 1.016,92"&# 34; - 0,15%"," 2.452.277,01" 2015年2月27日," 1.014,02"" 1.020,71"" 1.013,90"" 1.018,42"&# 34; 0,43%"" 9.259.299,68" 2015年2月26日," 1.008,59"" 1.018,17"" 1.006,84"" 1.014,01"&# 34; 0,56%"" 4.093.826,04" 2015年2月25日," 1.012,17"" 1.013,64"" 1.008,19"" 1.008,32"&# 34; - 0,34%"," 2.657.244,01" 2015年2月24日," 1.012,13"" 1.013,86"" 1.009,15"" 1.011,77"&# 34; 0.01%"" 4.191.901,39" 2015年2月23日," 1.014,95"" 1.015,83"" 1.007,83"" 1.011,71"&# 34; - 0,32%"," 3.320.966,59" 2015年2月20日," 1.009,79"" 1.016,83"" 1.006,33"" 1.014,95"&# 34; 0,52%"" 4.613.099,55" 2015年2月19日," 1.012,15"" 1.012,15"" 1.007,82"" 1.009,69&#​​34;&# 34; - 0,36%"," 2.519.468,20" 2015年2月18日," 1.015,28"" 1.017,33"" 1.011,20"" 1.013,31"&# 34; - 0,15%"," 6.790.678,01" 2015年2月17日," 1.015,88"" 1.020,19"" 1.014,46"" 1.014,86"&# 34; - 0,17%"," 4.307.328,02" 2015年2月16日," 1.023,31"" 1.028,33"" 1.016,24"" 1.016,55"&# 34; - 0,74%"," 4.164.024,61" 2015年2月13日," 1.020,60"" 1.025,28"" 1.016,73"" 1.024,09"&# 34; 0,34%"" 4.337.528,98" 2015年2月12日," 1.020,12"" 1.022,73"" 1.017,93"" 1.020,65"&# 34; 0.05%"" 3.518.091,90" 2015年2月11日," 1.020,94"" 1.027,32"" 1.016,67"" 1.020,17"&# 34; 0.05%"" 8.935.979,82"

但是当我在Debian VSP上运行相同的脚本时,csv输出文件变得非常混乱。有没有人遇到过这个?

1 个答案:

答案 0 :(得分:0)

我猜“乱”意味着当你在windows中打开CSV文件时,它会显示为一个大行?它与windows中的默认\ r \ n和Linux中的\ n有区别。只需使用一些非记事本编辑器就可以了(例如获取崇高文本http://www.sublimetext.com/3