美国航空航天局图片下载

时间:2019-11-03 07:34:06

标签: bash awk web-scraping sed grep

我想使用以下选项从美国航空航天局下载图像。

  1. 给定一个特定的日期,脚本应该能够下载该日期发布的图像

  2. 给定日期,脚本应该能够下载标题,说明文字和字幕

  3. 给定日期,脚本应该能够下载标题,说明文字和字幕

以下是我尝试过的代码,但功能不完全。

GET_DESCRIPTION="yes"

PICTURES_DIR=~/Pictures

DESCRIPTION_DIR=~

function get_page {
    echo "Downloading page to find image"
    wget http://apod.nasa.gov/apod/ --quiet -O /tmp/apod.html
    grep -m 1 jpg /tmp/apod.html | sed -e 's/<//' -e 's/>//' -e 's/.*=//' -e 's/"//g' -e 's/^/http:\/\/apod.nasa.gov\/apod\//' > /tmp/pic_url
}

function save_description {
    if [ ${GET_DESCRIPTION} == "yes" ]; then
        echo "Getting description from page"
        # Get description
        if [ -e $DESCRIPTION_DIR/description.txt ]; then
            rm $DESCRIPTION_DIR/description.txt
        fi

        if [ ! -e /tmp/apod.html ]; then
            get_page
        fi

        echo "Parsing description"
        sed -n '/<b> Explanation: <\/b>/,/<p> <center>/p' /tmp/apod.html |
        sed -e :a -e 's/<[^>]*>//g;/</N;//ba' |
        grep -Ev 'Explanation:' |
        tr '\n' ' ' |
        sed 's/  /\n\n/g' |
        awk 'NF { print $0 "\n" }' |
        sed 's/^[ \t]*//' |
        sed 's/[ \t]*$//' > $DESCRIPTION_DIR/description.txt
    fi
}

TODAY=$(date +'%Y%m%d')

if [ ! -e ~/Pictures/${TODAY}_apod.jpg ]; then
    echo "We don't have the picture saved, save it"

    get_page

    PICURL=`/bin/cat /tmp/pic_url`

    echo  "Picture URL is: ${PICURL}"

    echo  "Downloading image"
    wget --quiet $PICURL -O $PICTURES_DIR/${TODAY}_apod.jpg

    echo "Setting image as wallpaper"
    gconftool-2 -t string -s /desktop/gnome/background/picture_filename $PICTURES_DIR/${TODAY}_apod.jpg

    save_description

else
    get_page

    PICURL=`/bin/cat /tmp/pic_url`

    echo  "Picture URL is: ${PICURL}"

    SITEFILESIZE=$(wget --spider $PICURL 2>&1 | grep Length | awk '{print $2}')
    FILEFILESIZE=$(stat -c %s $PICTURES_DIR/${TODAY}_apod.jpg)

    if [ $SITEFILESIZE != $FILEFILESIZE ]; then
        echo "The picture has been updated, getting updated copy"
        rm $PICTURES_DIR/${TODAY}_apod.jpg


        PICURL=`/bin/cat /tmp/pic_url`

        echo  "Downloading image"
        wget --quiet $PICURL -O $PICTURES_DIR/${TODAY}_apod.jpg

        echo "Setting image as wallpaper"
       $PICTURES_DIR/${TODAY}_apod.jpg

        save_description
    else
        echo "Picture is the same, finishing up"
    fi
fi

请问我对bash还是很陌生,我从GitHub找到了上面的代码。这不是我的工作。我可以理解代码中正在发生的事情,但它并没有满足我的要求。请帮助

1 个答案:

答案 0 :(得分:0)

要修改现有代码以下载特定日期,请更改:

TODAY=$(date +'%Y%m%d')

收件人:

TODAY=$1

并通过像这样运行脚本将日期传递给脚本:

./nasa.sh 20191031

图像将保存在~/Pictures中,说明将另存为~/description.txt。 (~表示您的主目录。)您可以通过更改脚本顶部的以下变量分配来更改图像和描述目标目录:

PICTURES_DIR=~/Pictures
DESCRIPTION_DIR=~

PS:删除有关将图像设置为桌面墙纸的这些行:

echo "Setting image as wallpaper"
gconftool-2 -t string -s /desktop/gnome/background/picture_filename $PICTURES_DIR/${TODAY}_apod.jpg