无法快速读写文件以使我的脚本能够识别更改

时间:2015-06-14 22:17:23

标签: python beautifulsoup

我正在编写一个脚本,当我最喜欢的YouTuber Casey Neistat上传新视频时,该脚本最终能够通过Twitter帐户发推文。但是,为了做到这一点,我写了一个程序,当它识别出之前的YouTube链接列表时,应该能够将所有链接的“output.txt”文件与之前的视频进行比较。不包括最近上传的视频。我做了两个方法,一个叫做'mainloop',一遍又一遍地运行,看看所有Casey Neistat视频的前一个列表是否与从'getNeistatNewVideo'方法中检索到的一串新链接相同。然而,我遇到的问题是,一旦程序识别出一个新视频,就会转到方法'getNewURL',该方法将采用'output.txt'文件中记录的第一个链接。但是,当我说要打印这个新网址时,它说没有任何内容。我的预感是,这是因为python没有足够快地读取和写入output.txt文件,但是我可能错了。

我的代码如下:

import bs4
import requests
import re
import time
import tweepy


'''
This is the information required for Tweepy


CONSUMER_KEY =
CONSUMER_SECRET = 
ACCESS_KEY = 
ACCESS_SECRET = 
auth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET)
auth.set_access_token(ACCESS_KEY, ACCESS_SECRET)
api = tweepy.API(auth)

End of Tweepy Information
'''

root_url = 'https://www.youtube.com/'
index_url = root_url + 'user/caseyneistat/videos'

def getNeistatNewVideo():

    response = requests.get(index_url)
    soup = bs4.BeautifulSoup(response.text)
    return [a.attrs.get('href') for a in soup.select('div.yt-lockup-thumbnail a[href^=/watch]')]


def mainLoop():


    results = str("\n".join(getNeistatNewVideo()))

    past_results = open('output.txt').read()

    if results == past_results:
        print("No new videos at this time")

    else:
        print("There is a new video!")

        print('...')
        print('Writing to new text file')
        print('...')


        f = open("output.txt", "w")
        f.write(results)

        print('...')
        print('Done writing to new text file')
        print('...')

        getNewURL()

def getNewURL():

    url_search = open('output.txt').read()
    url_select = re.search('(.+)', url_search)
    print("New Url found: " + str(url_select))


while True:

    mainLoop()

    time.sleep(10)

    pass

1 个答案:

答案 0 :(得分:5)

您永远不会关闭文件,这可能是问题所在。例如,在mainLoop()中您应该:

f = open("output.txt", "w")
f.write(results)
f.close()

甚至更好:

with open('output.txt', 'w') as output:
    output.write(results)

一般情况下,在您打开文件的所有地方(即使它处于' r'模式)中使用with语句是个好主意它会自动关闭文件,并且还可以清楚地说明代码的哪个部分在给定时间与文件一起工作。