检查Github中是否有更新版本的本地文件,带R

时间:2013-05-16 03:12:19

标签: r git github download

简而言之:我需要在Github托管的文件中获取上次更改的日期。

总之:鉴于在Github中我有一个文件(一个R工作区),偶尔会更新,我想在R中创建一个函数来检查我的本地文件是否比repo中的文件旧(如果你很好奇,我的动机会在这篇文章的末尾公开)。 This is the file我在谈论。

原则上它应该有点容易,因为每个文件都有history page与之关联,但我的知识太差,不知道如何处理它。另外,this Q似乎暗示某种方式使用php做我想要的东西,但这对我来说真的是无法识别,所以我不知道它是否能以任何方式提供帮助。

所以,正如我在这篇文章的简短版本中所说,我需要找到一种方法来检索此文件的最后一次提交的日期。我可以找到一些方法将其与我之后的本地文件的提交日期进行比较。

提前致谢, 涓

动机:我正在使用R基础知识的在线课程,如果练习的解决方案是正确的(即学生可以立即检查他们的结果),则使用系统进行自我检查。该系统使用具有定期更新的功能和数据的文件,因为我经常发现错误和新问题。所以我的目标是有一个功能告诉学生是否有更新的文件。找到一种下载它并替换旧版的方法也很简洁,但现在是次要的。

3 个答案:

答案 0 :(得分:2)

似乎你需要github repo的本地克隆。暂时忘记R的语言细节(我不知道R),在git中,您可以通过git log以多种方式获取最新日期。从git log帮助文件(git help log),在占位符部分下:

%cd: committer date
%cD: committer date, RFC2822 style
%cr: committer date, relative
%ct: committer date, UNIX timestamp
%ci: committer date, ISO 8601 format

您可以使用以下git log命令从项目根目录检索文件的最新提交的UNIX时间戳(自1970年1月1日开始以来的几秒钟 - 非常容易比较) - < / p>

git log --format=%ct -1 -- ejercicios-de-programacion/rep-3/datos

返回一个数字,例如1368691710,但您也可以使用列出的其他格式。

现在您只需要找到一种方法从R进行系统调用,将项目root作为工作目录。 This SO post可能会有所帮助(但同样,我不是R)。

答案 1 :(得分:2)

问题是要保持下载的git-time。下面的解决方案将每次下载后的文件时间设置为Git日期,以供下次检查。

library(RCurl)
library(rjson)
destination = "datos" # assume current directory
repo = "https://api.github.com/repos/jumanbar/Curso-R/"
path = "ejercicios-de-programacion/rep-3/datos"
myopts = curlOptions(useragent="whatever",ssl.verifypeer=FALSE)

d = fromJSON(getURL(paste0(repo,"commits?path=",path),
                useragent="whatever",ssl.verifypeer=FALSE))[[1]]
gitDate  = as.POSIXct(d$commit$author$date)
MustDownload = !file.exists(destination) |  file.info(destination)$mtime > gitDate
if (MustDownload){
  url = d$url
  commit = fromJSON(getURL(url, .opts=myopts))
  files = unlist(lapply(commit$files,"[[","filename"))
  rawfile = commit$files[[which(files==path)]]$raw_url
  download.file(rawfile,destination,quiet=TRUE)
  Sys.setFileTime(destination,gitDate)
  print("File was downloaded")
}

从R看来,useragent和ssl.verifypeer是必需的;无需命令行即可运行。如果你有安全意识,那就有关于那个主题的文档,但我采取了简单的提交路径。

答案 2 :(得分:0)

也许你可以使用“git status”命令(告诉你是否有新的提交)与cronjobs组合。但是你需要一个本地克隆。我从未尝试过在cronjob中使用命令的输出。