简而言之:我需要在Github托管的文件中获取上次更改的日期。
总之:鉴于在Github中我有一个文件(一个R工作区),偶尔会更新,我想在R中创建一个函数来检查我的本地文件是否比repo中的文件旧(如果你很好奇,我的动机会在这篇文章的末尾公开)。 This is the file我在谈论。
原则上它应该有点容易,因为每个文件都有history page与之关联,但我的知识太差,不知道如何处理它。另外,this Q似乎暗示某种方式使用php做我想要的东西,但这对我来说真的是无法识别,所以我不知道它是否能以任何方式提供帮助。
所以,正如我在这篇文章的简短版本中所说,我需要找到一种方法来检索此文件的最后一次提交的日期。我可以找到一些方法将其与我之后的本地文件的提交日期进行比较。
提前致谢, 涓
动机:我正在使用R基础知识的在线课程,如果练习的解决方案是正确的(即学生可以立即检查他们的结果),则使用系统进行自我检查。该系统使用具有定期更新的功能和数据的文件,因为我经常发现错误和新问题。所以我的目标是有一个功能告诉学生是否有更新的文件。找到一种下载它并替换旧版的方法也很简洁,但现在是次要的。
答案 0 :(得分:2)
似乎你需要github repo的本地克隆。暂时忘记R的语言细节(我不知道R),在git中,您可以通过git log
以多种方式获取最新日期。从git log
帮助文件(git help log
),在占位符部分下:
%cd: committer date
%cD: committer date, RFC2822 style
%cr: committer date, relative
%ct: committer date, UNIX timestamp
%ci: committer date, ISO 8601 format
您可以使用以下git log
命令从项目根目录检索文件的最新提交的UNIX时间戳(自1970年1月1日开始以来的几秒钟 - 非常容易比较) - < / p>
git log --format=%ct -1 -- ejercicios-de-programacion/rep-3/datos
返回一个数字,例如1368691710,但您也可以使用列出的其他格式。
现在您只需要找到一种方法从R进行系统调用,将项目root作为工作目录。 This SO post可能会有所帮助(但同样,我不是R)。
答案 1 :(得分:2)
问题是要保持下载的git-time。下面的解决方案将每次下载后的文件时间设置为Git日期,以供下次检查。
library(RCurl)
library(rjson)
destination = "datos" # assume current directory
repo = "https://api.github.com/repos/jumanbar/Curso-R/"
path = "ejercicios-de-programacion/rep-3/datos"
myopts = curlOptions(useragent="whatever",ssl.verifypeer=FALSE)
d = fromJSON(getURL(paste0(repo,"commits?path=",path),
useragent="whatever",ssl.verifypeer=FALSE))[[1]]
gitDate = as.POSIXct(d$commit$author$date)
MustDownload = !file.exists(destination) | file.info(destination)$mtime > gitDate
if (MustDownload){
url = d$url
commit = fromJSON(getURL(url, .opts=myopts))
files = unlist(lapply(commit$files,"[[","filename"))
rawfile = commit$files[[which(files==path)]]$raw_url
download.file(rawfile,destination,quiet=TRUE)
Sys.setFileTime(destination,gitDate)
print("File was downloaded")
}
从R看来,useragent和ssl.verifypeer是必需的;无需命令行即可运行。如果你有安全意识,那就有关于那个主题的文档,但我采取了简单的提交路径。
答案 2 :(得分:0)
也许你可以使用“git status”命令(告诉你是否有新的提交)与cronjobs组合。但是你需要一个本地克隆。我从未尝试过在cronjob中使用命令的输出。