我可以配置Jupyter Notebook来分割源文件和生成的文件吗?

时间:2016-05-26 10:51:10

标签: jupyter jupyter-notebook

我真的很喜欢Jupyter Notebooks。 但是,与{ "took" : 2, "timed_out" : false, "_shards" : { "total" : 1, "successful" : 1, "failed" : 0 }, "hits" : { "total" : 2, "max_score" : 0.0, "hits" : [ ] }, "aggregations" : { "followUpActivity.metainfo.department" : { "doc_count_error_upper_bound" : 0, "sum_other_doc_count" : 0, "buckets" : [ ] } } } 之类的源控制系统一起使用它们很麻烦,因为git - 文件包含源代码(您实际在笔记本中编写的内容)和生成的输出文本/ HTML / images / metadata / ...

例如,现在很难解决合并冲突,因为所有内容都存储在一个包含大量生成数据的大文件中。

我想知道我是否可以将Jupyter配置为将笔记本存储为

  • 源文件:例如,我想这是一个Markdown文件,其中包含三个反引号(```)的所有东西都被解释为代码单元格。该文件的差异很有意义,合并冲突很容易手动解决。
  • 生成的文件:这包含其他所有内容。如果此文件中存在合并冲突,则可以通过重新生成它来解决。

这可能吗?

1 个答案:

答案 0 :(得分:0)

供参考:a slightly more general version of this question列出了使IPython和Jupyter适应这种效果的各种努力,this answer建议通过Git解决问题。 a Github project有一个基于该答案的Git过滤器,并且(在最后的编辑中)答案链接了一些类似的工具,如nbstripout