哪些Vars影响Clojure功能?

时间:2012-02-27 20:07:14

标签: clojure static-analysis dynamic-analysis free-variable

如何以编程方式确定哪些Vars可能会影响Clojure中定义的函数的结果?

考虑Clojure函数的这个定义:

(def ^:dynamic *increment* 3)
(defn f [x]
  (+ x *increment*))

这是x的函数,也是*increment*(以及clojure.core/+ (1)的函数;但我不太关心)。在为这个函数编写测试时,我想确保控制所有相关的输入,所以我做了这样的事情:

(assert (= (binding [*increment* 3] (f 1)) 4))
(assert (= (binding [*increment* -1] (f 1)) 0))

(想象一下,*increment*是某人可能合理改变的配置值;我不希望此功能的测试在发生这种情况时需要更改。)

我的问题是:我如何写一个断言,(f 1)的值可以取决于*increment*而不取决于任何其他Var?因为我希望有一天会有人重构一些代码并导致函数

(defn f [x]
  (+ x *increment* *additional-increment*))

并忽略更新测试,即使*additional-increment*为零,我也希望测试失败。

这当然是一个简化的例子 - 在一个大型系统中,可以有很多动态Vars,它们可以通过一长串函数调用来引用。即使f调用g调用h来引用Var,该解决方案也需要工作。如果它没有声称(with-out-str (prn "foo"))取决于*out*,那就太棒了,但这不太重要。如果被分析的代码调用eval或使用Java互操作,当然所有的投注都会关闭。

我可以想到三类解决方案:

  1. 从编译器中获取信息

    我想编译器会扫描函数定义以获取必要的信息,因为如果我尝试引用一个不存在的Var,它会抛出:

    user=> (defn g [x] (if true x (+ *foobar* x)))
    CompilerException java.lang.RuntimeException: Unable to resolve symbol: *foobar* in this context, compiling:(NO_SOURCE_PATH:24) 
    

    请注意,这发生在编译时,无论是否会执行违规代码。因此,编译器应该知道该函数可能引用了哪些Vars,并且我希望能够访问该信息。

  2. 解析源代码并遍历语法树,并在引用Var时记录

    因为代码就是数据而已。我想这意味着调用macroexpand并处理每个Clojure原语及其采用的各种语法。这看起来非常像编译阶段,能够调用编译器的某些部分,或者以某种方式将我自己的钩子添加到编译器中会很棒。

  3. 检测Var机制,执行测试并查看访问哪些Vars

    不像其他方法那样完整(如果在我的测试无法运用的代码分支中使用Var会怎么样?)但这就足够了。我想我需要重新定义def以产生类似于Var的东西但以某种方式记录其访问。


  4. (1)实际上,如果重新绑定+,特定功能不会改变;但是在Clojure 1.2中,你可以通过(defn f [x] (+ x 0 *increment*))来绕过优化,然后你就可以与(binding [+ -] (f 3))玩得开心。在Clojure 1.3中,尝试重新绑定+会引发错误。

2 个答案:

答案 0 :(得分:5)

关于您的第一点,您可以考虑使用analyze库。有了它,您可以很容易地找出表达式中使用的动态变量:

user> (def ^:dynamic *increment* 3)
user> (def src '(defn f [x]
                  (+ x *increment*)))
user> (def env {:ns {:name 'user} :context :eval})
user> (->> (analyze-one env src) 
           expr-seq 
           (filter (op= :var)) 
           (map :var) 
           (filter (comp :dynamic meta)) 
           set)
#{#'user/*increment*}

答案 1 :(得分:0)

我知道这不能回答你的问题,但是提供两个版本的函数并不是一件容易的事情,其中​​一个版本没有自由变量,而另一个版本调用第一个版本适当的顶级定义?

例如:

(def ^:dynamic *increment* 3)
(defn f
  ([x]
     (f x *increment*))
  ([x y]
     (+ x y)))

通过这种方式,您可以针对不依赖于任何全局状态的(f x y)编写所有测试。