Datomic entity-api在大量实体上运行缓慢?

时间:2018-02-26 07:57:45

标签: clojure scalability datomic

我需要将其他逻辑(如映射,条件,聚合)应用于我从Datomic获得的实体。我很难将它翻译成Datomic查询(我不确定在我的情况下是否可能),这就是为什么我使用了datomic的原始索引访问,所以最多的工作和逻辑是在Clojure中完成的。

它工作正常,直到我达到~500K条目并且整个方法变得非常慢。 相关代码:

(defn e->entry
  "Map e into entry"
  [e]
  {:id   (:entry/uuid e)
   ;; each flat field increases mapping time (seems linearly)
   :date (:entry/date e)
   :summ (:entry/summ e)   
   ;; although when using nested fields, mapping time rises significantly
   :groups (map #(-> % :dimension/group :group/name) 
                (:entry/dimensions e))})


;; query code:
(->> (d/datoms db :aevt :entry/uuid)
     (map #(->> % 
                :e
                (d/entity db)
                e->entry))))
     ;; TODO: other actions on mapped entries ...

30秒运行查询代码只是为了映射实体,我在查询中需要的字段越多,所需的就越多。

这是预期的行为吗?有没有办法可以加快速度,或者我错过了什么,这是不好的方法?

2 个答案:

答案 0 :(得分:2)

要完全回答此问题需要更多信息,请随时ask on the forum or open a support ticket

答案 1 :(得分:0)

我最终得到了以下优化,以防有人需要它:

(defn eid->entry
  "Mapping via :eavt index"
  [db eid]
  (->> (d/datoms db :eavt eid) ; access all datoms by eid once
       (seq)
       (reduce (fn [m dtm]
                 (let [attr-key (d/ident db (:a dtm))
                       v (:v dtm)]
                   (assoc m attr-key v))))))

;; new query code
(->> (d/datoms db :aevt :entry/uuid)
     (pmap #(->> % 
                 :e
                 (eid->entry db))))

我使用pmap而不是map并使用:eavt索引获取实体的所有属性和值,而不是直接使用d/entity

访问字段