我有一个包含400万个项目的Cosmos DB集合。 我的主要问题是如何对其执行“分组依据”查询。
现在我将其导出到json.gz blob存储。从本地C#程序将其转换为本地CSV文件。然后在其上运行一个简单的R脚本来执行分组依据。
我想在Azure中运行整个过程(使用Azure逻辑应用程序)。
最好的方法是什么?
谢谢!
答案 0 :(得分:0)
对于.NET和Node.js
Larry Maccherone提供了一个很棒的文档db-lumenize软件包,它支持聚合(分组依据,数据透视表和N维多维数据集)和时间序列转换作为DocumentDB中的存储过程。 此外,对于Python和Scala,您可以参考azure-cosmosdb-spark。
您可以参考此thread。
希望有帮助。