Azure:处理10万个Blob。我应该选择哪种Azure服务?

时间:2019-01-24 09:14:45

标签: azure batch-processing azure-storage-blobs azure-webjobssdk

我有1000k斑点。我需要删除其内容中的空行并覆盖。 为了实现这一目标,我计划使用:

  1. 天蓝色webjob
  2. DataFactory
  3. 天蓝色批次

您能给我一些建议,哪种服务最适合这种情况吗?

2 个答案:

答案 0 :(得分:1)

使用Azure Functions

  

使用简单的无服务器功能轻松构建所需的应用程序,这些功能可以扩展以满足需求。使用您选择的编程语言,不必担心服务器或基础架构。

Data Factory是一项数据集成服务,旨在创建,安排和管理您的数据集成。这不是用于删除文件中空行的工具。

Azure Batch是一种高性能计算解决方案,可以启动许多VM。这对于从文件中删除空行是非常矫over过正的。

答案 1 :(得分:1)

已经有人建议使用Azure Functions。我会增加更多。使用专门的Azure耐用功能并并行化称为扇入/扇出的任务。

您需要跟踪的所有Blob项目都将更加便宜,快捷。您可以在此处找到更多信息,并可以通过示例具体讨论如何并行化blob的任务。

https://docs.microsoft.com/en-us/azure/azure-functions/durable/durable-functions-cloud-backup