应用错误收集

将PubMed数据推送到Kafka

时间：2015-10-07 10:28:20

标签： python ftp apache-kafka pubmed kafka-python

在PubMed数据源中，我需要将输出推送到Kafka队列。每个源都可以被视为Kafka主题。（我知道Kafka中的概念并使用Python探索Kafka）

我可以通过FireFTP查看PubMed数据。

任何人都可以帮助您继续前进吗？

1 个答案:

答案 0 :(得分：0)

您将需要使用从FTP下载数据并将其假脱机到Kafka的服务。 Apache Flume就是这么做的。这很容易配置。您既可以使用FTP https://github.com/rstudio/shiny/issues/772#issuecomment-112919149的客户来源，也可以使用将文件下载到假脱机目录的cron作业，并从那里获取文件。 Flume有一个非常体面的Kafka Sink，允许连续写入kafka。

将路由器数据推送到分布式消息系统
如何在向主题推送/消费消息时测量kafka上的性能指标
将PubMed数据推送到Kafka
如何从发布的数据ncbi
将UDP消息推送到Kafka主题
将Avro文件推送到Kafka
更改Kafka Streams上的键但推送到新主题时，是否发生数据分区？
如何将PubMed中的Mesh写入数据帧
Using Apache Kafka - pushing data to storage
在春季启动的Junit在@EmbeddedKafka推后获得来自主题数据

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？