在使用websocket

时间:2018-04-12 10:28:02

标签: playframework apache-kafka akka-stream akka-kafka

是否可以使用Akka Streams Kafka在Kafka主题上获取最后一条消息?我正在创建一个侦听Kafka主题的websocket,但是当我连接时它会检索所有先前的unred消息。这可以添加相当多的消息,所以我只对最后一条消息+任何未来的消息感兴趣。 (或仅限未来的消息)

来源:

def source(): Flow[Any, String, NotUsed] = {
  val source = Consumer.plainSource(consumerSettings, Subscriptions.topics(MyTopic))
  Flow.fromSinkAndSource[Any, String](Sink.ignore, source.map(_.value)
}

消费者设置:

  @Provides
def providesConsumerSettings(@Named("kafkaUrl") kafkaUrl: String): ConsumerSettings[String, String] = {
  val deserializer = new StringDeserializer()
  val config = configuration.getOptional[Configuration]("akka.kafka.consumer")
    .getOrElse(Configuration.empty)

  ConsumerSettings(config.underlying, deserializer, deserializer)
    .withBootstrapServers(kafkaUrl)
    .withGroupId(GroupId)
}

我已尝试添加设置ConsumerSettings.withProperty(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "latest")

哪个应该“自动将偏移量重置为最新的偏移量”,但似乎没有任何效果。

1 个答案:

答案 0 :(得分:1)

我能够避免使用David van Geest here

非常简洁地描述的方法在客户端连接时获取任何上游数据。

归结为在消费者上拥有BroadcastHub:

val liveSource = Consumer.plainSource(consumerSettings, Subscriptions.topics(topic1, topic2))
.map(kafkaObject => utils.WebSockets.kafkaWrapper(kafkaObject.topic(), kafkaObject.value()))
.toMat(BroadcastHub.sink)(Keep.right)
.run()

并连接静态使用者以获取所有上游数据

liveSource.to(Sink.ignore).run()

接下来,这让我让WebSocket客户端订阅了使用者接收的所有数据,如下所示:

def source(): Flow[Any, String, NotUsed] = {Flow.fromSinkAndSource(Sink.ignore, liveSource)}

或基于KafkaTopic(或您想要的其他任何内容)进行过滤

def KafkaSpecificSource(kafkaTopic: String): Flow[Any, String, NotUsed] = {
  Flow.fromSinkAndSource(Sink.ignore, liveSource.filter({
    x =>
      (Json.parse(x) \ "topic").asOpt[String] match {
        case Some(str) => str.equals(kafkaTopic)
        case None => false
      }
  }))
}

这不能解决第一次连接时向用户提供x数据量的问题,但是我预见我们将为任何历史数据添加一个简单的数据库查询,并且让WebSocket连接仅专注于实时流数据。