当我调用端点大约需要7秒钟时,我已经使用笔记本和java aws sdk创建了一个模型。我如何进一步减少这种情况,有没有办法进行并行调用。
InvokeEndpointRequest request = new InvokeEndpointRequest();
InvokeEndpointResult p = amazonSageMakerRuntime.invokeEndpoint(request.withEndpointName("<endpoint>").withAccept("application/json").withContentType("application/json").withBody(ByteBuffer.wrap(data.getBytes())));