我的队友正在使用Spring Boot + PostgreSQL + Redis + Kafka等开发REST API,而我正在使用Prometheus,Grafana等制作监视工具来监视该API。
此API提供了四个端点。我们称它们为A,B,C和D。
我想收集“每个API端点的近似响应时间”的指标。因此,我编写了简单的脚本(Bash和Perl),用于测量使用curl
调用每个端点所花费的时间。然后,我使用crontab注册了脚本,每分钟执行一次。
# get response time
curl -XGET -s -w "\\n%{http_code}\\n%{time_total}\\n" "http://for.example/A" | tail -n 1 >> log_A
curl -XGET -s -w "\\n%{http_code}\\n%{time_total}\\n" "http://for.example/B" | tail -n 1 >> log_B
...
如下所示,结果有些奇怪:
调用一个端点大约需要100毫秒,而调用另一个端点只花费了几毫秒。
我调查了一下,发现每个cron作业的第一次呼叫花费了更长的时间。也就是说,如果我测量了A,B,C,然后再测量D,则A用了100毫秒。如果我测量了B,C,D,则A,B花费了100毫秒。接下来的三个端点很快就会做出回应。在图中,我修改了序列,可以看到它立即影响了结果。
我怀疑Spring Boot应用程序和数据库(或Redis或kafka?)之间的连接由于过期而断开,因此首先需要时间重新连接。但是我认为一分钟对于任何配置来说都太短了,以至于无法终止任何连接。无论如何,我应该从哪一点开始?
任何建议将不胜感激。
写完这篇文章后,我启动了一个非常简单的Spring Boot REST API应用程序,该应用程序的代码来自Spring Boot指南doc(https://spring.io/guides/gs/rest-service),而不使用DB或任何外部工具。始终curl
只需4毫秒。所以我更怀疑外部因素。
如果您需要查看有关Spring Boot应用程序的配置。这是pom.xml
和application.yaml
:
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<parent>
<groupId>com.company</groupId>
<artifactId>sylphid</artifactId>
<version>0.1.0</version>
</parent>
<modelVersion>4.0.0</modelVersion>
<artifactId>personal</artifactId>
<version>0.3.0</version>
<dependencies>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-data-jpa</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-web</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-cache</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-batch</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-data-redis</artifactId>
</dependency>
<!-- kafka -->
<dependency>
<groupId>org.springframework.kafka</groupId>
<artifactId>spring-kafka</artifactId>
<version>${spring-kafka.version}</version>
</dependency>
<dependency>
<groupId>io.springfox</groupId>
<artifactId>springfox-swagger2</artifactId>
<version>${swagger.version}</version>
</dependency>
<dependency>
<groupId>io.springfox</groupId>
<artifactId>springfox-swagger-ui</artifactId>
<version>${swagger.version}</version>
</dependency>
<!-- https://mvnrepository.com/artifact/io.springfox/springfox-spi -->
<dependency>
<groupId>io.springfox</groupId>
<artifactId>springfox-spi</artifactId>
<version>${swagger.version}</version>
</dependency>
<!-- https://mvnrepository.com/artifact/io.springfox/springfox-spring-web -->
<dependency>
<groupId>io.springfox</groupId>
<artifactId>springfox-spring-web</artifactId>
<version>${swagger.version}</version>
</dependency>
<dependency>
<groupId>org.postgresql</groupId>
<artifactId>postgresql</artifactId>
<scope>runtime</scope>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-test</artifactId>
<scope>test</scope>
</dependency>
</dependencies>
<build>
<resources>
<resource>
<directory>src/main/resources</directory>
<filtering>false</filtering>
</resource>
</resources>
<finalName>personal</finalName>
<plugins>
<plugin>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-maven-plugin</artifactId>
</plugin>
<plugin>
<groupId>io.fabric8</groupId>
<artifactId>docker-maven-plugin</artifactId>
<version>0.21.0</version>
<configuration>
<images>
<image>
<name>sylphid/${project.build.finalName}</name>
<build>
<from>openjdk:8u162-jdk</from>
<entryPoint>java -Dspring.profiles.active=docker -jar /application/${project.build.finalName}.jar</entryPoint>
<assembly>
<basedir>/application</basedir>
<descriptorRef>artifact</descriptorRef>
<inline>
<id>assembly</id>
<files>
<file>
<source>target/${project.build.finalName}.jar</source>
</file>
</files>
</inline>
</assembly>
<tags>
<tag>latest</tag>
<tag>${project.version}</tag>
</tags>
<ports>
<port>8080</port>
</ports>
</build>
<run>
<namingStrategy>alias</namingStrategy>
</run>
<alias>${project.build.finalName}</alias>
</image>
</images>
</configuration>
</plugin>
</plugins>
</build>
<repositories>
<repository>
<id>spring-snapshots</id>
<name>Spring Snapshots</name>
<url>https://repo.spring.io/snapshot</url>
<snapshots>
<enabled>true</enabled>
</snapshots>
</repository>
<repository>
<id>spring-milestones</id>
<name>Spring Milestones</name>
<url>https://repo.spring.io/milestone</url>
<snapshots>
<enabled>false</enabled>
</snapshots>
</repository>
<repository>
<id>sonatype-nexus-snapshots</id>
<name>Sonatype Nexus Snapshots</name>
<url>https://oss.sonatype.org/content/repositories/snapshots/</url>
<snapshots>
<enabled>true</enabled>
</snapshots>
<releases>
<enabled>false</enabled>
</releases>
</repository>
</repositories>
</project>
spring:
profiles: allnative
application:
name: personal
jpa:
database-platform: org.hibernate.dialect.PostgreSQL9Dialect
properties:
hibernate:
temp.use_jdbc_metadata_defaults: false
show_sql: false
format_sql: false
use_sql_comments: false
hibernate:
ddl-auto: update
datasource:
driver-class-name: org.postgresql.Driver
url: jdbc:postgresql://127.0.0.1:5432/sylphid
username: postgres
batch:
initialize-schema: always
cache:
type: redis
redis:
key-prefix: sylphid_
time-to-live: 60m
redis:
host: 127.0.0.1
port: 6379
kafka:
bootstrap-servers: 127.0.0.1:9092
consumer:
auto-offset-reset: earliest
group-id: bookclub
server:
port: 13480
app:
topic:
selection: bookclub.selection
management:
endpoints:
web:
exposure:
include: "*"
endpoint:
health:
show-details: always
logging:
file: allnative.log
我正在为每个端点呼叫curl
,没有任何延迟:
curl endpointA; curl endpointB; curl endpointC; curl endpointD
( almost 60 seconds interval before next cronjob )
curl endpointA; curl endpointB; curl endpointC; curl endpointD
...
昨天我尝试在每个curl
执行之间插入一些延迟,猜测“最后一个请求与当前请求之间的间隔会影响当前请求的响应时间”。 (例如...如果没有人长时间要求某人做某事,他可能会睡着。当有人呼唤他时,他需要更多时间醒来。如果有人呼唤他,他醒着的时候,他可以更快地完成第二工作。)
当我插入2秒钟以上的延迟时,我可以看到另一个端点开始变慢。当我插入10秒延迟时:
curl endpointA; sleep 10; curl endpointB; sleep 10;...
( about 20 seconds interval, because crontab still executes every minutes )
curl endpointA; sleep 10; curl endpointB; sleep 10;...
这是结果。每个端点在大约100毫秒后开始响应。
作为一项新尝试,我尝试使用Jetty代替Tomcat作为嵌入式服务器。结果有些令人印象深刻。使用Jetty进行的应用几乎对每次测量都显示非常稳定的响应时间。甚至连Jetty有时也显示出较长的响应时间(大约300毫秒左右),但这是非常罕见的情况。
我已经观察了两个测试集(Tomcat和Jetty)了几个小时,而我将观察一两天以上。如果结果继续,我打算告诉我的队友有关此事,并建议将嵌入式服务器更改为Jetty。
但是,如果Tomcat是麻烦的原因,我不知道为什么官方指南中的简单Spring Boot应用程序不会显示这种症状。
答案 0 :(得分:0)
这是一个非常有趣的测试。您的堆栈很复杂,在这种情况下,我了解性能的需求。
关于Tomcat / Jetty之间的性能差异。我可以建议您尝试使用MockMvc进行集成测试(请参阅get started)
我知道很难在OPS基础结构和DEV框架之间拆分测试,但是使用SpringBoot可以通过单元测试来测试和显示执行性能。
您可以随时在您的API上迭代对一个调用,并在执行周围添加一个StopWatch。
@RunWith(SpringRunner.class)
@SpringBootTest
@AutoConfigureMockMvc
public class ApplicationTest {
private final static Logger LOGGER = LoggerFactory.getLogger(ApplicationTest .class);
@Autowired
private MockMvc mockMvc;
@Test
public void shouldReturnDefaultMessage() throws Exception {
StopWatch stopWatch = new StopWatch("Testing REST API performances");
for(int i=1; i<=5; i<++) {
stopWatch.start("Test iteration " + i);
this.mockMvc.perform(get("/")).andDo(print()).andExpect(status().isOk())
.andExpect(content().string(containsString("Hello World")));
stopWatch.stop();
}
// Print the result
LOGGER.info(stopWatch.prettyPrint());
}
}
该测试应揭示性能问题,应由其余控制器启动。
在本地,我在第一次通话中也有延迟。
StopWatch“测试REST API性能”:运行时间(毫秒)= 806
您可以看到第一个通话花费很长时间。
希望我,我的回答将帮助您达到预期的效果并帮助您选择。