应用错误收集

为了测试目的，我正在玩睫毛我有以下设置：

aws上的3台机器（32核和64 GB内存）

我手动安装了带有hdfs和yarn服务的Hadoop 2（不使用EMR）。

机器＃1运行HDFS - （NameNode＆amp; SeconderyNameNode）和YARN - （resourcemanager），在主文件中定义

机器＃2运行HDFS - （datanode）和YARN - （nodemanager），在从属文件中定义

机器＃3运行HDFS - （datanode）和YARN - （nodemanager），在从属文件中定义

我想提交Apache flink作业，从hdfs读取大约20GB的日志处理它们，然后将结果存储在cassandra中

问题在于我认为我做错了，因为这项工作花费了大约一个小时的时间，而且我认为它不是很优化。

我使用以下命令运行flink：

./ flink-1.3.0 / bin / flink run -yn 2 -ys 30 -yjm 7000 -ytm 8000 -m yarn-cluster /home/ubuntu/reports_script-1.0-SNAPSHOT.jar

我在flink日志上看到有60个任务槽正在使用中，但是当我看到纱页时，我发现vcores和内存的使用率非常低

我做错了什么？