code review comments

linkedin · edwinalu · Sep 21, 2018 · Sep 24, 2018 · Sep 25, 2018 · Sep 25, 2018
commit fbd4e791bd26f14bd9f625de71a5882c098ed8b2
diff --git a/app/com/linkedin/drelephant/spark/heuristics/StagesAnalyzer.scala b/app/com/linkedin/drelephant/spark/heuristics/StagesAnalyzer.scala
@@ -81,17 +81,11 @@ private[heuristics] class StagesAnalyzer(
   private val maxRecommendedPartitions = heuristicConfigurationData.getParamMap
     .getOrDefault(MAX_RECOMMENDED_PARTITIONS_KEY, DEFAULT_MAX_RECOMMENDED_PARTITIONS).toInt
 
-  /**
-    * Get the analysis for each stage of the application.
-    *
-    * @param curNumPartitions the configured number of partitions for the application
-    *                         (value of spark.sql.shuffle.partitions).
-    * @return list of analysis results of stages.
-    */
-  def getStageAnalysis(curNumPartitions: Int): Seq[StageAnalysis] = {
-    val failedTasksStageMap = data.stagesWithFailedTasks.flatMap { stageData =>
-      stageData.tasks.map(tasks => (stageData.stageId, tasks.values))
-    }.toMap
+  /** @return list of analysis results for all the stages. */
+  def getStageAnalysis(): Seq[StageAnalysis] = {
+    val appConfigurationProperties: Map[String, String] = data.appConfigurationProperties
+    val curNumPartitions = appConfigurationProperties.get(SPARK_SQL_SHUFFLE_PARTITIONS)
+      .map(_.toInt).getOrElse(SPARK_SQL_SHUFFLE_PARTITIONS_DEFAULT)
 
     data.stageDatas.map { stageData =>
       val medianTime = stageData.taskSummary.collect {
@@ -112,7 +106,7 @@ private[heuristics] class StagesAnalyzer(
       val taskSkewResult = checkForTaskSkew(stageId, stageData, medianTime, maxTime, stageDuration,
           executionMemorySpillResult.severity)
       val stageFailureResult = checkForStageFailure(stageId, stageData)
-      val taskFailureResult = checkForTaskFailure(stageId, stageData, failedTasksStageMap)
+      val taskFailureResult = checkForTaskFailure(stageId, stageData)
       val gcResult = checkForGC(stageId, stageData)
 
       new StageAnalysis(stageData.stageId, executionMemorySpillResult, longTaskResult,
@@ -210,7 +204,6 @@ private[heuristics] class StagesAnalyzer(
         taskSkewThresholds.severityOf(max / median)
       case _ => Severity.NONE
     }
-    val median = medianTime.getOrElse(0.0D)
     val maximum = maxTime.getOrElse(0.0D)
     val taskSkewSeverity =
       if (maximum > taskDurationMinThreshold &&
@@ -225,12 +218,12 @@ private[heuristics] class StagesAnalyzer(
       // add more information about what might be causing skew if skew is being flagged
       // (reported severity is significant), or there is execution memory spill, since skew
       // can also cause execution memory spill.
-      val median = Utils.getDuration(medianTime.map(_.toLong).getOrElse(0L))
-      val maximum = Utils.getDuration(maxTime.map(_.toLong).getOrElse(0L))
+      val medianStr = Utils.getDuration(medianTime.map(_.toLong).getOrElse(0L))
+      val maximumStr = Utils.getDuration(maxTime.map(_.toLong).getOrElse(0L))
       var inputSkewSeverity = Severity.NONE
       if (hasSignificantSeverity(taskSkewSeverity)) {
         details +=
-          s"Stage $stageId has skew in task run time (median is $median, max is $maximum)"
+          s"Stage $stageId has skew in task run time (median is $medianStr, max is $maximumStr)"
       }
       stageData.taskSummary.foreach { summary =>
         checkSkewedData(stageId, summary.memoryBytesSpilled(DISTRIBUTION_MEDIAN_IDX),
@@ -367,13 +360,15 @@ private[heuristics] class StagesAnalyzer(
     *
     * @param stageId stage ID.
     * @param stageData stage data.
-    * @param failedTasksStageMap map of stage ID to list of failed tasks for the stage.
     * @return result of failed tasks analysis for the stage.
     */
   private def checkForTaskFailure(
       stageId: Int,
-      stageData: StageData,
-      failedTasksStageMap: Map[Int, Iterable[TaskDataImpl]]): TaskFailureResult = {
+      stageData: StageData): TaskFailureResult = {
+    val failedTasksStageMap = data.stagesWithFailedTasks.flatMap { stageData =>
+      stageData.tasks.map(tasks => (stageData.stageId, tasks.values))
+    }.toMap
+
     val failedTasks = failedTasksStageMap.get(stageId)
 
     val details = new ArrayBuffer[String]()

diff --git a/test/com/linkedin/drelephant/spark/heuristics/StagesAnalyzerTest.scala b/test/com/linkedin/drelephant/spark/heuristics/StagesAnalyzerTest.scala
@@ -21,7 +21,8 @@ class StagesAnalyzerTest extends FunSpec with Matchers {
         StageBuilder(3, 15).failures(2, 0, 1).create(),
         StageBuilder(4, 15).failures(3, 1, 2).create(),
         StageBuilder(5, 4).failures(2, 0, 0).status(StageStatus.FAILED, Some("array issues")).create())
-      val data = createSparkApplicationData(stages, Seq.empty, None)
+      val properties = Map( "spark.sql.shuffle.partitions" -> "200")
+      val data = createSparkApplicationData(stages, Seq.empty, Some(properties))
 
       val expectedAnalysis = Seq(
         StageAnalysisBuilder(1, 3).create(),
@@ -48,7 +49,7 @@ class StagesAnalyzerTest extends FunSpec with Matchers {
           .create())
 
       val stageAnalyzer = new StagesAnalyzer(heuristicConfigurationData, data)
-      val stageAnalysis = stageAnalyzer.getStageAnalysis(200)
+      val stageAnalysis = stageAnalyzer.getStageAnalysis()
       (0 until expectedAnalysis.size).foreach { i =>
         compareStageAnalysis(stageAnalysis(i), expectedAnalysis(i))
       }
@@ -71,7 +72,8 @@ class StagesAnalyzerTest extends FunSpec with Matchers {
         StageBuilder(12, 5).taskRuntime(2, 50, 53).times("09/09/2018 12:00:00", "09/09/2018 12:01:00").create(),
         StageBuilder(13, 5).taskRuntime(5, 50, 60).input(50, 500, 600).create(),
         StageBuilder(14, 5).taskRuntime(5, 200, 210).output(5, 200, 210).create())
-      val data = createSparkApplicationData(stages, Seq.empty, None)
+      val properties = Map( "spark.sql.shuffle.partitions" -> "5")
+      val data = createSparkApplicationData(stages, Seq.empty, Some(properties))
 
       val expectedAnalysis = Seq(
         StageAnalysisBuilder(1, 5).taskRuntime(200, 250)
@@ -130,7 +132,7 @@ class StagesAnalyzerTest extends FunSpec with Matchers {
             Seq()).create())
 
       val stageAnalyzer = new StagesAnalyzer(heuristicConfigurationData, data)
-      val stageAnalysis = stageAnalyzer.getStageAnalysis(5)
+      val stageAnalysis = stageAnalyzer.getStageAnalysis()
        (0 until expectedAnalysis.size).foreach { i =>
         compareStageAnalysis(stageAnalysis(i), expectedAnalysis(i))
       }
@@ -147,8 +149,9 @@ class StagesAnalyzerTest extends FunSpec with Matchers {
         StageBuilder(6, 3).taskRuntime(700, 3500, 4500).create(),
         StageBuilder(7, 2).taskRuntime(700, 900, 2000).create(),
         StageBuilder(8, 3).taskRuntime(3000, 3000, 9000).input(2 << 20, 3 << 20, 5 << 20).create())
+      val properties = Map( "spark.sql.shuffle.partitions" -> "3")
+      val data = createSparkApplicationData(stages, Seq.empty, Some(properties))
 
-      val data = createSparkApplicationData(stages, Seq.empty, None)
       val expectedAnalysis = Seq(
         StageAnalysisBuilder(1, 3).taskRuntime(120, 150).create(),
         StageAnalysisBuilder(2, 3).taskRuntime(180, 200).longTask(Severity.LOW, 0, Seq()).create(),
@@ -172,7 +175,7 @@ class StagesAnalyzerTest extends FunSpec with Matchers {
           .input(5 << 20).create())
 
       val stageAnalyzer = new StagesAnalyzer(heuristicConfigurationData, data)
-      val stageAnalysis = stageAnalyzer.getStageAnalysis(3)
+      val stageAnalysis = stageAnalyzer.getStageAnalysis()
       (0 until expectedAnalysis.size).foreach { i =>
         compareStageAnalysis(stageAnalysis(i), expectedAnalysis(i))
       }
@@ -206,7 +209,8 @@ class StagesAnalyzerTest extends FunSpec with Matchers {
           .spill(50, 250, 3L << 20).create(),
         StageBuilder(12, 3).taskRuntime(50, 250, 350).output(50, 250, 6 << 20)
           .spill(50, 250, 4L << 20).create())
-      val data = createSparkApplicationData(stages, Seq.empty, None)
+      val properties = Map( "spark.sql.shuffle.partitions" -> "5")
+      val data = createSparkApplicationData(stages, Seq.empty, Some(properties))
 
       val expectedAnalysis = Seq(
         StageAnalysisBuilder(1, 5).taskRuntime(100, 150)
@@ -304,7 +308,7 @@ class StagesAnalyzerTest extends FunSpec with Matchers {
           .create())
 
       val stageAnalyzer = new StagesAnalyzer(heuristicConfigurationData, data)
-      val stageAnalysis = stageAnalyzer.getStageAnalysis(5)
+      val stageAnalysis = stageAnalyzer.getStageAnalysis()
       (0 until expectedAnalysis.size).foreach { i =>
         compareStageAnalysis(stageAnalysis(i), expectedAnalysis(i))
       }