mdruiter · Jun 17, 2021
diff --git a/‎.github/scripts/label_title_regex.py
+2-8 b/‎.github/scripts/label_title_regex.py
+2-8
diff --git a/‎asv_benchmarks/benchmarks/cluster.py
+43-39 b/‎asv_benchmarks/benchmarks/cluster.py
+43-39
@@ -15,15 +15,9 @@
 title = issue.title
 
 
-regex_to_labels = [
-    (r"\bDOC\b", "Documentation"),
-    (r"\bCI\b", "Build / CI")
-]
+regex_to_labels = [(r"\bDOC\b", "Documentation"), (r"\bCI\b", "Build / CI")]
 
-labels_to_add = [
-    label for regex, label in regex_to_labels
-    if re.search(regex, title)
-]
+labels_to_add = [label for regex, label in regex_to_labels if re.search(regex, title)]
 
 if labels_to_add:
     issue.add_to_labels(*labels_to_add)
@@ -10,16 +10,16 @@ class KMeansBenchmark(Predictor, Transformer, Estimator, Benchmark):
     Benchmarks for KMeans.
     """
 
-    param_names = ['representation', 'algorithm', 'init']
-    params = (['dense', 'sparse'], ['full', 'elkan'], ['random', 'k-means++'])
+    param_names = ["representation", "algorithm", "init"]
+    params = (["dense", "sparse"], ["full", "elkan"], ["random", "k-means++"])
 
     def setup_cache(self):
         super().setup_cache()
 
     def make_data(self, params):
         representation, algorithm, init = params
 
-        if representation == 'sparse':
+        if representation == "sparse":
             data = _20newsgroups_highdim_dataset(n_samples=8000)
         else:
             data = _blobs_dataset(n_clusters=20)
@@ -29,44 +29,46 @@ def make_data(self, params):
     def make_estimator(self, params):
         representation, algorithm, init = params
 
-        max_iter = 30 if representation == 'sparse' else 100
+        max_iter = 30 if representation == "sparse" else 100
 
-        estimator = KMeans(n_clusters=20,
-                           algorithm=algorithm,
-                           init=init,
-                           n_init=1,
-                           max_iter=max_iter,
-                           tol=-1,
-                           random_state=0)
+        estimator = KMeans(
+            n_clusters=20,
+            algorithm=algorithm,
+            init=init,
+            n_init=1,
+            max_iter=max_iter,
+            tol=-1,
+            random_state=0,
+        )
 
         return estimator
 
     def make_scorers(self):
-        self.train_scorer = (
-            lambda _, __: neg_mean_inertia(self.X,
-                                           self.estimator.predict(self.X),
-                                           self.estimator.cluster_centers_))
-        self.test_scorer = (
-            lambda _, __: neg_mean_inertia(self.X_val,
-                                           self.estimator.predict(self.X_val),
-                                           self.estimator.cluster_centers_))
+        self.train_scorer = lambda _, __: neg_mean_inertia(
+            self.X, self.estimator.predict(self.X), self.estimator.cluster_centers_
+        )
+        self.test_scorer = lambda _, __: neg_mean_inertia(
+            self.X_val,
+            self.estimator.predict(self.X_val),
+            self.estimator.cluster_centers_,
+        )
 
 
 class MiniBatchKMeansBenchmark(Predictor, Transformer, Estimator, Benchmark):
     """
     Benchmarks for MiniBatchKMeans.
     """
 
-    param_names = ['representation', 'init']
-    params = (['dense', 'sparse'], ['random', 'k-means++'])
+    param_names = ["representation", "init"]
+    params = (["dense", "sparse"], ["random", "k-means++"])
 
     def setup_cache(self):
         super().setup_cache()
 
     def make_data(self, params):
         representation, init = params
 
-        if representation == 'sparse':
+        if representation == "sparse":
             data = _20newsgroups_highdim_dataset()
         else:
             data = _blobs_dataset(n_clusters=20)
@@ -76,25 +78,27 @@ def make_data(self, params):
     def make_estimator(self, params):
         representation, init = params
 
-        max_iter = 5 if representation == 'sparse' else 2
+        max_iter = 5 if representation == "sparse" else 2
 
-        estimator = MiniBatchKMeans(n_clusters=20,
-                                    init=init,
-                                    n_init=1,
-                                    max_iter=max_iter,
-                                    batch_size=1000,
-                                    max_no_improvement=None,
-                                    compute_labels=False,
-                                    random_state=0)
+        estimator = MiniBatchKMeans(
+            n_clusters=20,
+            init=init,
+            n_init=1,
+            max_iter=max_iter,
+            batch_size=1000,
+            max_no_improvement=None,
+            compute_labels=False,
+            random_state=0,
+        )
 
         return estimator
 
     def make_scorers(self):
-        self.train_scorer = (
-            lambda _, __: neg_mean_inertia(self.X,
-                                           self.estimator.predict(self.X),
-                                           self.estimator.cluster_centers_))
-        self.test_scorer = (
-            lambda _, __: neg_mean_inertia(self.X_val,
-                                           self.estimator.predict(self.X_val),
-                                           self.estimator.cluster_centers_))
+        self.train_scorer = lambda _, __: neg_mean_inertia(
+            self.X, self.estimator.predict(self.X), self.estimator.cluster_centers_
+        )
+        self.test_scorer = lambda _, __: neg_mean_inertia(
+            self.X_val,
+            self.estimator.predict(self.X_val),
+            self.estimator.cluster_centers_,
+        )