[Test] Add model speed and accuracy tests for RGCN (dmlc#2458)

* add rgcn acc bench * fix issue of multiple parametrize * model acc/speed test: RGCN * fix dep problem in docker run * add docstring
feixian15 · Dec 28, 2020 · 5d8330c · 5d8330c
1 parent f8b3ebc
commit 5d8330c
Show file tree

Hide file tree

Showing 9 changed files with 337 additions and 12 deletions.
diff --git a/benchmarks/asv.conf.json b/benchmarks/asv.conf.json
@@ -27,7 +27,7 @@
     ],
     // List of branches to benchmark. If not provided, defaults to "master"
     // (for git) or "default" (for mercurial).
-    "branches": ["master", "0.5.0", "0.5.2", "0.5.3", "0.4.3.post2"], // for git
+    "branches": ["HEAD"], // for git
     // The DVCS being used.  If not set, it will be automatically
     // determined from "repo" by looking at the protocol in the URL
     // (if remote), or by looking for special directories, such as

diff --git a/benchmarks/benchmarks/model_acc/bench_rgcn.py b/benchmarks/benchmarks/model_acc/bench_rgcn.py
@@ -0,0 +1,127 @@
+import dgl
+from dgl.nn.pytorch import RelGraphConv
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+
+from .. import utils
+
+class RGCN(nn.Module):
+    def __init__(self,
+                 num_nodes,
+                 n_hidden,
+                 num_classes,
+                 num_rels,
+                 num_bases,
+                 num_hidden_layers,
+                 dropout):
+        super(RGCN, self).__init__()
+        self.layers = nn.ModuleList()
+        # i2h
+        self.layers.append(RelGraphConv(num_nodes, n_hidden, num_rels, "basis",
+                                        num_bases, activation=F.relu, dropout=dropout,
+                                        low_mem=True))
+        # h2h
+        for i in range(num_hidden_layers):
+            self.layers.append(RelGraphConv(n_hidden, n_hidden, num_rels, "basis",
+                                            num_bases, activation=F.relu, dropout=dropout,
+                                            low_mem=True))
+        # o2h
+        self.layers.append(RelGraphConv(n_hidden, num_classes, num_rels, "basis",
+                                        num_bases, activation=None, low_mem=True))
+
+    def forward(self, g, h, r, norm):
+        for layer in self.layers:
+            h = layer(g, h, r, norm)
+        return h
+
+def evaluate(model, g, feats, edge_type, edge_norm, labels, idx):
+    model.eval()
+    with torch.no_grad():
+        logits = model(g, feats, edge_type, edge_norm)
+        logits = logits[idx]
+        _, indices = torch.max(logits, dim=1)
+        correct = torch.sum(indices == labels)
+        return correct.item() * 1.0 / len(labels) * 100
+
+@utils.benchmark('acc')
+@utils.parametrize('data', ['aifb', 'mutag'])
+def track_acc(data):
+    # args
+    if data == 'aifb':
+        num_bases = -1
+        l2norm = 0.
+    elif data == 'mutag':
+        num_bases = 30
+        l2norm = 5e-4
+    elif data == 'am':
+        num_bases = 40
+        l2norm = 5e-4
+    else:
+        raise ValueError()
+
+    data = utils.process_data(data)
+    device = utils.get_bench_device()
+
+    g = data[0]
+
+    num_rels = len(g.canonical_etypes)
+    category = data.predict_category
+    num_classes = data.num_classes
+    train_mask = g.nodes[category].data.pop('train_mask').bool().to(device)
+    test_mask = g.nodes[category].data.pop('test_mask').bool().to(device)
+    labels = g.nodes[category].data.pop('labels').to(device)
+
+    # calculate norm for each edge type and store in edge
+    for canonical_etype in g.canonical_etypes:
+        u, v, eid = g.all_edges(form='all', etype=canonical_etype)
+        _, inverse_index, count = torch.unique(v, return_inverse=True, return_counts=True)
+        degrees = count[inverse_index]
+        norm = 1. / degrees.float()
+        norm = norm.unsqueeze(1)
+        g.edges[canonical_etype].data['norm'] = norm
+
+    # get target category id
+    category_id = len(g.ntypes)
+    for i, ntype in enumerate(g.ntypes):
+        if ntype == category:
+            category_id = i
+
+    g = dgl.to_homogeneous(g, edata=['norm']).to(device)
+    num_nodes = g.number_of_nodes()
+    edge_norm = g.edata['norm']
+    edge_type = g.edata[dgl.ETYPE].long()
+
+    # find out the target node ids in g
+    target_idx = torch.where(g.ndata[dgl.NTYPE] == category_id)[0]
+    train_idx = target_idx[train_mask]
+    test_idx = target_idx[test_mask]
+    train_labels = labels[train_mask]
+    test_labels = labels[test_mask]
+
+    # since the nodes are featureless, the input feature is then the node id.
+    feats = torch.arange(num_nodes, device=device)
+
+    # create model
+    model = RGCN(num_nodes, 
+                 16,
+                 num_classes,
+                 num_rels,
+                 num_bases,
+                 0,
+                 0).to(device)
+
+    optimizer = torch.optim.Adam(model.parameters(),
+                                 lr=1e-2,
+                                 weight_decay=l2norm)
+
+    model.train()
+    for epoch in range(30):
+        logits = model(g, feats, edge_type, edge_norm)
+        loss = F.cross_entropy(logits[train_idx], train_labels)
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+
+    acc = evaluate(model, g, feats, edge_type, edge_norm, test_labels, test_idx)
+    return acc
diff --git a/benchmarks/benchmarks/model_speed/bench_gat.py b/benchmarks/benchmarks/model_speed/bench_gat.py
@@ -98,4 +98,4 @@ def track_time(data):
         optimizer.step()
     t1 = time.time()
 
-    return t1 - t0
+    return (t1 - t0) / num_epochs
diff --git a/benchmarks/benchmarks/model_speed/bench_rgcn.py b/benchmarks/benchmarks/model_speed/bench_rgcn.py
@@ -0,0 +1,118 @@
+import time
+import dgl
+from dgl.nn.pytorch import RelGraphConv
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+
+from .. import utils
+
+class RGCN(nn.Module):
+    def __init__(self,
+                 num_nodes,
+                 n_hidden,
+                 num_classes,
+                 num_rels,
+                 num_bases,
+                 num_hidden_layers,
+                 dropout):
+        super(RGCN, self).__init__()
+        self.layers = nn.ModuleList()
+        # i2h
+        self.layers.append(RelGraphConv(num_nodes, n_hidden, num_rels, "basis",
+                                        num_bases, activation=F.relu, dropout=dropout,
+                                        low_mem=True))
+        # h2h
+        for i in range(num_hidden_layers):
+            self.layers.append(RelGraphConv(n_hidden, n_hidden, num_rels, "basis",
+                                            num_bases, activation=F.relu, dropout=dropout,
+                                            low_mem=True))
+        # o2h
+        self.layers.append(RelGraphConv(n_hidden, num_classes, num_rels, "basis",
+                                        num_bases, activation=None, low_mem=True))
+
+    def forward(self, g, h, r, norm):
+        for layer in self.layers:
+            h = layer(g, h, r, norm)
+        return h
+
+@utils.benchmark('time', 3600)
+@utils.parametrize('data', ['aifb', 'am'])
+def track_time(data):
+    # args
+    if data == 'aifb':
+        num_bases = -1
+        l2norm = 0.
+    elif data == 'am':
+        num_bases = 40
+        l2norm = 5e-4
+    else:
+        raise ValueError()
+
+    data = utils.process_data(data)
+    device = utils.get_bench_device()
+    num_epochs = 30
+
+    g = data[0]
+
+    num_rels = len(g.canonical_etypes)
+    category = data.predict_category
+    num_classes = data.num_classes
+    train_mask = g.nodes[category].data.pop('train_mask').bool().to(device)
+    test_mask = g.nodes[category].data.pop('test_mask').bool().to(device)
+    labels = g.nodes[category].data.pop('labels').to(device)
+
+    # calculate norm for each edge type and store in edge
+    for canonical_etype in g.canonical_etypes:
+        u, v, eid = g.all_edges(form='all', etype=canonical_etype)
+        _, inverse_index, count = torch.unique(v, return_inverse=True, return_counts=True)
+        degrees = count[inverse_index]
+        norm = 1. / degrees.float()
+        norm = norm.unsqueeze(1)
+        g.edges[canonical_etype].data['norm'] = norm
+
+    # get target category id
+    category_id = len(g.ntypes)
+    for i, ntype in enumerate(g.ntypes):
+        if ntype == category:
+            category_id = i
+
+    g = dgl.to_homogeneous(g, edata=['norm']).to(device)
+    num_nodes = g.number_of_nodes()
+    edge_norm = g.edata['norm']
+    edge_type = g.edata[dgl.ETYPE].long()
+
+    # find out the target node ids in g
+    target_idx = torch.where(g.ndata[dgl.NTYPE] == category_id)[0]
+    train_idx = target_idx[train_mask]
+    test_idx = target_idx[test_mask]
+    train_labels = labels[train_mask]
+    test_labels = labels[test_mask]
+
+    # since the nodes are featureless, the input feature is then the node id.
+    feats = torch.arange(num_nodes, device=device)
+
+    # create model
+    model = RGCN(num_nodes, 
+                 16,
+                 num_classes,
+                 num_rels,
+                 num_bases,
+                 0,
+                 0).to(device)
+
+    optimizer = torch.optim.Adam(model.parameters(),
+                                 lr=1e-2,
+                                 weight_decay=l2norm)
+
+    model.train()
+    t0 = time.time()
+    for epoch in range(num_epochs):
+        logits = model(g, feats, edge_type, edge_norm)
+        loss = F.cross_entropy(logits[train_idx], train_labels)
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+    t1 = time.time()
+
+    return (t1 - t0) / num_epochs
diff --git a/benchmarks/benchmarks/model_speed/bench_sage.py b/benchmarks/benchmarks/model_speed/bench_sage.py
@@ -89,4 +89,4 @@ def track_time(data):
         optimizer.step()
     t1 = time.time()
 
-    return t1 - t0
+    return (t1 - t0) / num_epochs
diff --git a/benchmarks/benchmarks/model_speed/bench_sage_ns.py b/benchmarks/benchmarks/model_speed/bench_sage_ns.py
@@ -130,4 +130,4 @@ def track_time(data):
 
     t1 = time.time()
 
-    return t1 - t0
+    return (t1 - t0) / num_epochs
diff --git a/benchmarks/benchmarks/model_speed/bench_sage_unsupervised_ns.py b/benchmarks/benchmarks/model_speed/bench_sage_unsupervised_ns.py
@@ -180,4 +180,4 @@ def track_time(data):
 
     t1 = time.time()
 
-    return t1 - t0
+    return (t1 - t0) / num_epochs
Original file line number	Diff line number	Diff line change
Expand Up		@@ -130,4 +130,4 @@ def track_time(data):

		t1 = time.time()

		return t1 - t0
		return (t1 - t0) / num_epochs
Original file line number	Diff line number	Diff line change
Expand Up		@@ -180,4 +180,4 @@ def track_time(data):

		t1 = time.time()

		return t1 - t0
		return (t1 - t0) / num_epochs