GitHub - Luojiaqimath/NCART: Code for paper: NCART: Neural Classification and Regression Tree for Tabular Data

Code for our paper: NCART: Neural Classification and Regression Tree for Tabular Data

The supplementary materials are available in this repo.

See NCART_EXP for the datasets and the code.

Binary classification

import numpy as np
from sklearn.datasets import load_breast_cancer
import os
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
from ncart import NCARClassifier


data = load_breast_cancer()  
X = data.data.astype(np.float32)
y = data.target
feature_names = data.feature_names


# model = NCARClassifier(epochs=100, n_trees=8, n_layers=2, n_selected=6, use_gpu=False)  # CPU
# model = NCARClassifier(epochs=100, n_trees=8, n_layers=2, n_selected=6)  # single GPU
model = NCARClassifier(epochs=100, n_trees=8, n_layers=2, n_selected=6, data_parallel=True, gpu_ids=[0, 1])  # multiple GPU
model.fit(X, y)

importance = model.get_importance()

# Create a DataFrame with feature names and importance scores
feature_importance_df = pd.DataFrame({'Feature': feature_names, 'Importance': importance})
feature_importance_df = feature_importance_df.sort_values(by='Importance', ascending=False)

# Plot feature importances using Seaborn
plt.figure()
sns.barplot(x='Importance', y='Feature', data=feature_importance_df, width=0.6)
plt.title('Feature Importances', fontsize=12)
plt.xlabel('Importance Score', fontsize=15)
plt.ylabel('Features', fontsize=15)
plt.tick_params(axis='both', which='major', labelsize=12)
plt.tight_layout()
plt.show()

Multi-class classification

import numpy as np
from sklearn.datasets import load_iris
import os
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
from ncart import NCARClassifier


data = load_iris()  
X = data.data.astype(np.float32)
y = data.target
feature_names = data.feature_names


model = NCARClassifier(epochs=100, n_trees=8, n_layers=2, n_selected=6, use_gpu=False)  # CPU
# model = NCARClassifier(epochs=100, n_trees=8, n_layers=2, n_selected=6)  # single GPU
# model = NCARClassifier(epochs=100, n_trees=8, n_layers=2, n_selected=6, data_parallel=True, gpu_ids=[0, 1])  # multiple GPU
model.fit(X, y)


importance = model.get_importance()


# Create a DataFrame with feature names and importance scores
feature_importance_df = pd.DataFrame({'Feature': feature_names, 'Importance': importance})
feature_importance_df = feature_importance_df.sort_values(by='Importance', ascending=False)

# Plot feature importances using Seaborn
plt.figure()
sns.barplot(x='Importance', y='Feature', data=feature_importance_df, width=0.6)
plt.title('Feature Importances', fontsize=12)
plt.xlabel('Importance Score', fontsize=15)
plt.ylabel('Features', fontsize=15)
plt.tick_params(axis='both', which='major', labelsize=12)
plt.tight_layout()
plt.show()

Regression

import numpy as np
from sklearn.datasets import load_diabetes
import os
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
from ncart import NCARRegressor
import torch


data = load_diabetes()  
X = data.data.astype(np.float32)
y = data.target
feature_names = data.feature_names


# model = NCARRegressor(epochs=100, n_trees=8, n_layers=2, n_selected=6, use_gpu=False)  # CPU
model = NCARRegressor(epochs=5000, n_trees=8, n_layers=2, n_selected=6)  # single GPU
# model = NCARRegressor(epochs=100, n_trees=8, n_layers=2, n_selected=6, data_parallel=True, gpu_ids=[0, 1])  # multiple GPU
model.fit(X, y)


importance = model.get_importance()

# Create a DataFrame with feature names and importance scores
feature_importance_df = pd.DataFrame({'Feature': feature_names, 'Importance': importance})
feature_importance_df = feature_importance_df.sort_values(by='Importance', ascending=False)

# Plot feature importances using Seaborn
plt.figure()
sns.barplot(x='Importance', y='Feature', data=feature_importance_df, width=0.6)
plt.title('Feature Importances', fontsize=12)
plt.xlabel('Importance Score', fontsize=15)
plt.ylabel('Features', fontsize=15)
plt.tick_params(axis='both', which='major', labelsize=12)
plt.tight_layout()
plt.show()

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
NCART_EXP		NCART_EXP
LICENSE		LICENSE
README.md		README.md
Supplementary materials.pdf		Supplementary materials.pdf
binary.ipynb		binary.ipynb
multi_class.ipynb		multi_class.ipynb
ncart.py		ncart.py
regression.ipynb		regression.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Binary classification

Multi-class classification

Regression

About

Releases

Packages

Languages

License

Luojiaqimath/NCART

Folders and files

Latest commit

History

Repository files navigation

Binary classification

Multi-class classification

Regression

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages