Skip to content

Taurine-511/GPT

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

GPT

このプロジェクトは、小規模なローカル版のGPTモデルを作成することを目的としています。ローカルマシンで動作する軽量なGPTライクなモデルを開発し、教育目的や小規模なアプリケーション、クラウドベースのソリューションが難しい環境での利用を目指しています。

プロジェクト構成

プロジェクトは以下のように構成されています:

GPT/ │ ├── data/ # データセットを保存するディレクトリ │ ├── raw/ # 生のデータ(未加工のデータ) │ ├── processed/ # 前処理済みのデータ │ └── external/ # 外部から取得したデータ │ ├── notebooks/ # Jupyterノートブックを保存するディレクトリ │ ├── exploration.ipynb # データ探索や可視化のためのノートブック │ └── experiments.ipynb # モデルの実験のためのノートブック │ ├── src/ # ソースコードを保存するディレクトリ │ ├── init.py # Pythonパッケージとして認識されるためのファイル │ ├── data_loader.py # データ読み込みのためのスクリプト │ ├── preprocess.py # データ前処理のためのスクリプト │ ├── model.py # モデル定義のためのスクリプト │ ├── train.py # モデルのトレーニングスクリプト │ └── evaluate.py # モデルの評価スクリプト │ ├── tests/ # テストコードを保存するディレクトリ │ ├── init.py # Pythonパッケージとして認識されるためのファイル │ ├── test_data_loader.py # データ読み込みのテスト │ ├── test_preprocess.py # データ前処理のテスト │ ├── test_model.py # モデルのテスト │ ├── test_train.py # トレーニングのテスト │ └── test_evaluate.py # 評価のテスト │ ├── scripts/ # 一般的なスクリプトを保存するディレクトリ │ ├── run_train.sh # トレーニング実行スクリプト │ └── run_eval.sh # 評価実行スクリプト │ ├── config/ # 設定ファイルを保存するディレクトリ │ ├── config.yaml # トレーニング設定やモデルハイパーパラメータなど │ ├── logs/ # ログファイルを保存するディレクトリ │ └── training.log # トレーニングのログ │ ├── saved_models/ # トレーニング後のモデルを保存するディレクトリ │ └── best_model.pth # 最良のモデルのチェックポイント │ ├── requirements.txt # プロジェクトの依存関係を記述したファイル ├── environment.yml # conda環境の設定ファイル ├── README.md # プロジェクトの説明文書 └── .gitignore # Gitで無視するファイルを記述するファイル

bash コードをコピーする

はじめに

前提条件

このプロジェクトを実行するには、以下のソフトウェアがインストールされている必要があります。

  • Python 3.x
  • Conda(環境管理のため、推奨)

インストール

  1. リポジトリをクローンします:
    git clone https://github.com/your_username/GPT.git
    cd GPT

仮想環境を作成してアクティブにします(Condaを使用する場合):

sh コードをコピーする conda create --name gpt_env python=3.x conda activate gpt_env 必要な依存関係をインストールします:

sh コードをコピーする pip install -r requirements.txt

もしくは conda を使用する場合

conda env update --file environment.yml 使用方法 データ準備 生のデータをdata/raw/ディレクトリに配置します。src/data_loader.pyとsrc/preprocess.pyスクリプトを使用してデータを読み込み、前処理を行います。

トレーニング モデルをトレーニングするには、以下のコマンドを実行します:

sh コードをコピーする bash scripts/run_train.sh これにより、src/train.pyスクリプトが実行され、トレーニングが開始されます。

評価 モデルを評価するには、以下のコマンドを実行します:

sh コードをコピーする bash scripts/run_eval.sh これにより、src/evaluate.pyスクリプトが実行され、評価が行われます。

コントリビュート このプロジェクトへの貢献を歓迎します。改善提案や新機能の提案があれば、issueを作成するか、プルリクエストを送信してください。

ライセンス このプロジェクトはMITライセンスの下でライセンスされています。詳細についてはLICENSEファイルを参照してください。

謝辞 OpenAIが開発したGPTモデルにインスパイアされています。 このプロジェクトを可能にしたすべての貢献者とオープンソースプロジェクトに感謝します。 go コードをコピーする

このREADME.mdには、プロジェクトの概要、ディレクトリ構成、インストール手順、使用方法、コントリビューションガイドライン、ライセンス情報、および謝辞が含まれています。プロジェクトの詳細に合わせて、必要に応じて内容をカスタマイズしてください。

About

ローカルでGPT作る

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published