Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

データセットXのカラムを trainメソッドの戻り値に含める #17

Open
wants to merge 1 commit into
base: master
Choose a base branch
from

Conversation

EAakiyama3104
Copy link

表題通り.
これによって訓練にどのカラムを使ったのかを把握することができる

@risuoku
Copy link
Owner

risuoku commented Jan 6, 2020

「datasetについての情報が欲しい」というのであれば訓練時にcacheを有効にしておけば、DataFrameを読み込めば同じことがわかります。
「cacheを作るのは高コストだからカラム名だけわかるようにしたい」という使い方も考えられますが、その際は「訓練時のdatasetの情報をどう管理するか」という観点から考えたほうが良いかも。

この機能自体は否定しないけれど、cacheと上手く共存できるのが望ましい。cacheという呼び方じゃなくて、saved_dataset_value(保存済みdatasetの中身)みたいに扱うとか。

(ちなみに、preprocessorでカラム調整してる場合は、cacheの結果には乗ってこないけど、まあそれはconfigとcacheのカラムを見れば実際にどのカラムが使われたからわかるので不要なのでは、、と思う)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants