投稿

2月, 2021の投稿を表示しています

xfeatのaggregationで自作の関数を使いたい

イメージ
こんにちは、ぐぐりら(<a href="https://twitter.com/guglilac">@guglilac</a>)です。 特徴量作成のライブラリであるxfeatの集約特徴量を計算してくれるaggregationがとても便利で最近よく使っています。(xfeatはaggregation以外にも様々な機能があります。詳しくはこちらの記事などが参考になると思います。) [特徴量エンジニアリングのライブラリ xfeat を使ってみて便利だったこと - Taste of Tech Topics](https://acro-engineer.hatenablog.com/entry/2020/12/15/120000) 今回はタイトルの通り、xfeatのaggregtionの集約関数として自作の関数を使いたいときにどうするか、という内容について書いてみます。 ## aggregationの基本的な使い方 まずは自作関数を渡す前に、xfeatのaggregationの基本的な使い方をみてみます。 先ほど紹介した記事から引用したコードですが、以下のように書くと「性別ごとのAge,Pclassの平均、最大」が取得できます。 ```python from xfeat import aggregation aggregated_df, aggregated_cols = aggregation(train_df, group_key="Sex", group_values=["Age", "Pclass"], agg_methods=["mean", "max"] ) ``` と書くと |Sex|agg_mean_Age_grpby_Sex|agg_max_Age_grpby_Sex|agg_mean_Pclass_grpby_Sex|agg_max_Pclass_grpby_Sex| |----|----|----|----|----| |Ma