From 99a8835bdb0ada408dd718491729ff7d6f715e08 Mon Sep 17 00:00:00 2001
From: ph_ <jpatrickhall@gmail.com>
Date: Thu, 29 Jun 2023 12:40:58 -0400
Subject: [PATCH] final remediated model evaluations

---
 assignments/eval.ipynb                        | 1415 +++++++++++++++++
 .../model_eval_2023_06_28_21_00_17.csv        |   26 +
 2 files changed, 1441 insertions(+)
 create mode 100644 assignments/eval.ipynb
 create mode 100644 assignments/model_eval_2023_06_28_21_00_17.csv
diff --git a/assignments/eval.ipynb b/assignments/eval.ipynb
new file mode 100644
index 0000000..5a3a9ac
--- /dev/null
+++ b/assignments/eval.ipynb
@@ -0,0 +1,1415 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "id": "f7efc033",
+   "metadata": {},
+   "source": [
+    "## License \n",
+    "\n",
+    "Copyright 2021-2023 Patrick Hall (jphall@gwu.edu)\n",
+    "\n",
+    "Licensed under the Apache License, Version 2.0 (the \"License\");\n",
+    "you may not use this file except in compliance with the License.\n",
+    "You may obtain a copy of the License at\n",
+    "\n",
+    "    http://www.apache.org/licenses/LICENSE-2.0\n",
+    "\n",
+    "Unless required by applicable law or agreed to in writing, software\n",
+    "distributed under the License is distributed on an \"AS IS\" BASIS,\n",
+    "WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\n",
+    "See the License for the specific language governing permissions and\n",
+    "limitations under the License.\n",
+    "\n",
+    "*DISCLAIMER*: This notebook is not legal or compliance advice."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "aab60b41",
+   "metadata": {},
+   "source": [
+    "# Model Evaluation Notebook"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "281af306",
+   "metadata": {},
+   "source": [
+    "#### Imports and inits"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 1,
+   "id": "fd180587",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "import os              # for directory and file manipulation\n",
+    "import numpy as np     # for basic array manipulation\n",
+    "import pandas as pd    # for dataframe manipulation\n",
+    "import datetime        # for timestamp\n",
+    "\n",
+    "# for model eval\n",
+    "from sklearn.metrics import accuracy_score, f1_score, log_loss, mean_squared_error, roc_auc_score\n",
+    "\n",
+    "# global constants \n",
+    "ROUND = 3              # generally, insane precision is not needed \n",
+    "SEED = 12345           # seed for better reproducibility\n",
+    "\n",
+    "# set global random seed for better reproducibility\n",
+    "np.random.seed(SEED)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "eb2a39d4",
+   "metadata": {},
+   "source": [
+    "#### Set basic metadata"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 2,
+   "id": "98f640ed",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "y_name = 'high_priced'\n",
+    "scores_dir = 'data/scores'"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "cc8d83d0",
+   "metadata": {},
+   "source": [
+    "#### Read in score files "
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 3,
+   "id": "355c2b81",
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>high_priced</th>\n",
+       "      <th>fold</th>\n",
+       "      <th>group1_rem_ebm</th>\n",
+       "      <th>group2_rem_ebm</th>\n",
+       "      <th>group2_rem_ebm2</th>\n",
+       "      <th>group3_rem_piml_EBM</th>\n",
+       "      <th>group3_rem_piml_EBM2</th>\n",
+       "      <th>group5_rem_xgb2</th>\n",
+       "      <th>group8_rem_ebm</th>\n",
+       "      <th>group9_rem_xgb</th>\n",
+       "      <th>ph_rem_ebm</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>0.0</td>\n",
+       "      <td>2</td>\n",
+       "      <td>0.118787</td>\n",
+       "      <td>0.080557</td>\n",
+       "      <td>0.080557</td>\n",
+       "      <td>0.920389</td>\n",
+       "      <td>0.136749</td>\n",
+       "      <td>0.078326</td>\n",
+       "      <td>0.223846</td>\n",
+       "      <td>0.081792</td>\n",
+       "      <td>0.219429</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>0.0</td>\n",
+       "      <td>1</td>\n",
+       "      <td>0.084506</td>\n",
+       "      <td>0.026001</td>\n",
+       "      <td>0.026001</td>\n",
+       "      <td>0.969301</td>\n",
+       "      <td>0.053751</td>\n",
+       "      <td>0.035825</td>\n",
+       "      <td>0.053926</td>\n",
+       "      <td>0.110702</td>\n",
+       "      <td>0.053929</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>1.0</td>\n",
+       "      <td>4</td>\n",
+       "      <td>0.210389</td>\n",
+       "      <td>0.194961</td>\n",
+       "      <td>0.194961</td>\n",
+       "      <td>0.814272</td>\n",
+       "      <td>0.182311</td>\n",
+       "      <td>0.195332</td>\n",
+       "      <td>0.143522</td>\n",
+       "      <td>0.204048</td>\n",
+       "      <td>0.133863</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>0.0</td>\n",
+       "      <td>1</td>\n",
+       "      <td>0.008529</td>\n",
+       "      <td>0.028556</td>\n",
+       "      <td>0.028556</td>\n",
+       "      <td>0.974559</td>\n",
+       "      <td>0.004065</td>\n",
+       "      <td>0.022765</td>\n",
+       "      <td>0.009371</td>\n",
+       "      <td>0.024038</td>\n",
+       "      <td>0.014419</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>1.0</td>\n",
+       "      <td>2</td>\n",
+       "      <td>0.189933</td>\n",
+       "      <td>0.208263</td>\n",
+       "      <td>0.208263</td>\n",
+       "      <td>0.802908</td>\n",
+       "      <td>0.211120</td>\n",
+       "      <td>0.193035</td>\n",
+       "      <td>0.151100</td>\n",
+       "      <td>0.170243</td>\n",
+       "      <td>0.156047</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>...</th>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "      <td>...</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>19826</th>\n",
+       "      <td>0.0</td>\n",
+       "      <td>3</td>\n",
+       "      <td>0.163697</td>\n",
+       "      <td>0.228342</td>\n",
+       "      <td>0.228342</td>\n",
+       "      <td>0.792251</td>\n",
+       "      <td>0.209322</td>\n",
+       "      <td>0.235192</td>\n",
+       "      <td>0.216720</td>\n",
+       "      <td>0.181403</td>\n",
+       "      <td>0.184214</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>19827</th>\n",
+       "      <td>0.0</td>\n",
+       "      <td>1</td>\n",
+       "      <td>0.114999</td>\n",
+       "      <td>0.253998</td>\n",
+       "      <td>0.253998</td>\n",
+       "      <td>0.762946</td>\n",
+       "      <td>0.206744</td>\n",
+       "      <td>0.235832</td>\n",
+       "      <td>0.161401</td>\n",
+       "      <td>0.159468</td>\n",
+       "      <td>0.141663</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>19828</th>\n",
+       "      <td>1.0</td>\n",
+       "      <td>3</td>\n",
+       "      <td>0.141307</td>\n",
+       "      <td>0.213364</td>\n",
+       "      <td>0.213364</td>\n",
+       "      <td>0.747401</td>\n",
+       "      <td>0.246610</td>\n",
+       "      <td>0.208723</td>\n",
+       "      <td>0.242814</td>\n",
+       "      <td>0.138141</td>\n",
+       "      <td>0.233266</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>19829</th>\n",
+       "      <td>0.0</td>\n",
+       "      <td>1</td>\n",
+       "      <td>0.007766</td>\n",
+       "      <td>0.002176</td>\n",
+       "      <td>0.002176</td>\n",
+       "      <td>0.996455</td>\n",
+       "      <td>0.000268</td>\n",
+       "      <td>0.018702</td>\n",
+       "      <td>0.005657</td>\n",
+       "      <td>0.034570</td>\n",
+       "      <td>0.009914</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>19830</th>\n",
+       "      <td>0.0</td>\n",
+       "      <td>0</td>\n",
+       "      <td>0.163946</td>\n",
+       "      <td>0.185484</td>\n",
+       "      <td>0.185484</td>\n",
+       "      <td>0.811429</td>\n",
+       "      <td>0.177857</td>\n",
+       "      <td>0.215085</td>\n",
+       "      <td>0.167812</td>\n",
+       "      <td>0.177785</td>\n",
+       "      <td>0.155447</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "<p>19831 rows × 11 columns</p>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "       high_priced  fold  group1_rem_ebm  group2_rem_ebm  group2_rem_ebm2  \\\n",
+       "0              0.0     2        0.118787        0.080557         0.080557   \n",
+       "1              0.0     1        0.084506        0.026001         0.026001   \n",
+       "2              1.0     4        0.210389        0.194961         0.194961   \n",
+       "3              0.0     1        0.008529        0.028556         0.028556   \n",
+       "4              1.0     2        0.189933        0.208263         0.208263   \n",
+       "...            ...   ...             ...             ...              ...   \n",
+       "19826          0.0     3        0.163697        0.228342         0.228342   \n",
+       "19827          0.0     1        0.114999        0.253998         0.253998   \n",
+       "19828          1.0     3        0.141307        0.213364         0.213364   \n",
+       "19829          0.0     1        0.007766        0.002176         0.002176   \n",
+       "19830          0.0     0        0.163946        0.185484         0.185484   \n",
+       "\n",
+       "       group3_rem_piml_EBM  group3_rem_piml_EBM2  group5_rem_xgb2  \\\n",
+       "0                 0.920389              0.136749         0.078326   \n",
+       "1                 0.969301              0.053751         0.035825   \n",
+       "2                 0.814272              0.182311         0.195332   \n",
+       "3                 0.974559              0.004065         0.022765   \n",
+       "4                 0.802908              0.211120         0.193035   \n",
+       "...                    ...                   ...              ...   \n",
+       "19826             0.792251              0.209322         0.235192   \n",
+       "19827             0.762946              0.206744         0.235832   \n",
+       "19828             0.747401              0.246610         0.208723   \n",
+       "19829             0.996455              0.000268         0.018702   \n",
+       "19830             0.811429              0.177857         0.215085   \n",
+       "\n",
+       "       group8_rem_ebm  group9_rem_xgb  ph_rem_ebm  \n",
+       "0            0.223846        0.081792    0.219429  \n",
+       "1            0.053926        0.110702    0.053929  \n",
+       "2            0.143522        0.204048    0.133863  \n",
+       "3            0.009371        0.024038    0.014419  \n",
+       "4            0.151100        0.170243    0.156047  \n",
+       "...               ...             ...         ...  \n",
+       "19826        0.216720        0.181403    0.184214  \n",
+       "19827        0.161401        0.159468    0.141663  \n",
+       "19828        0.242814        0.138141    0.233266  \n",
+       "19829        0.005657        0.034570    0.009914  \n",
+       "19830        0.167812        0.177785    0.155447  \n",
+       "\n",
+       "[19831 rows x 11 columns]"
+      ]
+     },
+     "execution_count": 3,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "# init score frame with known test y values\n",
+    "scores_frame = pd.read_csv(scores_dir + os.sep +'key.csv', index_col='Unnamed: 0')\n",
+    "\n",
+    "# create random folds in reproducible way\n",
+    "np.random.seed(SEED)\n",
+    "scores_frame['fold'] = np.random.choice(5, scores_frame.shape[0])\n",
+    "\n",
+    "# read in each score file in the directory as a new column \n",
+    "for file in sorted(os.listdir(scores_dir)):\n",
+    "    if file != 'key.csv' and file.endswith('.csv'):\n",
+    "        scores_frame[file[:-4]] = pd.read_csv(scores_dir + os.sep + file)['phat']\n",
+    "\n",
+    "# sanity check \n",
+    "scores_frame"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "3e3cccda",
+   "metadata": {},
+   "source": [
+    "#### Utility function for max. accuracy"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 4,
+   "id": "2eb43506",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "def max_acc(y, phat, res=0.01): \n",
+    "\n",
+    "    \"\"\" Utility function for finding max. accuracy at some cutoff. \n",
+    "    \n",
+    "        :param y: Known y values.\n",
+    "        :param phat: Model scores.\n",
+    "        :param res: Resolution over which to search for max. accuracy, default 0.01.\n",
+    "        :return: Max. accuracy for model scores.\n",
+    "    \n",
+    "    \"\"\"\n",
+    "    \n",
+    "    # init frame to store acc at different cutoffs\n",
+    "    acc_frame = pd.DataFrame(columns=['cut', 'acc'])\n",
+    "    \n",
+    "    # copy known y and score values into a temporary frame\n",
+    "    temp_df = pd.concat([y, phat], axis=1)\n",
+    "    \n",
+    "    # find accuracy at different cutoffs and store in acc_frame\n",
+    "    for cut in np.arange(0, 1 + res, res):\n",
+    "        temp_df['decision'] = np.where(temp_df.iloc[:, 1] > cut, 1, 0)\n",
+    "        acc = accuracy_score(temp_df.iloc[:, 0], temp_df['decision'])\n",
+    "        acc_frame = acc_frame.append({'cut': cut,\n",
+    "                                      'acc': acc},\n",
+    "                                     ignore_index=True)\n",
+    "\n",
+    "    # find max accurcay across all cutoffs\n",
+    "    max_acc = acc_frame['acc'].max()\n",
+    "    \n",
+    "    # house keeping\n",
+    "    del acc_frame, temp_df\n",
+    "    \n",
+    "    return max_acc"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "b02c9651",
+   "metadata": {},
+   "source": [
+    "####  Utility function for max. F1"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 5,
+   "id": "fae3756b",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "def max_f1(y, phat, res=0.01): \n",
+    "    \n",
+    "    \"\"\" Utility function for finding max. F1 at some cutoff. \n",
+    "    \n",
+    "        :param y: Known y values.\n",
+    "        :param phat: Model scores.\n",
+    "        :param res: Resolution over which to search for max. F1, default 0.01.\n",
+    "        :return: Max. F1 for model scores.\n",
+    "    \n",
+    "    \"\"\"\n",
+    "    \n",
+    "    # init frame to store f1 at different cutoffs\n",
+    "    f1_frame = pd.DataFrame(columns=['cut', 'f1'])\n",
+    "    \n",
+    "    # copy known y and score values into a temporary frame\n",
+    "    temp_df = pd.concat([y, phat], axis=1)\n",
+    "    \n",
+    "    # find f1 at different cutoffs and store in acc_frame\n",
+    "    for cut in np.arange(0, 1 + res, res):\n",
+    "        temp_df['decision'] = np.where(temp_df.iloc[:, 1] > cut, 1, 0)\n",
+    "        f1 = f1_score(temp_df.iloc[:, 0], temp_df['decision'])\n",
+    "        f1_frame = f1_frame.append({'cut': cut,\n",
+    "                                    'f1': f1},\n",
+    "                                    ignore_index=True)\n",
+    "        \n",
+    "    # find max f1 across all cutoffs\n",
+    "    max_f1 = f1_frame['f1'].max()\n",
+    "    \n",
+    "     # house keeping\n",
+    "    del f1_frame, temp_df\n",
+    "    \n",
+    "    return max_f1"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "b447b732",
+   "metadata": {},
+   "source": [
+    "#### Rank all submitted scores "
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 6,
+   "id": "40fbe608",
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/html": [
+       "<div>\n",
+       "<style scoped>\n",
+       "    .dataframe tbody tr th:only-of-type {\n",
+       "        vertical-align: middle;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe tbody tr th {\n",
+       "        vertical-align: top;\n",
+       "    }\n",
+       "\n",
+       "    .dataframe thead th {\n",
+       "        text-align: right;\n",
+       "    }\n",
+       "</style>\n",
+       "<table border=\"1\" class=\"dataframe\">\n",
+       "  <thead>\n",
+       "    <tr style=\"text-align: right;\">\n",
+       "      <th></th>\n",
+       "      <th>fold</th>\n",
+       "      <th>metric</th>\n",
+       "      <th>group1_rem_ebm</th>\n",
+       "      <th>group2_rem_ebm</th>\n",
+       "      <th>group2_rem_ebm2</th>\n",
+       "      <th>group3_rem_piml_EBM</th>\n",
+       "      <th>group3_rem_piml_EBM2</th>\n",
+       "      <th>group5_rem_xgb2</th>\n",
+       "      <th>group8_rem_ebm</th>\n",
+       "      <th>group9_rem_xgb</th>\n",
+       "      <th>ph_rem_ebm</th>\n",
+       "      <th>group1_rem_ebm_rank</th>\n",
+       "      <th>group2_rem_ebm_rank</th>\n",
+       "      <th>group2_rem_ebm2_rank</th>\n",
+       "      <th>group3_rem_piml_EBM_rank</th>\n",
+       "      <th>group3_rem_piml_EBM2_rank</th>\n",
+       "      <th>group5_rem_xgb2_rank</th>\n",
+       "      <th>group8_rem_ebm_rank</th>\n",
+       "      <th>group9_rem_xgb_rank</th>\n",
+       "      <th>ph_rem_ebm_rank</th>\n",
+       "    </tr>\n",
+       "  </thead>\n",
+       "  <tbody>\n",
+       "    <tr>\n",
+       "      <th>0</th>\n",
+       "      <td>0.0</td>\n",
+       "      <td>acc</td>\n",
+       "      <td>0.900</td>\n",
+       "      <td>0.901</td>\n",
+       "      <td>0.901</td>\n",
+       "      <td>0.900</td>\n",
+       "      <td>0.901</td>\n",
+       "      <td>0.901</td>\n",
+       "      <td>0.901</td>\n",
+       "      <td>0.900</td>\n",
+       "      <td>0.901</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>3.5</td>\n",
+       "      <td>3.5</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>3.5</td>\n",
+       "      <td>3.5</td>\n",
+       "      <td>3.5</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>3.5</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>1</th>\n",
+       "      <td>0.0</td>\n",
+       "      <td>auc</td>\n",
+       "      <td>0.781</td>\n",
+       "      <td>0.840</td>\n",
+       "      <td>0.840</td>\n",
+       "      <td>0.163</td>\n",
+       "      <td>0.821</td>\n",
+       "      <td>0.836</td>\n",
+       "      <td>0.793</td>\n",
+       "      <td>0.797</td>\n",
+       "      <td>0.791</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>3.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>7.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>2</th>\n",
+       "      <td>0.0</td>\n",
+       "      <td>f1</td>\n",
+       "      <td>0.347</td>\n",
+       "      <td>0.405</td>\n",
+       "      <td>0.405</td>\n",
+       "      <td>0.182</td>\n",
+       "      <td>0.381</td>\n",
+       "      <td>0.392</td>\n",
+       "      <td>0.342</td>\n",
+       "      <td>0.357</td>\n",
+       "      <td>0.347</td>\n",
+       "      <td>6.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>3.0</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>6.5</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>3</th>\n",
+       "      <td>0.0</td>\n",
+       "      <td>logloss</td>\n",
+       "      <td>0.280</td>\n",
+       "      <td>0.251</td>\n",
+       "      <td>0.251</td>\n",
+       "      <td>3.257</td>\n",
+       "      <td>0.262</td>\n",
+       "      <td>0.254</td>\n",
+       "      <td>0.274</td>\n",
+       "      <td>0.277</td>\n",
+       "      <td>0.275</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>3.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>6.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>4</th>\n",
+       "      <td>0.0</td>\n",
+       "      <td>mse</td>\n",
+       "      <td>0.082</td>\n",
+       "      <td>0.077</td>\n",
+       "      <td>0.077</td>\n",
+       "      <td>0.773</td>\n",
+       "      <td>0.078</td>\n",
+       "      <td>0.077</td>\n",
+       "      <td>0.081</td>\n",
+       "      <td>0.081</td>\n",
+       "      <td>0.081</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>2.0</td>\n",
+       "      <td>2.0</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>2.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>6.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>5</th>\n",
+       "      <td>1.0</td>\n",
+       "      <td>acc</td>\n",
+       "      <td>0.906</td>\n",
+       "      <td>0.906</td>\n",
+       "      <td>0.906</td>\n",
+       "      <td>0.906</td>\n",
+       "      <td>0.906</td>\n",
+       "      <td>0.906</td>\n",
+       "      <td>0.906</td>\n",
+       "      <td>0.906</td>\n",
+       "      <td>0.906</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>6</th>\n",
+       "      <td>1.0</td>\n",
+       "      <td>auc</td>\n",
+       "      <td>0.767</td>\n",
+       "      <td>0.828</td>\n",
+       "      <td>0.828</td>\n",
+       "      <td>0.172</td>\n",
+       "      <td>0.810</td>\n",
+       "      <td>0.822</td>\n",
+       "      <td>0.774</td>\n",
+       "      <td>0.779</td>\n",
+       "      <td>0.772</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>3.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>7.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>7</th>\n",
+       "      <td>1.0</td>\n",
+       "      <td>f1</td>\n",
+       "      <td>0.312</td>\n",
+       "      <td>0.368</td>\n",
+       "      <td>0.368</td>\n",
+       "      <td>0.172</td>\n",
+       "      <td>0.348</td>\n",
+       "      <td>0.360</td>\n",
+       "      <td>0.319</td>\n",
+       "      <td>0.329</td>\n",
+       "      <td>0.321</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>3.0</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>6.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>8</th>\n",
+       "      <td>1.0</td>\n",
+       "      <td>logloss</td>\n",
+       "      <td>0.272</td>\n",
+       "      <td>0.246</td>\n",
+       "      <td>0.246</td>\n",
+       "      <td>3.253</td>\n",
+       "      <td>0.258</td>\n",
+       "      <td>0.250</td>\n",
+       "      <td>0.270</td>\n",
+       "      <td>0.271</td>\n",
+       "      <td>0.272</td>\n",
+       "      <td>7.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>3.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>7.5</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>9</th>\n",
+       "      <td>1.0</td>\n",
+       "      <td>mse</td>\n",
+       "      <td>0.079</td>\n",
+       "      <td>0.074</td>\n",
+       "      <td>0.074</td>\n",
+       "      <td>0.778</td>\n",
+       "      <td>0.077</td>\n",
+       "      <td>0.075</td>\n",
+       "      <td>0.079</td>\n",
+       "      <td>0.078</td>\n",
+       "      <td>0.079</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>3.0</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>7.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>10</th>\n",
+       "      <td>2.0</td>\n",
+       "      <td>acc</td>\n",
+       "      <td>0.908</td>\n",
+       "      <td>0.908</td>\n",
+       "      <td>0.908</td>\n",
+       "      <td>0.908</td>\n",
+       "      <td>0.908</td>\n",
+       "      <td>0.910</td>\n",
+       "      <td>0.908</td>\n",
+       "      <td>0.908</td>\n",
+       "      <td>0.909</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>1.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>2.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>11</th>\n",
+       "      <td>2.0</td>\n",
+       "      <td>auc</td>\n",
+       "      <td>0.759</td>\n",
+       "      <td>0.825</td>\n",
+       "      <td>0.825</td>\n",
+       "      <td>0.175</td>\n",
+       "      <td>0.815</td>\n",
+       "      <td>0.826</td>\n",
+       "      <td>0.781</td>\n",
+       "      <td>0.772</td>\n",
+       "      <td>0.780</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>2.5</td>\n",
+       "      <td>2.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>1.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>6.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>12</th>\n",
+       "      <td>2.0</td>\n",
+       "      <td>f1</td>\n",
+       "      <td>0.304</td>\n",
+       "      <td>0.372</td>\n",
+       "      <td>0.372</td>\n",
+       "      <td>0.169</td>\n",
+       "      <td>0.354</td>\n",
+       "      <td>0.371</td>\n",
+       "      <td>0.315</td>\n",
+       "      <td>0.320</td>\n",
+       "      <td>0.323</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>3.0</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>5.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>13</th>\n",
+       "      <td>2.0</td>\n",
+       "      <td>logloss</td>\n",
+       "      <td>0.271</td>\n",
+       "      <td>0.246</td>\n",
+       "      <td>0.246</td>\n",
+       "      <td>3.284</td>\n",
+       "      <td>0.251</td>\n",
+       "      <td>0.245</td>\n",
+       "      <td>0.264</td>\n",
+       "      <td>0.271</td>\n",
+       "      <td>0.264</td>\n",
+       "      <td>7.5</td>\n",
+       "      <td>2.5</td>\n",
+       "      <td>2.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>1.0</td>\n",
+       "      <td>5.5</td>\n",
+       "      <td>7.5</td>\n",
+       "      <td>5.5</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>14</th>\n",
+       "      <td>2.0</td>\n",
+       "      <td>mse</td>\n",
+       "      <td>0.078</td>\n",
+       "      <td>0.073</td>\n",
+       "      <td>0.073</td>\n",
+       "      <td>0.781</td>\n",
+       "      <td>0.074</td>\n",
+       "      <td>0.073</td>\n",
+       "      <td>0.076</td>\n",
+       "      <td>0.077</td>\n",
+       "      <td>0.076</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>2.0</td>\n",
+       "      <td>2.0</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>2.0</td>\n",
+       "      <td>5.5</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>5.5</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>15</th>\n",
+       "      <td>3.0</td>\n",
+       "      <td>acc</td>\n",
+       "      <td>0.903</td>\n",
+       "      <td>0.903</td>\n",
+       "      <td>0.903</td>\n",
+       "      <td>0.903</td>\n",
+       "      <td>0.903</td>\n",
+       "      <td>0.903</td>\n",
+       "      <td>0.903</td>\n",
+       "      <td>0.903</td>\n",
+       "      <td>0.903</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>5.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>16</th>\n",
+       "      <td>3.0</td>\n",
+       "      <td>auc</td>\n",
+       "      <td>0.772</td>\n",
+       "      <td>0.826</td>\n",
+       "      <td>0.826</td>\n",
+       "      <td>0.174</td>\n",
+       "      <td>0.809</td>\n",
+       "      <td>0.823</td>\n",
+       "      <td>0.775</td>\n",
+       "      <td>0.786</td>\n",
+       "      <td>0.772</td>\n",
+       "      <td>7.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>3.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>7.5</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>17</th>\n",
+       "      <td>3.0</td>\n",
+       "      <td>f1</td>\n",
+       "      <td>0.317</td>\n",
+       "      <td>0.371</td>\n",
+       "      <td>0.371</td>\n",
+       "      <td>0.177</td>\n",
+       "      <td>0.361</td>\n",
+       "      <td>0.365</td>\n",
+       "      <td>0.328</td>\n",
+       "      <td>0.343</td>\n",
+       "      <td>0.323</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>3.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>7.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>18</th>\n",
+       "      <td>3.0</td>\n",
+       "      <td>logloss</td>\n",
+       "      <td>0.276</td>\n",
+       "      <td>0.252</td>\n",
+       "      <td>0.252</td>\n",
+       "      <td>3.254</td>\n",
+       "      <td>0.262</td>\n",
+       "      <td>0.253</td>\n",
+       "      <td>0.275</td>\n",
+       "      <td>0.275</td>\n",
+       "      <td>0.276</td>\n",
+       "      <td>7.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>3.0</td>\n",
+       "      <td>5.5</td>\n",
+       "      <td>5.5</td>\n",
+       "      <td>7.5</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>19</th>\n",
+       "      <td>3.0</td>\n",
+       "      <td>mse</td>\n",
+       "      <td>0.081</td>\n",
+       "      <td>0.077</td>\n",
+       "      <td>0.077</td>\n",
+       "      <td>0.775</td>\n",
+       "      <td>0.079</td>\n",
+       "      <td>0.077</td>\n",
+       "      <td>0.080</td>\n",
+       "      <td>0.080</td>\n",
+       "      <td>0.080</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>2.0</td>\n",
+       "      <td>2.0</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>2.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>6.0</td>\n",
+       "      <td>6.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>20</th>\n",
+       "      <td>4.0</td>\n",
+       "      <td>acc</td>\n",
+       "      <td>0.895</td>\n",
+       "      <td>0.897</td>\n",
+       "      <td>0.897</td>\n",
+       "      <td>0.895</td>\n",
+       "      <td>0.895</td>\n",
+       "      <td>0.898</td>\n",
+       "      <td>0.895</td>\n",
+       "      <td>0.896</td>\n",
+       "      <td>0.895</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>2.5</td>\n",
+       "      <td>2.5</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>1.0</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>7.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>21</th>\n",
+       "      <td>4.0</td>\n",
+       "      <td>auc</td>\n",
+       "      <td>0.754</td>\n",
+       "      <td>0.831</td>\n",
+       "      <td>0.831</td>\n",
+       "      <td>0.170</td>\n",
+       "      <td>0.818</td>\n",
+       "      <td>0.828</td>\n",
+       "      <td>0.785</td>\n",
+       "      <td>0.779</td>\n",
+       "      <td>0.782</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>3.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>6.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>22</th>\n",
+       "      <td>4.0</td>\n",
+       "      <td>f1</td>\n",
+       "      <td>0.323</td>\n",
+       "      <td>0.401</td>\n",
+       "      <td>0.401</td>\n",
+       "      <td>0.190</td>\n",
+       "      <td>0.404</td>\n",
+       "      <td>0.397</td>\n",
+       "      <td>0.364</td>\n",
+       "      <td>0.354</td>\n",
+       "      <td>0.362</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>2.5</td>\n",
+       "      <td>2.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>1.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>6.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>23</th>\n",
+       "      <td>4.0</td>\n",
+       "      <td>logloss</td>\n",
+       "      <td>0.296</td>\n",
+       "      <td>0.263</td>\n",
+       "      <td>0.263</td>\n",
+       "      <td>3.200</td>\n",
+       "      <td>0.273</td>\n",
+       "      <td>0.266</td>\n",
+       "      <td>0.286</td>\n",
+       "      <td>0.291</td>\n",
+       "      <td>0.287</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>1.5</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>3.0</td>\n",
+       "      <td>5.0</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>6.0</td>\n",
+       "    </tr>\n",
+       "    <tr>\n",
+       "      <th>24</th>\n",
+       "      <td>4.0</td>\n",
+       "      <td>mse</td>\n",
+       "      <td>0.087</td>\n",
+       "      <td>0.080</td>\n",
+       "      <td>0.080</td>\n",
+       "      <td>0.771</td>\n",
+       "      <td>0.082</td>\n",
+       "      <td>0.080</td>\n",
+       "      <td>0.084</td>\n",
+       "      <td>0.086</td>\n",
+       "      <td>0.084</td>\n",
+       "      <td>8.0</td>\n",
+       "      <td>2.0</td>\n",
+       "      <td>2.0</td>\n",
+       "      <td>9.0</td>\n",
+       "      <td>4.0</td>\n",
+       "      <td>2.0</td>\n",
+       "      <td>5.5</td>\n",
+       "      <td>7.0</td>\n",
+       "      <td>5.5</td>\n",
+       "    </tr>\n",
+       "  </tbody>\n",
+       "</table>\n",
+       "</div>"
+      ],
+      "text/plain": [
+       "    fold   metric  group1_rem_ebm  group2_rem_ebm  group2_rem_ebm2  \\\n",
+       "0    0.0      acc           0.900           0.901            0.901   \n",
+       "1    0.0      auc           0.781           0.840            0.840   \n",
+       "2    0.0       f1           0.347           0.405            0.405   \n",
+       "3    0.0  logloss           0.280           0.251            0.251   \n",
+       "4    0.0      mse           0.082           0.077            0.077   \n",
+       "5    1.0      acc           0.906           0.906            0.906   \n",
+       "6    1.0      auc           0.767           0.828            0.828   \n",
+       "7    1.0       f1           0.312           0.368            0.368   \n",
+       "8    1.0  logloss           0.272           0.246            0.246   \n",
+       "9    1.0      mse           0.079           0.074            0.074   \n",
+       "10   2.0      acc           0.908           0.908            0.908   \n",
+       "11   2.0      auc           0.759           0.825            0.825   \n",
+       "12   2.0       f1           0.304           0.372            0.372   \n",
+       "13   2.0  logloss           0.271           0.246            0.246   \n",
+       "14   2.0      mse           0.078           0.073            0.073   \n",
+       "15   3.0      acc           0.903           0.903            0.903   \n",
+       "16   3.0      auc           0.772           0.826            0.826   \n",
+       "17   3.0       f1           0.317           0.371            0.371   \n",
+       "18   3.0  logloss           0.276           0.252            0.252   \n",
+       "19   3.0      mse           0.081           0.077            0.077   \n",
+       "20   4.0      acc           0.895           0.897            0.897   \n",
+       "21   4.0      auc           0.754           0.831            0.831   \n",
+       "22   4.0       f1           0.323           0.401            0.401   \n",
+       "23   4.0  logloss           0.296           0.263            0.263   \n",
+       "24   4.0      mse           0.087           0.080            0.080   \n",
+       "\n",
+       "    group3_rem_piml_EBM  group3_rem_piml_EBM2  group5_rem_xgb2  \\\n",
+       "0                 0.900                 0.901            0.901   \n",
+       "1                 0.163                 0.821            0.836   \n",
+       "2                 0.182                 0.381            0.392   \n",
+       "3                 3.257                 0.262            0.254   \n",
+       "4                 0.773                 0.078            0.077   \n",
+       "5                 0.906                 0.906            0.906   \n",
+       "6                 0.172                 0.810            0.822   \n",
+       "7                 0.172                 0.348            0.360   \n",
+       "8                 3.253                 0.258            0.250   \n",
+       "9                 0.778                 0.077            0.075   \n",
+       "10                0.908                 0.908            0.910   \n",
+       "11                0.175                 0.815            0.826   \n",
+       "12                0.169                 0.354            0.371   \n",
+       "13                3.284                 0.251            0.245   \n",
+       "14                0.781                 0.074            0.073   \n",
+       "15                0.903                 0.903            0.903   \n",
+       "16                0.174                 0.809            0.823   \n",
+       "17                0.177                 0.361            0.365   \n",
+       "18                3.254                 0.262            0.253   \n",
+       "19                0.775                 0.079            0.077   \n",
+       "20                0.895                 0.895            0.898   \n",
+       "21                0.170                 0.818            0.828   \n",
+       "22                0.190                 0.404            0.397   \n",
+       "23                3.200                 0.273            0.266   \n",
+       "24                0.771                 0.082            0.080   \n",
+       "\n",
+       "    group8_rem_ebm  group9_rem_xgb  ph_rem_ebm  group1_rem_ebm_rank  \\\n",
+       "0            0.901           0.900       0.901                  8.0   \n",
+       "1            0.793           0.797       0.791                  8.0   \n",
+       "2            0.342           0.357       0.347                  6.5   \n",
+       "3            0.274           0.277       0.275                  8.0   \n",
+       "4            0.081           0.081       0.081                  8.0   \n",
+       "5            0.906           0.906       0.906                  5.0   \n",
+       "6            0.774           0.779       0.772                  8.0   \n",
+       "7            0.319           0.329       0.321                  8.0   \n",
+       "8            0.270           0.271       0.272                  7.5   \n",
+       "9            0.079           0.078       0.079                  7.0   \n",
+       "10           0.908           0.908       0.909                  6.0   \n",
+       "11           0.781           0.772       0.780                  8.0   \n",
+       "12           0.315           0.320       0.323                  8.0   \n",
+       "13           0.264           0.271       0.264                  7.5   \n",
+       "14           0.076           0.077       0.076                  8.0   \n",
+       "15           0.903           0.903       0.903                  5.0   \n",
+       "16           0.775           0.786       0.772                  7.5   \n",
+       "17           0.328           0.343       0.323                  8.0   \n",
+       "18           0.275           0.275       0.276                  7.5   \n",
+       "19           0.080           0.080       0.080                  8.0   \n",
+       "20           0.895           0.896       0.895                  7.0   \n",
+       "21           0.785           0.779       0.782                  8.0   \n",
+       "22           0.364           0.354       0.362                  8.0   \n",
+       "23           0.286           0.291       0.287                  8.0   \n",
+       "24           0.084           0.086       0.084                  8.0   \n",
+       "\n",
+       "    group2_rem_ebm_rank  group2_rem_ebm2_rank  group3_rem_piml_EBM_rank  \\\n",
+       "0                   3.5                   3.5                       8.0   \n",
+       "1                   1.5                   1.5                       9.0   \n",
+       "2                   1.5                   1.5                       9.0   \n",
+       "3                   1.5                   1.5                       9.0   \n",
+       "4                   2.0                   2.0                       9.0   \n",
+       "5                   5.0                   5.0                       5.0   \n",
+       "6                   1.5                   1.5                       9.0   \n",
+       "7                   1.5                   1.5                       9.0   \n",
+       "8                   1.5                   1.5                       9.0   \n",
+       "9                   1.5                   1.5                       9.0   \n",
+       "10                  6.0                   6.0                       6.0   \n",
+       "11                  2.5                   2.5                       9.0   \n",
+       "12                  1.5                   1.5                       9.0   \n",
+       "13                  2.5                   2.5                       9.0   \n",
+       "14                  2.0                   2.0                       9.0   \n",
+       "15                  5.0                   5.0                       5.0   \n",
+       "16                  1.5                   1.5                       9.0   \n",
+       "17                  1.5                   1.5                       9.0   \n",
+       "18                  1.5                   1.5                       9.0   \n",
+       "19                  2.0                   2.0                       9.0   \n",
+       "20                  2.5                   2.5                       7.0   \n",
+       "21                  1.5                   1.5                       9.0   \n",
+       "22                  2.5                   2.5                       9.0   \n",
+       "23                  1.5                   1.5                       9.0   \n",
+       "24                  2.0                   2.0                       9.0   \n",
+       "\n",
+       "    group3_rem_piml_EBM2_rank  group5_rem_xgb2_rank  group8_rem_ebm_rank  \\\n",
+       "0                         3.5                   3.5                  3.5   \n",
+       "1                         4.0                   3.0                  6.0   \n",
+       "2                         4.0                   3.0                  8.0   \n",
+       "3                         4.0                   3.0                  5.0   \n",
+       "4                         4.0                   2.0                  6.0   \n",
+       "5                         5.0                   5.0                  5.0   \n",
+       "6                         4.0                   3.0                  6.0   \n",
+       "7                         4.0                   3.0                  7.0   \n",
+       "8                         4.0                   3.0                  5.0   \n",
+       "9                         4.0                   3.0                  7.0   \n",
+       "10                        6.0                   1.0                  6.0   \n",
+       "11                        4.0                   1.0                  5.0   \n",
+       "12                        4.0                   3.0                  7.0   \n",
+       "13                        4.0                   1.0                  5.5   \n",
+       "14                        4.0                   2.0                  5.5   \n",
+       "15                        5.0                   5.0                  5.0   \n",
+       "16                        4.0                   3.0                  6.0   \n",
+       "17                        4.0                   3.0                  6.0   \n",
+       "18                        4.0                   3.0                  5.5   \n",
+       "19                        4.0                   2.0                  6.0   \n",
+       "20                        7.0                   1.0                  7.0   \n",
+       "21                        4.0                   3.0                  5.0   \n",
+       "22                        1.0                   4.0                  5.0   \n",
+       "23                        4.0                   3.0                  5.0   \n",
+       "24                        4.0                   2.0                  5.5   \n",
+       "\n",
+       "    group9_rem_xgb_rank  ph_rem_ebm_rank  \n",
+       "0                   8.0              3.5  \n",
+       "1                   5.0              7.0  \n",
+       "2                   5.0              6.5  \n",
+       "3                   7.0              6.0  \n",
+       "4                   6.0              6.0  \n",
+       "5                   5.0              5.0  \n",
+       "6                   5.0              7.0  \n",
+       "7                   5.0              6.0  \n",
+       "8                   6.0              7.5  \n",
+       "9                   5.0              7.0  \n",
+       "10                  6.0              2.0  \n",
+       "11                  7.0              6.0  \n",
+       "12                  6.0              5.0  \n",
+       "13                  7.5              5.5  \n",
+       "14                  7.0              5.5  \n",
+       "15                  5.0              5.0  \n",
+       "16                  5.0              7.5  \n",
+       "17                  5.0              7.0  \n",
+       "18                  5.5              7.5  \n",
+       "19                  6.0              6.0  \n",
+       "20                  4.0              7.0  \n",
+       "21                  7.0              6.0  \n",
+       "22                  7.0              6.0  \n",
+       "23                  7.0              6.0  \n",
+       "24                  7.0              5.5  "
+      ]
+     },
+     "execution_count": 6,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "eval_frame = pd.DataFrame() # init frame to hold score ranking\n",
+    "metric_list = ['acc', 'auc', 'f1', 'logloss', 'mse'] # metric to use for evaluation\n",
+    "\n",
+    "# create eval frame row-by-row\n",
+    "for fold in sorted(scores_frame['fold'].unique()): # loop through folds \n",
+    "    for metric_name in metric_list: # loop through metrics\n",
+    "        \n",
+    "        # init row dict to hold each rows values\n",
+    "        row_dict = {'fold': fold,\n",
+    "                    'metric': metric_name}\n",
+    "        \n",
+    "        # cache known y values for fold\n",
+    "        fold_y = scores_frame.loc[scores_frame['fold'] == fold, y_name]\n",
+    "        \n",
+    "        for col_name in scores_frame.columns[2:]:\n",
+    "            \n",
+    "            # cache fold scores\n",
+    "            fold_scores = scores_frame.loc[scores_frame['fold'] == fold, col_name]\n",
+    "            \n",
+    "            # calculate evaluation metric for fold\n",
+    "            # with reasonable precision \n",
+    "            \n",
+    "            if metric_name == 'acc':\n",
+    "                row_dict[col_name] = np.round(max_acc(fold_y, fold_scores), ROUND)\n",
+    "                \n",
+    "            if metric_name == 'auc':\n",
+    "                row_dict[col_name] = np.round(roc_auc_score(fold_y, fold_scores), ROUND)\n",
+    "                \n",
+    "            if metric_name == 'f1':\n",
+    "                row_dict[col_name] = np.round(max_f1(fold_y, fold_scores), ROUND) \n",
+    "                \n",
+    "            if metric_name == 'logloss':\n",
+    "                row_dict[col_name] = np.round(log_loss(fold_y, fold_scores), ROUND)\n",
+    "                \n",
+    "            if metric_name == 'mse':\n",
+    "                row_dict[col_name] = np.round(mean_squared_error(fold_y, fold_scores), ROUND)\n",
+    "        \n",
+    "        # append row values to eval_frame\n",
+    "        eval_frame = eval_frame.append(row_dict, ignore_index=True)\n",
+    "\n",
+    "# init a temporary frame to hold rank information\n",
+    "rank_names = [name + '_rank' for name in sorted(eval_frame.columns) if name not in ['fold', 'metric']]\n",
+    "rank_frame = pd.DataFrame(columns=rank_names)        \n",
+    "\n",
+    "# set columns to necessary order\n",
+    "eval_frame = eval_frame[['fold', 'metric'] + [name for name in sorted(eval_frame.columns) if name not in ['fold', 'metric']]]\n",
+    "\n",
+    "# determine score ranks row-by-row\n",
+    "for i in range(0, eval_frame.shape[0]):\n",
+    "        \n",
+    "        # get ranks for row based on metric\n",
+    "        metric_name = eval_frame.loc[i, 'metric']\n",
+    "        if metric_name in ['logloss', 'mse']:\n",
+    "            ranks = eval_frame.iloc[i, 2:].rank().values\n",
+    "        else:\n",
+    "            ranks = eval_frame.iloc[i, 2:].rank(ascending=False).values\n",
+    "        \n",
+    "        # create single-row frame and append to rank_frame\n",
+    "        row_frame = pd.DataFrame(ranks.reshape(1, ranks.shape[0]), columns=rank_names)\n",
+    "        rank_frame = rank_frame.append(row_frame, ignore_index=True)\n",
+    "        \n",
+    "        # house keeping\n",
+    "        del row_frame\n",
+    "\n",
+    "# merge ranks onto eval_frame\n",
+    "eval_frame = pd.concat([eval_frame, rank_frame], axis=1)\n",
+    "\n",
+    "# house keeping\n",
+    "del rank_frame\n",
+    "        \n",
+    "eval_frame"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "37ed3b5f",
+   "metadata": {},
+   "source": [
+    "#### Save `eval_frame` as CSV"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 7,
+   "id": "aa89d862",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "eval_frame.to_csv('model_eval_' + str(datetime.datetime.now().strftime(\"%Y_%m_%d_%H_%M_%S\") + '.csv'), \n",
+    "                  index=False)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "4525d3ea",
+   "metadata": {},
+   "source": [
+    "#### Display simple ranked score list "
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 8,
+   "id": "f8ff5fa5",
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "group2_rem_ebm_rank          2.28\n",
+       "group2_rem_ebm2_rank         2.28\n",
+       "group5_rem_xgb2_rank         2.74\n",
+       "group3_rem_piml_EBM2_rank    4.14\n",
+       "group8_rem_ebm_rank          5.74\n",
+       "group9_rem_xgb_rank          5.96\n",
+       "ph_rem_ebm_rank              5.96\n",
+       "group1_rem_ebm_rank          7.46\n",
+       "group3_rem_piml_EBM_rank     8.44\n",
+       "dtype: float64"
+      ]
+     },
+     "execution_count": 8,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "eval_frame[[name for name in eval_frame.columns if name.endswith('rank')]].mean().sort_values()"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3 (ipykernel)",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.9.16"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 5
+}
diff --git a/assignments/model_eval_2023_06_28_21_00_17.csv b/assignments/model_eval_2023_06_28_21_00_17.csv
new file mode 100644
index 0000000..551556c
--- /dev/null
+++ b/assignments/model_eval_2023_06_28_21_00_17.csv
@@ -0,0 +1,26 @@
+fold,metric,group1_rem_ebm,group2_rem_ebm,group2_rem_ebm2,group3_rem_piml_EBM,group3_rem_piml_EBM2,group5_rem_xgb2,group8_rem_ebm,group9_rem_xgb,ph_rem_ebm,group1_rem_ebm_rank,group2_rem_ebm_rank,group2_rem_ebm2_rank,group3_rem_piml_EBM_rank,group3_rem_piml_EBM2_rank,group5_rem_xgb2_rank,group8_rem_ebm_rank,group9_rem_xgb_rank,ph_rem_ebm_rank
+0.0,acc,0.9,0.901,0.901,0.9,0.901,0.901,0.901,0.9,0.901,8.0,3.5,3.5,8.0,3.5,3.5,3.5,8.0,3.5
+0.0,auc,0.781,0.84,0.84,0.163,0.821,0.836,0.793,0.797,0.791,8.0,1.5,1.5,9.0,4.0,3.0,6.0,5.0,7.0
+0.0,f1,0.347,0.405,0.405,0.182,0.381,0.392,0.342,0.357,0.347,6.5,1.5,1.5,9.0,4.0,3.0,8.0,5.0,6.5
+0.0,logloss,0.28,0.251,0.251,3.257,0.262,0.254,0.274,0.277,0.275,8.0,1.5,1.5,9.0,4.0,3.0,5.0,7.0,6.0
+0.0,mse,0.082,0.077,0.077,0.773,0.078,0.077,0.081,0.081,0.081,8.0,2.0,2.0,9.0,4.0,2.0,6.0,6.0,6.0
+1.0,acc,0.906,0.906,0.906,0.906,0.906,0.906,0.906,0.906,0.906,5.0,5.0,5.0,5.0,5.0,5.0,5.0,5.0,5.0
+1.0,auc,0.767,0.828,0.828,0.172,0.81,0.822,0.774,0.779,0.772,8.0,1.5,1.5,9.0,4.0,3.0,6.0,5.0,7.0
+1.0,f1,0.312,0.368,0.368,0.172,0.348,0.36,0.319,0.329,0.321,8.0,1.5,1.5,9.0,4.0,3.0,7.0,5.0,6.0
+1.0,logloss,0.272,0.246,0.246,3.253,0.258,0.25,0.27,0.271,0.272,7.5,1.5,1.5,9.0,4.0,3.0,5.0,6.0,7.5
+1.0,mse,0.079,0.074,0.074,0.778,0.077,0.075,0.079,0.078,0.079,7.0,1.5,1.5,9.0,4.0,3.0,7.0,5.0,7.0
+2.0,acc,0.908,0.908,0.908,0.908,0.908,0.91,0.908,0.908,0.909,6.0,6.0,6.0,6.0,6.0,1.0,6.0,6.0,2.0
+2.0,auc,0.759,0.825,0.825,0.175,0.815,0.826,0.781,0.772,0.78,8.0,2.5,2.5,9.0,4.0,1.0,5.0,7.0,6.0
+2.0,f1,0.304,0.372,0.372,0.169,0.354,0.371,0.315,0.32,0.323,8.0,1.5,1.5,9.0,4.0,3.0,7.0,6.0,5.0
+2.0,logloss,0.271,0.246,0.246,3.284,0.251,0.245,0.264,0.271,0.264,7.5,2.5,2.5,9.0,4.0,1.0,5.5,7.5,5.5
+2.0,mse,0.078,0.073,0.073,0.781,0.074,0.073,0.076,0.077,0.076,8.0,2.0,2.0,9.0,4.0,2.0,5.5,7.0,5.5
+3.0,acc,0.903,0.903,0.903,0.903,0.903,0.903,0.903,0.903,0.903,5.0,5.0,5.0,5.0,5.0,5.0,5.0,5.0,5.0
+3.0,auc,0.772,0.826,0.826,0.174,0.809,0.823,0.775,0.786,0.772,7.5,1.5,1.5,9.0,4.0,3.0,6.0,5.0,7.5
+3.0,f1,0.317,0.371,0.371,0.177,0.361,0.365,0.328,0.343,0.323,8.0,1.5,1.5,9.0,4.0,3.0,6.0,5.0,7.0
+3.0,logloss,0.276,0.252,0.252,3.254,0.262,0.253,0.275,0.275,0.276,7.5,1.5,1.5,9.0,4.0,3.0,5.5,5.5,7.5
+3.0,mse,0.081,0.077,0.077,0.775,0.079,0.077,0.08,0.08,0.08,8.0,2.0,2.0,9.0,4.0,2.0,6.0,6.0,6.0
+4.0,acc,0.895,0.897,0.897,0.895,0.895,0.898,0.895,0.896,0.895,7.0,2.5,2.5,7.0,7.0,1.0,7.0,4.0,7.0
+4.0,auc,0.754,0.831,0.831,0.17,0.818,0.828,0.785,0.779,0.782,8.0,1.5,1.5,9.0,4.0,3.0,5.0,7.0,6.0
+4.0,f1,0.323,0.401,0.401,0.19,0.404,0.397,0.364,0.354,0.362,8.0,2.5,2.5,9.0,1.0,4.0,5.0,7.0,6.0
+4.0,logloss,0.296,0.263,0.263,3.2,0.273,0.266,0.286,0.291,0.287,8.0,1.5,1.5,9.0,4.0,3.0,5.0,7.0,6.0
+4.0,mse,0.087,0.08,0.08,0.771,0.082,0.08,0.084,0.086,0.084,8.0,2.0,2.0,9.0,4.0,2.0,5.5,7.0,5.5

	high_priced	fold	group1_rem_ebm	group2_rem_ebm	group2_rem_ebm2	group3_rem_piml_EBM	group3_rem_piml_EBM2	group5_rem_xgb2	group8_rem_ebm	group9_rem_xgb	ph_rem_ebm
0	0.0	2	0.118787	0.080557	0.080557	0.920389	0.136749	0.078326	0.223846	0.081792	0.219429
1	0.0	1	0.084506	0.026001	0.026001	0.969301	0.053751	0.035825	0.053926	0.110702	0.053929
2	1.0	4	0.210389	0.194961	0.194961	0.814272	0.182311	0.195332	0.143522	0.204048	0.133863
3	0.0	1	0.008529	0.028556	0.028556	0.974559	0.004065	0.022765	0.009371	0.024038	0.014419
4	1.0	2	0.189933	0.208263	0.208263	0.802908	0.211120	0.193035	0.151100	0.170243	0.156047
...	...	...	...	...	...	...	...	...	...	...	...
19826	0.0	3	0.163697	0.228342	0.228342	0.792251	0.209322	0.235192	0.216720	0.181403	0.184214
19827	0.0	1	0.114999	0.253998	0.253998	0.762946	0.206744	0.235832	0.161401	0.159468	0.141663
19828	1.0	3	0.141307	0.213364	0.213364	0.747401	0.246610	0.208723	0.242814	0.138141	0.233266
19829	0.0	1	0.007766	0.002176	0.002176	0.996455	0.000268	0.018702	0.005657	0.034570	0.009914
19830	0.0	0	0.163946	0.185484	0.185484	0.811429	0.177857	0.215085	0.167812	0.177785	0.155447
	fold	metric	group1_rem_ebm	group2_rem_ebm	group2_rem_ebm2	group3_rem_piml_EBM	group3_rem_piml_EBM2	group5_rem_xgb2	group8_rem_ebm	group9_rem_xgb	ph_rem_ebm	group1_rem_ebm_rank	group2_rem_ebm_rank	group2_rem_ebm2_rank	group3_rem_piml_EBM_rank	group3_rem_piml_EBM2_rank	group5_rem_xgb2_rank	group8_rem_ebm_rank	group9_rem_xgb_rank	ph_rem_ebm_rank
0	0.0	acc	0.900	0.901	0.901	0.900	0.901	0.901	0.901	0.900	0.901	8.0	3.5	3.5	8.0	3.5	3.5	3.5	8.0	3.5
1	0.0	auc	0.781	0.840	0.840	0.163	0.821	0.836	0.793	0.797	0.791	8.0	1.5	1.5	9.0	4.0	3.0	6.0	5.0	7.0
2	0.0	f1	0.347	0.405	0.405	0.182	0.381	0.392	0.342	0.357	0.347	6.5	1.5	1.5	9.0	4.0	3.0	8.0	5.0	6.5
3	0.0	logloss	0.280	0.251	0.251	3.257	0.262	0.254	0.274	0.277	0.275	8.0	1.5	1.5	9.0	4.0	3.0	5.0	7.0	6.0
4	0.0	mse	0.082	0.077	0.077	0.773	0.078	0.077	0.081	0.081	0.081	8.0	2.0	2.0	9.0	4.0	2.0	6.0	6.0	6.0
5	1.0	acc	0.906	0.906	0.906	0.906	0.906	0.906	0.906	0.906	0.906	5.0	5.0	5.0	5.0	5.0	5.0	5.0	5.0	5.0
6	1.0	auc	0.767	0.828	0.828	0.172	0.810	0.822	0.774	0.779	0.772	8.0	1.5	1.5	9.0	4.0	3.0	6.0	5.0	7.0
7	1.0	f1	0.312	0.368	0.368	0.172	0.348	0.360	0.319	0.329	0.321	8.0	1.5	1.5	9.0	4.0	3.0	7.0	5.0	6.0
8	1.0	logloss	0.272	0.246	0.246	3.253	0.258	0.250	0.270	0.271	0.272	7.5	1.5	1.5	9.0	4.0	3.0	5.0	6.0	7.5
9	1.0	mse	0.079	0.074	0.074	0.778	0.077	0.075	0.079	0.078	0.079	7.0	1.5	1.5	9.0	4.0	3.0	7.0	5.0	7.0
10	2.0	acc	0.908	0.908	0.908	0.908	0.908	0.910	0.908	0.908	0.909	6.0	6.0	6.0	6.0	6.0	1.0	6.0	6.0	2.0
11	2.0	auc	0.759	0.825	0.825	0.175	0.815	0.826	0.781	0.772	0.780	8.0	2.5	2.5	9.0	4.0	1.0	5.0	7.0	6.0
12	2.0	f1	0.304	0.372	0.372	0.169	0.354	0.371	0.315	0.320	0.323	8.0	1.5	1.5	9.0	4.0	3.0	7.0	6.0	5.0
13	2.0	logloss	0.271	0.246	0.246	3.284	0.251	0.245	0.264	0.271	0.264	7.5	2.5	2.5	9.0	4.0	1.0	5.5	7.5	5.5
14	2.0	mse	0.078	0.073	0.073	0.781	0.074	0.073	0.076	0.077	0.076	8.0	2.0	2.0	9.0	4.0	2.0	5.5	7.0	5.5
15	3.0	acc	0.903	0.903	0.903	0.903	0.903	0.903	0.903	0.903	0.903	5.0	5.0	5.0	5.0	5.0	5.0	5.0	5.0	5.0
16	3.0	auc	0.772	0.826	0.826	0.174	0.809	0.823	0.775	0.786	0.772	7.5	1.5	1.5	9.0	4.0	3.0	6.0	5.0	7.5
17	3.0	f1	0.317	0.371	0.371	0.177	0.361	0.365	0.328	0.343	0.323	8.0	1.5	1.5	9.0	4.0	3.0	6.0	5.0	7.0
18	3.0	logloss	0.276	0.252	0.252	3.254	0.262	0.253	0.275	0.275	0.276	7.5	1.5	1.5	9.0	4.0	3.0	5.5	5.5	7.5
19	3.0	mse	0.081	0.077	0.077	0.775	0.079	0.077	0.080	0.080	0.080	8.0	2.0	2.0	9.0	4.0	2.0	6.0	6.0	6.0
20	4.0	acc	0.895	0.897	0.897	0.895	0.895	0.898	0.895	0.896	0.895	7.0	2.5	2.5	7.0	7.0	1.0	7.0	4.0	7.0
21	4.0	auc	0.754	0.831	0.831	0.170	0.818	0.828	0.785	0.779	0.782	8.0	1.5	1.5	9.0	4.0	3.0	5.0	7.0	6.0
22	4.0	f1	0.323	0.401	0.401	0.190	0.404	0.397	0.364	0.354	0.362	8.0	2.5	2.5	9.0	1.0	4.0	5.0	7.0	6.0
23	4.0	logloss	0.296	0.263	0.263	3.200	0.273	0.266	0.286	0.291	0.287	8.0	1.5	1.5	9.0	4.0	3.0	5.0	7.0	6.0
24	4.0	mse	0.087	0.080	0.080	0.771	0.082	0.080	0.084	0.086	0.084	8.0	2.0	2.0	9.0	4.0	2.0	5.5	7.0	5.5