diff --git a/lakehouse_engine/core/exec_env.html b/lakehouse_engine/core/exec_env.html
index 0298aef..a415453 100644
--- a/lakehouse_engine/core/exec_env.html
+++ b/lakehouse_engine/core/exec_env.html
@@ -65,88 +65,95 @@ <h1 class="modulename">
                         <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos"> 1</span></a><span class="sd">&quot;&quot;&quot;Module to take care of creating a singleton of the execution environment class.&quot;&quot;&quot;</span>
 </span><span id="L-2"><a href="#L-2"><span class="linenos"> 2</span></a><span class="kn">import</span> <span class="nn">os</span>
 </span><span id="L-3"><a href="#L-3"><span class="linenos"> 3</span></a>
-</span><span id="L-4"><a href="#L-4"><span class="linenos"> 4</span></a><span class="kn">from</span> <span class="nn">pyspark</span> <span class="kn">import</span> <span class="n">SparkConf</span>
-</span><span id="L-5"><a href="#L-5"><span class="linenos"> 5</span></a><span class="kn">from</span> <span class="nn">pyspark.sql</span> <span class="kn">import</span> <span class="n">SparkSession</span>
-</span><span id="L-6"><a href="#L-6"><span class="linenos"> 6</span></a>
-</span><span id="L-7"><a href="#L-7"><span class="linenos"> 7</span></a><span class="kn">from</span> <span class="nn">lakehouse_engine.utils.logging_handler</span> <span class="kn">import</span> <span class="n">LoggingHandler</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos"> 4</span></a><span class="kn">from</span> <span class="nn">pyspark.sql</span> <span class="kn">import</span> <span class="n">SparkSession</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos"> 5</span></a>
+</span><span id="L-6"><a href="#L-6"><span class="linenos"> 6</span></a><span class="kn">from</span> <span class="nn">lakehouse_engine.utils.logging_handler</span> <span class="kn">import</span> <span class="n">LoggingHandler</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos"> 7</span></a>
 </span><span id="L-8"><a href="#L-8"><span class="linenos"> 8</span></a>
-</span><span id="L-9"><a href="#L-9"><span class="linenos"> 9</span></a>
-</span><span id="L-10"><a href="#L-10"><span class="linenos">10</span></a><span class="k">class</span> <span class="nc">ExecEnv</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
-</span><span id="L-11"><a href="#L-11"><span class="linenos">11</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Represents the basic resources regarding the engine execution environment.</span>
-</span><span id="L-12"><a href="#L-12"><span class="linenos">12</span></a>
-</span><span id="L-13"><a href="#L-13"><span class="linenos">13</span></a><span class="sd">    Currently, it is solely used to encapsulate the logic to get a Spark session.</span>
-</span><span id="L-14"><a href="#L-14"><span class="linenos">14</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-15"><a href="#L-15"><span class="linenos">15</span></a>
-</span><span id="L-16"><a href="#L-16"><span class="linenos">16</span></a>    <span class="n">SESSION</span><span class="p">:</span> <span class="n">SparkSession</span>
-</span><span id="L-17"><a href="#L-17"><span class="linenos">17</span></a>    <span class="n">_LOGGER</span> <span class="o">=</span> <span class="n">LoggingHandler</span><span class="p">(</span><span class="vm">__name__</span><span class="p">)</span><span class="o">.</span><span class="n">get_logger</span><span class="p">()</span>
-</span><span id="L-18"><a href="#L-18"><span class="linenos">18</span></a>    <span class="n">DEFAULT_AWS_REGION</span> <span class="o">=</span> <span class="s2">&quot;eu-west-1&quot;</span>
-</span><span id="L-19"><a href="#L-19"><span class="linenos">19</span></a>
-</span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a>    <span class="nd">@classmethod</span>
-</span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a>    <span class="k">def</span> <span class="nf">get_or_create</span><span class="p">(</span>
-</span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a>        <span class="bp">cls</span><span class="p">,</span>
-</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a>        <span class="n">session</span><span class="p">:</span> <span class="n">SparkSession</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a>        <span class="n">enable_hive_support</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>        <span class="n">app_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a>        <span class="n">config</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get or create an execution environment session (currently Spark).</span>
-</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a>
-</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a><span class="sd">        It instantiates a singleton session that can be accessed anywhere from the</span>
-</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a><span class="sd">        lakehouse engine.</span>
-</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a>
-</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a><span class="sd">        Args:</span>
-</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a><span class="sd">            session: spark session.</span>
-</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a><span class="sd">            enable_hive_support: whether to enable hive support or not.</span>
-</span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a><span class="sd">            app_name: application name.</span>
-</span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a><span class="sd">            config: extra spark configs to supply to the spark session.</span>
-</span><span id="L-38"><a href="#L-38"><span class="linenos">38</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-39"><a href="#L-39"><span class="linenos">39</span></a>        <span class="n">default_config</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="L-40"><a href="#L-40"><span class="linenos">40</span></a>            <span class="s2">&quot;spark.databricks.delta.optimizeWrite.enabled&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="L-41"><a href="#L-41"><span class="linenos">41</span></a>            <span class="s2">&quot;spark.sql.adaptive.enabled&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="L-42"><a href="#L-42"><span class="linenos">42</span></a>            <span class="s2">&quot;spark.databricks.delta.merge.enableLowShuffle&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="L-43"><a href="#L-43"><span class="linenos">43</span></a>        <span class="p">}</span>
-</span><span id="L-44"><a href="#L-44"><span class="linenos">44</span></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-45"><a href="#L-45"><span class="linenos">45</span></a>            <span class="sa">f</span><span class="s2">&quot;Using the following default configs you may want to override them for &quot;</span>
-</span><span id="L-46"><a href="#L-46"><span class="linenos">46</span></a>            <span class="sa">f</span><span class="s2">&quot;your job: </span><span class="si">{</span><span class="n">default_config</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="L-47"><a href="#L-47"><span class="linenos">47</span></a>        <span class="p">)</span>
-</span><span id="L-48"><a href="#L-48"><span class="linenos">48</span></a>        <span class="n">final_config</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="p">{</span><span class="o">**</span><span class="n">default_config</span><span class="p">,</span> <span class="o">**</span><span class="p">(</span><span class="n">config</span> <span class="k">if</span> <span class="n">config</span> <span class="k">else</span> <span class="p">{})}</span>
-</span><span id="L-49"><a href="#L-49"><span class="linenos">49</span></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Final config is: </span><span class="si">{</span><span class="n">final_config</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="L-50"><a href="#L-50"><span class="linenos">50</span></a>
-</span><span id="L-51"><a href="#L-51"><span class="linenos">51</span></a>        <span class="k">if</span> <span class="n">session</span><span class="p">:</span>
-</span><span id="L-52"><a href="#L-52"><span class="linenos">52</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span> <span class="o">=</span> <span class="n">session</span>
-</span><span id="L-53"><a href="#L-53"><span class="linenos">53</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-54"><a href="#L-54"><span class="linenos">54</span></a>            <span class="n">session_builder</span> <span class="o">=</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">builder</span><span class="o">.</span><span class="n">appName</span><span class="p">(</span><span class="n">app_name</span><span class="p">)</span>
-</span><span id="L-55"><a href="#L-55"><span class="linenos">55</span></a>            <span class="k">if</span> <span class="n">config</span><span class="p">:</span>
-</span><span id="L-56"><a href="#L-56"><span class="linenos">56</span></a>                <span class="n">session_builder</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">config</span><span class="p">(</span>
-</span><span id="L-57"><a href="#L-57"><span class="linenos">57</span></a>                    <span class="n">conf</span><span class="o">=</span><span class="n">SparkConf</span><span class="p">()</span><span class="o">.</span><span class="n">setAll</span><span class="p">(</span><span class="n">final_config</span><span class="o">.</span><span class="n">items</span><span class="p">())</span>  <span class="c1"># type: ignore</span>
-</span><span id="L-58"><a href="#L-58"><span class="linenos">58</span></a>                <span class="p">)</span>
-</span><span id="L-59"><a href="#L-59"><span class="linenos">59</span></a>            <span class="k">if</span> <span class="n">enable_hive_support</span><span class="p">:</span>
-</span><span id="L-60"><a href="#L-60"><span class="linenos">60</span></a>                <span class="n">session_builder</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">enableHiveSupport</span><span class="p">()</span>
-</span><span id="L-61"><a href="#L-61"><span class="linenos">61</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">getOrCreate</span><span class="p">()</span>
-</span><span id="L-62"><a href="#L-62"><span class="linenos">62</span></a>
-</span><span id="L-63"><a href="#L-63"><span class="linenos">63</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">_set_environment_variables</span><span class="p">(</span><span class="n">final_config</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;os_env_vars&quot;</span><span class="p">))</span>
-</span><span id="L-64"><a href="#L-64"><span class="linenos">64</span></a>
-</span><span id="L-65"><a href="#L-65"><span class="linenos">65</span></a>    <span class="nd">@classmethod</span>
-</span><span id="L-66"><a href="#L-66"><span class="linenos">66</span></a>    <span class="k">def</span> <span class="nf">_set_environment_variables</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">os_env_vars</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-67"><a href="#L-67"><span class="linenos">67</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Set environment variables at OS level.</span>
-</span><span id="L-68"><a href="#L-68"><span class="linenos">68</span></a>
-</span><span id="L-69"><a href="#L-69"><span class="linenos">69</span></a><span class="sd">        By default, we are setting the AWS_DEFAULT_REGION as we have identified this is</span>
-</span><span id="L-70"><a href="#L-70"><span class="linenos">70</span></a><span class="sd">        beneficial to avoid getBucketLocation permission problems.</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos"> 9</span></a><span class="k">class</span> <span class="nc">ExecEnv</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos">10</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Represents the basic resources regarding the engine execution environment.</span>
+</span><span id="L-11"><a href="#L-11"><span class="linenos">11</span></a>
+</span><span id="L-12"><a href="#L-12"><span class="linenos">12</span></a><span class="sd">    Currently, it is solely used to encapsulate the logic to get a Spark session.</span>
+</span><span id="L-13"><a href="#L-13"><span class="linenos">13</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos">14</span></a>
+</span><span id="L-15"><a href="#L-15"><span class="linenos">15</span></a>    <span class="n">SESSION</span><span class="p">:</span> <span class="n">SparkSession</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos">16</span></a>    <span class="n">_LOGGER</span> <span class="o">=</span> <span class="n">LoggingHandler</span><span class="p">(</span><span class="vm">__name__</span><span class="p">)</span><span class="o">.</span><span class="n">get_logger</span><span class="p">()</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos">17</span></a>    <span class="n">DEFAULT_AWS_REGION</span> <span class="o">=</span> <span class="s2">&quot;eu-west-1&quot;</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos">18</span></a>
+</span><span id="L-19"><a href="#L-19"><span class="linenos">19</span></a>    <span class="nd">@classmethod</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a>    <span class="k">def</span> <span class="nf">get_or_create</span><span class="p">(</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a>        <span class="bp">cls</span><span class="p">,</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a>        <span class="n">session</span><span class="p">:</span> <span class="n">SparkSession</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a>        <span class="n">enable_hive_support</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a>        <span class="n">app_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a>        <span class="n">config</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get or create an execution environment session (currently Spark).</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a>
+</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a><span class="sd">        It instantiates a singleton session that can be accessed anywhere from the</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a><span class="sd">        lakehouse engine.</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a>
+</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a><span class="sd">        Args:</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a><span class="sd">            session: spark session.</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a><span class="sd">            enable_hive_support: whether to enable hive support or not.</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a><span class="sd">            app_name: application name.</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a><span class="sd">            config: extra spark configs to supply to the spark session.</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos">38</span></a>        <span class="n">default_config</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos">39</span></a>            <span class="s2">&quot;spark.databricks.delta.optimizeWrite.enabled&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos">40</span></a>            <span class="s2">&quot;spark.sql.adaptive.enabled&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos">41</span></a>            <span class="s2">&quot;spark.databricks.delta.merge.enableLowShuffle&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos">42</span></a>        <span class="p">}</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos">43</span></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos">44</span></a>            <span class="sa">f</span><span class="s2">&quot;Using the following default configs you may want to override them for &quot;</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos">45</span></a>            <span class="sa">f</span><span class="s2">&quot;your job: </span><span class="si">{</span><span class="n">default_config</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos">46</span></a>        <span class="p">)</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos">47</span></a>        <span class="n">final_config</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="p">{</span><span class="o">**</span><span class="n">default_config</span><span class="p">,</span> <span class="o">**</span><span class="p">(</span><span class="n">config</span> <span class="k">if</span> <span class="n">config</span> <span class="k">else</span> <span class="p">{})}</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos">48</span></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Final config is: </span><span class="si">{</span><span class="n">final_config</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos">49</span></a>
+</span><span id="L-50"><a href="#L-50"><span class="linenos">50</span></a>        <span class="k">if</span> <span class="n">session</span><span class="p">:</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos">51</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span> <span class="o">=</span> <span class="n">session</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos">52</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos">53</span></a>            <span class="c1"># with active session we do not need app name</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos">54</span></a>            <span class="k">if</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">getActiveSession</span><span class="p">():</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos">55</span></a>                <span class="n">app_name</span> <span class="o">=</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">getActiveSession</span><span class="p">()</span><span class="o">.</span><span class="n">sparkContext</span><span class="o">.</span><span class="n">appName</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos">56</span></a>                <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Detected active session: </span><span class="si">{</span><span class="n">app_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos">57</span></a>            <span class="k">elif</span> <span class="ow">not</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">getActiveSession</span><span class="p">()</span> <span class="ow">and</span> <span class="ow">not</span> <span class="n">app_name</span><span class="p">:</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos">58</span></a>                <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;No active session or appname detected&quot;</span><span class="p">)</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos">59</span></a>                <span class="n">app_name</span> <span class="o">=</span> <span class="s2">&quot;lakehouse_engine&quot;</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos">60</span></a>            <span class="c1"># we will still add this part to set configs</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos">61</span></a>            <span class="n">session_builder</span> <span class="o">=</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">builder</span><span class="o">.</span><span class="n">appName</span><span class="p">(</span><span class="n">app_name</span><span class="p">)</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos">62</span></a>            <span class="k">if</span> <span class="n">config</span><span class="p">:</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos">63</span></a>                <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">final_config</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos">64</span></a>                    <span class="n">session_builder</span><span class="o">.</span><span class="n">config</span><span class="p">(</span><span class="n">k</span><span class="p">,</span> <span class="n">v</span><span class="p">)</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos">65</span></a>
+</span><span id="L-66"><a href="#L-66"><span class="linenos">66</span></a>            <span class="k">if</span> <span class="n">enable_hive_support</span><span class="p">:</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos">67</span></a>                <span class="n">session_builder</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">enableHiveSupport</span><span class="p">()</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos">68</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">getOrCreate</span><span class="p">()</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos">69</span></a>
+</span><span id="L-70"><a href="#L-70"><span class="linenos">70</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">_set_environment_variables</span><span class="p">(</span><span class="n">final_config</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;os_env_vars&quot;</span><span class="p">))</span>
 </span><span id="L-71"><a href="#L-71"><span class="linenos">71</span></a>
-</span><span id="L-72"><a href="#L-72"><span class="linenos">72</span></a><span class="sd">        Args:</span>
-</span><span id="L-73"><a href="#L-73"><span class="linenos">73</span></a><span class="sd">            os_env_vars: this parameter can be used to pass the environment variables to</span>
-</span><span id="L-74"><a href="#L-74"><span class="linenos">74</span></a><span class="sd">            be defined.</span>
-</span><span id="L-75"><a href="#L-75"><span class="linenos">75</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-76"><a href="#L-76"><span class="linenos">76</span></a>        <span class="k">if</span> <span class="n">os_env_vars</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-77"><a href="#L-77"><span class="linenos">77</span></a>            <span class="n">os_env_vars</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos">72</span></a>    <span class="nd">@classmethod</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos">73</span></a>    <span class="k">def</span> <span class="nf">_set_environment_variables</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">os_env_vars</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos">74</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Set environment variables at OS level.</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos">75</span></a>
+</span><span id="L-76"><a href="#L-76"><span class="linenos">76</span></a><span class="sd">        By default, we are setting the AWS_DEFAULT_REGION as we have identified this is</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos">77</span></a><span class="sd">        beneficial to avoid getBucketLocation permission problems.</span>
 </span><span id="L-78"><a href="#L-78"><span class="linenos">78</span></a>
-</span><span id="L-79"><a href="#L-79"><span class="linenos">79</span></a>        <span class="k">for</span> <span class="n">env_var</span> <span class="ow">in</span> <span class="n">os_env_vars</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="L-80"><a href="#L-80"><span class="linenos">80</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="n">env_var</span><span class="p">[</span><span class="mi">0</span><span class="p">]]</span> <span class="o">=</span> <span class="n">env_var</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="L-81"><a href="#L-81"><span class="linenos">81</span></a>
-</span><span id="L-82"><a href="#L-82"><span class="linenos">82</span></a>        <span class="k">if</span> <span class="s2">&quot;AWS_DEFAULT_REGION&quot;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">os_env_vars</span><span class="p">:</span>
-</span><span id="L-83"><a href="#L-83"><span class="linenos">83</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s2">&quot;AWS_DEFAULT_REGION&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span><span class="o">.</span><span class="n">sparkContext</span><span class="o">.</span><span class="n">getConf</span><span class="p">()</span><span class="o">.</span><span class="n">get</span><span class="p">(</span>
-</span><span id="L-84"><a href="#L-84"><span class="linenos">84</span></a>                <span class="s2">&quot;spark.databricks.clusterUsageTags.region&quot;</span><span class="p">,</span> <span class="bp">cls</span><span class="o">.</span><span class="n">DEFAULT_AWS_REGION</span>
-</span><span id="L-85"><a href="#L-85"><span class="linenos">85</span></a>            <span class="p">)</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos">79</span></a><span class="sd">        Args:</span>
+</span><span id="L-80"><a href="#L-80"><span class="linenos">80</span></a><span class="sd">            os_env_vars: this parameter can be used to pass the environment variables to</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos">81</span></a><span class="sd">            be defined.</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos">82</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos">83</span></a>        <span class="k">if</span> <span class="n">os_env_vars</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos">84</span></a>            <span class="n">os_env_vars</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos">85</span></a>
+</span><span id="L-86"><a href="#L-86"><span class="linenos">86</span></a>        <span class="k">for</span> <span class="n">env_var</span> <span class="ow">in</span> <span class="n">os_env_vars</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos">87</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="n">env_var</span><span class="p">[</span><span class="mi">0</span><span class="p">]]</span> <span class="o">=</span> <span class="n">env_var</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos">88</span></a>
+</span><span id="L-89"><a href="#L-89"><span class="linenos">89</span></a>        <span class="k">if</span> <span class="s2">&quot;AWS_DEFAULT_REGION&quot;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">os_env_vars</span><span class="p">:</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos">90</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s2">&quot;AWS_DEFAULT_REGION&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span><span class="o">.</span><span class="n">sparkContext</span><span class="o">.</span><span class="n">getConf</span><span class="p">()</span><span class="o">.</span><span class="n">get</span><span class="p">(</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos">91</span></a>                <span class="s2">&quot;spark.databricks.clusterUsageTags.region&quot;</span><span class="p">,</span> <span class="bp">cls</span><span class="o">.</span><span class="n">DEFAULT_AWS_REGION</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos">92</span></a>            <span class="p">)</span>
 </span></pre></div>
 
 
@@ -162,82 +169,90 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#ExecEnv"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="ExecEnv-11"><a href="#ExecEnv-11"><span class="linenos">11</span></a><span class="k">class</span> <span class="nc">ExecEnv</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
-</span><span id="ExecEnv-12"><a href="#ExecEnv-12"><span class="linenos">12</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Represents the basic resources regarding the engine execution environment.</span>
-</span><span id="ExecEnv-13"><a href="#ExecEnv-13"><span class="linenos">13</span></a>
-</span><span id="ExecEnv-14"><a href="#ExecEnv-14"><span class="linenos">14</span></a><span class="sd">    Currently, it is solely used to encapsulate the logic to get a Spark session.</span>
-</span><span id="ExecEnv-15"><a href="#ExecEnv-15"><span class="linenos">15</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="ExecEnv-16"><a href="#ExecEnv-16"><span class="linenos">16</span></a>
-</span><span id="ExecEnv-17"><a href="#ExecEnv-17"><span class="linenos">17</span></a>    <span class="n">SESSION</span><span class="p">:</span> <span class="n">SparkSession</span>
-</span><span id="ExecEnv-18"><a href="#ExecEnv-18"><span class="linenos">18</span></a>    <span class="n">_LOGGER</span> <span class="o">=</span> <span class="n">LoggingHandler</span><span class="p">(</span><span class="vm">__name__</span><span class="p">)</span><span class="o">.</span><span class="n">get_logger</span><span class="p">()</span>
-</span><span id="ExecEnv-19"><a href="#ExecEnv-19"><span class="linenos">19</span></a>    <span class="n">DEFAULT_AWS_REGION</span> <span class="o">=</span> <span class="s2">&quot;eu-west-1&quot;</span>
-</span><span id="ExecEnv-20"><a href="#ExecEnv-20"><span class="linenos">20</span></a>
-</span><span id="ExecEnv-21"><a href="#ExecEnv-21"><span class="linenos">21</span></a>    <span class="nd">@classmethod</span>
-</span><span id="ExecEnv-22"><a href="#ExecEnv-22"><span class="linenos">22</span></a>    <span class="k">def</span> <span class="nf">get_or_create</span><span class="p">(</span>
-</span><span id="ExecEnv-23"><a href="#ExecEnv-23"><span class="linenos">23</span></a>        <span class="bp">cls</span><span class="p">,</span>
-</span><span id="ExecEnv-24"><a href="#ExecEnv-24"><span class="linenos">24</span></a>        <span class="n">session</span><span class="p">:</span> <span class="n">SparkSession</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="ExecEnv-25"><a href="#ExecEnv-25"><span class="linenos">25</span></a>        <span class="n">enable_hive_support</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="ExecEnv-26"><a href="#ExecEnv-26"><span class="linenos">26</span></a>        <span class="n">app_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="ExecEnv-27"><a href="#ExecEnv-27"><span class="linenos">27</span></a>        <span class="n">config</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="ExecEnv-28"><a href="#ExecEnv-28"><span class="linenos">28</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="ExecEnv-29"><a href="#ExecEnv-29"><span class="linenos">29</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get or create an execution environment session (currently Spark).</span>
-</span><span id="ExecEnv-30"><a href="#ExecEnv-30"><span class="linenos">30</span></a>
-</span><span id="ExecEnv-31"><a href="#ExecEnv-31"><span class="linenos">31</span></a><span class="sd">        It instantiates a singleton session that can be accessed anywhere from the</span>
-</span><span id="ExecEnv-32"><a href="#ExecEnv-32"><span class="linenos">32</span></a><span class="sd">        lakehouse engine.</span>
-</span><span id="ExecEnv-33"><a href="#ExecEnv-33"><span class="linenos">33</span></a>
-</span><span id="ExecEnv-34"><a href="#ExecEnv-34"><span class="linenos">34</span></a><span class="sd">        Args:</span>
-</span><span id="ExecEnv-35"><a href="#ExecEnv-35"><span class="linenos">35</span></a><span class="sd">            session: spark session.</span>
-</span><span id="ExecEnv-36"><a href="#ExecEnv-36"><span class="linenos">36</span></a><span class="sd">            enable_hive_support: whether to enable hive support or not.</span>
-</span><span id="ExecEnv-37"><a href="#ExecEnv-37"><span class="linenos">37</span></a><span class="sd">            app_name: application name.</span>
-</span><span id="ExecEnv-38"><a href="#ExecEnv-38"><span class="linenos">38</span></a><span class="sd">            config: extra spark configs to supply to the spark session.</span>
-</span><span id="ExecEnv-39"><a href="#ExecEnv-39"><span class="linenos">39</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="ExecEnv-40"><a href="#ExecEnv-40"><span class="linenos">40</span></a>        <span class="n">default_config</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="ExecEnv-41"><a href="#ExecEnv-41"><span class="linenos">41</span></a>            <span class="s2">&quot;spark.databricks.delta.optimizeWrite.enabled&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="ExecEnv-42"><a href="#ExecEnv-42"><span class="linenos">42</span></a>            <span class="s2">&quot;spark.sql.adaptive.enabled&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="ExecEnv-43"><a href="#ExecEnv-43"><span class="linenos">43</span></a>            <span class="s2">&quot;spark.databricks.delta.merge.enableLowShuffle&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="ExecEnv-44"><a href="#ExecEnv-44"><span class="linenos">44</span></a>        <span class="p">}</span>
-</span><span id="ExecEnv-45"><a href="#ExecEnv-45"><span class="linenos">45</span></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="ExecEnv-46"><a href="#ExecEnv-46"><span class="linenos">46</span></a>            <span class="sa">f</span><span class="s2">&quot;Using the following default configs you may want to override them for &quot;</span>
-</span><span id="ExecEnv-47"><a href="#ExecEnv-47"><span class="linenos">47</span></a>            <span class="sa">f</span><span class="s2">&quot;your job: </span><span class="si">{</span><span class="n">default_config</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="ExecEnv-48"><a href="#ExecEnv-48"><span class="linenos">48</span></a>        <span class="p">)</span>
-</span><span id="ExecEnv-49"><a href="#ExecEnv-49"><span class="linenos">49</span></a>        <span class="n">final_config</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="p">{</span><span class="o">**</span><span class="n">default_config</span><span class="p">,</span> <span class="o">**</span><span class="p">(</span><span class="n">config</span> <span class="k">if</span> <span class="n">config</span> <span class="k">else</span> <span class="p">{})}</span>
-</span><span id="ExecEnv-50"><a href="#ExecEnv-50"><span class="linenos">50</span></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Final config is: </span><span class="si">{</span><span class="n">final_config</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="ExecEnv-51"><a href="#ExecEnv-51"><span class="linenos">51</span></a>
-</span><span id="ExecEnv-52"><a href="#ExecEnv-52"><span class="linenos">52</span></a>        <span class="k">if</span> <span class="n">session</span><span class="p">:</span>
-</span><span id="ExecEnv-53"><a href="#ExecEnv-53"><span class="linenos">53</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span> <span class="o">=</span> <span class="n">session</span>
-</span><span id="ExecEnv-54"><a href="#ExecEnv-54"><span class="linenos">54</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="ExecEnv-55"><a href="#ExecEnv-55"><span class="linenos">55</span></a>            <span class="n">session_builder</span> <span class="o">=</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">builder</span><span class="o">.</span><span class="n">appName</span><span class="p">(</span><span class="n">app_name</span><span class="p">)</span>
-</span><span id="ExecEnv-56"><a href="#ExecEnv-56"><span class="linenos">56</span></a>            <span class="k">if</span> <span class="n">config</span><span class="p">:</span>
-</span><span id="ExecEnv-57"><a href="#ExecEnv-57"><span class="linenos">57</span></a>                <span class="n">session_builder</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">config</span><span class="p">(</span>
-</span><span id="ExecEnv-58"><a href="#ExecEnv-58"><span class="linenos">58</span></a>                    <span class="n">conf</span><span class="o">=</span><span class="n">SparkConf</span><span class="p">()</span><span class="o">.</span><span class="n">setAll</span><span class="p">(</span><span class="n">final_config</span><span class="o">.</span><span class="n">items</span><span class="p">())</span>  <span class="c1"># type: ignore</span>
-</span><span id="ExecEnv-59"><a href="#ExecEnv-59"><span class="linenos">59</span></a>                <span class="p">)</span>
-</span><span id="ExecEnv-60"><a href="#ExecEnv-60"><span class="linenos">60</span></a>            <span class="k">if</span> <span class="n">enable_hive_support</span><span class="p">:</span>
-</span><span id="ExecEnv-61"><a href="#ExecEnv-61"><span class="linenos">61</span></a>                <span class="n">session_builder</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">enableHiveSupport</span><span class="p">()</span>
-</span><span id="ExecEnv-62"><a href="#ExecEnv-62"><span class="linenos">62</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">getOrCreate</span><span class="p">()</span>
-</span><span id="ExecEnv-63"><a href="#ExecEnv-63"><span class="linenos">63</span></a>
-</span><span id="ExecEnv-64"><a href="#ExecEnv-64"><span class="linenos">64</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">_set_environment_variables</span><span class="p">(</span><span class="n">final_config</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;os_env_vars&quot;</span><span class="p">))</span>
-</span><span id="ExecEnv-65"><a href="#ExecEnv-65"><span class="linenos">65</span></a>
-</span><span id="ExecEnv-66"><a href="#ExecEnv-66"><span class="linenos">66</span></a>    <span class="nd">@classmethod</span>
-</span><span id="ExecEnv-67"><a href="#ExecEnv-67"><span class="linenos">67</span></a>    <span class="k">def</span> <span class="nf">_set_environment_variables</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">os_env_vars</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="ExecEnv-68"><a href="#ExecEnv-68"><span class="linenos">68</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Set environment variables at OS level.</span>
-</span><span id="ExecEnv-69"><a href="#ExecEnv-69"><span class="linenos">69</span></a>
-</span><span id="ExecEnv-70"><a href="#ExecEnv-70"><span class="linenos">70</span></a><span class="sd">        By default, we are setting the AWS_DEFAULT_REGION as we have identified this is</span>
-</span><span id="ExecEnv-71"><a href="#ExecEnv-71"><span class="linenos">71</span></a><span class="sd">        beneficial to avoid getBucketLocation permission problems.</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="ExecEnv-10"><a href="#ExecEnv-10"><span class="linenos">10</span></a><span class="k">class</span> <span class="nc">ExecEnv</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
+</span><span id="ExecEnv-11"><a href="#ExecEnv-11"><span class="linenos">11</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Represents the basic resources regarding the engine execution environment.</span>
+</span><span id="ExecEnv-12"><a href="#ExecEnv-12"><span class="linenos">12</span></a>
+</span><span id="ExecEnv-13"><a href="#ExecEnv-13"><span class="linenos">13</span></a><span class="sd">    Currently, it is solely used to encapsulate the logic to get a Spark session.</span>
+</span><span id="ExecEnv-14"><a href="#ExecEnv-14"><span class="linenos">14</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="ExecEnv-15"><a href="#ExecEnv-15"><span class="linenos">15</span></a>
+</span><span id="ExecEnv-16"><a href="#ExecEnv-16"><span class="linenos">16</span></a>    <span class="n">SESSION</span><span class="p">:</span> <span class="n">SparkSession</span>
+</span><span id="ExecEnv-17"><a href="#ExecEnv-17"><span class="linenos">17</span></a>    <span class="n">_LOGGER</span> <span class="o">=</span> <span class="n">LoggingHandler</span><span class="p">(</span><span class="vm">__name__</span><span class="p">)</span><span class="o">.</span><span class="n">get_logger</span><span class="p">()</span>
+</span><span id="ExecEnv-18"><a href="#ExecEnv-18"><span class="linenos">18</span></a>    <span class="n">DEFAULT_AWS_REGION</span> <span class="o">=</span> <span class="s2">&quot;eu-west-1&quot;</span>
+</span><span id="ExecEnv-19"><a href="#ExecEnv-19"><span class="linenos">19</span></a>
+</span><span id="ExecEnv-20"><a href="#ExecEnv-20"><span class="linenos">20</span></a>    <span class="nd">@classmethod</span>
+</span><span id="ExecEnv-21"><a href="#ExecEnv-21"><span class="linenos">21</span></a>    <span class="k">def</span> <span class="nf">get_or_create</span><span class="p">(</span>
+</span><span id="ExecEnv-22"><a href="#ExecEnv-22"><span class="linenos">22</span></a>        <span class="bp">cls</span><span class="p">,</span>
+</span><span id="ExecEnv-23"><a href="#ExecEnv-23"><span class="linenos">23</span></a>        <span class="n">session</span><span class="p">:</span> <span class="n">SparkSession</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="ExecEnv-24"><a href="#ExecEnv-24"><span class="linenos">24</span></a>        <span class="n">enable_hive_support</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="ExecEnv-25"><a href="#ExecEnv-25"><span class="linenos">25</span></a>        <span class="n">app_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="ExecEnv-26"><a href="#ExecEnv-26"><span class="linenos">26</span></a>        <span class="n">config</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="ExecEnv-27"><a href="#ExecEnv-27"><span class="linenos">27</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ExecEnv-28"><a href="#ExecEnv-28"><span class="linenos">28</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get or create an execution environment session (currently Spark).</span>
+</span><span id="ExecEnv-29"><a href="#ExecEnv-29"><span class="linenos">29</span></a>
+</span><span id="ExecEnv-30"><a href="#ExecEnv-30"><span class="linenos">30</span></a><span class="sd">        It instantiates a singleton session that can be accessed anywhere from the</span>
+</span><span id="ExecEnv-31"><a href="#ExecEnv-31"><span class="linenos">31</span></a><span class="sd">        lakehouse engine.</span>
+</span><span id="ExecEnv-32"><a href="#ExecEnv-32"><span class="linenos">32</span></a>
+</span><span id="ExecEnv-33"><a href="#ExecEnv-33"><span class="linenos">33</span></a><span class="sd">        Args:</span>
+</span><span id="ExecEnv-34"><a href="#ExecEnv-34"><span class="linenos">34</span></a><span class="sd">            session: spark session.</span>
+</span><span id="ExecEnv-35"><a href="#ExecEnv-35"><span class="linenos">35</span></a><span class="sd">            enable_hive_support: whether to enable hive support or not.</span>
+</span><span id="ExecEnv-36"><a href="#ExecEnv-36"><span class="linenos">36</span></a><span class="sd">            app_name: application name.</span>
+</span><span id="ExecEnv-37"><a href="#ExecEnv-37"><span class="linenos">37</span></a><span class="sd">            config: extra spark configs to supply to the spark session.</span>
+</span><span id="ExecEnv-38"><a href="#ExecEnv-38"><span class="linenos">38</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ExecEnv-39"><a href="#ExecEnv-39"><span class="linenos">39</span></a>        <span class="n">default_config</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="ExecEnv-40"><a href="#ExecEnv-40"><span class="linenos">40</span></a>            <span class="s2">&quot;spark.databricks.delta.optimizeWrite.enabled&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="ExecEnv-41"><a href="#ExecEnv-41"><span class="linenos">41</span></a>            <span class="s2">&quot;spark.sql.adaptive.enabled&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="ExecEnv-42"><a href="#ExecEnv-42"><span class="linenos">42</span></a>            <span class="s2">&quot;spark.databricks.delta.merge.enableLowShuffle&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="ExecEnv-43"><a href="#ExecEnv-43"><span class="linenos">43</span></a>        <span class="p">}</span>
+</span><span id="ExecEnv-44"><a href="#ExecEnv-44"><span class="linenos">44</span></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="ExecEnv-45"><a href="#ExecEnv-45"><span class="linenos">45</span></a>            <span class="sa">f</span><span class="s2">&quot;Using the following default configs you may want to override them for &quot;</span>
+</span><span id="ExecEnv-46"><a href="#ExecEnv-46"><span class="linenos">46</span></a>            <span class="sa">f</span><span class="s2">&quot;your job: </span><span class="si">{</span><span class="n">default_config</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="ExecEnv-47"><a href="#ExecEnv-47"><span class="linenos">47</span></a>        <span class="p">)</span>
+</span><span id="ExecEnv-48"><a href="#ExecEnv-48"><span class="linenos">48</span></a>        <span class="n">final_config</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="p">{</span><span class="o">**</span><span class="n">default_config</span><span class="p">,</span> <span class="o">**</span><span class="p">(</span><span class="n">config</span> <span class="k">if</span> <span class="n">config</span> <span class="k">else</span> <span class="p">{})}</span>
+</span><span id="ExecEnv-49"><a href="#ExecEnv-49"><span class="linenos">49</span></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Final config is: </span><span class="si">{</span><span class="n">final_config</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="ExecEnv-50"><a href="#ExecEnv-50"><span class="linenos">50</span></a>
+</span><span id="ExecEnv-51"><a href="#ExecEnv-51"><span class="linenos">51</span></a>        <span class="k">if</span> <span class="n">session</span><span class="p">:</span>
+</span><span id="ExecEnv-52"><a href="#ExecEnv-52"><span class="linenos">52</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span> <span class="o">=</span> <span class="n">session</span>
+</span><span id="ExecEnv-53"><a href="#ExecEnv-53"><span class="linenos">53</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="ExecEnv-54"><a href="#ExecEnv-54"><span class="linenos">54</span></a>            <span class="c1"># with active session we do not need app name</span>
+</span><span id="ExecEnv-55"><a href="#ExecEnv-55"><span class="linenos">55</span></a>            <span class="k">if</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">getActiveSession</span><span class="p">():</span>
+</span><span id="ExecEnv-56"><a href="#ExecEnv-56"><span class="linenos">56</span></a>                <span class="n">app_name</span> <span class="o">=</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">getActiveSession</span><span class="p">()</span><span class="o">.</span><span class="n">sparkContext</span><span class="o">.</span><span class="n">appName</span>
+</span><span id="ExecEnv-57"><a href="#ExecEnv-57"><span class="linenos">57</span></a>                <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Detected active session: </span><span class="si">{</span><span class="n">app_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="ExecEnv-58"><a href="#ExecEnv-58"><span class="linenos">58</span></a>            <span class="k">elif</span> <span class="ow">not</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">getActiveSession</span><span class="p">()</span> <span class="ow">and</span> <span class="ow">not</span> <span class="n">app_name</span><span class="p">:</span>
+</span><span id="ExecEnv-59"><a href="#ExecEnv-59"><span class="linenos">59</span></a>                <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;No active session or appname detected&quot;</span><span class="p">)</span>
+</span><span id="ExecEnv-60"><a href="#ExecEnv-60"><span class="linenos">60</span></a>                <span class="n">app_name</span> <span class="o">=</span> <span class="s2">&quot;lakehouse_engine&quot;</span>
+</span><span id="ExecEnv-61"><a href="#ExecEnv-61"><span class="linenos">61</span></a>            <span class="c1"># we will still add this part to set configs</span>
+</span><span id="ExecEnv-62"><a href="#ExecEnv-62"><span class="linenos">62</span></a>            <span class="n">session_builder</span> <span class="o">=</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">builder</span><span class="o">.</span><span class="n">appName</span><span class="p">(</span><span class="n">app_name</span><span class="p">)</span>
+</span><span id="ExecEnv-63"><a href="#ExecEnv-63"><span class="linenos">63</span></a>            <span class="k">if</span> <span class="n">config</span><span class="p">:</span>
+</span><span id="ExecEnv-64"><a href="#ExecEnv-64"><span class="linenos">64</span></a>                <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">final_config</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="ExecEnv-65"><a href="#ExecEnv-65"><span class="linenos">65</span></a>                    <span class="n">session_builder</span><span class="o">.</span><span class="n">config</span><span class="p">(</span><span class="n">k</span><span class="p">,</span> <span class="n">v</span><span class="p">)</span>
+</span><span id="ExecEnv-66"><a href="#ExecEnv-66"><span class="linenos">66</span></a>
+</span><span id="ExecEnv-67"><a href="#ExecEnv-67"><span class="linenos">67</span></a>            <span class="k">if</span> <span class="n">enable_hive_support</span><span class="p">:</span>
+</span><span id="ExecEnv-68"><a href="#ExecEnv-68"><span class="linenos">68</span></a>                <span class="n">session_builder</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">enableHiveSupport</span><span class="p">()</span>
+</span><span id="ExecEnv-69"><a href="#ExecEnv-69"><span class="linenos">69</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">getOrCreate</span><span class="p">()</span>
+</span><span id="ExecEnv-70"><a href="#ExecEnv-70"><span class="linenos">70</span></a>
+</span><span id="ExecEnv-71"><a href="#ExecEnv-71"><span class="linenos">71</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">_set_environment_variables</span><span class="p">(</span><span class="n">final_config</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;os_env_vars&quot;</span><span class="p">))</span>
 </span><span id="ExecEnv-72"><a href="#ExecEnv-72"><span class="linenos">72</span></a>
-</span><span id="ExecEnv-73"><a href="#ExecEnv-73"><span class="linenos">73</span></a><span class="sd">        Args:</span>
-</span><span id="ExecEnv-74"><a href="#ExecEnv-74"><span class="linenos">74</span></a><span class="sd">            os_env_vars: this parameter can be used to pass the environment variables to</span>
-</span><span id="ExecEnv-75"><a href="#ExecEnv-75"><span class="linenos">75</span></a><span class="sd">            be defined.</span>
-</span><span id="ExecEnv-76"><a href="#ExecEnv-76"><span class="linenos">76</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="ExecEnv-77"><a href="#ExecEnv-77"><span class="linenos">77</span></a>        <span class="k">if</span> <span class="n">os_env_vars</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="ExecEnv-78"><a href="#ExecEnv-78"><span class="linenos">78</span></a>            <span class="n">os_env_vars</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="ExecEnv-73"><a href="#ExecEnv-73"><span class="linenos">73</span></a>    <span class="nd">@classmethod</span>
+</span><span id="ExecEnv-74"><a href="#ExecEnv-74"><span class="linenos">74</span></a>    <span class="k">def</span> <span class="nf">_set_environment_variables</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">os_env_vars</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ExecEnv-75"><a href="#ExecEnv-75"><span class="linenos">75</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Set environment variables at OS level.</span>
+</span><span id="ExecEnv-76"><a href="#ExecEnv-76"><span class="linenos">76</span></a>
+</span><span id="ExecEnv-77"><a href="#ExecEnv-77"><span class="linenos">77</span></a><span class="sd">        By default, we are setting the AWS_DEFAULT_REGION as we have identified this is</span>
+</span><span id="ExecEnv-78"><a href="#ExecEnv-78"><span class="linenos">78</span></a><span class="sd">        beneficial to avoid getBucketLocation permission problems.</span>
 </span><span id="ExecEnv-79"><a href="#ExecEnv-79"><span class="linenos">79</span></a>
-</span><span id="ExecEnv-80"><a href="#ExecEnv-80"><span class="linenos">80</span></a>        <span class="k">for</span> <span class="n">env_var</span> <span class="ow">in</span> <span class="n">os_env_vars</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="ExecEnv-81"><a href="#ExecEnv-81"><span class="linenos">81</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="n">env_var</span><span class="p">[</span><span class="mi">0</span><span class="p">]]</span> <span class="o">=</span> <span class="n">env_var</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="ExecEnv-82"><a href="#ExecEnv-82"><span class="linenos">82</span></a>
-</span><span id="ExecEnv-83"><a href="#ExecEnv-83"><span class="linenos">83</span></a>        <span class="k">if</span> <span class="s2">&quot;AWS_DEFAULT_REGION&quot;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">os_env_vars</span><span class="p">:</span>
-</span><span id="ExecEnv-84"><a href="#ExecEnv-84"><span class="linenos">84</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s2">&quot;AWS_DEFAULT_REGION&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span><span class="o">.</span><span class="n">sparkContext</span><span class="o">.</span><span class="n">getConf</span><span class="p">()</span><span class="o">.</span><span class="n">get</span><span class="p">(</span>
-</span><span id="ExecEnv-85"><a href="#ExecEnv-85"><span class="linenos">85</span></a>                <span class="s2">&quot;spark.databricks.clusterUsageTags.region&quot;</span><span class="p">,</span> <span class="bp">cls</span><span class="o">.</span><span class="n">DEFAULT_AWS_REGION</span>
-</span><span id="ExecEnv-86"><a href="#ExecEnv-86"><span class="linenos">86</span></a>            <span class="p">)</span>
+</span><span id="ExecEnv-80"><a href="#ExecEnv-80"><span class="linenos">80</span></a><span class="sd">        Args:</span>
+</span><span id="ExecEnv-81"><a href="#ExecEnv-81"><span class="linenos">81</span></a><span class="sd">            os_env_vars: this parameter can be used to pass the environment variables to</span>
+</span><span id="ExecEnv-82"><a href="#ExecEnv-82"><span class="linenos">82</span></a><span class="sd">            be defined.</span>
+</span><span id="ExecEnv-83"><a href="#ExecEnv-83"><span class="linenos">83</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ExecEnv-84"><a href="#ExecEnv-84"><span class="linenos">84</span></a>        <span class="k">if</span> <span class="n">os_env_vars</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ExecEnv-85"><a href="#ExecEnv-85"><span class="linenos">85</span></a>            <span class="n">os_env_vars</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="ExecEnv-86"><a href="#ExecEnv-86"><span class="linenos">86</span></a>
+</span><span id="ExecEnv-87"><a href="#ExecEnv-87"><span class="linenos">87</span></a>        <span class="k">for</span> <span class="n">env_var</span> <span class="ow">in</span> <span class="n">os_env_vars</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="ExecEnv-88"><a href="#ExecEnv-88"><span class="linenos">88</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="n">env_var</span><span class="p">[</span><span class="mi">0</span><span class="p">]]</span> <span class="o">=</span> <span class="n">env_var</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="ExecEnv-89"><a href="#ExecEnv-89"><span class="linenos">89</span></a>
+</span><span id="ExecEnv-90"><a href="#ExecEnv-90"><span class="linenos">90</span></a>        <span class="k">if</span> <span class="s2">&quot;AWS_DEFAULT_REGION&quot;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">os_env_vars</span><span class="p">:</span>
+</span><span id="ExecEnv-91"><a href="#ExecEnv-91"><span class="linenos">91</span></a>            <span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s2">&quot;AWS_DEFAULT_REGION&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span><span class="o">.</span><span class="n">sparkContext</span><span class="o">.</span><span class="n">getConf</span><span class="p">()</span><span class="o">.</span><span class="n">get</span><span class="p">(</span>
+</span><span id="ExecEnv-92"><a href="#ExecEnv-92"><span class="linenos">92</span></a>                <span class="s2">&quot;spark.databricks.clusterUsageTags.region&quot;</span><span class="p">,</span> <span class="bp">cls</span><span class="o">.</span><span class="n">DEFAULT_AWS_REGION</span>
+</span><span id="ExecEnv-93"><a href="#ExecEnv-93"><span class="linenos">93</span></a>            <span class="p">)</span>
 </span></pre></div>
 
 
@@ -259,50 +274,58 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#ExecEnv.get_or_create"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="ExecEnv.get_or_create-21"><a href="#ExecEnv.get_or_create-21"><span class="linenos">21</span></a>    <span class="nd">@classmethod</span>
-</span><span id="ExecEnv.get_or_create-22"><a href="#ExecEnv.get_or_create-22"><span class="linenos">22</span></a>    <span class="k">def</span> <span class="nf">get_or_create</span><span class="p">(</span>
-</span><span id="ExecEnv.get_or_create-23"><a href="#ExecEnv.get_or_create-23"><span class="linenos">23</span></a>        <span class="bp">cls</span><span class="p">,</span>
-</span><span id="ExecEnv.get_or_create-24"><a href="#ExecEnv.get_or_create-24"><span class="linenos">24</span></a>        <span class="n">session</span><span class="p">:</span> <span class="n">SparkSession</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="ExecEnv.get_or_create-25"><a href="#ExecEnv.get_or_create-25"><span class="linenos">25</span></a>        <span class="n">enable_hive_support</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="ExecEnv.get_or_create-26"><a href="#ExecEnv.get_or_create-26"><span class="linenos">26</span></a>        <span class="n">app_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="ExecEnv.get_or_create-27"><a href="#ExecEnv.get_or_create-27"><span class="linenos">27</span></a>        <span class="n">config</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="ExecEnv.get_or_create-28"><a href="#ExecEnv.get_or_create-28"><span class="linenos">28</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="ExecEnv.get_or_create-29"><a href="#ExecEnv.get_or_create-29"><span class="linenos">29</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get or create an execution environment session (currently Spark).</span>
-</span><span id="ExecEnv.get_or_create-30"><a href="#ExecEnv.get_or_create-30"><span class="linenos">30</span></a>
-</span><span id="ExecEnv.get_or_create-31"><a href="#ExecEnv.get_or_create-31"><span class="linenos">31</span></a><span class="sd">        It instantiates a singleton session that can be accessed anywhere from the</span>
-</span><span id="ExecEnv.get_or_create-32"><a href="#ExecEnv.get_or_create-32"><span class="linenos">32</span></a><span class="sd">        lakehouse engine.</span>
-</span><span id="ExecEnv.get_or_create-33"><a href="#ExecEnv.get_or_create-33"><span class="linenos">33</span></a>
-</span><span id="ExecEnv.get_or_create-34"><a href="#ExecEnv.get_or_create-34"><span class="linenos">34</span></a><span class="sd">        Args:</span>
-</span><span id="ExecEnv.get_or_create-35"><a href="#ExecEnv.get_or_create-35"><span class="linenos">35</span></a><span class="sd">            session: spark session.</span>
-</span><span id="ExecEnv.get_or_create-36"><a href="#ExecEnv.get_or_create-36"><span class="linenos">36</span></a><span class="sd">            enable_hive_support: whether to enable hive support or not.</span>
-</span><span id="ExecEnv.get_or_create-37"><a href="#ExecEnv.get_or_create-37"><span class="linenos">37</span></a><span class="sd">            app_name: application name.</span>
-</span><span id="ExecEnv.get_or_create-38"><a href="#ExecEnv.get_or_create-38"><span class="linenos">38</span></a><span class="sd">            config: extra spark configs to supply to the spark session.</span>
-</span><span id="ExecEnv.get_or_create-39"><a href="#ExecEnv.get_or_create-39"><span class="linenos">39</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="ExecEnv.get_or_create-40"><a href="#ExecEnv.get_or_create-40"><span class="linenos">40</span></a>        <span class="n">default_config</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="ExecEnv.get_or_create-41"><a href="#ExecEnv.get_or_create-41"><span class="linenos">41</span></a>            <span class="s2">&quot;spark.databricks.delta.optimizeWrite.enabled&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="ExecEnv.get_or_create-42"><a href="#ExecEnv.get_or_create-42"><span class="linenos">42</span></a>            <span class="s2">&quot;spark.sql.adaptive.enabled&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="ExecEnv.get_or_create-43"><a href="#ExecEnv.get_or_create-43"><span class="linenos">43</span></a>            <span class="s2">&quot;spark.databricks.delta.merge.enableLowShuffle&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
-</span><span id="ExecEnv.get_or_create-44"><a href="#ExecEnv.get_or_create-44"><span class="linenos">44</span></a>        <span class="p">}</span>
-</span><span id="ExecEnv.get_or_create-45"><a href="#ExecEnv.get_or_create-45"><span class="linenos">45</span></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="ExecEnv.get_or_create-46"><a href="#ExecEnv.get_or_create-46"><span class="linenos">46</span></a>            <span class="sa">f</span><span class="s2">&quot;Using the following default configs you may want to override them for &quot;</span>
-</span><span id="ExecEnv.get_or_create-47"><a href="#ExecEnv.get_or_create-47"><span class="linenos">47</span></a>            <span class="sa">f</span><span class="s2">&quot;your job: </span><span class="si">{</span><span class="n">default_config</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="ExecEnv.get_or_create-48"><a href="#ExecEnv.get_or_create-48"><span class="linenos">48</span></a>        <span class="p">)</span>
-</span><span id="ExecEnv.get_or_create-49"><a href="#ExecEnv.get_or_create-49"><span class="linenos">49</span></a>        <span class="n">final_config</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="p">{</span><span class="o">**</span><span class="n">default_config</span><span class="p">,</span> <span class="o">**</span><span class="p">(</span><span class="n">config</span> <span class="k">if</span> <span class="n">config</span> <span class="k">else</span> <span class="p">{})}</span>
-</span><span id="ExecEnv.get_or_create-50"><a href="#ExecEnv.get_or_create-50"><span class="linenos">50</span></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Final config is: </span><span class="si">{</span><span class="n">final_config</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="ExecEnv.get_or_create-51"><a href="#ExecEnv.get_or_create-51"><span class="linenos">51</span></a>
-</span><span id="ExecEnv.get_or_create-52"><a href="#ExecEnv.get_or_create-52"><span class="linenos">52</span></a>        <span class="k">if</span> <span class="n">session</span><span class="p">:</span>
-</span><span id="ExecEnv.get_or_create-53"><a href="#ExecEnv.get_or_create-53"><span class="linenos">53</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span> <span class="o">=</span> <span class="n">session</span>
-</span><span id="ExecEnv.get_or_create-54"><a href="#ExecEnv.get_or_create-54"><span class="linenos">54</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="ExecEnv.get_or_create-55"><a href="#ExecEnv.get_or_create-55"><span class="linenos">55</span></a>            <span class="n">session_builder</span> <span class="o">=</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">builder</span><span class="o">.</span><span class="n">appName</span><span class="p">(</span><span class="n">app_name</span><span class="p">)</span>
-</span><span id="ExecEnv.get_or_create-56"><a href="#ExecEnv.get_or_create-56"><span class="linenos">56</span></a>            <span class="k">if</span> <span class="n">config</span><span class="p">:</span>
-</span><span id="ExecEnv.get_or_create-57"><a href="#ExecEnv.get_or_create-57"><span class="linenos">57</span></a>                <span class="n">session_builder</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">config</span><span class="p">(</span>
-</span><span id="ExecEnv.get_or_create-58"><a href="#ExecEnv.get_or_create-58"><span class="linenos">58</span></a>                    <span class="n">conf</span><span class="o">=</span><span class="n">SparkConf</span><span class="p">()</span><span class="o">.</span><span class="n">setAll</span><span class="p">(</span><span class="n">final_config</span><span class="o">.</span><span class="n">items</span><span class="p">())</span>  <span class="c1"># type: ignore</span>
-</span><span id="ExecEnv.get_or_create-59"><a href="#ExecEnv.get_or_create-59"><span class="linenos">59</span></a>                <span class="p">)</span>
-</span><span id="ExecEnv.get_or_create-60"><a href="#ExecEnv.get_or_create-60"><span class="linenos">60</span></a>            <span class="k">if</span> <span class="n">enable_hive_support</span><span class="p">:</span>
-</span><span id="ExecEnv.get_or_create-61"><a href="#ExecEnv.get_or_create-61"><span class="linenos">61</span></a>                <span class="n">session_builder</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">enableHiveSupport</span><span class="p">()</span>
-</span><span id="ExecEnv.get_or_create-62"><a href="#ExecEnv.get_or_create-62"><span class="linenos">62</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">getOrCreate</span><span class="p">()</span>
-</span><span id="ExecEnv.get_or_create-63"><a href="#ExecEnv.get_or_create-63"><span class="linenos">63</span></a>
-</span><span id="ExecEnv.get_or_create-64"><a href="#ExecEnv.get_or_create-64"><span class="linenos">64</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">_set_environment_variables</span><span class="p">(</span><span class="n">final_config</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;os_env_vars&quot;</span><span class="p">))</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="ExecEnv.get_or_create-20"><a href="#ExecEnv.get_or_create-20"><span class="linenos">20</span></a>    <span class="nd">@classmethod</span>
+</span><span id="ExecEnv.get_or_create-21"><a href="#ExecEnv.get_or_create-21"><span class="linenos">21</span></a>    <span class="k">def</span> <span class="nf">get_or_create</span><span class="p">(</span>
+</span><span id="ExecEnv.get_or_create-22"><a href="#ExecEnv.get_or_create-22"><span class="linenos">22</span></a>        <span class="bp">cls</span><span class="p">,</span>
+</span><span id="ExecEnv.get_or_create-23"><a href="#ExecEnv.get_or_create-23"><span class="linenos">23</span></a>        <span class="n">session</span><span class="p">:</span> <span class="n">SparkSession</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="ExecEnv.get_or_create-24"><a href="#ExecEnv.get_or_create-24"><span class="linenos">24</span></a>        <span class="n">enable_hive_support</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="ExecEnv.get_or_create-25"><a href="#ExecEnv.get_or_create-25"><span class="linenos">25</span></a>        <span class="n">app_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="ExecEnv.get_or_create-26"><a href="#ExecEnv.get_or_create-26"><span class="linenos">26</span></a>        <span class="n">config</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="ExecEnv.get_or_create-27"><a href="#ExecEnv.get_or_create-27"><span class="linenos">27</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ExecEnv.get_or_create-28"><a href="#ExecEnv.get_or_create-28"><span class="linenos">28</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get or create an execution environment session (currently Spark).</span>
+</span><span id="ExecEnv.get_or_create-29"><a href="#ExecEnv.get_or_create-29"><span class="linenos">29</span></a>
+</span><span id="ExecEnv.get_or_create-30"><a href="#ExecEnv.get_or_create-30"><span class="linenos">30</span></a><span class="sd">        It instantiates a singleton session that can be accessed anywhere from the</span>
+</span><span id="ExecEnv.get_or_create-31"><a href="#ExecEnv.get_or_create-31"><span class="linenos">31</span></a><span class="sd">        lakehouse engine.</span>
+</span><span id="ExecEnv.get_or_create-32"><a href="#ExecEnv.get_or_create-32"><span class="linenos">32</span></a>
+</span><span id="ExecEnv.get_or_create-33"><a href="#ExecEnv.get_or_create-33"><span class="linenos">33</span></a><span class="sd">        Args:</span>
+</span><span id="ExecEnv.get_or_create-34"><a href="#ExecEnv.get_or_create-34"><span class="linenos">34</span></a><span class="sd">            session: spark session.</span>
+</span><span id="ExecEnv.get_or_create-35"><a href="#ExecEnv.get_or_create-35"><span class="linenos">35</span></a><span class="sd">            enable_hive_support: whether to enable hive support or not.</span>
+</span><span id="ExecEnv.get_or_create-36"><a href="#ExecEnv.get_or_create-36"><span class="linenos">36</span></a><span class="sd">            app_name: application name.</span>
+</span><span id="ExecEnv.get_or_create-37"><a href="#ExecEnv.get_or_create-37"><span class="linenos">37</span></a><span class="sd">            config: extra spark configs to supply to the spark session.</span>
+</span><span id="ExecEnv.get_or_create-38"><a href="#ExecEnv.get_or_create-38"><span class="linenos">38</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ExecEnv.get_or_create-39"><a href="#ExecEnv.get_or_create-39"><span class="linenos">39</span></a>        <span class="n">default_config</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="ExecEnv.get_or_create-40"><a href="#ExecEnv.get_or_create-40"><span class="linenos">40</span></a>            <span class="s2">&quot;spark.databricks.delta.optimizeWrite.enabled&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="ExecEnv.get_or_create-41"><a href="#ExecEnv.get_or_create-41"><span class="linenos">41</span></a>            <span class="s2">&quot;spark.sql.adaptive.enabled&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="ExecEnv.get_or_create-42"><a href="#ExecEnv.get_or_create-42"><span class="linenos">42</span></a>            <span class="s2">&quot;spark.databricks.delta.merge.enableLowShuffle&quot;</span><span class="p">:</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="ExecEnv.get_or_create-43"><a href="#ExecEnv.get_or_create-43"><span class="linenos">43</span></a>        <span class="p">}</span>
+</span><span id="ExecEnv.get_or_create-44"><a href="#ExecEnv.get_or_create-44"><span class="linenos">44</span></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="ExecEnv.get_or_create-45"><a href="#ExecEnv.get_or_create-45"><span class="linenos">45</span></a>            <span class="sa">f</span><span class="s2">&quot;Using the following default configs you may want to override them for &quot;</span>
+</span><span id="ExecEnv.get_or_create-46"><a href="#ExecEnv.get_or_create-46"><span class="linenos">46</span></a>            <span class="sa">f</span><span class="s2">&quot;your job: </span><span class="si">{</span><span class="n">default_config</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="ExecEnv.get_or_create-47"><a href="#ExecEnv.get_or_create-47"><span class="linenos">47</span></a>        <span class="p">)</span>
+</span><span id="ExecEnv.get_or_create-48"><a href="#ExecEnv.get_or_create-48"><span class="linenos">48</span></a>        <span class="n">final_config</span><span class="p">:</span> <span class="nb">dict</span> <span class="o">=</span> <span class="p">{</span><span class="o">**</span><span class="n">default_config</span><span class="p">,</span> <span class="o">**</span><span class="p">(</span><span class="n">config</span> <span class="k">if</span> <span class="n">config</span> <span class="k">else</span> <span class="p">{})}</span>
+</span><span id="ExecEnv.get_or_create-49"><a href="#ExecEnv.get_or_create-49"><span class="linenos">49</span></a>        <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Final config is: </span><span class="si">{</span><span class="n">final_config</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="ExecEnv.get_or_create-50"><a href="#ExecEnv.get_or_create-50"><span class="linenos">50</span></a>
+</span><span id="ExecEnv.get_or_create-51"><a href="#ExecEnv.get_or_create-51"><span class="linenos">51</span></a>        <span class="k">if</span> <span class="n">session</span><span class="p">:</span>
+</span><span id="ExecEnv.get_or_create-52"><a href="#ExecEnv.get_or_create-52"><span class="linenos">52</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span> <span class="o">=</span> <span class="n">session</span>
+</span><span id="ExecEnv.get_or_create-53"><a href="#ExecEnv.get_or_create-53"><span class="linenos">53</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="ExecEnv.get_or_create-54"><a href="#ExecEnv.get_or_create-54"><span class="linenos">54</span></a>            <span class="c1"># with active session we do not need app name</span>
+</span><span id="ExecEnv.get_or_create-55"><a href="#ExecEnv.get_or_create-55"><span class="linenos">55</span></a>            <span class="k">if</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">getActiveSession</span><span class="p">():</span>
+</span><span id="ExecEnv.get_or_create-56"><a href="#ExecEnv.get_or_create-56"><span class="linenos">56</span></a>                <span class="n">app_name</span> <span class="o">=</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">getActiveSession</span><span class="p">()</span><span class="o">.</span><span class="n">sparkContext</span><span class="o">.</span><span class="n">appName</span>
+</span><span id="ExecEnv.get_or_create-57"><a href="#ExecEnv.get_or_create-57"><span class="linenos">57</span></a>                <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Detected active session: </span><span class="si">{</span><span class="n">app_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="ExecEnv.get_or_create-58"><a href="#ExecEnv.get_or_create-58"><span class="linenos">58</span></a>            <span class="k">elif</span> <span class="ow">not</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">getActiveSession</span><span class="p">()</span> <span class="ow">and</span> <span class="ow">not</span> <span class="n">app_name</span><span class="p">:</span>
+</span><span id="ExecEnv.get_or_create-59"><a href="#ExecEnv.get_or_create-59"><span class="linenos">59</span></a>                <span class="bp">cls</span><span class="o">.</span><span class="n">_LOGGER</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;No active session or appname detected&quot;</span><span class="p">)</span>
+</span><span id="ExecEnv.get_or_create-60"><a href="#ExecEnv.get_or_create-60"><span class="linenos">60</span></a>                <span class="n">app_name</span> <span class="o">=</span> <span class="s2">&quot;lakehouse_engine&quot;</span>
+</span><span id="ExecEnv.get_or_create-61"><a href="#ExecEnv.get_or_create-61"><span class="linenos">61</span></a>            <span class="c1"># we will still add this part to set configs</span>
+</span><span id="ExecEnv.get_or_create-62"><a href="#ExecEnv.get_or_create-62"><span class="linenos">62</span></a>            <span class="n">session_builder</span> <span class="o">=</span> <span class="n">SparkSession</span><span class="o">.</span><span class="n">builder</span><span class="o">.</span><span class="n">appName</span><span class="p">(</span><span class="n">app_name</span><span class="p">)</span>
+</span><span id="ExecEnv.get_or_create-63"><a href="#ExecEnv.get_or_create-63"><span class="linenos">63</span></a>            <span class="k">if</span> <span class="n">config</span><span class="p">:</span>
+</span><span id="ExecEnv.get_or_create-64"><a href="#ExecEnv.get_or_create-64"><span class="linenos">64</span></a>                <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">final_config</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="ExecEnv.get_or_create-65"><a href="#ExecEnv.get_or_create-65"><span class="linenos">65</span></a>                    <span class="n">session_builder</span><span class="o">.</span><span class="n">config</span><span class="p">(</span><span class="n">k</span><span class="p">,</span> <span class="n">v</span><span class="p">)</span>
+</span><span id="ExecEnv.get_or_create-66"><a href="#ExecEnv.get_or_create-66"><span class="linenos">66</span></a>
+</span><span id="ExecEnv.get_or_create-67"><a href="#ExecEnv.get_or_create-67"><span class="linenos">67</span></a>            <span class="k">if</span> <span class="n">enable_hive_support</span><span class="p">:</span>
+</span><span id="ExecEnv.get_or_create-68"><a href="#ExecEnv.get_or_create-68"><span class="linenos">68</span></a>                <span class="n">session_builder</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">enableHiveSupport</span><span class="p">()</span>
+</span><span id="ExecEnv.get_or_create-69"><a href="#ExecEnv.get_or_create-69"><span class="linenos">69</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">SESSION</span> <span class="o">=</span> <span class="n">session_builder</span><span class="o">.</span><span class="n">getOrCreate</span><span class="p">()</span>
+</span><span id="ExecEnv.get_or_create-70"><a href="#ExecEnv.get_or_create-70"><span class="linenos">70</span></a>
+</span><span id="ExecEnv.get_or_create-71"><a href="#ExecEnv.get_or_create-71"><span class="linenos">71</span></a>            <span class="bp">cls</span><span class="o">.</span><span class="n">_set_environment_variables</span><span class="p">(</span><span class="n">final_config</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;os_env_vars&quot;</span><span class="p">))</span>
 </span></pre></div>
 
 
diff --git a/lakehouse_engine/core/file_manager.html b/lakehouse_engine/core/file_manager.html
index 34af7db..8ae2cd2 100644
--- a/lakehouse_engine/core/file_manager.html
+++ b/lakehouse_engine/core/file_manager.html
@@ -97,7 +97,7 @@ <h1 class="modulename">
 
                         <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">  1</span></a><span class="sd">&quot;&quot;&quot;File manager module.&quot;&quot;&quot;</span>
 </span><span id="L-2"><a href="#L-2"><span class="linenos">  2</span></a><span class="kn">import</span> <span class="nn">time</span>
-</span><span id="L-3"><a href="#L-3"><span class="linenos">  3</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Any</span><span class="p">,</span> <span class="n">Optional</span>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">  3</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Any</span><span class="p">,</span> <span class="n">Optional</span><span class="p">,</span> <span class="n">Tuple</span>
 </span><span id="L-4"><a href="#L-4"><span class="linenos">  4</span></a>
 </span><span id="L-5"><a href="#L-5"><span class="linenos">  5</span></a><span class="kn">import</span> <span class="nn">boto3</span>
 </span><span id="L-6"><a href="#L-6"><span class="linenos">  6</span></a>
@@ -111,516 +111,609 @@ <h1 class="modulename">
 </span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a><span class="kn">from</span> <span class="nn">lakehouse_engine.utils.logging_handler</span> <span class="kn">import</span> <span class="n">LoggingHandler</span>
 </span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a>
 </span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a>
-</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a><span class="k">def</span> <span class="nf">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_paths</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
-</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Build the dry run request return format.</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a><span class="k">def</span> <span class="nf">_process_directory_path</span><span class="p">(</span><span class="n">path</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Add &#39;/&#39; to the end of the path of a directory.</span>
 </span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a>
 </span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a><span class="sd">    Args:</span>
-</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="sd">        bucket: name of bucket to perform operation.</span>
-</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a><span class="sd">        object_paths: paths of object to list.</span>
-</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a>
-</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a><span class="sd">    Returns:</span>
-</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a><span class="sd">        A dict with a list of objects that would be copied/deleted.</span>
-</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>    <span class="n">response</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="sd">        path: directory to be processed</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a><span class="sd">    Returns:</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a><span class="sd">        Directory path stripped and with &#39;/&#39; at the end.</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a>    <span class="n">path</span> <span class="o">=</span> <span class="n">path</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>    <span class="k">return</span> <span class="n">path</span> <span class="k">if</span> <span class="n">path</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;/&quot;</span> <span class="k">else</span> <span class="n">path</span> <span class="o">+</span> <span class="s2">&quot;/&quot;</span>
 </span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a>
-</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>    <span class="k">for</span> <span class="n">path</span> <span class="ow">in</span> <span class="n">object_paths</span><span class="p">:</span>
-</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a>        <span class="n">path</span> <span class="o">=</span> <span class="n">path</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
-</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a>        <span class="n">res</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">path</span><span class="p">)</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a><span class="k">def</span> <span class="nf">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_paths</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Build the dry run request return format.</span>
 </span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a>
-</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a>        <span class="k">if</span> <span class="n">res</span><span class="p">:</span>
-</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>            <span class="n">response</span><span class="p">[</span><span class="n">path</span><span class="p">]</span> <span class="o">=</span> <span class="n">res</span>
-</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a>            <span class="n">response</span><span class="p">[</span><span class="n">path</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;No such key&quot;</span><span class="p">]</span>
-</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>
-</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>    <span class="k">return</span> <span class="n">response</span>
-</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>
-</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>
-</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a><span class="k">def</span> <span class="nf">_list_objects_recursively</span><span class="p">(</span><span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">path</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">:</span>
-</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Recursively list all objects given a prefix in s3.</span>
-</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>
-</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="sd">    Args:</span>
-</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="sd">        bucket: name of bucket to perform the list.</span>
-</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a><span class="sd">        path: path to be used as a prefix.</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a><span class="sd">    Args:</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a><span class="sd">        bucket: name of bucket to perform operation.</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a><span class="sd">        object_paths: paths of object to list.</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a><span class="sd">    Returns:</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a><span class="sd">        A dict with a list of objects that would be copied/deleted.</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>    <span class="n">response</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>    <span class="k">for</span> <span class="n">path</span> <span class="ow">in</span> <span class="n">object_paths</span><span class="p">:</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>        <span class="k">if</span> <span class="n">_check_directory</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">path</span><span class="p">):</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a>            <span class="n">path</span> <span class="o">=</span> <span class="n">_process_directory_path</span><span class="p">(</span><span class="n">path</span><span class="p">)</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a>        <span class="n">res</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">path</span><span class="p">)</span>
 </span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a>
-</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a><span class="sd">    Returns:</span>
-</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a><span class="sd">        A list of object names fetched recursively.</span>
-</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>    <span class="n">object_list</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>    <span class="n">more_objects</span> <span class="o">=</span> <span class="kc">True</span>
-</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a>    <span class="n">pagination</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a>        <span class="k">if</span> <span class="n">res</span><span class="p">:</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a>            <span class="n">response</span><span class="p">[</span><span class="n">path</span><span class="p">]</span> <span class="o">=</span> <span class="n">res</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>            <span class="n">response</span><span class="p">[</span><span class="n">path</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;No such key&quot;</span><span class="p">]</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a>    <span class="k">return</span> <span class="n">response</span>
 </span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a>
-</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a>    <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">client</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
-</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a>
-</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>    <span class="k">while</span> <span class="n">more_objects</span><span class="p">:</span>
-</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">pagination</span><span class="p">:</span>
-</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>            <span class="n">list_response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">list_objects_v2</span><span class="p">(</span><span class="n">Bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">Prefix</span><span class="o">=</span><span class="n">path</span><span class="p">)</span>
-</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>            <span class="n">list_response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">list_objects_v2</span><span class="p">(</span>
-</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>                <span class="n">Bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span>
-</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>                <span class="n">Prefix</span><span class="o">=</span><span class="n">path</span><span class="p">,</span>
-</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>                <span class="n">ContinuationToken</span><span class="o">=</span><span class="n">pagination</span><span class="p">,</span>
-</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>            <span class="p">)</span>
-</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a>
-</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>        <span class="k">if</span> <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">CONTENTS</span><span class="o">.</span><span class="n">value</span> <span class="ow">in</span> <span class="n">list_response</span><span class="p">:</span>
-</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>            <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">list_response</span><span class="p">[</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">CONTENTS</span><span class="o">.</span><span class="n">value</span><span class="p">]:</span>
-</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>                <span class="n">object_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">obj</span><span class="p">[</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">])</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a><span class="k">def</span> <span class="nf">_list_objects</span><span class="p">(</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>    <span class="n">s3_client</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">path</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">paginator</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">list</span><span class="p">,</span> <span class="nb">str</span><span class="p">]:</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;List 1000 objects in a bucket given a prefix and paginator in s3.</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a><span class="sd">    Args:</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a><span class="sd">        bucket: name of bucket to perform the list.</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a><span class="sd">        path: path to be used as a prefix.</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a><span class="sd">        paginator: paginator token to be used.</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a><span class="sd">    Returns:</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a><span class="sd">         A list of object names.</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>    <span class="n">object_list</span> <span class="o">=</span> <span class="p">[]</span>
 </span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>
-</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>        <span class="k">if</span> <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">CONTINUATION</span><span class="o">.</span><span class="n">value</span> <span class="ow">in</span> <span class="n">list_response</span><span class="p">:</span>
-</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>            <span class="n">pagination</span> <span class="o">=</span> <span class="n">list_response</span><span class="p">[</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">CONTINUATION</span><span class="o">.</span><span class="n">value</span><span class="p">]</span>
-</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>            <span class="n">more_objects</span> <span class="o">=</span> <span class="kc">False</span>
-</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>
-</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>    <span class="k">return</span> <span class="n">object_list</span>
-</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>
-</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>
-</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a><span class="k">class</span> <span class="nc">FileManager</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
-</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Set of actions to manipulate files in several ways.&quot;&quot;&quot;</span>
-</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>
-</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>    <span class="n">_logger</span> <span class="o">=</span> <span class="n">LoggingHandler</span><span class="p">(</span><span class="vm">__name__</span><span class="p">)</span><span class="o">.</span><span class="n">get_logger</span><span class="p">()</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">paginator</span><span class="p">:</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>        <span class="n">list_response</span> <span class="o">=</span> <span class="n">s3_client</span><span class="o">.</span><span class="n">list_objects_v2</span><span class="p">(</span><span class="n">Bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">Prefix</span><span class="o">=</span><span class="n">path</span><span class="p">)</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>        <span class="n">list_response</span> <span class="o">=</span> <span class="n">s3_client</span><span class="o">.</span><span class="n">list_objects_v2</span><span class="p">(</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>            <span class="n">Bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>            <span class="n">Prefix</span><span class="o">=</span><span class="n">path</span><span class="p">,</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>            <span class="n">ContinuationToken</span><span class="o">=</span><span class="n">paginator</span><span class="p">,</span>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>        <span class="p">)</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a>    <span class="k">if</span> <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">CONTENTS</span><span class="o">.</span><span class="n">value</span> <span class="ow">in</span> <span class="n">list_response</span><span class="p">:</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>        <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">list_response</span><span class="p">[</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">CONTENTS</span><span class="o">.</span><span class="n">value</span><span class="p">]:</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>            <span class="n">object_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">obj</span><span class="p">[</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">])</span>
 </span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a>
-</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">configs</span><span class="p">:</span> <span class="nb">dict</span><span class="p">):</span>
-</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Construct FileManager algorithm instances.</span>
-</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>
-</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a><span class="sd">        Args:</span>
-</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a><span class="sd">            configs: configurations for the FileManager algorithm.</span>
-</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">configs</span> <span class="o">=</span> <span class="n">configs</span>
-</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">function</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;function&quot;</span><span class="p">]</span>
-</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>
-</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a>    <span class="k">def</span> <span class="nf">get_function</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get a specific function to execute.&quot;&quot;&quot;</span>
-</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a>        <span class="n">available_functions</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>            <span class="s2">&quot;delete_objects&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">delete_objects</span><span class="p">,</span>
-</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>            <span class="s2">&quot;copy_objects&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">copy_objects</span><span class="p">,</span>
-</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>            <span class="s2">&quot;request_restore&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">request_restore</span><span class="p">,</span>
-</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>            <span class="s2">&quot;check_restore_status&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">,</span>
-</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>            <span class="s2">&quot;request_restore_to_destination_and_wait&quot;</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">request_restore_to_destination_and_wait</span>
-</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>            <span class="p">),</span>
-</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>        <span class="p">}</span>
-</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>
-</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Function being executed: </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="p">))</span>
-</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">function</span> <span class="ow">in</span> <span class="n">available_functions</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
-</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>            <span class="n">func</span> <span class="o">=</span> <span class="n">available_functions</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="p">]</span>
-</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>            <span class="n">func</span><span class="p">()</span>
-</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>            <span class="k">raise</span> <span class="ne">NotImplementedError</span><span class="p">(</span>
-</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a>                <span class="sa">f</span><span class="s2">&quot;The requested function </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="si">}</span><span class="s2"> is not implemented.&quot;</span>
-</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>            <span class="p">)</span>
-</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a>
-</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>    <span class="k">def</span> <span class="nf">delete_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Delete objects and &#39;directories&#39; in s3.</span>
-</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>
-</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a><span class="sd">        If dry_run is set to True the function will print a dict with all the</span>
-</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a><span class="sd">        paths that would be deleted based on the given keys.</span>
-</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>        <span class="n">bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>        <span class="n">objects_paths</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;object_paths&quot;</span><span class="p">]</span>
-</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
-</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>
-</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>        <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">client</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>    <span class="k">if</span> <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">CONTINUATION</span><span class="o">.</span><span class="n">value</span> <span class="ow">in</span> <span class="n">list_response</span><span class="p">:</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>        <span class="n">pagination</span> <span class="o">=</span> <span class="n">list_response</span><span class="p">[</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">CONTINUATION</span><span class="o">.</span><span class="n">value</span><span class="p">]</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>        <span class="n">pagination</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>    <span class="k">return</span> <span class="n">object_list</span><span class="p">,</span> <span class="n">pagination</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a><span class="k">def</span> <span class="nf">_list_objects_recursively</span><span class="p">(</span><span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">path</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">:</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Recursively list all objects given a prefix in s3.</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a><span class="sd">    Args:</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a><span class="sd">        bucket: name of bucket to perform the list.</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a><span class="sd">        path: path to be used as a prefix.</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a><span class="sd">    Returns:</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a><span class="sd">        A list of object names fetched recursively.</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>    <span class="n">object_list</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>    <span class="n">more_objects</span> <span class="o">=</span> <span class="kc">True</span>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>    <span class="n">paginator</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>    <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">client</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>    <span class="k">while</span> <span class="n">more_objects</span><span class="p">:</span>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>        <span class="n">temp_list</span><span class="p">,</span> <span class="n">paginator</span> <span class="o">=</span> <span class="n">_list_objects</span><span class="p">(</span><span class="n">s3</span><span class="p">,</span> <span class="n">bucket</span><span class="p">,</span> <span class="n">path</span><span class="p">,</span> <span class="n">paginator</span><span class="p">)</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a>        <span class="n">object_list</span><span class="o">.</span><span class="n">extend</span><span class="p">(</span><span class="n">temp_list</span><span class="p">)</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">paginator</span><span class="p">:</span>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>            <span class="n">more_objects</span> <span class="o">=</span> <span class="kc">False</span>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>    <span class="k">return</span> <span class="n">object_list</span>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a><span class="k">def</span> <span class="nf">_check_directory</span><span class="p">(</span><span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">path</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Checks if the object is a &#39;directory&#39; in s3.</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a><span class="sd">    Args:</span>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a><span class="sd">        bucket: name of bucket to perform the check.</span>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a><span class="sd">        path: path to be used as a prefix.</span>
 </span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>
-</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
-</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="n">objects_paths</span><span class="p">)</span>
-</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>
-</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be deleted:&quot;</span><span class="p">)</span>
-</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>            <span class="n">objects_to_delete</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>            <span class="k">for</span> <span class="n">path</span> <span class="ow">in</span> <span class="n">objects_paths</span><span class="p">:</span>
-</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>                <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">_list_objects_recursively</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">path</span><span class="p">):</span>
-</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>                    <span class="n">objects_to_delete</span><span class="o">.</span><span class="n">append</span><span class="p">({</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">obj</span><span class="p">})</span>
-</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a>
-</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">delete_objects</span><span class="p">(</span>
-</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>                <span class="n">Bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span>
-</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>                <span class="n">Delete</span><span class="o">=</span><span class="p">{</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">OBJECTS</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">objects_to_delete</span><span class="p">},</span>
-</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a>            <span class="p">)</span>
-</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>
-</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
-</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>
-</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>    <span class="k">def</span> <span class="nf">copy_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Copies objects and &#39;directories&#39; in s3.&quot;&quot;&quot;</span>
-</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
-</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>        <span class="n">destination_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_bucket&quot;</span><span class="p">]</span>
-</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>        <span class="n">destination_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_object&quot;</span><span class="p">]</span>
-</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
-</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>
-</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_copy_objects</span><span class="p">(</span>
-</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
-</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>            <span class="n">destination_bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
-</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>            <span class="n">destination_object</span><span class="o">=</span><span class="n">destination_object</span><span class="p">,</span>
-</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
-</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a>        <span class="p">)</span>
-</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>
-</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>    <span class="k">def</span> <span class="nf">request_restore</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request the restore of archived data.&quot;&quot;&quot;</span>
-</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
-</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a>        <span class="n">restore_expiration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;restore_expiration&quot;</span><span class="p">]</span>
-</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a>        <span class="n">retrieval_tier</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;retrieval_tier&quot;</span><span class="p">]</span>
-</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
-</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>
-</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore</span><span class="p">(</span>
-</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>            <span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>            <span class="n">source_object</span><span class="p">,</span>
-</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>            <span class="n">restore_expiration</span><span class="p">,</span>
-</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>            <span class="n">retrieval_tier</span><span class="p">,</span>
-</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>            <span class="n">dry_run</span><span class="p">,</span>
-</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a>        <span class="p">)</span>
-</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a>
-</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a>    <span class="k">def</span> <span class="nf">check_restore_status</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of archived data.&quot;&quot;&quot;</span>
-</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
-</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a>
-</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a>        <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
-</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a>            <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
-</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a>        <span class="p">)</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a><span class="sd">    Returns:</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a><span class="sd">        If path represents a &#39;directory&#39;.</span>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>    <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">client</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>    <span class="n">objects</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">_list_objects</span><span class="p">(</span><span class="n">s3</span><span class="p">,</span> <span class="n">bucket</span><span class="p">,</span> <span class="n">path</span><span class="p">)</span>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>    <span class="k">return</span> <span class="nb">len</span><span class="p">(</span><span class="n">objects</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a><span class="k">class</span> <span class="nc">FileManager</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Set of actions to manipulate files in several ways.&quot;&quot;&quot;</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>    <span class="n">_logger</span> <span class="o">=</span> <span class="n">LoggingHandler</span><span class="p">(</span><span class="vm">__name__</span><span class="p">)</span><span class="o">.</span><span class="n">get_logger</span><span class="p">()</span>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">configs</span><span class="p">:</span> <span class="nb">dict</span><span class="p">):</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Construct FileManager algorithm instances.</span>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a><span class="sd">        Args:</span>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a><span class="sd">            configs: configurations for the FileManager algorithm.</span>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">configs</span> <span class="o">=</span> <span class="n">configs</span>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">function</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;function&quot;</span><span class="p">]</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>    <span class="k">def</span> <span class="nf">get_function</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get a specific function to execute.&quot;&quot;&quot;</span>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>        <span class="n">available_functions</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>            <span class="s2">&quot;delete_objects&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">delete_objects</span><span class="p">,</span>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>            <span class="s2">&quot;copy_objects&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">copy_objects</span><span class="p">,</span>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a>            <span class="s2">&quot;request_restore&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">request_restore</span><span class="p">,</span>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>            <span class="s2">&quot;check_restore_status&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">,</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>            <span class="s2">&quot;request_restore_to_destination_and_wait&quot;</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">request_restore_to_destination_and_wait</span>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a>            <span class="p">),</span>
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>        <span class="p">}</span>
+</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Function being executed: </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="p">))</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">function</span> <span class="ow">in</span> <span class="n">available_functions</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>            <span class="n">func</span> <span class="o">=</span> <span class="n">available_functions</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="p">]</span>
+</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a>            <span class="n">func</span><span class="p">()</span>
+</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a>            <span class="k">raise</span> <span class="ne">NotImplementedError</span><span class="p">(</span>
+</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>                <span class="sa">f</span><span class="s2">&quot;The requested function </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="si">}</span><span class="s2"> is not implemented.&quot;</span>
+</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>            <span class="p">)</span>
+</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>
+</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>    <span class="k">def</span> <span class="nf">_delete_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">objects_paths</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Delete objects recursively in s3.</span>
+</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>
+</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a><span class="sd">        Params:</span>
+</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a><span class="sd">            bucket: name of bucket to perform the delete operation.</span>
+</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a><span class="sd">            objects_paths: objects to be deleted.</span>
+</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a>        <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">client</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
+</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a>
+</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a>        <span class="k">for</span> <span class="n">path</span> <span class="ow">in</span> <span class="n">objects_paths</span><span class="p">:</span>
+</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a>            <span class="k">if</span> <span class="n">_check_directory</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">path</span><span class="p">):</span>
+</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a>                <span class="n">path</span> <span class="o">=</span> <span class="n">_process_directory_path</span><span class="p">(</span><span class="n">path</span><span class="p">)</span>
+</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a>                <span class="n">path</span> <span class="o">=</span> <span class="n">path</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
 </span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a>
-</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span>
-</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a><span class="s2">            Restore status:</span>
-</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a><span class="s2">            - Not Started: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;not_started_objects&#39;</span><span class="p">)</span><span class="si">}</span>
-</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a><span class="s2">            - Ongoing: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;ongoing_objects&#39;</span><span class="p">)</span><span class="si">}</span>
-</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a><span class="s2">            - Restored: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;restored_objects&#39;</span><span class="p">)</span><span class="si">}</span>
-</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a><span class="s2">            Total objects in this restore process: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;total_objects&#39;</span><span class="p">)</span><span class="si">}</span>
-</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a><span class="s2">            &quot;&quot;&quot;</span>
-</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>        <span class="p">)</span>
-</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>
-</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a>    <span class="k">def</span> <span class="nf">request_restore_to_destination_and_wait</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request and wait for the restore to complete, polling the restore status.</span>
-</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>
-</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a><span class="sd">        After the restore is done, copy the restored files to destination</span>
-</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
-</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a>        <span class="n">destination_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_bucket&quot;</span><span class="p">]</span>
-</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>        <span class="n">destination_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_object&quot;</span><span class="p">]</span>
-</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a>        <span class="n">restore_expiration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;restore_expiration&quot;</span><span class="p">]</span>
-</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a>        <span class="n">retrieval_tier</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;retrieval_tier&quot;</span><span class="p">]</span>
-</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
-</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a>
-</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore_and_wait</span><span class="p">(</span>
-</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
-</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a>            <span class="n">restore_expiration</span><span class="o">=</span><span class="n">restore_expiration</span><span class="p">,</span>
-</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>            <span class="n">retrieval_tier</span><span class="o">=</span><span class="n">retrieval_tier</span><span class="p">,</span>
-</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
-</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>        <span class="p">)</span>
+</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a>            <span class="n">more_objects</span> <span class="o">=</span> <span class="kc">True</span>
+</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a>            <span class="n">paginator</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
+</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a>            <span class="n">objects_to_delete</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a>
+</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>            <span class="k">while</span> <span class="n">more_objects</span><span class="p">:</span>
+</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a>                <span class="n">objects_found</span><span class="p">,</span> <span class="n">paginator</span> <span class="o">=</span> <span class="n">_list_objects</span><span class="p">(</span>
+</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>                    <span class="n">s3_client</span><span class="o">=</span><span class="n">s3</span><span class="p">,</span> <span class="n">bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">path</span><span class="p">,</span> <span class="n">paginator</span><span class="o">=</span><span class="n">paginator</span>
+</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>                <span class="p">)</span>
+</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>                <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_found</span><span class="p">:</span>
+</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>                    <span class="n">objects_to_delete</span><span class="o">.</span><span class="n">append</span><span class="p">({</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">obj</span><span class="p">})</span>
+</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a>
+</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a>                <span class="k">if</span> <span class="ow">not</span> <span class="n">paginator</span><span class="p">:</span>
+</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>                    <span class="n">more_objects</span> <span class="o">=</span> <span class="kc">False</span>
+</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a>
+</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a>                <span class="n">response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">delete_objects</span><span class="p">(</span>
+</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a>                    <span class="n">Bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span>
+</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a>                    <span class="n">Delete</span><span class="o">=</span><span class="p">{</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">OBJECTS</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">objects_to_delete</span><span class="p">},</span>
+</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a>                <span class="p">)</span>
+</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a>                <span class="n">objects_to_delete</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a>
+</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a>    <span class="k">def</span> <span class="nf">delete_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Delete objects and &#39;directories&#39; in s3.</span>
+</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>
+</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a><span class="sd">        If dry_run is set to True the function will print a dict with all the</span>
+</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a><span class="sd">        paths that would be deleted based on the given keys.</span>
+</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>        <span class="n">bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>        <span class="n">objects_paths</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;object_paths&quot;</span><span class="p">]</span>
+</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
 </span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>
-</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a>            <span class="sa">f</span><span class="s2">&quot;Restoration complete for </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2"> and </span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>        <span class="p">)</span>
-</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a>            <span class="sa">f</span><span class="s2">&quot;Starting to copy data from </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2"> to &quot;</span>
-</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a>        <span class="p">)</span>
-</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_copy_objects</span><span class="p">(</span>
-</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
-</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a>            <span class="n">destination_bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
-</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a>            <span class="n">destination_object</span><span class="o">=</span><span class="n">destination_object</span><span class="p">,</span>
-</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
-</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a>        <span class="p">)</span>
-</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a>            <span class="sa">f</span><span class="s2">&quot;Finished copying data, data should be available on </span><span class="si">{</span><span class="n">destination_bucket</span><span class="si">}</span><span class="s2">/&quot;</span>
-</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a>        <span class="p">)</span>
-</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a>
-</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a>    <span class="k">def</span> <span class="nf">_copy_objects</span><span class="p">(</span>
-</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a>        <span class="n">destination_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a>        <span class="n">destination_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Copies objects and &#39;directories&#39; in s3.</span>
-</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>
-</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a><span class="sd">        Args:</span>
-</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a><span class="sd">            source_bucket: name of bucket to perform the copy.</span>
-</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a><span class="sd">            source_object: object/folder to be copied.</span>
-</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a><span class="sd">            destination_bucket: name of the target bucket to copy.</span>
-</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a><span class="sd">            destination_object: target object/folder to copy.</span>
-</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
-</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
-</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a>        <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">client</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
-</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a>
-</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
-</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="p">[</span><span class="n">source_object</span><span class="p">])</span>
-</span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a>
-</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>            <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be copied:&quot;</span><span class="p">)</span>
-</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a>            <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
-</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a>            <span class="n">copy_object</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
-</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a>                <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
-</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a>            <span class="p">)</span>
+</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
+</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="n">objects_paths</span><span class="p">)</span>
+</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>
+</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be deleted:&quot;</span><span class="p">)</span>
+</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_delete_objects</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">objects_paths</span><span class="p">)</span>
+</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a>
+</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a>    <span class="k">def</span> <span class="nf">copy_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Copies objects and &#39;directories&#39; in s3.&quot;&quot;&quot;</span>
+</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
+</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a>        <span class="n">destination_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_bucket&quot;</span><span class="p">]</span>
+</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a>        <span class="n">destination_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_object&quot;</span><span class="p">]</span>
+</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
+</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a>
+</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_copy_objects</span><span class="p">(</span>
+</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
+</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a>            <span class="n">destination_bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
+</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a>            <span class="n">destination_object</span><span class="o">=</span><span class="n">destination_object</span><span class="p">,</span>
+</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
+</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a>        <span class="p">)</span>
+</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a>
+</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a>    <span class="k">def</span> <span class="nf">request_restore</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request the restore of archived data.&quot;&quot;&quot;</span>
+</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
+</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>        <span class="n">restore_expiration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;restore_expiration&quot;</span><span class="p">]</span>
+</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>        <span class="n">retrieval_tier</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;retrieval_tier&quot;</span><span class="p">]</span>
+</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
+</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a>
+</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore</span><span class="p">(</span>
+</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a>            <span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a>            <span class="n">source_object</span><span class="p">,</span>
+</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a>            <span class="n">restore_expiration</span><span class="p">,</span>
+</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a>            <span class="n">retrieval_tier</span><span class="p">,</span>
+</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a>            <span class="n">dry_run</span><span class="p">,</span>
+</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a>        <span class="p">)</span>
+</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a>
+</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a>    <span class="k">def</span> <span class="nf">check_restore_status</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of archived data.&quot;&quot;&quot;</span>
+</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
+</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a>
+</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a>        <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
+</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a>            <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
+</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a>        <span class="p">)</span>
 </span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a>
-</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">copy_object</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>                <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Copying obj: </span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a>
-</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a>                <span class="n">response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">copy_object</span><span class="p">(</span>
-</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a>                    <span class="n">Bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
-</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a>                    <span class="n">CopySource</span><span class="o">=</span><span class="p">{</span>
-</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a>                        <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">BUCKET</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a>                        <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">source_object</span><span class="p">,</span>
-</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a>                    <span class="p">},</span>
-</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a>                    <span class="n">Key</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">copy_object</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;/&quot;</span><span class="p">)[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;&quot;&quot;</span><span class="p">,</span>
-</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a>                <span class="p">)</span>
-</span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a>                <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
-</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a>                <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">copy_object</span><span class="p">:</span>
-</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a>                    <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Copying obj: </span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a>
-</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a>                    <span class="n">final_path</span> <span class="o">=</span> <span class="n">obj</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="n">source_object</span><span class="p">,</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
-</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a>
-</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a>                    <span class="n">response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">copy_object</span><span class="p">(</span>
-</span><span id="L-283"><a href="#L-283"><span class="linenos">283</span></a>                        <span class="n">Bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
-</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a>                        <span class="n">CopySource</span><span class="o">=</span><span class="p">{</span>
-</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a>                            <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">BUCKET</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a>                            <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">obj</span><span class="p">,</span>
-</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a>                        <span class="p">},</span>
-</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a>                        <span class="n">Key</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}{</span><span class="n">final_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a>                    <span class="p">)</span>
-</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a>                    <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
-</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a>
-</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a>
-</span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a><span class="k">class</span> <span class="nc">ArchiveFileManager</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
-</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Set of actions to restore archives.&quot;&quot;&quot;</span>
-</span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a>
-</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a>    <span class="n">_logger</span> <span class="o">=</span> <span class="n">LoggingHandler</span><span class="p">(</span><span class="vm">__name__</span><span class="p">)</span><span class="o">.</span><span class="n">get_logger</span><span class="p">()</span>
-</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a>
-</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a>    <span class="k">def</span> <span class="nf">_get_archived_object</span><span class="p">(</span><span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_key</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Any</span><span class="p">]:</span>
-</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get the archived object if it&#39;s an object.</span>
-</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a>
-</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a><span class="sd">        Args:</span>
-</span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a><span class="sd">            bucket: name of bucket to check get the object.</span>
-</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a><span class="sd">            object_key: object to get.</span>
-</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a>
-</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a><span class="sd">        Returns:</span>
-</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a><span class="sd">            S3 Object if it&#39;s an archived object, otherwise None.</span>
-</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a>        <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">resource</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
-</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a>        <span class="n">object_to_restore</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">Object</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">)</span>
-</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a>
-</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a>        <span class="k">if</span> <span class="p">(</span>
-</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a>            <span class="n">object_to_restore</span><span class="o">.</span><span class="n">storage_class</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span>
-</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a>            <span class="ow">and</span> <span class="n">object_to_restore</span><span class="o">.</span><span class="n">storage_class</span> <span class="ow">in</span> <span class="n">ARCHIVE_STORAGE_CLASS</span>
-</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a>        <span class="p">):</span>
-</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a>            <span class="k">return</span> <span class="n">object_to_restore</span>
-</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-318"><a href="#L-318"><span class="linenos">318</span></a>            <span class="k">return</span> <span class="kc">None</span>
-</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a>
-</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a>    <span class="k">def</span> <span class="nf">_check_object_restore_status</span><span class="p">(</span>
-</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a>        <span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_key</span><span class="p">:</span> <span class="nb">str</span>
-</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">RestoreStatus</span><span class="p">]:</span>
-</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of the archive.</span>
-</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a>
-</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a><span class="sd">        Args:</span>
-</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a><span class="sd">            bucket: name of bucket to check the restore status.</span>
-</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a><span class="sd">            object_key: object to check the restore status.</span>
-</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a>
-</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a><span class="sd">        Returns:</span>
-</span><span id="L-331"><a href="#L-331"><span class="linenos">331</span></a><span class="sd">            The restore status represented by an enum, possible values are:</span>
-</span><span id="L-332"><a href="#L-332"><span class="linenos">332</span></a><span class="sd">                NOT_STARTED, ONGOING or RESTORED</span>
-</span><span id="L-333"><a href="#L-333"><span class="linenos">333</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-334"><a href="#L-334"><span class="linenos">334</span></a>        <span class="n">archived_object</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_get_archived_object</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">)</span>
-</span><span id="L-335"><a href="#L-335"><span class="linenos">335</span></a>
-</span><span id="L-336"><a href="#L-336"><span class="linenos">336</span></a>        <span class="k">if</span> <span class="n">archived_object</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-337"><a href="#L-337"><span class="linenos">337</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="L-338"><a href="#L-338"><span class="linenos">338</span></a>        <span class="k">elif</span> <span class="n">archived_object</span><span class="o">.</span><span class="n">restore</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-339"><a href="#L-339"><span class="linenos">339</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">NOT_STARTED</span>
-</span><span id="L-340"><a href="#L-340"><span class="linenos">340</span></a>        <span class="k">elif</span> <span class="s1">&#39;ongoing-request=&quot;true&quot;&#39;</span> <span class="ow">in</span> <span class="n">archived_object</span><span class="o">.</span><span class="n">restore</span><span class="p">:</span>
-</span><span id="L-341"><a href="#L-341"><span class="linenos">341</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">ONGOING</span>
-</span><span id="L-342"><a href="#L-342"><span class="linenos">342</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-343"><a href="#L-343"><span class="linenos">343</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">RESTORED</span>
+</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span>
+</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a><span class="s2">            Restore status:</span>
+</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a><span class="s2">            - Not Started: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;not_started_objects&#39;</span><span class="p">)</span><span class="si">}</span>
+</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a><span class="s2">            - Ongoing: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;ongoing_objects&#39;</span><span class="p">)</span><span class="si">}</span>
+</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a><span class="s2">            - Restored: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;restored_objects&#39;</span><span class="p">)</span><span class="si">}</span>
+</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a><span class="s2">            Total objects in this restore process: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;total_objects&#39;</span><span class="p">)</span><span class="si">}</span>
+</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a><span class="s2">            &quot;&quot;&quot;</span>
+</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a>        <span class="p">)</span>
+</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a>
+</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a>    <span class="k">def</span> <span class="nf">request_restore_to_destination_and_wait</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request and wait for the restore to complete, polling the restore status.</span>
+</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a>
+</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a><span class="sd">        After the restore is done, copy the restored files to destination</span>
+</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
+</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a>        <span class="n">destination_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_bucket&quot;</span><span class="p">]</span>
+</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a>        <span class="n">destination_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_object&quot;</span><span class="p">]</span>
+</span><span id="L-283"><a href="#L-283"><span class="linenos">283</span></a>        <span class="n">restore_expiration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;restore_expiration&quot;</span><span class="p">]</span>
+</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a>        <span class="n">retrieval_tier</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;retrieval_tier&quot;</span><span class="p">]</span>
+</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
+</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a>
+</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore_and_wait</span><span class="p">(</span>
+</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
+</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a>            <span class="n">restore_expiration</span><span class="o">=</span><span class="n">restore_expiration</span><span class="p">,</span>
+</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a>            <span class="n">retrieval_tier</span><span class="o">=</span><span class="n">retrieval_tier</span><span class="p">,</span>
+</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
+</span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a>        <span class="p">)</span>
+</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a>
+</span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a>            <span class="sa">f</span><span class="s2">&quot;Restoration complete for </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2"> and </span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a>        <span class="p">)</span>
+</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a>            <span class="sa">f</span><span class="s2">&quot;Starting to copy data from </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2"> to &quot;</span>
+</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a>        <span class="p">)</span>
+</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_copy_objects</span><span class="p">(</span>
+</span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
+</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a>            <span class="n">destination_bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
+</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a>            <span class="n">destination_object</span><span class="o">=</span><span class="n">destination_object</span><span class="p">,</span>
+</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
+</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a>        <span class="p">)</span>
+</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a>            <span class="sa">f</span><span class="s2">&quot;Finished copying data, data should be available on </span><span class="si">{</span><span class="n">destination_bucket</span><span class="si">}</span><span class="s2">/&quot;</span>
+</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a>        <span class="p">)</span>
+</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a>
+</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a>    <span class="k">def</span> <span class="nf">_copy_objects</span><span class="p">(</span>
+</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-318"><a href="#L-318"><span class="linenos">318</span></a>        <span class="n">destination_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a>        <span class="n">destination_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Copies objects and &#39;directories&#39; in s3.</span>
+</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a>
+</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a><span class="sd">        Args:</span>
+</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a><span class="sd">            source_bucket: name of bucket to perform the copy.</span>
+</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a><span class="sd">            source_object: object/folder to be copied.</span>
+</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a><span class="sd">            destination_bucket: name of the target bucket to copy.</span>
+</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a><span class="sd">            destination_object: target object/folder to copy.</span>
+</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
+</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
+</span><span id="L-331"><a href="#L-331"><span class="linenos">331</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-332"><a href="#L-332"><span class="linenos">332</span></a>        <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">client</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
+</span><span id="L-333"><a href="#L-333"><span class="linenos">333</span></a>
+</span><span id="L-334"><a href="#L-334"><span class="linenos">334</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
+</span><span id="L-335"><a href="#L-335"><span class="linenos">335</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="p">[</span><span class="n">source_object</span><span class="p">])</span>
+</span><span id="L-336"><a href="#L-336"><span class="linenos">336</span></a>
+</span><span id="L-337"><a href="#L-337"><span class="linenos">337</span></a>            <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be copied:&quot;</span><span class="p">)</span>
+</span><span id="L-338"><a href="#L-338"><span class="linenos">338</span></a>            <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="L-339"><a href="#L-339"><span class="linenos">339</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-340"><a href="#L-340"><span class="linenos">340</span></a>            <span class="n">original_object_name</span> <span class="o">=</span> <span class="n">source_object</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;/&quot;</span><span class="p">)[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="L-341"><a href="#L-341"><span class="linenos">341</span></a>
+</span><span id="L-342"><a href="#L-342"><span class="linenos">342</span></a>            <span class="k">if</span> <span class="n">_check_directory</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span><span class="p">):</span>
+</span><span id="L-343"><a href="#L-343"><span class="linenos">343</span></a>                <span class="n">source_object</span> <span class="o">=</span> <span class="n">_process_directory_path</span><span class="p">(</span><span class="n">source_object</span><span class="p">)</span>
 </span><span id="L-344"><a href="#L-344"><span class="linenos">344</span></a>
-</span><span id="L-345"><a href="#L-345"><span class="linenos">345</span></a>        <span class="k">return</span> <span class="n">status</span>
-</span><span id="L-346"><a href="#L-346"><span class="linenos">346</span></a>
-</span><span id="L-347"><a href="#L-347"><span class="linenos">347</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="L-348"><a href="#L-348"><span class="linenos">348</span></a>    <span class="k">def</span> <span class="nf">check_restore_status</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
-</span><span id="L-349"><a href="#L-349"><span class="linenos">349</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of archived data.</span>
-</span><span id="L-350"><a href="#L-350"><span class="linenos">350</span></a>
-</span><span id="L-351"><a href="#L-351"><span class="linenos">351</span></a><span class="sd">        Args:</span>
-</span><span id="L-352"><a href="#L-352"><span class="linenos">352</span></a><span class="sd">            source_bucket: name of bucket to check the restore status.</span>
-</span><span id="L-353"><a href="#L-353"><span class="linenos">353</span></a><span class="sd">            source_object: object to check the restore status.</span>
-</span><span id="L-354"><a href="#L-354"><span class="linenos">354</span></a>
-</span><span id="L-355"><a href="#L-355"><span class="linenos">355</span></a><span class="sd">        Returns:</span>
-</span><span id="L-356"><a href="#L-356"><span class="linenos">356</span></a><span class="sd">            A dict containing the amount of objects in each status.</span>
-</span><span id="L-357"><a href="#L-357"><span class="linenos">357</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-358"><a href="#L-358"><span class="linenos">358</span></a>        <span class="n">not_started_objects</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-359"><a href="#L-359"><span class="linenos">359</span></a>        <span class="n">ongoing_objects</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-360"><a href="#L-360"><span class="linenos">360</span></a>        <span class="n">restored_objects</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-361"><a href="#L-361"><span class="linenos">361</span></a>        <span class="n">total_objects</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="L-362"><a href="#L-362"><span class="linenos">362</span></a>
-</span><span id="L-363"><a href="#L-363"><span class="linenos">363</span></a>        <span class="n">objects_to_restore</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
-</span><span id="L-364"><a href="#L-364"><span class="linenos">364</span></a>            <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
-</span><span id="L-365"><a href="#L-365"><span class="linenos">365</span></a>        <span class="p">)</span>
-</span><span id="L-366"><a href="#L-366"><span class="linenos">366</span></a>
-</span><span id="L-367"><a href="#L-367"><span class="linenos">367</span></a>        <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_to_restore</span><span class="p">:</span>
-</span><span id="L-368"><a href="#L-368"><span class="linenos">368</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Checking restore status for: </span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="L-369"><a href="#L-369"><span class="linenos">369</span></a>
-</span><span id="L-370"><a href="#L-370"><span class="linenos">370</span></a>            <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_check_object_restore_status</span><span class="p">(</span>
-</span><span id="L-371"><a href="#L-371"><span class="linenos">371</span></a>                <span class="n">source_bucket</span><span class="p">,</span> <span class="n">obj</span>
-</span><span id="L-372"><a href="#L-372"><span class="linenos">372</span></a>            <span class="p">)</span>
-</span><span id="L-373"><a href="#L-373"><span class="linenos">373</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">restore_status</span><span class="p">:</span>
-</span><span id="L-374"><a href="#L-374"><span class="linenos">374</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span>
-</span><span id="L-375"><a href="#L-375"><span class="linenos">375</span></a>                    <span class="sa">f</span><span class="s2">&quot;Restore status not found for </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="L-376"><a href="#L-376"><span class="linenos">376</span></a>                <span class="p">)</span>
-</span><span id="L-377"><a href="#L-377"><span class="linenos">377</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="L-378"><a href="#L-378"><span class="linenos">378</span></a>                <span class="n">total_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-345"><a href="#L-345"><span class="linenos">345</span></a>                <span class="n">copy_object</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
+</span><span id="L-346"><a href="#L-346"><span class="linenos">346</span></a>                    <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
+</span><span id="L-347"><a href="#L-347"><span class="linenos">347</span></a>                <span class="p">)</span>
+</span><span id="L-348"><a href="#L-348"><span class="linenos">348</span></a>
+</span><span id="L-349"><a href="#L-349"><span class="linenos">349</span></a>                <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">copy_object</span><span class="p">:</span>
+</span><span id="L-350"><a href="#L-350"><span class="linenos">350</span></a>                    <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Copying obj: </span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-351"><a href="#L-351"><span class="linenos">351</span></a>
+</span><span id="L-352"><a href="#L-352"><span class="linenos">352</span></a>                    <span class="n">final_path</span> <span class="o">=</span> <span class="n">obj</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="n">source_object</span><span class="p">,</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="L-353"><a href="#L-353"><span class="linenos">353</span></a>
+</span><span id="L-354"><a href="#L-354"><span class="linenos">354</span></a>                    <span class="n">response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">copy_object</span><span class="p">(</span>
+</span><span id="L-355"><a href="#L-355"><span class="linenos">355</span></a>                        <span class="n">Bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
+</span><span id="L-356"><a href="#L-356"><span class="linenos">356</span></a>                        <span class="n">CopySource</span><span class="o">=</span><span class="p">{</span>
+</span><span id="L-357"><a href="#L-357"><span class="linenos">357</span></a>                            <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">BUCKET</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="L-358"><a href="#L-358"><span class="linenos">358</span></a>                            <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">obj</span><span class="p">,</span>
+</span><span id="L-359"><a href="#L-359"><span class="linenos">359</span></a>                        <span class="p">},</span>
+</span><span id="L-360"><a href="#L-360"><span class="linenos">360</span></a>                        <span class="n">Key</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">original_object_name</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">final_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="L-361"><a href="#L-361"><span class="linenos">361</span></a>                    <span class="p">)</span>
+</span><span id="L-362"><a href="#L-362"><span class="linenos">362</span></a>                    <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="L-363"><a href="#L-363"><span class="linenos">363</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-364"><a href="#L-364"><span class="linenos">364</span></a>                <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Copying obj: </span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-365"><a href="#L-365"><span class="linenos">365</span></a>
+</span><span id="L-366"><a href="#L-366"><span class="linenos">366</span></a>                <span class="n">response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">copy_object</span><span class="p">(</span>
+</span><span id="L-367"><a href="#L-367"><span class="linenos">367</span></a>                    <span class="n">Bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
+</span><span id="L-368"><a href="#L-368"><span class="linenos">368</span></a>                    <span class="n">CopySource</span><span class="o">=</span><span class="p">{</span>
+</span><span id="L-369"><a href="#L-369"><span class="linenos">369</span></a>                        <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">BUCKET</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="L-370"><a href="#L-370"><span class="linenos">370</span></a>                        <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">source_object</span><span class="p">,</span>
+</span><span id="L-371"><a href="#L-371"><span class="linenos">371</span></a>                    <span class="p">},</span>
+</span><span id="L-372"><a href="#L-372"><span class="linenos">372</span></a>                    <span class="n">Key</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">original_object_name</span><span class="si">}</span><span class="s2">&quot;&quot;&quot;</span><span class="p">,</span>
+</span><span id="L-373"><a href="#L-373"><span class="linenos">373</span></a>                <span class="p">)</span>
+</span><span id="L-374"><a href="#L-374"><span class="linenos">374</span></a>                <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="L-375"><a href="#L-375"><span class="linenos">375</span></a>
+</span><span id="L-376"><a href="#L-376"><span class="linenos">376</span></a>
+</span><span id="L-377"><a href="#L-377"><span class="linenos">377</span></a><span class="k">class</span> <span class="nc">ArchiveFileManager</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
+</span><span id="L-378"><a href="#L-378"><span class="linenos">378</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Set of actions to restore archives.&quot;&quot;&quot;</span>
 </span><span id="L-379"><a href="#L-379"><span class="linenos">379</span></a>
-</span><span id="L-380"><a href="#L-380"><span class="linenos">380</span></a>                <span class="k">if</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">NOT_STARTED</span> <span class="o">==</span> <span class="n">restore_status</span><span class="p">:</span>
-</span><span id="L-381"><a href="#L-381"><span class="linenos">381</span></a>                    <span class="n">not_started_objects</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-382"><a href="#L-382"><span class="linenos">382</span></a>                <span class="k">elif</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">ONGOING</span> <span class="o">==</span> <span class="n">restore_status</span><span class="p">:</span>
-</span><span id="L-383"><a href="#L-383"><span class="linenos">383</span></a>                    <span class="n">ongoing_objects</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-384"><a href="#L-384"><span class="linenos">384</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="L-385"><a href="#L-385"><span class="linenos">385</span></a>                    <span class="n">restored_objects</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="L-386"><a href="#L-386"><span class="linenos">386</span></a>
-</span><span id="L-387"><a href="#L-387"><span class="linenos">387</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-388"><a href="#L-388"><span class="linenos">388</span></a>                    <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2"> restore status is </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">value</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="L-389"><a href="#L-389"><span class="linenos">389</span></a>                <span class="p">)</span>
-</span><span id="L-390"><a href="#L-390"><span class="linenos">390</span></a>
-</span><span id="L-391"><a href="#L-391"><span class="linenos">391</span></a>        <span class="k">return</span> <span class="p">{</span>
-</span><span id="L-392"><a href="#L-392"><span class="linenos">392</span></a>            <span class="s2">&quot;total_objects&quot;</span><span class="p">:</span> <span class="n">total_objects</span><span class="p">,</span>
-</span><span id="L-393"><a href="#L-393"><span class="linenos">393</span></a>            <span class="s2">&quot;not_started_objects&quot;</span><span class="p">:</span> <span class="n">not_started_objects</span><span class="p">,</span>
-</span><span id="L-394"><a href="#L-394"><span class="linenos">394</span></a>            <span class="s2">&quot;ongoing_objects&quot;</span><span class="p">:</span> <span class="n">ongoing_objects</span><span class="p">,</span>
-</span><span id="L-395"><a href="#L-395"><span class="linenos">395</span></a>            <span class="s2">&quot;restored_objects&quot;</span><span class="p">:</span> <span class="n">restored_objects</span><span class="p">,</span>
-</span><span id="L-396"><a href="#L-396"><span class="linenos">396</span></a>        <span class="p">}</span>
-</span><span id="L-397"><a href="#L-397"><span class="linenos">397</span></a>
-</span><span id="L-398"><a href="#L-398"><span class="linenos">398</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="L-399"><a href="#L-399"><span class="linenos">399</span></a>    <span class="k">def</span> <span class="nf">_request_restore_object</span><span class="p">(</span>
-</span><span id="L-400"><a href="#L-400"><span class="linenos">400</span></a>        <span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_key</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span>
-</span><span id="L-401"><a href="#L-401"><span class="linenos">401</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-402"><a href="#L-402"><span class="linenos">402</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request a restore of the archive.</span>
+</span><span id="L-380"><a href="#L-380"><span class="linenos">380</span></a>    <span class="n">_logger</span> <span class="o">=</span> <span class="n">LoggingHandler</span><span class="p">(</span><span class="vm">__name__</span><span class="p">)</span><span class="o">.</span><span class="n">get_logger</span><span class="p">()</span>
+</span><span id="L-381"><a href="#L-381"><span class="linenos">381</span></a>
+</span><span id="L-382"><a href="#L-382"><span class="linenos">382</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="L-383"><a href="#L-383"><span class="linenos">383</span></a>    <span class="k">def</span> <span class="nf">_get_archived_object</span><span class="p">(</span><span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_key</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Any</span><span class="p">]:</span>
+</span><span id="L-384"><a href="#L-384"><span class="linenos">384</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get the archived object if it&#39;s an object.</span>
+</span><span id="L-385"><a href="#L-385"><span class="linenos">385</span></a>
+</span><span id="L-386"><a href="#L-386"><span class="linenos">386</span></a><span class="sd">        Args:</span>
+</span><span id="L-387"><a href="#L-387"><span class="linenos">387</span></a><span class="sd">            bucket: name of bucket to check get the object.</span>
+</span><span id="L-388"><a href="#L-388"><span class="linenos">388</span></a><span class="sd">            object_key: object to get.</span>
+</span><span id="L-389"><a href="#L-389"><span class="linenos">389</span></a>
+</span><span id="L-390"><a href="#L-390"><span class="linenos">390</span></a><span class="sd">        Returns:</span>
+</span><span id="L-391"><a href="#L-391"><span class="linenos">391</span></a><span class="sd">            S3 Object if it&#39;s an archived object, otherwise None.</span>
+</span><span id="L-392"><a href="#L-392"><span class="linenos">392</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-393"><a href="#L-393"><span class="linenos">393</span></a>        <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">resource</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
+</span><span id="L-394"><a href="#L-394"><span class="linenos">394</span></a>        <span class="n">object_to_restore</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">Object</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">)</span>
+</span><span id="L-395"><a href="#L-395"><span class="linenos">395</span></a>
+</span><span id="L-396"><a href="#L-396"><span class="linenos">396</span></a>        <span class="k">if</span> <span class="p">(</span>
+</span><span id="L-397"><a href="#L-397"><span class="linenos">397</span></a>            <span class="n">object_to_restore</span><span class="o">.</span><span class="n">storage_class</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span>
+</span><span id="L-398"><a href="#L-398"><span class="linenos">398</span></a>            <span class="ow">and</span> <span class="n">object_to_restore</span><span class="o">.</span><span class="n">storage_class</span> <span class="ow">in</span> <span class="n">ARCHIVE_STORAGE_CLASS</span>
+</span><span id="L-399"><a href="#L-399"><span class="linenos">399</span></a>        <span class="p">):</span>
+</span><span id="L-400"><a href="#L-400"><span class="linenos">400</span></a>            <span class="k">return</span> <span class="n">object_to_restore</span>
+</span><span id="L-401"><a href="#L-401"><span class="linenos">401</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-402"><a href="#L-402"><span class="linenos">402</span></a>            <span class="k">return</span> <span class="kc">None</span>
 </span><span id="L-403"><a href="#L-403"><span class="linenos">403</span></a>
-</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a><span class="sd">        Args:</span>
-</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a><span class="sd">            bucket: name of bucket to perform the restore.</span>
-</span><span id="L-406"><a href="#L-406"><span class="linenos">406</span></a><span class="sd">            object_key: object to be restored.</span>
-</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a><span class="sd">            expiration: restore expiration.</span>
-</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
-</span><span id="L-409"><a href="#L-409"><span class="linenos">409</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
-</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">RestoreType</span><span class="o">.</span><span class="n">exists</span><span class="p">(</span><span class="n">retrieval_tier</span><span class="p">):</span>
-</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a>            <span class="k">raise</span> <span class="n">RestoreTypeNotFoundException</span><span class="p">(</span>
-</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a>                <span class="sa">f</span><span class="s2">&quot;Restore type </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not supported.&quot;</span>
-</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a>            <span class="p">)</span>
-</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a>
-</span><span id="L-416"><a href="#L-416"><span class="linenos">416</span></a>        <span class="n">archived_object</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_get_archived_object</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">)</span>
-</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a>
-</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a>        <span class="k">if</span> <span class="n">archived_object</span> <span class="ow">and</span> <span class="n">archived_object</span><span class="o">.</span><span class="n">restore</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-419"><a href="#L-419"><span class="linenos">419</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restoring archive </span><span class="si">{</span><span class="n">bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">object_key</span><span class="si">}</span><span class="s2">.&quot;</span><span class="p">)</span>
-</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a>            <span class="n">archived_object</span><span class="o">.</span><span class="n">restore_object</span><span class="p">(</span>
-</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a>                <span class="n">RestoreRequest</span><span class="o">=</span><span class="p">{</span>
-</span><span id="L-422"><a href="#L-422"><span class="linenos">422</span></a>                    <span class="s2">&quot;Days&quot;</span><span class="p">:</span> <span class="n">expiration</span><span class="p">,</span>
-</span><span id="L-423"><a href="#L-423"><span class="linenos">423</span></a>                    <span class="s2">&quot;GlacierJobParameters&quot;</span><span class="p">:</span> <span class="p">{</span><span class="s2">&quot;Tier&quot;</span><span class="p">:</span> <span class="n">retrieval_tier</span><span class="p">},</span>
-</span><span id="L-424"><a href="#L-424"><span class="linenos">424</span></a>                <span class="p">}</span>
-</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a>            <span class="p">)</span>
+</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a>    <span class="k">def</span> <span class="nf">_check_object_restore_status</span><span class="p">(</span>
+</span><span id="L-406"><a href="#L-406"><span class="linenos">406</span></a>        <span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_key</span><span class="p">:</span> <span class="nb">str</span>
+</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">RestoreStatus</span><span class="p">]:</span>
+</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of the archive.</span>
+</span><span id="L-409"><a href="#L-409"><span class="linenos">409</span></a>
+</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a><span class="sd">        Args:</span>
+</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a><span class="sd">            bucket: name of bucket to check the restore status.</span>
+</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a><span class="sd">            object_key: object to check the restore status.</span>
+</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a>
+</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a><span class="sd">        Returns:</span>
+</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a><span class="sd">            The restore status represented by an enum, possible values are:</span>
+</span><span id="L-416"><a href="#L-416"><span class="linenos">416</span></a><span class="sd">                NOT_STARTED, ONGOING or RESTORED</span>
+</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a>        <span class="n">archived_object</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_get_archived_object</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">)</span>
+</span><span id="L-419"><a href="#L-419"><span class="linenos">419</span></a>
+</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a>        <span class="k">if</span> <span class="n">archived_object</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="L-422"><a href="#L-422"><span class="linenos">422</span></a>        <span class="k">elif</span> <span class="n">archived_object</span><span class="o">.</span><span class="n">restore</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-423"><a href="#L-423"><span class="linenos">423</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">NOT_STARTED</span>
+</span><span id="L-424"><a href="#L-424"><span class="linenos">424</span></a>        <span class="k">elif</span> <span class="s1">&#39;ongoing-request=&quot;true&quot;&#39;</span> <span class="ow">in</span> <span class="n">archived_object</span><span class="o">.</span><span class="n">restore</span><span class="p">:</span>
+</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">ONGOING</span>
 </span><span id="L-426"><a href="#L-426"><span class="linenos">426</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a>                <span class="sa">f</span><span class="s2">&quot;Restore request for </span><span class="si">{</span><span class="n">bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">object_key</span><span class="si">}</span><span class="s2"> not performed.&quot;</span>
-</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a>            <span class="p">)</span>
+</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">RESTORED</span>
+</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a>
+</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a>        <span class="k">return</span> <span class="n">status</span>
 </span><span id="L-430"><a href="#L-430"><span class="linenos">430</span></a>
 </span><span id="L-431"><a href="#L-431"><span class="linenos">431</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a>    <span class="k">def</span> <span class="nf">request_restore</span><span class="p">(</span>
-</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a>        <span class="n">restore_expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a>        <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request the restore of archived data.</span>
-</span><span id="L-440"><a href="#L-440"><span class="linenos">440</span></a>
-</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a><span class="sd">        Args:</span>
-</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a><span class="sd">            source_bucket: name of bucket to perform the restore.</span>
-</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a><span class="sd">            source_object: object to be restored.</span>
-</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a><span class="sd">            restore_expiration: restore expiration in days.</span>
-</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
-</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
-</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
-</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
-</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
-</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="p">[</span><span class="n">source_object</span><span class="p">])</span>
-</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a>
-</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be restored:&quot;</span><span class="p">)</span>
-</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
-</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="L-456"><a href="#L-456"><span class="linenos">456</span></a>            <span class="n">objects_to_restore</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
-</span><span id="L-457"><a href="#L-457"><span class="linenos">457</span></a>                <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
-</span><span id="L-458"><a href="#L-458"><span class="linenos">458</span></a>            <span class="p">)</span>
-</span><span id="L-459"><a href="#L-459"><span class="linenos">459</span></a>
-</span><span id="L-460"><a href="#L-460"><span class="linenos">460</span></a>            <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_to_restore</span><span class="p">:</span>
-</span><span id="L-461"><a href="#L-461"><span class="linenos">461</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_request_restore_object</span><span class="p">(</span>
-</span><span id="L-462"><a href="#L-462"><span class="linenos">462</span></a>                    <span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="L-463"><a href="#L-463"><span class="linenos">463</span></a>                    <span class="n">obj</span><span class="p">,</span>
-</span><span id="L-464"><a href="#L-464"><span class="linenos">464</span></a>                    <span class="n">restore_expiration</span><span class="p">,</span>
-</span><span id="L-465"><a href="#L-465"><span class="linenos">465</span></a>                    <span class="n">retrieval_tier</span><span class="p">,</span>
-</span><span id="L-466"><a href="#L-466"><span class="linenos">466</span></a>                <span class="p">)</span>
-</span><span id="L-467"><a href="#L-467"><span class="linenos">467</span></a>
-</span><span id="L-468"><a href="#L-468"><span class="linenos">468</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="L-469"><a href="#L-469"><span class="linenos">469</span></a>    <span class="k">def</span> <span class="nf">request_restore_and_wait</span><span class="p">(</span>
-</span><span id="L-470"><a href="#L-470"><span class="linenos">470</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-471"><a href="#L-471"><span class="linenos">471</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-472"><a href="#L-472"><span class="linenos">472</span></a>        <span class="n">restore_expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="L-473"><a href="#L-473"><span class="linenos">473</span></a>        <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="L-474"><a href="#L-474"><span class="linenos">474</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="L-475"><a href="#L-475"><span class="linenos">475</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="L-476"><a href="#L-476"><span class="linenos">476</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request and wait for the restore to complete, polling the restore status.</span>
+</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a>    <span class="k">def</span> <span class="nf">check_restore_status</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
+</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of archived data.</span>
+</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a>
+</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a><span class="sd">        Args:</span>
+</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a><span class="sd">            source_bucket: name of bucket to check the restore status.</span>
+</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a><span class="sd">            source_object: object to check the restore status.</span>
+</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a>
+</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a><span class="sd">        Returns:</span>
+</span><span id="L-440"><a href="#L-440"><span class="linenos">440</span></a><span class="sd">            A dict containing the amount of objects in each status.</span>
+</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a>        <span class="n">not_started_objects</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a>        <span class="n">ongoing_objects</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a>        <span class="n">restored_objects</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a>        <span class="n">total_objects</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a>
+</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a>        <span class="k">if</span> <span class="n">_check_directory</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span><span class="p">):</span>
+</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a>            <span class="n">source_object</span> <span class="o">=</span> <span class="n">_process_directory_path</span><span class="p">(</span><span class="n">source_object</span><span class="p">)</span>
+</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a>
+</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a>        <span class="n">objects_to_restore</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
+</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a>            <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
+</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a>        <span class="p">)</span>
+</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a>
+</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a>        <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_to_restore</span><span class="p">:</span>
+</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Checking restore status for: </span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-456"><a href="#L-456"><span class="linenos">456</span></a>
+</span><span id="L-457"><a href="#L-457"><span class="linenos">457</span></a>            <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_check_object_restore_status</span><span class="p">(</span>
+</span><span id="L-458"><a href="#L-458"><span class="linenos">458</span></a>                <span class="n">source_bucket</span><span class="p">,</span> <span class="n">obj</span>
+</span><span id="L-459"><a href="#L-459"><span class="linenos">459</span></a>            <span class="p">)</span>
+</span><span id="L-460"><a href="#L-460"><span class="linenos">460</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">restore_status</span><span class="p">:</span>
+</span><span id="L-461"><a href="#L-461"><span class="linenos">461</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span>
+</span><span id="L-462"><a href="#L-462"><span class="linenos">462</span></a>                    <span class="sa">f</span><span class="s2">&quot;Restore status not found for </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="L-463"><a href="#L-463"><span class="linenos">463</span></a>                <span class="p">)</span>
+</span><span id="L-464"><a href="#L-464"><span class="linenos">464</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="L-465"><a href="#L-465"><span class="linenos">465</span></a>                <span class="n">total_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-466"><a href="#L-466"><span class="linenos">466</span></a>
+</span><span id="L-467"><a href="#L-467"><span class="linenos">467</span></a>                <span class="k">if</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">NOT_STARTED</span> <span class="o">==</span> <span class="n">restore_status</span><span class="p">:</span>
+</span><span id="L-468"><a href="#L-468"><span class="linenos">468</span></a>                    <span class="n">not_started_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-469"><a href="#L-469"><span class="linenos">469</span></a>                <span class="k">elif</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">ONGOING</span> <span class="o">==</span> <span class="n">restore_status</span><span class="p">:</span>
+</span><span id="L-470"><a href="#L-470"><span class="linenos">470</span></a>                    <span class="n">ongoing_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-471"><a href="#L-471"><span class="linenos">471</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="L-472"><a href="#L-472"><span class="linenos">472</span></a>                    <span class="n">restored_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="L-473"><a href="#L-473"><span class="linenos">473</span></a>
+</span><span id="L-474"><a href="#L-474"><span class="linenos">474</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-475"><a href="#L-475"><span class="linenos">475</span></a>                    <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2"> restore status is </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">value</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="L-476"><a href="#L-476"><span class="linenos">476</span></a>                <span class="p">)</span>
 </span><span id="L-477"><a href="#L-477"><span class="linenos">477</span></a>
-</span><span id="L-478"><a href="#L-478"><span class="linenos">478</span></a><span class="sd">        Args:</span>
-</span><span id="L-479"><a href="#L-479"><span class="linenos">479</span></a><span class="sd">            source_bucket: name of bucket to perform the restore.</span>
-</span><span id="L-480"><a href="#L-480"><span class="linenos">480</span></a><span class="sd">            source_object: object to be restored.</span>
-</span><span id="L-481"><a href="#L-481"><span class="linenos">481</span></a><span class="sd">            restore_expiration: restore expiration in days.</span>
-</span><span id="L-482"><a href="#L-482"><span class="linenos">482</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
-</span><span id="L-483"><a href="#L-483"><span class="linenos">483</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
-</span><span id="L-484"><a href="#L-484"><span class="linenos">484</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
-</span><span id="L-485"><a href="#L-485"><span class="linenos">485</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
-</span><span id="L-486"><a href="#L-486"><span class="linenos">486</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-487"><a href="#L-487"><span class="linenos">487</span></a>        <span class="k">if</span> <span class="n">retrieval_tier</span> <span class="o">!=</span> <span class="n">RestoreType</span><span class="o">.</span><span class="n">EXPEDITED</span><span class="o">.</span><span class="n">value</span><span class="p">:</span>
-</span><span id="L-488"><a href="#L-488"><span class="linenos">488</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span>
-</span><span id="L-489"><a href="#L-489"><span class="linenos">489</span></a>                <span class="sa">f</span><span class="s2">&quot;Retrieval Tier </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not allowed on this operation! This &quot;</span>
-</span><span id="L-490"><a href="#L-490"><span class="linenos">490</span></a>                <span class="s2">&quot;kind of restore should be used just with `Expedited` retrieval tier &quot;</span>
-</span><span id="L-491"><a href="#L-491"><span class="linenos">491</span></a>                <span class="s2">&quot;to save cluster costs.&quot;</span>
-</span><span id="L-492"><a href="#L-492"><span class="linenos">492</span></a>            <span class="p">)</span>
-</span><span id="L-493"><a href="#L-493"><span class="linenos">493</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="L-494"><a href="#L-494"><span class="linenos">494</span></a>                <span class="sa">f</span><span class="s2">&quot;Retrieval Tier </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not allowed on this operation! This &quot;</span>
-</span><span id="L-495"><a href="#L-495"><span class="linenos">495</span></a>                <span class="s2">&quot;kind of restore should be used just with `Expedited` retrieval tier &quot;</span>
-</span><span id="L-496"><a href="#L-496"><span class="linenos">496</span></a>                <span class="s2">&quot;to save cluster costs.&quot;</span>
-</span><span id="L-497"><a href="#L-497"><span class="linenos">497</span></a>            <span class="p">)</span>
-</span><span id="L-498"><a href="#L-498"><span class="linenos">498</span></a>
-</span><span id="L-499"><a href="#L-499"><span class="linenos">499</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore</span><span class="p">(</span>
-</span><span id="L-500"><a href="#L-500"><span class="linenos">500</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="L-501"><a href="#L-501"><span class="linenos">501</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
-</span><span id="L-502"><a href="#L-502"><span class="linenos">502</span></a>            <span class="n">restore_expiration</span><span class="o">=</span><span class="n">restore_expiration</span><span class="p">,</span>
-</span><span id="L-503"><a href="#L-503"><span class="linenos">503</span></a>            <span class="n">retrieval_tier</span><span class="o">=</span><span class="n">retrieval_tier</span><span class="p">,</span>
-</span><span id="L-504"><a href="#L-504"><span class="linenos">504</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
-</span><span id="L-505"><a href="#L-505"><span class="linenos">505</span></a>        <span class="p">)</span>
-</span><span id="L-506"><a href="#L-506"><span class="linenos">506</span></a>        <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
-</span><span id="L-507"><a href="#L-507"><span class="linenos">507</span></a>            <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
-</span><span id="L-508"><a href="#L-508"><span class="linenos">508</span></a>        <span class="p">)</span>
-</span><span id="L-509"><a href="#L-509"><span class="linenos">509</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restore status: </span><span class="si">{</span><span class="n">restore_status</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="L-510"><a href="#L-510"><span class="linenos">510</span></a>
-</span><span id="L-511"><a href="#L-511"><span class="linenos">511</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">dry_run</span><span class="p">:</span>
-</span><span id="L-512"><a href="#L-512"><span class="linenos">512</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Checking the restore status in 5 minutes.&quot;</span><span class="p">)</span>
-</span><span id="L-513"><a href="#L-513"><span class="linenos">513</span></a>            <span class="n">wait_time</span> <span class="o">=</span> <span class="mi">300</span>
-</span><span id="L-514"><a href="#L-514"><span class="linenos">514</span></a>            <span class="k">while</span> <span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;total_objects&quot;</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span>
-</span><span id="L-515"><a href="#L-515"><span class="linenos">515</span></a>                <span class="s2">&quot;restored_objects&quot;</span>
-</span><span id="L-516"><a href="#L-516"><span class="linenos">516</span></a>            <span class="p">):</span>
-</span><span id="L-517"><a href="#L-517"><span class="linenos">517</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="L-518"><a href="#L-518"><span class="linenos">518</span></a>                    <span class="s2">&quot;Not all objects have been restored yet, checking the status again &quot;</span>
-</span><span id="L-519"><a href="#L-519"><span class="linenos">519</span></a>                    <span class="sa">f</span><span class="s2">&quot;in </span><span class="si">{</span><span class="n">wait_time</span><span class="si">}</span><span class="s2"> seconds.&quot;</span>
-</span><span id="L-520"><a href="#L-520"><span class="linenos">520</span></a>                <span class="p">)</span>
-</span><span id="L-521"><a href="#L-521"><span class="linenos">521</span></a>                <span class="n">time</span><span class="o">.</span><span class="n">sleep</span><span class="p">(</span><span class="n">wait_time</span><span class="p">)</span>
-</span><span id="L-522"><a href="#L-522"><span class="linenos">522</span></a>                <span class="n">wait_time</span> <span class="o">=</span> <span class="mi">30</span>
-</span><span id="L-523"><a href="#L-523"><span class="linenos">523</span></a>                <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
-</span><span id="L-524"><a href="#L-524"><span class="linenos">524</span></a>                    <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
-</span><span id="L-525"><a href="#L-525"><span class="linenos">525</span></a>                <span class="p">)</span>
-</span><span id="L-526"><a href="#L-526"><span class="linenos">526</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restore status: </span><span class="si">{</span><span class="n">restore_status</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-478"><a href="#L-478"><span class="linenos">478</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="L-479"><a href="#L-479"><span class="linenos">479</span></a>            <span class="s2">&quot;total_objects&quot;</span><span class="p">:</span> <span class="n">total_objects</span><span class="p">,</span>
+</span><span id="L-480"><a href="#L-480"><span class="linenos">480</span></a>            <span class="s2">&quot;not_started_objects&quot;</span><span class="p">:</span> <span class="n">not_started_objects</span><span class="p">,</span>
+</span><span id="L-481"><a href="#L-481"><span class="linenos">481</span></a>            <span class="s2">&quot;ongoing_objects&quot;</span><span class="p">:</span> <span class="n">ongoing_objects</span><span class="p">,</span>
+</span><span id="L-482"><a href="#L-482"><span class="linenos">482</span></a>            <span class="s2">&quot;restored_objects&quot;</span><span class="p">:</span> <span class="n">restored_objects</span><span class="p">,</span>
+</span><span id="L-483"><a href="#L-483"><span class="linenos">483</span></a>        <span class="p">}</span>
+</span><span id="L-484"><a href="#L-484"><span class="linenos">484</span></a>
+</span><span id="L-485"><a href="#L-485"><span class="linenos">485</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="L-486"><a href="#L-486"><span class="linenos">486</span></a>    <span class="k">def</span> <span class="nf">_request_restore_object</span><span class="p">(</span>
+</span><span id="L-487"><a href="#L-487"><span class="linenos">487</span></a>        <span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_key</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span>
+</span><span id="L-488"><a href="#L-488"><span class="linenos">488</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-489"><a href="#L-489"><span class="linenos">489</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request a restore of the archive.</span>
+</span><span id="L-490"><a href="#L-490"><span class="linenos">490</span></a>
+</span><span id="L-491"><a href="#L-491"><span class="linenos">491</span></a><span class="sd">        Args:</span>
+</span><span id="L-492"><a href="#L-492"><span class="linenos">492</span></a><span class="sd">            bucket: name of bucket to perform the restore.</span>
+</span><span id="L-493"><a href="#L-493"><span class="linenos">493</span></a><span class="sd">            object_key: object to be restored.</span>
+</span><span id="L-494"><a href="#L-494"><span class="linenos">494</span></a><span class="sd">            expiration: restore expiration.</span>
+</span><span id="L-495"><a href="#L-495"><span class="linenos">495</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
+</span><span id="L-496"><a href="#L-496"><span class="linenos">496</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
+</span><span id="L-497"><a href="#L-497"><span class="linenos">497</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-498"><a href="#L-498"><span class="linenos">498</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">RestoreType</span><span class="o">.</span><span class="n">exists</span><span class="p">(</span><span class="n">retrieval_tier</span><span class="p">):</span>
+</span><span id="L-499"><a href="#L-499"><span class="linenos">499</span></a>            <span class="k">raise</span> <span class="n">RestoreTypeNotFoundException</span><span class="p">(</span>
+</span><span id="L-500"><a href="#L-500"><span class="linenos">500</span></a>                <span class="sa">f</span><span class="s2">&quot;Restore type </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not supported.&quot;</span>
+</span><span id="L-501"><a href="#L-501"><span class="linenos">501</span></a>            <span class="p">)</span>
+</span><span id="L-502"><a href="#L-502"><span class="linenos">502</span></a>
+</span><span id="L-503"><a href="#L-503"><span class="linenos">503</span></a>        <span class="k">if</span> <span class="n">_check_directory</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">):</span>
+</span><span id="L-504"><a href="#L-504"><span class="linenos">504</span></a>            <span class="n">object_key</span> <span class="o">=</span> <span class="n">_process_directory_path</span><span class="p">(</span><span class="n">object_key</span><span class="p">)</span>
+</span><span id="L-505"><a href="#L-505"><span class="linenos">505</span></a>
+</span><span id="L-506"><a href="#L-506"><span class="linenos">506</span></a>        <span class="n">archived_object</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_get_archived_object</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">)</span>
+</span><span id="L-507"><a href="#L-507"><span class="linenos">507</span></a>
+</span><span id="L-508"><a href="#L-508"><span class="linenos">508</span></a>        <span class="k">if</span> <span class="n">archived_object</span> <span class="ow">and</span> <span class="n">archived_object</span><span class="o">.</span><span class="n">restore</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-509"><a href="#L-509"><span class="linenos">509</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restoring archive </span><span class="si">{</span><span class="n">bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">object_key</span><span class="si">}</span><span class="s2">.&quot;</span><span class="p">)</span>
+</span><span id="L-510"><a href="#L-510"><span class="linenos">510</span></a>            <span class="n">archived_object</span><span class="o">.</span><span class="n">restore_object</span><span class="p">(</span>
+</span><span id="L-511"><a href="#L-511"><span class="linenos">511</span></a>                <span class="n">RestoreRequest</span><span class="o">=</span><span class="p">{</span>
+</span><span id="L-512"><a href="#L-512"><span class="linenos">512</span></a>                    <span class="s2">&quot;Days&quot;</span><span class="p">:</span> <span class="n">expiration</span><span class="p">,</span>
+</span><span id="L-513"><a href="#L-513"><span class="linenos">513</span></a>                    <span class="s2">&quot;GlacierJobParameters&quot;</span><span class="p">:</span> <span class="p">{</span><span class="s2">&quot;Tier&quot;</span><span class="p">:</span> <span class="n">retrieval_tier</span><span class="p">},</span>
+</span><span id="L-514"><a href="#L-514"><span class="linenos">514</span></a>                <span class="p">}</span>
+</span><span id="L-515"><a href="#L-515"><span class="linenos">515</span></a>            <span class="p">)</span>
+</span><span id="L-516"><a href="#L-516"><span class="linenos">516</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-517"><a href="#L-517"><span class="linenos">517</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-518"><a href="#L-518"><span class="linenos">518</span></a>                <span class="sa">f</span><span class="s2">&quot;Restore request for </span><span class="si">{</span><span class="n">bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">object_key</span><span class="si">}</span><span class="s2"> not performed.&quot;</span>
+</span><span id="L-519"><a href="#L-519"><span class="linenos">519</span></a>            <span class="p">)</span>
+</span><span id="L-520"><a href="#L-520"><span class="linenos">520</span></a>
+</span><span id="L-521"><a href="#L-521"><span class="linenos">521</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="L-522"><a href="#L-522"><span class="linenos">522</span></a>    <span class="k">def</span> <span class="nf">request_restore</span><span class="p">(</span>
+</span><span id="L-523"><a href="#L-523"><span class="linenos">523</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-524"><a href="#L-524"><span class="linenos">524</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-525"><a href="#L-525"><span class="linenos">525</span></a>        <span class="n">restore_expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-526"><a href="#L-526"><span class="linenos">526</span></a>        <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-527"><a href="#L-527"><span class="linenos">527</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="L-528"><a href="#L-528"><span class="linenos">528</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-529"><a href="#L-529"><span class="linenos">529</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request the restore of archived data.</span>
+</span><span id="L-530"><a href="#L-530"><span class="linenos">530</span></a>
+</span><span id="L-531"><a href="#L-531"><span class="linenos">531</span></a><span class="sd">        Args:</span>
+</span><span id="L-532"><a href="#L-532"><span class="linenos">532</span></a><span class="sd">            source_bucket: name of bucket to perform the restore.</span>
+</span><span id="L-533"><a href="#L-533"><span class="linenos">533</span></a><span class="sd">            source_object: object to be restored.</span>
+</span><span id="L-534"><a href="#L-534"><span class="linenos">534</span></a><span class="sd">            restore_expiration: restore expiration in days.</span>
+</span><span id="L-535"><a href="#L-535"><span class="linenos">535</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
+</span><span id="L-536"><a href="#L-536"><span class="linenos">536</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
+</span><span id="L-537"><a href="#L-537"><span class="linenos">537</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
+</span><span id="L-538"><a href="#L-538"><span class="linenos">538</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
+</span><span id="L-539"><a href="#L-539"><span class="linenos">539</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-540"><a href="#L-540"><span class="linenos">540</span></a>        <span class="k">if</span> <span class="n">_check_directory</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span><span class="p">):</span>
+</span><span id="L-541"><a href="#L-541"><span class="linenos">541</span></a>            <span class="n">source_object</span> <span class="o">=</span> <span class="n">_process_directory_path</span><span class="p">(</span><span class="n">source_object</span><span class="p">)</span>
+</span><span id="L-542"><a href="#L-542"><span class="linenos">542</span></a>
+</span><span id="L-543"><a href="#L-543"><span class="linenos">543</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
+</span><span id="L-544"><a href="#L-544"><span class="linenos">544</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="p">[</span><span class="n">source_object</span><span class="p">])</span>
+</span><span id="L-545"><a href="#L-545"><span class="linenos">545</span></a>
+</span><span id="L-546"><a href="#L-546"><span class="linenos">546</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be restored:&quot;</span><span class="p">)</span>
+</span><span id="L-547"><a href="#L-547"><span class="linenos">547</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="L-548"><a href="#L-548"><span class="linenos">548</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-549"><a href="#L-549"><span class="linenos">549</span></a>            <span class="n">objects_to_restore</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
+</span><span id="L-550"><a href="#L-550"><span class="linenos">550</span></a>                <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
+</span><span id="L-551"><a href="#L-551"><span class="linenos">551</span></a>            <span class="p">)</span>
+</span><span id="L-552"><a href="#L-552"><span class="linenos">552</span></a>
+</span><span id="L-553"><a href="#L-553"><span class="linenos">553</span></a>            <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_to_restore</span><span class="p">:</span>
+</span><span id="L-554"><a href="#L-554"><span class="linenos">554</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_request_restore_object</span><span class="p">(</span>
+</span><span id="L-555"><a href="#L-555"><span class="linenos">555</span></a>                    <span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="L-556"><a href="#L-556"><span class="linenos">556</span></a>                    <span class="n">obj</span><span class="p">,</span>
+</span><span id="L-557"><a href="#L-557"><span class="linenos">557</span></a>                    <span class="n">restore_expiration</span><span class="p">,</span>
+</span><span id="L-558"><a href="#L-558"><span class="linenos">558</span></a>                    <span class="n">retrieval_tier</span><span class="p">,</span>
+</span><span id="L-559"><a href="#L-559"><span class="linenos">559</span></a>                <span class="p">)</span>
+</span><span id="L-560"><a href="#L-560"><span class="linenos">560</span></a>
+</span><span id="L-561"><a href="#L-561"><span class="linenos">561</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="L-562"><a href="#L-562"><span class="linenos">562</span></a>    <span class="k">def</span> <span class="nf">request_restore_and_wait</span><span class="p">(</span>
+</span><span id="L-563"><a href="#L-563"><span class="linenos">563</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-564"><a href="#L-564"><span class="linenos">564</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-565"><a href="#L-565"><span class="linenos">565</span></a>        <span class="n">restore_expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-566"><a href="#L-566"><span class="linenos">566</span></a>        <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-567"><a href="#L-567"><span class="linenos">567</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="L-568"><a href="#L-568"><span class="linenos">568</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-569"><a href="#L-569"><span class="linenos">569</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request and wait for the restore to complete, polling the restore status.</span>
+</span><span id="L-570"><a href="#L-570"><span class="linenos">570</span></a>
+</span><span id="L-571"><a href="#L-571"><span class="linenos">571</span></a><span class="sd">        Args:</span>
+</span><span id="L-572"><a href="#L-572"><span class="linenos">572</span></a><span class="sd">            source_bucket: name of bucket to perform the restore.</span>
+</span><span id="L-573"><a href="#L-573"><span class="linenos">573</span></a><span class="sd">            source_object: object to be restored.</span>
+</span><span id="L-574"><a href="#L-574"><span class="linenos">574</span></a><span class="sd">            restore_expiration: restore expiration in days.</span>
+</span><span id="L-575"><a href="#L-575"><span class="linenos">575</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
+</span><span id="L-576"><a href="#L-576"><span class="linenos">576</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
+</span><span id="L-577"><a href="#L-577"><span class="linenos">577</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
+</span><span id="L-578"><a href="#L-578"><span class="linenos">578</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
+</span><span id="L-579"><a href="#L-579"><span class="linenos">579</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-580"><a href="#L-580"><span class="linenos">580</span></a>        <span class="k">if</span> <span class="n">retrieval_tier</span> <span class="o">!=</span> <span class="n">RestoreType</span><span class="o">.</span><span class="n">EXPEDITED</span><span class="o">.</span><span class="n">value</span><span class="p">:</span>
+</span><span id="L-581"><a href="#L-581"><span class="linenos">581</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span>
+</span><span id="L-582"><a href="#L-582"><span class="linenos">582</span></a>                <span class="sa">f</span><span class="s2">&quot;Retrieval Tier </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not allowed on this operation! This &quot;</span>
+</span><span id="L-583"><a href="#L-583"><span class="linenos">583</span></a>                <span class="s2">&quot;kind of restore should be used just with `Expedited` retrieval tier &quot;</span>
+</span><span id="L-584"><a href="#L-584"><span class="linenos">584</span></a>                <span class="s2">&quot;to save cluster costs.&quot;</span>
+</span><span id="L-585"><a href="#L-585"><span class="linenos">585</span></a>            <span class="p">)</span>
+</span><span id="L-586"><a href="#L-586"><span class="linenos">586</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="L-587"><a href="#L-587"><span class="linenos">587</span></a>                <span class="sa">f</span><span class="s2">&quot;Retrieval Tier </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not allowed on this operation! This &quot;</span>
+</span><span id="L-588"><a href="#L-588"><span class="linenos">588</span></a>                <span class="s2">&quot;kind of restore should be used just with `Expedited` retrieval tier &quot;</span>
+</span><span id="L-589"><a href="#L-589"><span class="linenos">589</span></a>                <span class="s2">&quot;to save cluster costs.&quot;</span>
+</span><span id="L-590"><a href="#L-590"><span class="linenos">590</span></a>            <span class="p">)</span>
+</span><span id="L-591"><a href="#L-591"><span class="linenos">591</span></a>
+</span><span id="L-592"><a href="#L-592"><span class="linenos">592</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore</span><span class="p">(</span>
+</span><span id="L-593"><a href="#L-593"><span class="linenos">593</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="L-594"><a href="#L-594"><span class="linenos">594</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
+</span><span id="L-595"><a href="#L-595"><span class="linenos">595</span></a>            <span class="n">restore_expiration</span><span class="o">=</span><span class="n">restore_expiration</span><span class="p">,</span>
+</span><span id="L-596"><a href="#L-596"><span class="linenos">596</span></a>            <span class="n">retrieval_tier</span><span class="o">=</span><span class="n">retrieval_tier</span><span class="p">,</span>
+</span><span id="L-597"><a href="#L-597"><span class="linenos">597</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
+</span><span id="L-598"><a href="#L-598"><span class="linenos">598</span></a>        <span class="p">)</span>
+</span><span id="L-599"><a href="#L-599"><span class="linenos">599</span></a>        <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
+</span><span id="L-600"><a href="#L-600"><span class="linenos">600</span></a>            <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
+</span><span id="L-601"><a href="#L-601"><span class="linenos">601</span></a>        <span class="p">)</span>
+</span><span id="L-602"><a href="#L-602"><span class="linenos">602</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restore status: </span><span class="si">{</span><span class="n">restore_status</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-603"><a href="#L-603"><span class="linenos">603</span></a>
+</span><span id="L-604"><a href="#L-604"><span class="linenos">604</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">dry_run</span><span class="p">:</span>
+</span><span id="L-605"><a href="#L-605"><span class="linenos">605</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Checking the restore status in 5 minutes.&quot;</span><span class="p">)</span>
+</span><span id="L-606"><a href="#L-606"><span class="linenos">606</span></a>            <span class="n">wait_time</span> <span class="o">=</span> <span class="mi">300</span>
+</span><span id="L-607"><a href="#L-607"><span class="linenos">607</span></a>            <span class="k">while</span> <span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;total_objects&quot;</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span>
+</span><span id="L-608"><a href="#L-608"><span class="linenos">608</span></a>                <span class="s2">&quot;restored_objects&quot;</span>
+</span><span id="L-609"><a href="#L-609"><span class="linenos">609</span></a>            <span class="p">):</span>
+</span><span id="L-610"><a href="#L-610"><span class="linenos">610</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="L-611"><a href="#L-611"><span class="linenos">611</span></a>                    <span class="s2">&quot;Not all objects have been restored yet, checking the status again &quot;</span>
+</span><span id="L-612"><a href="#L-612"><span class="linenos">612</span></a>                    <span class="sa">f</span><span class="s2">&quot;in </span><span class="si">{</span><span class="n">wait_time</span><span class="si">}</span><span class="s2"> seconds.&quot;</span>
+</span><span id="L-613"><a href="#L-613"><span class="linenos">613</span></a>                <span class="p">)</span>
+</span><span id="L-614"><a href="#L-614"><span class="linenos">614</span></a>                <span class="n">time</span><span class="o">.</span><span class="n">sleep</span><span class="p">(</span><span class="n">wait_time</span><span class="p">)</span>
+</span><span id="L-615"><a href="#L-615"><span class="linenos">615</span></a>                <span class="n">wait_time</span> <span class="o">=</span> <span class="mi">30</span>
+</span><span id="L-616"><a href="#L-616"><span class="linenos">616</span></a>                <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
+</span><span id="L-617"><a href="#L-617"><span class="linenos">617</span></a>                    <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
+</span><span id="L-618"><a href="#L-618"><span class="linenos">618</span></a>                <span class="p">)</span>
+</span><span id="L-619"><a href="#L-619"><span class="linenos">619</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restore status: </span><span class="si">{</span><span class="n">restore_status</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -636,218 +729,247 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#FileManager"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager-80"><a href="#FileManager-80"><span class="linenos"> 80</span></a><span class="k">class</span> <span class="nc">FileManager</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
-</span><span id="FileManager-81"><a href="#FileManager-81"><span class="linenos"> 81</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Set of actions to manipulate files in several ways.&quot;&quot;&quot;</span>
-</span><span id="FileManager-82"><a href="#FileManager-82"><span class="linenos"> 82</span></a>
-</span><span id="FileManager-83"><a href="#FileManager-83"><span class="linenos"> 83</span></a>    <span class="n">_logger</span> <span class="o">=</span> <span class="n">LoggingHandler</span><span class="p">(</span><span class="vm">__name__</span><span class="p">)</span><span class="o">.</span><span class="n">get_logger</span><span class="p">()</span>
-</span><span id="FileManager-84"><a href="#FileManager-84"><span class="linenos"> 84</span></a>
-</span><span id="FileManager-85"><a href="#FileManager-85"><span class="linenos"> 85</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">configs</span><span class="p">:</span> <span class="nb">dict</span><span class="p">):</span>
-</span><span id="FileManager-86"><a href="#FileManager-86"><span class="linenos"> 86</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Construct FileManager algorithm instances.</span>
-</span><span id="FileManager-87"><a href="#FileManager-87"><span class="linenos"> 87</span></a>
-</span><span id="FileManager-88"><a href="#FileManager-88"><span class="linenos"> 88</span></a><span class="sd">        Args:</span>
-</span><span id="FileManager-89"><a href="#FileManager-89"><span class="linenos"> 89</span></a><span class="sd">            configs: configurations for the FileManager algorithm.</span>
-</span><span id="FileManager-90"><a href="#FileManager-90"><span class="linenos"> 90</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="FileManager-91"><a href="#FileManager-91"><span class="linenos"> 91</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">configs</span> <span class="o">=</span> <span class="n">configs</span>
-</span><span id="FileManager-92"><a href="#FileManager-92"><span class="linenos"> 92</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">function</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;function&quot;</span><span class="p">]</span>
-</span><span id="FileManager-93"><a href="#FileManager-93"><span class="linenos"> 93</span></a>
-</span><span id="FileManager-94"><a href="#FileManager-94"><span class="linenos"> 94</span></a>    <span class="k">def</span> <span class="nf">get_function</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="FileManager-95"><a href="#FileManager-95"><span class="linenos"> 95</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get a specific function to execute.&quot;&quot;&quot;</span>
-</span><span id="FileManager-96"><a href="#FileManager-96"><span class="linenos"> 96</span></a>        <span class="n">available_functions</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="FileManager-97"><a href="#FileManager-97"><span class="linenos"> 97</span></a>            <span class="s2">&quot;delete_objects&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">delete_objects</span><span class="p">,</span>
-</span><span id="FileManager-98"><a href="#FileManager-98"><span class="linenos"> 98</span></a>            <span class="s2">&quot;copy_objects&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">copy_objects</span><span class="p">,</span>
-</span><span id="FileManager-99"><a href="#FileManager-99"><span class="linenos"> 99</span></a>            <span class="s2">&quot;request_restore&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">request_restore</span><span class="p">,</span>
-</span><span id="FileManager-100"><a href="#FileManager-100"><span class="linenos">100</span></a>            <span class="s2">&quot;check_restore_status&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">,</span>
-</span><span id="FileManager-101"><a href="#FileManager-101"><span class="linenos">101</span></a>            <span class="s2">&quot;request_restore_to_destination_and_wait&quot;</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="FileManager-102"><a href="#FileManager-102"><span class="linenos">102</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">request_restore_to_destination_and_wait</span>
-</span><span id="FileManager-103"><a href="#FileManager-103"><span class="linenos">103</span></a>            <span class="p">),</span>
-</span><span id="FileManager-104"><a href="#FileManager-104"><span class="linenos">104</span></a>        <span class="p">}</span>
-</span><span id="FileManager-105"><a href="#FileManager-105"><span class="linenos">105</span></a>
-</span><span id="FileManager-106"><a href="#FileManager-106"><span class="linenos">106</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Function being executed: </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="p">))</span>
-</span><span id="FileManager-107"><a href="#FileManager-107"><span class="linenos">107</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">function</span> <span class="ow">in</span> <span class="n">available_functions</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
-</span><span id="FileManager-108"><a href="#FileManager-108"><span class="linenos">108</span></a>            <span class="n">func</span> <span class="o">=</span> <span class="n">available_functions</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="p">]</span>
-</span><span id="FileManager-109"><a href="#FileManager-109"><span class="linenos">109</span></a>            <span class="n">func</span><span class="p">()</span>
-</span><span id="FileManager-110"><a href="#FileManager-110"><span class="linenos">110</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="FileManager-111"><a href="#FileManager-111"><span class="linenos">111</span></a>            <span class="k">raise</span> <span class="ne">NotImplementedError</span><span class="p">(</span>
-</span><span id="FileManager-112"><a href="#FileManager-112"><span class="linenos">112</span></a>                <span class="sa">f</span><span class="s2">&quot;The requested function </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="si">}</span><span class="s2"> is not implemented.&quot;</span>
-</span><span id="FileManager-113"><a href="#FileManager-113"><span class="linenos">113</span></a>            <span class="p">)</span>
-</span><span id="FileManager-114"><a href="#FileManager-114"><span class="linenos">114</span></a>
-</span><span id="FileManager-115"><a href="#FileManager-115"><span class="linenos">115</span></a>    <span class="k">def</span> <span class="nf">delete_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="FileManager-116"><a href="#FileManager-116"><span class="linenos">116</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Delete objects and &#39;directories&#39; in s3.</span>
-</span><span id="FileManager-117"><a href="#FileManager-117"><span class="linenos">117</span></a>
-</span><span id="FileManager-118"><a href="#FileManager-118"><span class="linenos">118</span></a><span class="sd">        If dry_run is set to True the function will print a dict with all the</span>
-</span><span id="FileManager-119"><a href="#FileManager-119"><span class="linenos">119</span></a><span class="sd">        paths that would be deleted based on the given keys.</span>
-</span><span id="FileManager-120"><a href="#FileManager-120"><span class="linenos">120</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="FileManager-121"><a href="#FileManager-121"><span class="linenos">121</span></a>        <span class="n">bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager-122"><a href="#FileManager-122"><span class="linenos">122</span></a>        <span class="n">objects_paths</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;object_paths&quot;</span><span class="p">]</span>
-</span><span id="FileManager-123"><a href="#FileManager-123"><span class="linenos">123</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
-</span><span id="FileManager-124"><a href="#FileManager-124"><span class="linenos">124</span></a>
-</span><span id="FileManager-125"><a href="#FileManager-125"><span class="linenos">125</span></a>        <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">client</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
-</span><span id="FileManager-126"><a href="#FileManager-126"><span class="linenos">126</span></a>
-</span><span id="FileManager-127"><a href="#FileManager-127"><span class="linenos">127</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
-</span><span id="FileManager-128"><a href="#FileManager-128"><span class="linenos">128</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="n">objects_paths</span><span class="p">)</span>
-</span><span id="FileManager-129"><a href="#FileManager-129"><span class="linenos">129</span></a>
-</span><span id="FileManager-130"><a href="#FileManager-130"><span class="linenos">130</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be deleted:&quot;</span><span class="p">)</span>
-</span><span id="FileManager-131"><a href="#FileManager-131"><span class="linenos">131</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="FileManager-132"><a href="#FileManager-132"><span class="linenos">132</span></a>            <span class="n">objects_to_delete</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="FileManager-133"><a href="#FileManager-133"><span class="linenos">133</span></a>            <span class="k">for</span> <span class="n">path</span> <span class="ow">in</span> <span class="n">objects_paths</span><span class="p">:</span>
-</span><span id="FileManager-134"><a href="#FileManager-134"><span class="linenos">134</span></a>                <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">_list_objects_recursively</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">path</span><span class="p">):</span>
-</span><span id="FileManager-135"><a href="#FileManager-135"><span class="linenos">135</span></a>                    <span class="n">objects_to_delete</span><span class="o">.</span><span class="n">append</span><span class="p">({</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">obj</span><span class="p">})</span>
-</span><span id="FileManager-136"><a href="#FileManager-136"><span class="linenos">136</span></a>
-</span><span id="FileManager-137"><a href="#FileManager-137"><span class="linenos">137</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">delete_objects</span><span class="p">(</span>
-</span><span id="FileManager-138"><a href="#FileManager-138"><span class="linenos">138</span></a>                <span class="n">Bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span>
-</span><span id="FileManager-139"><a href="#FileManager-139"><span class="linenos">139</span></a>                <span class="n">Delete</span><span class="o">=</span><span class="p">{</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">OBJECTS</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">objects_to_delete</span><span class="p">},</span>
-</span><span id="FileManager-140"><a href="#FileManager-140"><span class="linenos">140</span></a>            <span class="p">)</span>
-</span><span id="FileManager-141"><a href="#FileManager-141"><span class="linenos">141</span></a>
-</span><span id="FileManager-142"><a href="#FileManager-142"><span class="linenos">142</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
-</span><span id="FileManager-143"><a href="#FileManager-143"><span class="linenos">143</span></a>
-</span><span id="FileManager-144"><a href="#FileManager-144"><span class="linenos">144</span></a>    <span class="k">def</span> <span class="nf">copy_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="FileManager-145"><a href="#FileManager-145"><span class="linenos">145</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Copies objects and &#39;directories&#39; in s3.&quot;&quot;&quot;</span>
-</span><span id="FileManager-146"><a href="#FileManager-146"><span class="linenos">146</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager-147"><a href="#FileManager-147"><span class="linenos">147</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
-</span><span id="FileManager-148"><a href="#FileManager-148"><span class="linenos">148</span></a>        <span class="n">destination_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager-149"><a href="#FileManager-149"><span class="linenos">149</span></a>        <span class="n">destination_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_object&quot;</span><span class="p">]</span>
-</span><span id="FileManager-150"><a href="#FileManager-150"><span class="linenos">150</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
-</span><span id="FileManager-151"><a href="#FileManager-151"><span class="linenos">151</span></a>
-</span><span id="FileManager-152"><a href="#FileManager-152"><span class="linenos">152</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_copy_objects</span><span class="p">(</span>
-</span><span id="FileManager-153"><a href="#FileManager-153"><span class="linenos">153</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="FileManager-154"><a href="#FileManager-154"><span class="linenos">154</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
-</span><span id="FileManager-155"><a href="#FileManager-155"><span class="linenos">155</span></a>            <span class="n">destination_bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
-</span><span id="FileManager-156"><a href="#FileManager-156"><span class="linenos">156</span></a>            <span class="n">destination_object</span><span class="o">=</span><span class="n">destination_object</span><span class="p">,</span>
-</span><span id="FileManager-157"><a href="#FileManager-157"><span class="linenos">157</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
-</span><span id="FileManager-158"><a href="#FileManager-158"><span class="linenos">158</span></a>        <span class="p">)</span>
-</span><span id="FileManager-159"><a href="#FileManager-159"><span class="linenos">159</span></a>
-</span><span id="FileManager-160"><a href="#FileManager-160"><span class="linenos">160</span></a>    <span class="k">def</span> <span class="nf">request_restore</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="FileManager-161"><a href="#FileManager-161"><span class="linenos">161</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request the restore of archived data.&quot;&quot;&quot;</span>
-</span><span id="FileManager-162"><a href="#FileManager-162"><span class="linenos">162</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager-163"><a href="#FileManager-163"><span class="linenos">163</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
-</span><span id="FileManager-164"><a href="#FileManager-164"><span class="linenos">164</span></a>        <span class="n">restore_expiration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;restore_expiration&quot;</span><span class="p">]</span>
-</span><span id="FileManager-165"><a href="#FileManager-165"><span class="linenos">165</span></a>        <span class="n">retrieval_tier</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;retrieval_tier&quot;</span><span class="p">]</span>
-</span><span id="FileManager-166"><a href="#FileManager-166"><span class="linenos">166</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
-</span><span id="FileManager-167"><a href="#FileManager-167"><span class="linenos">167</span></a>
-</span><span id="FileManager-168"><a href="#FileManager-168"><span class="linenos">168</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore</span><span class="p">(</span>
-</span><span id="FileManager-169"><a href="#FileManager-169"><span class="linenos">169</span></a>            <span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="FileManager-170"><a href="#FileManager-170"><span class="linenos">170</span></a>            <span class="n">source_object</span><span class="p">,</span>
-</span><span id="FileManager-171"><a href="#FileManager-171"><span class="linenos">171</span></a>            <span class="n">restore_expiration</span><span class="p">,</span>
-</span><span id="FileManager-172"><a href="#FileManager-172"><span class="linenos">172</span></a>            <span class="n">retrieval_tier</span><span class="p">,</span>
-</span><span id="FileManager-173"><a href="#FileManager-173"><span class="linenos">173</span></a>            <span class="n">dry_run</span><span class="p">,</span>
-</span><span id="FileManager-174"><a href="#FileManager-174"><span class="linenos">174</span></a>        <span class="p">)</span>
-</span><span id="FileManager-175"><a href="#FileManager-175"><span class="linenos">175</span></a>
-</span><span id="FileManager-176"><a href="#FileManager-176"><span class="linenos">176</span></a>    <span class="k">def</span> <span class="nf">check_restore_status</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="FileManager-177"><a href="#FileManager-177"><span class="linenos">177</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of archived data.&quot;&quot;&quot;</span>
-</span><span id="FileManager-178"><a href="#FileManager-178"><span class="linenos">178</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager-179"><a href="#FileManager-179"><span class="linenos">179</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
-</span><span id="FileManager-180"><a href="#FileManager-180"><span class="linenos">180</span></a>
-</span><span id="FileManager-181"><a href="#FileManager-181"><span class="linenos">181</span></a>        <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
-</span><span id="FileManager-182"><a href="#FileManager-182"><span class="linenos">182</span></a>            <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
-</span><span id="FileManager-183"><a href="#FileManager-183"><span class="linenos">183</span></a>        <span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager-135"><a href="#FileManager-135"><span class="linenos">135</span></a><span class="k">class</span> <span class="nc">FileManager</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
+</span><span id="FileManager-136"><a href="#FileManager-136"><span class="linenos">136</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Set of actions to manipulate files in several ways.&quot;&quot;&quot;</span>
+</span><span id="FileManager-137"><a href="#FileManager-137"><span class="linenos">137</span></a>
+</span><span id="FileManager-138"><a href="#FileManager-138"><span class="linenos">138</span></a>    <span class="n">_logger</span> <span class="o">=</span> <span class="n">LoggingHandler</span><span class="p">(</span><span class="vm">__name__</span><span class="p">)</span><span class="o">.</span><span class="n">get_logger</span><span class="p">()</span>
+</span><span id="FileManager-139"><a href="#FileManager-139"><span class="linenos">139</span></a>
+</span><span id="FileManager-140"><a href="#FileManager-140"><span class="linenos">140</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">configs</span><span class="p">:</span> <span class="nb">dict</span><span class="p">):</span>
+</span><span id="FileManager-141"><a href="#FileManager-141"><span class="linenos">141</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Construct FileManager algorithm instances.</span>
+</span><span id="FileManager-142"><a href="#FileManager-142"><span class="linenos">142</span></a>
+</span><span id="FileManager-143"><a href="#FileManager-143"><span class="linenos">143</span></a><span class="sd">        Args:</span>
+</span><span id="FileManager-144"><a href="#FileManager-144"><span class="linenos">144</span></a><span class="sd">            configs: configurations for the FileManager algorithm.</span>
+</span><span id="FileManager-145"><a href="#FileManager-145"><span class="linenos">145</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="FileManager-146"><a href="#FileManager-146"><span class="linenos">146</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">configs</span> <span class="o">=</span> <span class="n">configs</span>
+</span><span id="FileManager-147"><a href="#FileManager-147"><span class="linenos">147</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">function</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;function&quot;</span><span class="p">]</span>
+</span><span id="FileManager-148"><a href="#FileManager-148"><span class="linenos">148</span></a>
+</span><span id="FileManager-149"><a href="#FileManager-149"><span class="linenos">149</span></a>    <span class="k">def</span> <span class="nf">get_function</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager-150"><a href="#FileManager-150"><span class="linenos">150</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get a specific function to execute.&quot;&quot;&quot;</span>
+</span><span id="FileManager-151"><a href="#FileManager-151"><span class="linenos">151</span></a>        <span class="n">available_functions</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="FileManager-152"><a href="#FileManager-152"><span class="linenos">152</span></a>            <span class="s2">&quot;delete_objects&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">delete_objects</span><span class="p">,</span>
+</span><span id="FileManager-153"><a href="#FileManager-153"><span class="linenos">153</span></a>            <span class="s2">&quot;copy_objects&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">copy_objects</span><span class="p">,</span>
+</span><span id="FileManager-154"><a href="#FileManager-154"><span class="linenos">154</span></a>            <span class="s2">&quot;request_restore&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">request_restore</span><span class="p">,</span>
+</span><span id="FileManager-155"><a href="#FileManager-155"><span class="linenos">155</span></a>            <span class="s2">&quot;check_restore_status&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">,</span>
+</span><span id="FileManager-156"><a href="#FileManager-156"><span class="linenos">156</span></a>            <span class="s2">&quot;request_restore_to_destination_and_wait&quot;</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="FileManager-157"><a href="#FileManager-157"><span class="linenos">157</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">request_restore_to_destination_and_wait</span>
+</span><span id="FileManager-158"><a href="#FileManager-158"><span class="linenos">158</span></a>            <span class="p">),</span>
+</span><span id="FileManager-159"><a href="#FileManager-159"><span class="linenos">159</span></a>        <span class="p">}</span>
+</span><span id="FileManager-160"><a href="#FileManager-160"><span class="linenos">160</span></a>
+</span><span id="FileManager-161"><a href="#FileManager-161"><span class="linenos">161</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Function being executed: </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="p">))</span>
+</span><span id="FileManager-162"><a href="#FileManager-162"><span class="linenos">162</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">function</span> <span class="ow">in</span> <span class="n">available_functions</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
+</span><span id="FileManager-163"><a href="#FileManager-163"><span class="linenos">163</span></a>            <span class="n">func</span> <span class="o">=</span> <span class="n">available_functions</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="p">]</span>
+</span><span id="FileManager-164"><a href="#FileManager-164"><span class="linenos">164</span></a>            <span class="n">func</span><span class="p">()</span>
+</span><span id="FileManager-165"><a href="#FileManager-165"><span class="linenos">165</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="FileManager-166"><a href="#FileManager-166"><span class="linenos">166</span></a>            <span class="k">raise</span> <span class="ne">NotImplementedError</span><span class="p">(</span>
+</span><span id="FileManager-167"><a href="#FileManager-167"><span class="linenos">167</span></a>                <span class="sa">f</span><span class="s2">&quot;The requested function </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="si">}</span><span class="s2"> is not implemented.&quot;</span>
+</span><span id="FileManager-168"><a href="#FileManager-168"><span class="linenos">168</span></a>            <span class="p">)</span>
+</span><span id="FileManager-169"><a href="#FileManager-169"><span class="linenos">169</span></a>
+</span><span id="FileManager-170"><a href="#FileManager-170"><span class="linenos">170</span></a>    <span class="k">def</span> <span class="nf">_delete_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">objects_paths</span><span class="p">:</span> <span class="nb">list</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager-171"><a href="#FileManager-171"><span class="linenos">171</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Delete objects recursively in s3.</span>
+</span><span id="FileManager-172"><a href="#FileManager-172"><span class="linenos">172</span></a>
+</span><span id="FileManager-173"><a href="#FileManager-173"><span class="linenos">173</span></a><span class="sd">        Params:</span>
+</span><span id="FileManager-174"><a href="#FileManager-174"><span class="linenos">174</span></a><span class="sd">            bucket: name of bucket to perform the delete operation.</span>
+</span><span id="FileManager-175"><a href="#FileManager-175"><span class="linenos">175</span></a><span class="sd">            objects_paths: objects to be deleted.</span>
+</span><span id="FileManager-176"><a href="#FileManager-176"><span class="linenos">176</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="FileManager-177"><a href="#FileManager-177"><span class="linenos">177</span></a>        <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">client</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
+</span><span id="FileManager-178"><a href="#FileManager-178"><span class="linenos">178</span></a>
+</span><span id="FileManager-179"><a href="#FileManager-179"><span class="linenos">179</span></a>        <span class="k">for</span> <span class="n">path</span> <span class="ow">in</span> <span class="n">objects_paths</span><span class="p">:</span>
+</span><span id="FileManager-180"><a href="#FileManager-180"><span class="linenos">180</span></a>            <span class="k">if</span> <span class="n">_check_directory</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">path</span><span class="p">):</span>
+</span><span id="FileManager-181"><a href="#FileManager-181"><span class="linenos">181</span></a>                <span class="n">path</span> <span class="o">=</span> <span class="n">_process_directory_path</span><span class="p">(</span><span class="n">path</span><span class="p">)</span>
+</span><span id="FileManager-182"><a href="#FileManager-182"><span class="linenos">182</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="FileManager-183"><a href="#FileManager-183"><span class="linenos">183</span></a>                <span class="n">path</span> <span class="o">=</span> <span class="n">path</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
 </span><span id="FileManager-184"><a href="#FileManager-184"><span class="linenos">184</span></a>
-</span><span id="FileManager-185"><a href="#FileManager-185"><span class="linenos">185</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="FileManager-186"><a href="#FileManager-186"><span class="linenos">186</span></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span>
-</span><span id="FileManager-187"><a href="#FileManager-187"><span class="linenos">187</span></a><span class="s2">            Restore status:</span>
-</span><span id="FileManager-188"><a href="#FileManager-188"><span class="linenos">188</span></a><span class="s2">            - Not Started: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;not_started_objects&#39;</span><span class="p">)</span><span class="si">}</span>
-</span><span id="FileManager-189"><a href="#FileManager-189"><span class="linenos">189</span></a><span class="s2">            - Ongoing: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;ongoing_objects&#39;</span><span class="p">)</span><span class="si">}</span>
-</span><span id="FileManager-190"><a href="#FileManager-190"><span class="linenos">190</span></a><span class="s2">            - Restored: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;restored_objects&#39;</span><span class="p">)</span><span class="si">}</span>
-</span><span id="FileManager-191"><a href="#FileManager-191"><span class="linenos">191</span></a><span class="s2">            Total objects in this restore process: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;total_objects&#39;</span><span class="p">)</span><span class="si">}</span>
-</span><span id="FileManager-192"><a href="#FileManager-192"><span class="linenos">192</span></a><span class="s2">            &quot;&quot;&quot;</span>
-</span><span id="FileManager-193"><a href="#FileManager-193"><span class="linenos">193</span></a>        <span class="p">)</span>
-</span><span id="FileManager-194"><a href="#FileManager-194"><span class="linenos">194</span></a>
-</span><span id="FileManager-195"><a href="#FileManager-195"><span class="linenos">195</span></a>    <span class="k">def</span> <span class="nf">request_restore_to_destination_and_wait</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="FileManager-196"><a href="#FileManager-196"><span class="linenos">196</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request and wait for the restore to complete, polling the restore status.</span>
-</span><span id="FileManager-197"><a href="#FileManager-197"><span class="linenos">197</span></a>
-</span><span id="FileManager-198"><a href="#FileManager-198"><span class="linenos">198</span></a><span class="sd">        After the restore is done, copy the restored files to destination</span>
-</span><span id="FileManager-199"><a href="#FileManager-199"><span class="linenos">199</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="FileManager-200"><a href="#FileManager-200"><span class="linenos">200</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager-201"><a href="#FileManager-201"><span class="linenos">201</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
-</span><span id="FileManager-202"><a href="#FileManager-202"><span class="linenos">202</span></a>        <span class="n">destination_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager-203"><a href="#FileManager-203"><span class="linenos">203</span></a>        <span class="n">destination_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_object&quot;</span><span class="p">]</span>
-</span><span id="FileManager-204"><a href="#FileManager-204"><span class="linenos">204</span></a>        <span class="n">restore_expiration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;restore_expiration&quot;</span><span class="p">]</span>
-</span><span id="FileManager-205"><a href="#FileManager-205"><span class="linenos">205</span></a>        <span class="n">retrieval_tier</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;retrieval_tier&quot;</span><span class="p">]</span>
-</span><span id="FileManager-206"><a href="#FileManager-206"><span class="linenos">206</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
-</span><span id="FileManager-207"><a href="#FileManager-207"><span class="linenos">207</span></a>
-</span><span id="FileManager-208"><a href="#FileManager-208"><span class="linenos">208</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore_and_wait</span><span class="p">(</span>
-</span><span id="FileManager-209"><a href="#FileManager-209"><span class="linenos">209</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="FileManager-210"><a href="#FileManager-210"><span class="linenos">210</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
-</span><span id="FileManager-211"><a href="#FileManager-211"><span class="linenos">211</span></a>            <span class="n">restore_expiration</span><span class="o">=</span><span class="n">restore_expiration</span><span class="p">,</span>
-</span><span id="FileManager-212"><a href="#FileManager-212"><span class="linenos">212</span></a>            <span class="n">retrieval_tier</span><span class="o">=</span><span class="n">retrieval_tier</span><span class="p">,</span>
-</span><span id="FileManager-213"><a href="#FileManager-213"><span class="linenos">213</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
-</span><span id="FileManager-214"><a href="#FileManager-214"><span class="linenos">214</span></a>        <span class="p">)</span>
+</span><span id="FileManager-185"><a href="#FileManager-185"><span class="linenos">185</span></a>            <span class="n">more_objects</span> <span class="o">=</span> <span class="kc">True</span>
+</span><span id="FileManager-186"><a href="#FileManager-186"><span class="linenos">186</span></a>            <span class="n">paginator</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
+</span><span id="FileManager-187"><a href="#FileManager-187"><span class="linenos">187</span></a>            <span class="n">objects_to_delete</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="FileManager-188"><a href="#FileManager-188"><span class="linenos">188</span></a>
+</span><span id="FileManager-189"><a href="#FileManager-189"><span class="linenos">189</span></a>            <span class="k">while</span> <span class="n">more_objects</span><span class="p">:</span>
+</span><span id="FileManager-190"><a href="#FileManager-190"><span class="linenos">190</span></a>                <span class="n">objects_found</span><span class="p">,</span> <span class="n">paginator</span> <span class="o">=</span> <span class="n">_list_objects</span><span class="p">(</span>
+</span><span id="FileManager-191"><a href="#FileManager-191"><span class="linenos">191</span></a>                    <span class="n">s3_client</span><span class="o">=</span><span class="n">s3</span><span class="p">,</span> <span class="n">bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">path</span><span class="p">,</span> <span class="n">paginator</span><span class="o">=</span><span class="n">paginator</span>
+</span><span id="FileManager-192"><a href="#FileManager-192"><span class="linenos">192</span></a>                <span class="p">)</span>
+</span><span id="FileManager-193"><a href="#FileManager-193"><span class="linenos">193</span></a>                <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_found</span><span class="p">:</span>
+</span><span id="FileManager-194"><a href="#FileManager-194"><span class="linenos">194</span></a>                    <span class="n">objects_to_delete</span><span class="o">.</span><span class="n">append</span><span class="p">({</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">obj</span><span class="p">})</span>
+</span><span id="FileManager-195"><a href="#FileManager-195"><span class="linenos">195</span></a>
+</span><span id="FileManager-196"><a href="#FileManager-196"><span class="linenos">196</span></a>                <span class="k">if</span> <span class="ow">not</span> <span class="n">paginator</span><span class="p">:</span>
+</span><span id="FileManager-197"><a href="#FileManager-197"><span class="linenos">197</span></a>                    <span class="n">more_objects</span> <span class="o">=</span> <span class="kc">False</span>
+</span><span id="FileManager-198"><a href="#FileManager-198"><span class="linenos">198</span></a>
+</span><span id="FileManager-199"><a href="#FileManager-199"><span class="linenos">199</span></a>                <span class="n">response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">delete_objects</span><span class="p">(</span>
+</span><span id="FileManager-200"><a href="#FileManager-200"><span class="linenos">200</span></a>                    <span class="n">Bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span>
+</span><span id="FileManager-201"><a href="#FileManager-201"><span class="linenos">201</span></a>                    <span class="n">Delete</span><span class="o">=</span><span class="p">{</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">OBJECTS</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">objects_to_delete</span><span class="p">},</span>
+</span><span id="FileManager-202"><a href="#FileManager-202"><span class="linenos">202</span></a>                <span class="p">)</span>
+</span><span id="FileManager-203"><a href="#FileManager-203"><span class="linenos">203</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="FileManager-204"><a href="#FileManager-204"><span class="linenos">204</span></a>                <span class="n">objects_to_delete</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="FileManager-205"><a href="#FileManager-205"><span class="linenos">205</span></a>
+</span><span id="FileManager-206"><a href="#FileManager-206"><span class="linenos">206</span></a>    <span class="k">def</span> <span class="nf">delete_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager-207"><a href="#FileManager-207"><span class="linenos">207</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Delete objects and &#39;directories&#39; in s3.</span>
+</span><span id="FileManager-208"><a href="#FileManager-208"><span class="linenos">208</span></a>
+</span><span id="FileManager-209"><a href="#FileManager-209"><span class="linenos">209</span></a><span class="sd">        If dry_run is set to True the function will print a dict with all the</span>
+</span><span id="FileManager-210"><a href="#FileManager-210"><span class="linenos">210</span></a><span class="sd">        paths that would be deleted based on the given keys.</span>
+</span><span id="FileManager-211"><a href="#FileManager-211"><span class="linenos">211</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="FileManager-212"><a href="#FileManager-212"><span class="linenos">212</span></a>        <span class="n">bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager-213"><a href="#FileManager-213"><span class="linenos">213</span></a>        <span class="n">objects_paths</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;object_paths&quot;</span><span class="p">]</span>
+</span><span id="FileManager-214"><a href="#FileManager-214"><span class="linenos">214</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
 </span><span id="FileManager-215"><a href="#FileManager-215"><span class="linenos">215</span></a>
-</span><span id="FileManager-216"><a href="#FileManager-216"><span class="linenos">216</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="FileManager-217"><a href="#FileManager-217"><span class="linenos">217</span></a>            <span class="sa">f</span><span class="s2">&quot;Restoration complete for </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2"> and </span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="FileManager-218"><a href="#FileManager-218"><span class="linenos">218</span></a>        <span class="p">)</span>
-</span><span id="FileManager-219"><a href="#FileManager-219"><span class="linenos">219</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="FileManager-220"><a href="#FileManager-220"><span class="linenos">220</span></a>            <span class="sa">f</span><span class="s2">&quot;Starting to copy data from </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2"> to &quot;</span>
-</span><span id="FileManager-221"><a href="#FileManager-221"><span class="linenos">221</span></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="FileManager-222"><a href="#FileManager-222"><span class="linenos">222</span></a>        <span class="p">)</span>
-</span><span id="FileManager-223"><a href="#FileManager-223"><span class="linenos">223</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_copy_objects</span><span class="p">(</span>
-</span><span id="FileManager-224"><a href="#FileManager-224"><span class="linenos">224</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="FileManager-225"><a href="#FileManager-225"><span class="linenos">225</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
-</span><span id="FileManager-226"><a href="#FileManager-226"><span class="linenos">226</span></a>            <span class="n">destination_bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
-</span><span id="FileManager-227"><a href="#FileManager-227"><span class="linenos">227</span></a>            <span class="n">destination_object</span><span class="o">=</span><span class="n">destination_object</span><span class="p">,</span>
-</span><span id="FileManager-228"><a href="#FileManager-228"><span class="linenos">228</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
-</span><span id="FileManager-229"><a href="#FileManager-229"><span class="linenos">229</span></a>        <span class="p">)</span>
-</span><span id="FileManager-230"><a href="#FileManager-230"><span class="linenos">230</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="FileManager-231"><a href="#FileManager-231"><span class="linenos">231</span></a>            <span class="sa">f</span><span class="s2">&quot;Finished copying data, data should be available on </span><span class="si">{</span><span class="n">destination_bucket</span><span class="si">}</span><span class="s2">/&quot;</span>
-</span><span id="FileManager-232"><a href="#FileManager-232"><span class="linenos">232</span></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="FileManager-233"><a href="#FileManager-233"><span class="linenos">233</span></a>        <span class="p">)</span>
-</span><span id="FileManager-234"><a href="#FileManager-234"><span class="linenos">234</span></a>
-</span><span id="FileManager-235"><a href="#FileManager-235"><span class="linenos">235</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="FileManager-236"><a href="#FileManager-236"><span class="linenos">236</span></a>    <span class="k">def</span> <span class="nf">_copy_objects</span><span class="p">(</span>
-</span><span id="FileManager-237"><a href="#FileManager-237"><span class="linenos">237</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="FileManager-238"><a href="#FileManager-238"><span class="linenos">238</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="FileManager-239"><a href="#FileManager-239"><span class="linenos">239</span></a>        <span class="n">destination_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="FileManager-240"><a href="#FileManager-240"><span class="linenos">240</span></a>        <span class="n">destination_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="FileManager-241"><a href="#FileManager-241"><span class="linenos">241</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="FileManager-242"><a href="#FileManager-242"><span class="linenos">242</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="FileManager-243"><a href="#FileManager-243"><span class="linenos">243</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Copies objects and &#39;directories&#39; in s3.</span>
-</span><span id="FileManager-244"><a href="#FileManager-244"><span class="linenos">244</span></a>
-</span><span id="FileManager-245"><a href="#FileManager-245"><span class="linenos">245</span></a><span class="sd">        Args:</span>
-</span><span id="FileManager-246"><a href="#FileManager-246"><span class="linenos">246</span></a><span class="sd">            source_bucket: name of bucket to perform the copy.</span>
-</span><span id="FileManager-247"><a href="#FileManager-247"><span class="linenos">247</span></a><span class="sd">            source_object: object/folder to be copied.</span>
-</span><span id="FileManager-248"><a href="#FileManager-248"><span class="linenos">248</span></a><span class="sd">            destination_bucket: name of the target bucket to copy.</span>
-</span><span id="FileManager-249"><a href="#FileManager-249"><span class="linenos">249</span></a><span class="sd">            destination_object: target object/folder to copy.</span>
-</span><span id="FileManager-250"><a href="#FileManager-250"><span class="linenos">250</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
-</span><span id="FileManager-251"><a href="#FileManager-251"><span class="linenos">251</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
-</span><span id="FileManager-252"><a href="#FileManager-252"><span class="linenos">252</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="FileManager-253"><a href="#FileManager-253"><span class="linenos">253</span></a>        <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">client</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
-</span><span id="FileManager-254"><a href="#FileManager-254"><span class="linenos">254</span></a>
-</span><span id="FileManager-255"><a href="#FileManager-255"><span class="linenos">255</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
-</span><span id="FileManager-256"><a href="#FileManager-256"><span class="linenos">256</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="p">[</span><span class="n">source_object</span><span class="p">])</span>
-</span><span id="FileManager-257"><a href="#FileManager-257"><span class="linenos">257</span></a>
-</span><span id="FileManager-258"><a href="#FileManager-258"><span class="linenos">258</span></a>            <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be copied:&quot;</span><span class="p">)</span>
-</span><span id="FileManager-259"><a href="#FileManager-259"><span class="linenos">259</span></a>            <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
-</span><span id="FileManager-260"><a href="#FileManager-260"><span class="linenos">260</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="FileManager-261"><a href="#FileManager-261"><span class="linenos">261</span></a>            <span class="n">copy_object</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
-</span><span id="FileManager-262"><a href="#FileManager-262"><span class="linenos">262</span></a>                <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
-</span><span id="FileManager-263"><a href="#FileManager-263"><span class="linenos">263</span></a>            <span class="p">)</span>
+</span><span id="FileManager-216"><a href="#FileManager-216"><span class="linenos">216</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
+</span><span id="FileManager-217"><a href="#FileManager-217"><span class="linenos">217</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="n">objects_paths</span><span class="p">)</span>
+</span><span id="FileManager-218"><a href="#FileManager-218"><span class="linenos">218</span></a>
+</span><span id="FileManager-219"><a href="#FileManager-219"><span class="linenos">219</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be deleted:&quot;</span><span class="p">)</span>
+</span><span id="FileManager-220"><a href="#FileManager-220"><span class="linenos">220</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="FileManager-221"><a href="#FileManager-221"><span class="linenos">221</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="FileManager-222"><a href="#FileManager-222"><span class="linenos">222</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_delete_objects</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">objects_paths</span><span class="p">)</span>
+</span><span id="FileManager-223"><a href="#FileManager-223"><span class="linenos">223</span></a>
+</span><span id="FileManager-224"><a href="#FileManager-224"><span class="linenos">224</span></a>    <span class="k">def</span> <span class="nf">copy_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager-225"><a href="#FileManager-225"><span class="linenos">225</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Copies objects and &#39;directories&#39; in s3.&quot;&quot;&quot;</span>
+</span><span id="FileManager-226"><a href="#FileManager-226"><span class="linenos">226</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager-227"><a href="#FileManager-227"><span class="linenos">227</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
+</span><span id="FileManager-228"><a href="#FileManager-228"><span class="linenos">228</span></a>        <span class="n">destination_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager-229"><a href="#FileManager-229"><span class="linenos">229</span></a>        <span class="n">destination_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_object&quot;</span><span class="p">]</span>
+</span><span id="FileManager-230"><a href="#FileManager-230"><span class="linenos">230</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
+</span><span id="FileManager-231"><a href="#FileManager-231"><span class="linenos">231</span></a>
+</span><span id="FileManager-232"><a href="#FileManager-232"><span class="linenos">232</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_copy_objects</span><span class="p">(</span>
+</span><span id="FileManager-233"><a href="#FileManager-233"><span class="linenos">233</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="FileManager-234"><a href="#FileManager-234"><span class="linenos">234</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
+</span><span id="FileManager-235"><a href="#FileManager-235"><span class="linenos">235</span></a>            <span class="n">destination_bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
+</span><span id="FileManager-236"><a href="#FileManager-236"><span class="linenos">236</span></a>            <span class="n">destination_object</span><span class="o">=</span><span class="n">destination_object</span><span class="p">,</span>
+</span><span id="FileManager-237"><a href="#FileManager-237"><span class="linenos">237</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
+</span><span id="FileManager-238"><a href="#FileManager-238"><span class="linenos">238</span></a>        <span class="p">)</span>
+</span><span id="FileManager-239"><a href="#FileManager-239"><span class="linenos">239</span></a>
+</span><span id="FileManager-240"><a href="#FileManager-240"><span class="linenos">240</span></a>    <span class="k">def</span> <span class="nf">request_restore</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager-241"><a href="#FileManager-241"><span class="linenos">241</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request the restore of archived data.&quot;&quot;&quot;</span>
+</span><span id="FileManager-242"><a href="#FileManager-242"><span class="linenos">242</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager-243"><a href="#FileManager-243"><span class="linenos">243</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
+</span><span id="FileManager-244"><a href="#FileManager-244"><span class="linenos">244</span></a>        <span class="n">restore_expiration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;restore_expiration&quot;</span><span class="p">]</span>
+</span><span id="FileManager-245"><a href="#FileManager-245"><span class="linenos">245</span></a>        <span class="n">retrieval_tier</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;retrieval_tier&quot;</span><span class="p">]</span>
+</span><span id="FileManager-246"><a href="#FileManager-246"><span class="linenos">246</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
+</span><span id="FileManager-247"><a href="#FileManager-247"><span class="linenos">247</span></a>
+</span><span id="FileManager-248"><a href="#FileManager-248"><span class="linenos">248</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore</span><span class="p">(</span>
+</span><span id="FileManager-249"><a href="#FileManager-249"><span class="linenos">249</span></a>            <span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="FileManager-250"><a href="#FileManager-250"><span class="linenos">250</span></a>            <span class="n">source_object</span><span class="p">,</span>
+</span><span id="FileManager-251"><a href="#FileManager-251"><span class="linenos">251</span></a>            <span class="n">restore_expiration</span><span class="p">,</span>
+</span><span id="FileManager-252"><a href="#FileManager-252"><span class="linenos">252</span></a>            <span class="n">retrieval_tier</span><span class="p">,</span>
+</span><span id="FileManager-253"><a href="#FileManager-253"><span class="linenos">253</span></a>            <span class="n">dry_run</span><span class="p">,</span>
+</span><span id="FileManager-254"><a href="#FileManager-254"><span class="linenos">254</span></a>        <span class="p">)</span>
+</span><span id="FileManager-255"><a href="#FileManager-255"><span class="linenos">255</span></a>
+</span><span id="FileManager-256"><a href="#FileManager-256"><span class="linenos">256</span></a>    <span class="k">def</span> <span class="nf">check_restore_status</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager-257"><a href="#FileManager-257"><span class="linenos">257</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of archived data.&quot;&quot;&quot;</span>
+</span><span id="FileManager-258"><a href="#FileManager-258"><span class="linenos">258</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager-259"><a href="#FileManager-259"><span class="linenos">259</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
+</span><span id="FileManager-260"><a href="#FileManager-260"><span class="linenos">260</span></a>
+</span><span id="FileManager-261"><a href="#FileManager-261"><span class="linenos">261</span></a>        <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
+</span><span id="FileManager-262"><a href="#FileManager-262"><span class="linenos">262</span></a>            <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
+</span><span id="FileManager-263"><a href="#FileManager-263"><span class="linenos">263</span></a>        <span class="p">)</span>
 </span><span id="FileManager-264"><a href="#FileManager-264"><span class="linenos">264</span></a>
-</span><span id="FileManager-265"><a href="#FileManager-265"><span class="linenos">265</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">copy_object</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="FileManager-266"><a href="#FileManager-266"><span class="linenos">266</span></a>                <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Copying obj: </span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="FileManager-267"><a href="#FileManager-267"><span class="linenos">267</span></a>
-</span><span id="FileManager-268"><a href="#FileManager-268"><span class="linenos">268</span></a>                <span class="n">response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">copy_object</span><span class="p">(</span>
-</span><span id="FileManager-269"><a href="#FileManager-269"><span class="linenos">269</span></a>                    <span class="n">Bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
-</span><span id="FileManager-270"><a href="#FileManager-270"><span class="linenos">270</span></a>                    <span class="n">CopySource</span><span class="o">=</span><span class="p">{</span>
-</span><span id="FileManager-271"><a href="#FileManager-271"><span class="linenos">271</span></a>                        <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">BUCKET</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="FileManager-272"><a href="#FileManager-272"><span class="linenos">272</span></a>                        <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">source_object</span><span class="p">,</span>
-</span><span id="FileManager-273"><a href="#FileManager-273"><span class="linenos">273</span></a>                    <span class="p">},</span>
-</span><span id="FileManager-274"><a href="#FileManager-274"><span class="linenos">274</span></a>                    <span class="n">Key</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">copy_object</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;/&quot;</span><span class="p">)[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;&quot;&quot;</span><span class="p">,</span>
-</span><span id="FileManager-275"><a href="#FileManager-275"><span class="linenos">275</span></a>                <span class="p">)</span>
-</span><span id="FileManager-276"><a href="#FileManager-276"><span class="linenos">276</span></a>                <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
-</span><span id="FileManager-277"><a href="#FileManager-277"><span class="linenos">277</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="FileManager-278"><a href="#FileManager-278"><span class="linenos">278</span></a>                <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">copy_object</span><span class="p">:</span>
-</span><span id="FileManager-279"><a href="#FileManager-279"><span class="linenos">279</span></a>                    <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Copying obj: </span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="FileManager-280"><a href="#FileManager-280"><span class="linenos">280</span></a>
-</span><span id="FileManager-281"><a href="#FileManager-281"><span class="linenos">281</span></a>                    <span class="n">final_path</span> <span class="o">=</span> <span class="n">obj</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="n">source_object</span><span class="p">,</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
-</span><span id="FileManager-282"><a href="#FileManager-282"><span class="linenos">282</span></a>
-</span><span id="FileManager-283"><a href="#FileManager-283"><span class="linenos">283</span></a>                    <span class="n">response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">copy_object</span><span class="p">(</span>
-</span><span id="FileManager-284"><a href="#FileManager-284"><span class="linenos">284</span></a>                        <span class="n">Bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
-</span><span id="FileManager-285"><a href="#FileManager-285"><span class="linenos">285</span></a>                        <span class="n">CopySource</span><span class="o">=</span><span class="p">{</span>
-</span><span id="FileManager-286"><a href="#FileManager-286"><span class="linenos">286</span></a>                            <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">BUCKET</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="FileManager-287"><a href="#FileManager-287"><span class="linenos">287</span></a>                            <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">obj</span><span class="p">,</span>
-</span><span id="FileManager-288"><a href="#FileManager-288"><span class="linenos">288</span></a>                        <span class="p">},</span>
-</span><span id="FileManager-289"><a href="#FileManager-289"><span class="linenos">289</span></a>                        <span class="n">Key</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}{</span><span class="n">final_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="FileManager-290"><a href="#FileManager-290"><span class="linenos">290</span></a>                    <span class="p">)</span>
-</span><span id="FileManager-291"><a href="#FileManager-291"><span class="linenos">291</span></a>                    <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="FileManager-265"><a href="#FileManager-265"><span class="linenos">265</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="FileManager-266"><a href="#FileManager-266"><span class="linenos">266</span></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span>
+</span><span id="FileManager-267"><a href="#FileManager-267"><span class="linenos">267</span></a><span class="s2">            Restore status:</span>
+</span><span id="FileManager-268"><a href="#FileManager-268"><span class="linenos">268</span></a><span class="s2">            - Not Started: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;not_started_objects&#39;</span><span class="p">)</span><span class="si">}</span>
+</span><span id="FileManager-269"><a href="#FileManager-269"><span class="linenos">269</span></a><span class="s2">            - Ongoing: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;ongoing_objects&#39;</span><span class="p">)</span><span class="si">}</span>
+</span><span id="FileManager-270"><a href="#FileManager-270"><span class="linenos">270</span></a><span class="s2">            - Restored: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;restored_objects&#39;</span><span class="p">)</span><span class="si">}</span>
+</span><span id="FileManager-271"><a href="#FileManager-271"><span class="linenos">271</span></a><span class="s2">            Total objects in this restore process: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;total_objects&#39;</span><span class="p">)</span><span class="si">}</span>
+</span><span id="FileManager-272"><a href="#FileManager-272"><span class="linenos">272</span></a><span class="s2">            &quot;&quot;&quot;</span>
+</span><span id="FileManager-273"><a href="#FileManager-273"><span class="linenos">273</span></a>        <span class="p">)</span>
+</span><span id="FileManager-274"><a href="#FileManager-274"><span class="linenos">274</span></a>
+</span><span id="FileManager-275"><a href="#FileManager-275"><span class="linenos">275</span></a>    <span class="k">def</span> <span class="nf">request_restore_to_destination_and_wait</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager-276"><a href="#FileManager-276"><span class="linenos">276</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request and wait for the restore to complete, polling the restore status.</span>
+</span><span id="FileManager-277"><a href="#FileManager-277"><span class="linenos">277</span></a>
+</span><span id="FileManager-278"><a href="#FileManager-278"><span class="linenos">278</span></a><span class="sd">        After the restore is done, copy the restored files to destination</span>
+</span><span id="FileManager-279"><a href="#FileManager-279"><span class="linenos">279</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="FileManager-280"><a href="#FileManager-280"><span class="linenos">280</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager-281"><a href="#FileManager-281"><span class="linenos">281</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
+</span><span id="FileManager-282"><a href="#FileManager-282"><span class="linenos">282</span></a>        <span class="n">destination_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager-283"><a href="#FileManager-283"><span class="linenos">283</span></a>        <span class="n">destination_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_object&quot;</span><span class="p">]</span>
+</span><span id="FileManager-284"><a href="#FileManager-284"><span class="linenos">284</span></a>        <span class="n">restore_expiration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;restore_expiration&quot;</span><span class="p">]</span>
+</span><span id="FileManager-285"><a href="#FileManager-285"><span class="linenos">285</span></a>        <span class="n">retrieval_tier</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;retrieval_tier&quot;</span><span class="p">]</span>
+</span><span id="FileManager-286"><a href="#FileManager-286"><span class="linenos">286</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
+</span><span id="FileManager-287"><a href="#FileManager-287"><span class="linenos">287</span></a>
+</span><span id="FileManager-288"><a href="#FileManager-288"><span class="linenos">288</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore_and_wait</span><span class="p">(</span>
+</span><span id="FileManager-289"><a href="#FileManager-289"><span class="linenos">289</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="FileManager-290"><a href="#FileManager-290"><span class="linenos">290</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
+</span><span id="FileManager-291"><a href="#FileManager-291"><span class="linenos">291</span></a>            <span class="n">restore_expiration</span><span class="o">=</span><span class="n">restore_expiration</span><span class="p">,</span>
+</span><span id="FileManager-292"><a href="#FileManager-292"><span class="linenos">292</span></a>            <span class="n">retrieval_tier</span><span class="o">=</span><span class="n">retrieval_tier</span><span class="p">,</span>
+</span><span id="FileManager-293"><a href="#FileManager-293"><span class="linenos">293</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
+</span><span id="FileManager-294"><a href="#FileManager-294"><span class="linenos">294</span></a>        <span class="p">)</span>
+</span><span id="FileManager-295"><a href="#FileManager-295"><span class="linenos">295</span></a>
+</span><span id="FileManager-296"><a href="#FileManager-296"><span class="linenos">296</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="FileManager-297"><a href="#FileManager-297"><span class="linenos">297</span></a>            <span class="sa">f</span><span class="s2">&quot;Restoration complete for </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2"> and </span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="FileManager-298"><a href="#FileManager-298"><span class="linenos">298</span></a>        <span class="p">)</span>
+</span><span id="FileManager-299"><a href="#FileManager-299"><span class="linenos">299</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="FileManager-300"><a href="#FileManager-300"><span class="linenos">300</span></a>            <span class="sa">f</span><span class="s2">&quot;Starting to copy data from </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2"> to &quot;</span>
+</span><span id="FileManager-301"><a href="#FileManager-301"><span class="linenos">301</span></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="FileManager-302"><a href="#FileManager-302"><span class="linenos">302</span></a>        <span class="p">)</span>
+</span><span id="FileManager-303"><a href="#FileManager-303"><span class="linenos">303</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_copy_objects</span><span class="p">(</span>
+</span><span id="FileManager-304"><a href="#FileManager-304"><span class="linenos">304</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="FileManager-305"><a href="#FileManager-305"><span class="linenos">305</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
+</span><span id="FileManager-306"><a href="#FileManager-306"><span class="linenos">306</span></a>            <span class="n">destination_bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
+</span><span id="FileManager-307"><a href="#FileManager-307"><span class="linenos">307</span></a>            <span class="n">destination_object</span><span class="o">=</span><span class="n">destination_object</span><span class="p">,</span>
+</span><span id="FileManager-308"><a href="#FileManager-308"><span class="linenos">308</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
+</span><span id="FileManager-309"><a href="#FileManager-309"><span class="linenos">309</span></a>        <span class="p">)</span>
+</span><span id="FileManager-310"><a href="#FileManager-310"><span class="linenos">310</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="FileManager-311"><a href="#FileManager-311"><span class="linenos">311</span></a>            <span class="sa">f</span><span class="s2">&quot;Finished copying data, data should be available on </span><span class="si">{</span><span class="n">destination_bucket</span><span class="si">}</span><span class="s2">/&quot;</span>
+</span><span id="FileManager-312"><a href="#FileManager-312"><span class="linenos">312</span></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="FileManager-313"><a href="#FileManager-313"><span class="linenos">313</span></a>        <span class="p">)</span>
+</span><span id="FileManager-314"><a href="#FileManager-314"><span class="linenos">314</span></a>
+</span><span id="FileManager-315"><a href="#FileManager-315"><span class="linenos">315</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="FileManager-316"><a href="#FileManager-316"><span class="linenos">316</span></a>    <span class="k">def</span> <span class="nf">_copy_objects</span><span class="p">(</span>
+</span><span id="FileManager-317"><a href="#FileManager-317"><span class="linenos">317</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="FileManager-318"><a href="#FileManager-318"><span class="linenos">318</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="FileManager-319"><a href="#FileManager-319"><span class="linenos">319</span></a>        <span class="n">destination_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="FileManager-320"><a href="#FileManager-320"><span class="linenos">320</span></a>        <span class="n">destination_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="FileManager-321"><a href="#FileManager-321"><span class="linenos">321</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="FileManager-322"><a href="#FileManager-322"><span class="linenos">322</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager-323"><a href="#FileManager-323"><span class="linenos">323</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Copies objects and &#39;directories&#39; in s3.</span>
+</span><span id="FileManager-324"><a href="#FileManager-324"><span class="linenos">324</span></a>
+</span><span id="FileManager-325"><a href="#FileManager-325"><span class="linenos">325</span></a><span class="sd">        Args:</span>
+</span><span id="FileManager-326"><a href="#FileManager-326"><span class="linenos">326</span></a><span class="sd">            source_bucket: name of bucket to perform the copy.</span>
+</span><span id="FileManager-327"><a href="#FileManager-327"><span class="linenos">327</span></a><span class="sd">            source_object: object/folder to be copied.</span>
+</span><span id="FileManager-328"><a href="#FileManager-328"><span class="linenos">328</span></a><span class="sd">            destination_bucket: name of the target bucket to copy.</span>
+</span><span id="FileManager-329"><a href="#FileManager-329"><span class="linenos">329</span></a><span class="sd">            destination_object: target object/folder to copy.</span>
+</span><span id="FileManager-330"><a href="#FileManager-330"><span class="linenos">330</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
+</span><span id="FileManager-331"><a href="#FileManager-331"><span class="linenos">331</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
+</span><span id="FileManager-332"><a href="#FileManager-332"><span class="linenos">332</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="FileManager-333"><a href="#FileManager-333"><span class="linenos">333</span></a>        <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">client</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
+</span><span id="FileManager-334"><a href="#FileManager-334"><span class="linenos">334</span></a>
+</span><span id="FileManager-335"><a href="#FileManager-335"><span class="linenos">335</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
+</span><span id="FileManager-336"><a href="#FileManager-336"><span class="linenos">336</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="p">[</span><span class="n">source_object</span><span class="p">])</span>
+</span><span id="FileManager-337"><a href="#FileManager-337"><span class="linenos">337</span></a>
+</span><span id="FileManager-338"><a href="#FileManager-338"><span class="linenos">338</span></a>            <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be copied:&quot;</span><span class="p">)</span>
+</span><span id="FileManager-339"><a href="#FileManager-339"><span class="linenos">339</span></a>            <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="FileManager-340"><a href="#FileManager-340"><span class="linenos">340</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="FileManager-341"><a href="#FileManager-341"><span class="linenos">341</span></a>            <span class="n">original_object_name</span> <span class="o">=</span> <span class="n">source_object</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;/&quot;</span><span class="p">)[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="FileManager-342"><a href="#FileManager-342"><span class="linenos">342</span></a>
+</span><span id="FileManager-343"><a href="#FileManager-343"><span class="linenos">343</span></a>            <span class="k">if</span> <span class="n">_check_directory</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span><span class="p">):</span>
+</span><span id="FileManager-344"><a href="#FileManager-344"><span class="linenos">344</span></a>                <span class="n">source_object</span> <span class="o">=</span> <span class="n">_process_directory_path</span><span class="p">(</span><span class="n">source_object</span><span class="p">)</span>
+</span><span id="FileManager-345"><a href="#FileManager-345"><span class="linenos">345</span></a>
+</span><span id="FileManager-346"><a href="#FileManager-346"><span class="linenos">346</span></a>                <span class="n">copy_object</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
+</span><span id="FileManager-347"><a href="#FileManager-347"><span class="linenos">347</span></a>                    <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
+</span><span id="FileManager-348"><a href="#FileManager-348"><span class="linenos">348</span></a>                <span class="p">)</span>
+</span><span id="FileManager-349"><a href="#FileManager-349"><span class="linenos">349</span></a>
+</span><span id="FileManager-350"><a href="#FileManager-350"><span class="linenos">350</span></a>                <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">copy_object</span><span class="p">:</span>
+</span><span id="FileManager-351"><a href="#FileManager-351"><span class="linenos">351</span></a>                    <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Copying obj: </span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="FileManager-352"><a href="#FileManager-352"><span class="linenos">352</span></a>
+</span><span id="FileManager-353"><a href="#FileManager-353"><span class="linenos">353</span></a>                    <span class="n">final_path</span> <span class="o">=</span> <span class="n">obj</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="n">source_object</span><span class="p">,</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="FileManager-354"><a href="#FileManager-354"><span class="linenos">354</span></a>
+</span><span id="FileManager-355"><a href="#FileManager-355"><span class="linenos">355</span></a>                    <span class="n">response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">copy_object</span><span class="p">(</span>
+</span><span id="FileManager-356"><a href="#FileManager-356"><span class="linenos">356</span></a>                        <span class="n">Bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
+</span><span id="FileManager-357"><a href="#FileManager-357"><span class="linenos">357</span></a>                        <span class="n">CopySource</span><span class="o">=</span><span class="p">{</span>
+</span><span id="FileManager-358"><a href="#FileManager-358"><span class="linenos">358</span></a>                            <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">BUCKET</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="FileManager-359"><a href="#FileManager-359"><span class="linenos">359</span></a>                            <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">obj</span><span class="p">,</span>
+</span><span id="FileManager-360"><a href="#FileManager-360"><span class="linenos">360</span></a>                        <span class="p">},</span>
+</span><span id="FileManager-361"><a href="#FileManager-361"><span class="linenos">361</span></a>                        <span class="n">Key</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">original_object_name</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">final_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="FileManager-362"><a href="#FileManager-362"><span class="linenos">362</span></a>                    <span class="p">)</span>
+</span><span id="FileManager-363"><a href="#FileManager-363"><span class="linenos">363</span></a>                    <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="FileManager-364"><a href="#FileManager-364"><span class="linenos">364</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="FileManager-365"><a href="#FileManager-365"><span class="linenos">365</span></a>                <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Copying obj: </span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="FileManager-366"><a href="#FileManager-366"><span class="linenos">366</span></a>
+</span><span id="FileManager-367"><a href="#FileManager-367"><span class="linenos">367</span></a>                <span class="n">response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">copy_object</span><span class="p">(</span>
+</span><span id="FileManager-368"><a href="#FileManager-368"><span class="linenos">368</span></a>                    <span class="n">Bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
+</span><span id="FileManager-369"><a href="#FileManager-369"><span class="linenos">369</span></a>                    <span class="n">CopySource</span><span class="o">=</span><span class="p">{</span>
+</span><span id="FileManager-370"><a href="#FileManager-370"><span class="linenos">370</span></a>                        <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">BUCKET</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="FileManager-371"><a href="#FileManager-371"><span class="linenos">371</span></a>                        <span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">source_object</span><span class="p">,</span>
+</span><span id="FileManager-372"><a href="#FileManager-372"><span class="linenos">372</span></a>                    <span class="p">},</span>
+</span><span id="FileManager-373"><a href="#FileManager-373"><span class="linenos">373</span></a>                    <span class="n">Key</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">original_object_name</span><span class="si">}</span><span class="s2">&quot;&quot;&quot;</span><span class="p">,</span>
+</span><span id="FileManager-374"><a href="#FileManager-374"><span class="linenos">374</span></a>                <span class="p">)</span>
+</span><span id="FileManager-375"><a href="#FileManager-375"><span class="linenos">375</span></a>                <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -865,14 +987,14 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#FileManager.__init__"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.__init__-85"><a href="#FileManager.__init__-85"><span class="linenos">85</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">configs</span><span class="p">:</span> <span class="nb">dict</span><span class="p">):</span>
-</span><span id="FileManager.__init__-86"><a href="#FileManager.__init__-86"><span class="linenos">86</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Construct FileManager algorithm instances.</span>
-</span><span id="FileManager.__init__-87"><a href="#FileManager.__init__-87"><span class="linenos">87</span></a>
-</span><span id="FileManager.__init__-88"><a href="#FileManager.__init__-88"><span class="linenos">88</span></a><span class="sd">        Args:</span>
-</span><span id="FileManager.__init__-89"><a href="#FileManager.__init__-89"><span class="linenos">89</span></a><span class="sd">            configs: configurations for the FileManager algorithm.</span>
-</span><span id="FileManager.__init__-90"><a href="#FileManager.__init__-90"><span class="linenos">90</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="FileManager.__init__-91"><a href="#FileManager.__init__-91"><span class="linenos">91</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">configs</span> <span class="o">=</span> <span class="n">configs</span>
-</span><span id="FileManager.__init__-92"><a href="#FileManager.__init__-92"><span class="linenos">92</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">function</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;function&quot;</span><span class="p">]</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.__init__-140"><a href="#FileManager.__init__-140"><span class="linenos">140</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">configs</span><span class="p">:</span> <span class="nb">dict</span><span class="p">):</span>
+</span><span id="FileManager.__init__-141"><a href="#FileManager.__init__-141"><span class="linenos">141</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Construct FileManager algorithm instances.</span>
+</span><span id="FileManager.__init__-142"><a href="#FileManager.__init__-142"><span class="linenos">142</span></a>
+</span><span id="FileManager.__init__-143"><a href="#FileManager.__init__-143"><span class="linenos">143</span></a><span class="sd">        Args:</span>
+</span><span id="FileManager.__init__-144"><a href="#FileManager.__init__-144"><span class="linenos">144</span></a><span class="sd">            configs: configurations for the FileManager algorithm.</span>
+</span><span id="FileManager.__init__-145"><a href="#FileManager.__init__-145"><span class="linenos">145</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="FileManager.__init__-146"><a href="#FileManager.__init__-146"><span class="linenos">146</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">configs</span> <span class="o">=</span> <span class="n">configs</span>
+</span><span id="FileManager.__init__-147"><a href="#FileManager.__init__-147"><span class="linenos">147</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">function</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;function&quot;</span><span class="p">]</span>
 </span></pre></div>
 
 
@@ -895,26 +1017,26 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#FileManager.get_function"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.get_function-94"><a href="#FileManager.get_function-94"><span class="linenos"> 94</span></a>    <span class="k">def</span> <span class="nf">get_function</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="FileManager.get_function-95"><a href="#FileManager.get_function-95"><span class="linenos"> 95</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get a specific function to execute.&quot;&quot;&quot;</span>
-</span><span id="FileManager.get_function-96"><a href="#FileManager.get_function-96"><span class="linenos"> 96</span></a>        <span class="n">available_functions</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="FileManager.get_function-97"><a href="#FileManager.get_function-97"><span class="linenos"> 97</span></a>            <span class="s2">&quot;delete_objects&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">delete_objects</span><span class="p">,</span>
-</span><span id="FileManager.get_function-98"><a href="#FileManager.get_function-98"><span class="linenos"> 98</span></a>            <span class="s2">&quot;copy_objects&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">copy_objects</span><span class="p">,</span>
-</span><span id="FileManager.get_function-99"><a href="#FileManager.get_function-99"><span class="linenos"> 99</span></a>            <span class="s2">&quot;request_restore&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">request_restore</span><span class="p">,</span>
-</span><span id="FileManager.get_function-100"><a href="#FileManager.get_function-100"><span class="linenos">100</span></a>            <span class="s2">&quot;check_restore_status&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">,</span>
-</span><span id="FileManager.get_function-101"><a href="#FileManager.get_function-101"><span class="linenos">101</span></a>            <span class="s2">&quot;request_restore_to_destination_and_wait&quot;</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="FileManager.get_function-102"><a href="#FileManager.get_function-102"><span class="linenos">102</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">request_restore_to_destination_and_wait</span>
-</span><span id="FileManager.get_function-103"><a href="#FileManager.get_function-103"><span class="linenos">103</span></a>            <span class="p">),</span>
-</span><span id="FileManager.get_function-104"><a href="#FileManager.get_function-104"><span class="linenos">104</span></a>        <span class="p">}</span>
-</span><span id="FileManager.get_function-105"><a href="#FileManager.get_function-105"><span class="linenos">105</span></a>
-</span><span id="FileManager.get_function-106"><a href="#FileManager.get_function-106"><span class="linenos">106</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Function being executed: </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="p">))</span>
-</span><span id="FileManager.get_function-107"><a href="#FileManager.get_function-107"><span class="linenos">107</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">function</span> <span class="ow">in</span> <span class="n">available_functions</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
-</span><span id="FileManager.get_function-108"><a href="#FileManager.get_function-108"><span class="linenos">108</span></a>            <span class="n">func</span> <span class="o">=</span> <span class="n">available_functions</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="p">]</span>
-</span><span id="FileManager.get_function-109"><a href="#FileManager.get_function-109"><span class="linenos">109</span></a>            <span class="n">func</span><span class="p">()</span>
-</span><span id="FileManager.get_function-110"><a href="#FileManager.get_function-110"><span class="linenos">110</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="FileManager.get_function-111"><a href="#FileManager.get_function-111"><span class="linenos">111</span></a>            <span class="k">raise</span> <span class="ne">NotImplementedError</span><span class="p">(</span>
-</span><span id="FileManager.get_function-112"><a href="#FileManager.get_function-112"><span class="linenos">112</span></a>                <span class="sa">f</span><span class="s2">&quot;The requested function </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="si">}</span><span class="s2"> is not implemented.&quot;</span>
-</span><span id="FileManager.get_function-113"><a href="#FileManager.get_function-113"><span class="linenos">113</span></a>            <span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.get_function-149"><a href="#FileManager.get_function-149"><span class="linenos">149</span></a>    <span class="k">def</span> <span class="nf">get_function</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager.get_function-150"><a href="#FileManager.get_function-150"><span class="linenos">150</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get a specific function to execute.&quot;&quot;&quot;</span>
+</span><span id="FileManager.get_function-151"><a href="#FileManager.get_function-151"><span class="linenos">151</span></a>        <span class="n">available_functions</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="FileManager.get_function-152"><a href="#FileManager.get_function-152"><span class="linenos">152</span></a>            <span class="s2">&quot;delete_objects&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">delete_objects</span><span class="p">,</span>
+</span><span id="FileManager.get_function-153"><a href="#FileManager.get_function-153"><span class="linenos">153</span></a>            <span class="s2">&quot;copy_objects&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">copy_objects</span><span class="p">,</span>
+</span><span id="FileManager.get_function-154"><a href="#FileManager.get_function-154"><span class="linenos">154</span></a>            <span class="s2">&quot;request_restore&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">request_restore</span><span class="p">,</span>
+</span><span id="FileManager.get_function-155"><a href="#FileManager.get_function-155"><span class="linenos">155</span></a>            <span class="s2">&quot;check_restore_status&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">,</span>
+</span><span id="FileManager.get_function-156"><a href="#FileManager.get_function-156"><span class="linenos">156</span></a>            <span class="s2">&quot;request_restore_to_destination_and_wait&quot;</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="FileManager.get_function-157"><a href="#FileManager.get_function-157"><span class="linenos">157</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">request_restore_to_destination_and_wait</span>
+</span><span id="FileManager.get_function-158"><a href="#FileManager.get_function-158"><span class="linenos">158</span></a>            <span class="p">),</span>
+</span><span id="FileManager.get_function-159"><a href="#FileManager.get_function-159"><span class="linenos">159</span></a>        <span class="p">}</span>
+</span><span id="FileManager.get_function-160"><a href="#FileManager.get_function-160"><span class="linenos">160</span></a>
+</span><span id="FileManager.get_function-161"><a href="#FileManager.get_function-161"><span class="linenos">161</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Function being executed: </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="p">))</span>
+</span><span id="FileManager.get_function-162"><a href="#FileManager.get_function-162"><span class="linenos">162</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">function</span> <span class="ow">in</span> <span class="n">available_functions</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
+</span><span id="FileManager.get_function-163"><a href="#FileManager.get_function-163"><span class="linenos">163</span></a>            <span class="n">func</span> <span class="o">=</span> <span class="n">available_functions</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="p">]</span>
+</span><span id="FileManager.get_function-164"><a href="#FileManager.get_function-164"><span class="linenos">164</span></a>            <span class="n">func</span><span class="p">()</span>
+</span><span id="FileManager.get_function-165"><a href="#FileManager.get_function-165"><span class="linenos">165</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="FileManager.get_function-166"><a href="#FileManager.get_function-166"><span class="linenos">166</span></a>            <span class="k">raise</span> <span class="ne">NotImplementedError</span><span class="p">(</span>
+</span><span id="FileManager.get_function-167"><a href="#FileManager.get_function-167"><span class="linenos">167</span></a>                <span class="sa">f</span><span class="s2">&quot;The requested function </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">function</span><span class="si">}</span><span class="s2"> is not implemented.&quot;</span>
+</span><span id="FileManager.get_function-168"><a href="#FileManager.get_function-168"><span class="linenos">168</span></a>            <span class="p">)</span>
 </span></pre></div>
 
 
@@ -934,34 +1056,23 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#FileManager.delete_objects"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.delete_objects-115"><a href="#FileManager.delete_objects-115"><span class="linenos">115</span></a>    <span class="k">def</span> <span class="nf">delete_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="FileManager.delete_objects-116"><a href="#FileManager.delete_objects-116"><span class="linenos">116</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Delete objects and &#39;directories&#39; in s3.</span>
-</span><span id="FileManager.delete_objects-117"><a href="#FileManager.delete_objects-117"><span class="linenos">117</span></a>
-</span><span id="FileManager.delete_objects-118"><a href="#FileManager.delete_objects-118"><span class="linenos">118</span></a><span class="sd">        If dry_run is set to True the function will print a dict with all the</span>
-</span><span id="FileManager.delete_objects-119"><a href="#FileManager.delete_objects-119"><span class="linenos">119</span></a><span class="sd">        paths that would be deleted based on the given keys.</span>
-</span><span id="FileManager.delete_objects-120"><a href="#FileManager.delete_objects-120"><span class="linenos">120</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="FileManager.delete_objects-121"><a href="#FileManager.delete_objects-121"><span class="linenos">121</span></a>        <span class="n">bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager.delete_objects-122"><a href="#FileManager.delete_objects-122"><span class="linenos">122</span></a>        <span class="n">objects_paths</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;object_paths&quot;</span><span class="p">]</span>
-</span><span id="FileManager.delete_objects-123"><a href="#FileManager.delete_objects-123"><span class="linenos">123</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
-</span><span id="FileManager.delete_objects-124"><a href="#FileManager.delete_objects-124"><span class="linenos">124</span></a>
-</span><span id="FileManager.delete_objects-125"><a href="#FileManager.delete_objects-125"><span class="linenos">125</span></a>        <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">client</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
-</span><span id="FileManager.delete_objects-126"><a href="#FileManager.delete_objects-126"><span class="linenos">126</span></a>
-</span><span id="FileManager.delete_objects-127"><a href="#FileManager.delete_objects-127"><span class="linenos">127</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
-</span><span id="FileManager.delete_objects-128"><a href="#FileManager.delete_objects-128"><span class="linenos">128</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="n">objects_paths</span><span class="p">)</span>
-</span><span id="FileManager.delete_objects-129"><a href="#FileManager.delete_objects-129"><span class="linenos">129</span></a>
-</span><span id="FileManager.delete_objects-130"><a href="#FileManager.delete_objects-130"><span class="linenos">130</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be deleted:&quot;</span><span class="p">)</span>
-</span><span id="FileManager.delete_objects-131"><a href="#FileManager.delete_objects-131"><span class="linenos">131</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="FileManager.delete_objects-132"><a href="#FileManager.delete_objects-132"><span class="linenos">132</span></a>            <span class="n">objects_to_delete</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="FileManager.delete_objects-133"><a href="#FileManager.delete_objects-133"><span class="linenos">133</span></a>            <span class="k">for</span> <span class="n">path</span> <span class="ow">in</span> <span class="n">objects_paths</span><span class="p">:</span>
-</span><span id="FileManager.delete_objects-134"><a href="#FileManager.delete_objects-134"><span class="linenos">134</span></a>                <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">_list_objects_recursively</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">path</span><span class="p">):</span>
-</span><span id="FileManager.delete_objects-135"><a href="#FileManager.delete_objects-135"><span class="linenos">135</span></a>                    <span class="n">objects_to_delete</span><span class="o">.</span><span class="n">append</span><span class="p">({</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">KEY</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">obj</span><span class="p">})</span>
-</span><span id="FileManager.delete_objects-136"><a href="#FileManager.delete_objects-136"><span class="linenos">136</span></a>
-</span><span id="FileManager.delete_objects-137"><a href="#FileManager.delete_objects-137"><span class="linenos">137</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">delete_objects</span><span class="p">(</span>
-</span><span id="FileManager.delete_objects-138"><a href="#FileManager.delete_objects-138"><span class="linenos">138</span></a>                <span class="n">Bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span>
-</span><span id="FileManager.delete_objects-139"><a href="#FileManager.delete_objects-139"><span class="linenos">139</span></a>                <span class="n">Delete</span><span class="o">=</span><span class="p">{</span><span class="n">FileManagerAPIKeys</span><span class="o">.</span><span class="n">OBJECTS</span><span class="o">.</span><span class="n">value</span><span class="p">:</span> <span class="n">objects_to_delete</span><span class="p">},</span>
-</span><span id="FileManager.delete_objects-140"><a href="#FileManager.delete_objects-140"><span class="linenos">140</span></a>            <span class="p">)</span>
-</span><span id="FileManager.delete_objects-141"><a href="#FileManager.delete_objects-141"><span class="linenos">141</span></a>
-</span><span id="FileManager.delete_objects-142"><a href="#FileManager.delete_objects-142"><span class="linenos">142</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.delete_objects-206"><a href="#FileManager.delete_objects-206"><span class="linenos">206</span></a>    <span class="k">def</span> <span class="nf">delete_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager.delete_objects-207"><a href="#FileManager.delete_objects-207"><span class="linenos">207</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Delete objects and &#39;directories&#39; in s3.</span>
+</span><span id="FileManager.delete_objects-208"><a href="#FileManager.delete_objects-208"><span class="linenos">208</span></a>
+</span><span id="FileManager.delete_objects-209"><a href="#FileManager.delete_objects-209"><span class="linenos">209</span></a><span class="sd">        If dry_run is set to True the function will print a dict with all the</span>
+</span><span id="FileManager.delete_objects-210"><a href="#FileManager.delete_objects-210"><span class="linenos">210</span></a><span class="sd">        paths that would be deleted based on the given keys.</span>
+</span><span id="FileManager.delete_objects-211"><a href="#FileManager.delete_objects-211"><span class="linenos">211</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="FileManager.delete_objects-212"><a href="#FileManager.delete_objects-212"><span class="linenos">212</span></a>        <span class="n">bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager.delete_objects-213"><a href="#FileManager.delete_objects-213"><span class="linenos">213</span></a>        <span class="n">objects_paths</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;object_paths&quot;</span><span class="p">]</span>
+</span><span id="FileManager.delete_objects-214"><a href="#FileManager.delete_objects-214"><span class="linenos">214</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
+</span><span id="FileManager.delete_objects-215"><a href="#FileManager.delete_objects-215"><span class="linenos">215</span></a>
+</span><span id="FileManager.delete_objects-216"><a href="#FileManager.delete_objects-216"><span class="linenos">216</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
+</span><span id="FileManager.delete_objects-217"><a href="#FileManager.delete_objects-217"><span class="linenos">217</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="n">objects_paths</span><span class="p">)</span>
+</span><span id="FileManager.delete_objects-218"><a href="#FileManager.delete_objects-218"><span class="linenos">218</span></a>
+</span><span id="FileManager.delete_objects-219"><a href="#FileManager.delete_objects-219"><span class="linenos">219</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be deleted:&quot;</span><span class="p">)</span>
+</span><span id="FileManager.delete_objects-220"><a href="#FileManager.delete_objects-220"><span class="linenos">220</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="FileManager.delete_objects-221"><a href="#FileManager.delete_objects-221"><span class="linenos">221</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="FileManager.delete_objects-222"><a href="#FileManager.delete_objects-222"><span class="linenos">222</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_delete_objects</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">objects_paths</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -984,21 +1095,21 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#FileManager.copy_objects"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.copy_objects-144"><a href="#FileManager.copy_objects-144"><span class="linenos">144</span></a>    <span class="k">def</span> <span class="nf">copy_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="FileManager.copy_objects-145"><a href="#FileManager.copy_objects-145"><span class="linenos">145</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Copies objects and &#39;directories&#39; in s3.&quot;&quot;&quot;</span>
-</span><span id="FileManager.copy_objects-146"><a href="#FileManager.copy_objects-146"><span class="linenos">146</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager.copy_objects-147"><a href="#FileManager.copy_objects-147"><span class="linenos">147</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
-</span><span id="FileManager.copy_objects-148"><a href="#FileManager.copy_objects-148"><span class="linenos">148</span></a>        <span class="n">destination_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager.copy_objects-149"><a href="#FileManager.copy_objects-149"><span class="linenos">149</span></a>        <span class="n">destination_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_object&quot;</span><span class="p">]</span>
-</span><span id="FileManager.copy_objects-150"><a href="#FileManager.copy_objects-150"><span class="linenos">150</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
-</span><span id="FileManager.copy_objects-151"><a href="#FileManager.copy_objects-151"><span class="linenos">151</span></a>
-</span><span id="FileManager.copy_objects-152"><a href="#FileManager.copy_objects-152"><span class="linenos">152</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_copy_objects</span><span class="p">(</span>
-</span><span id="FileManager.copy_objects-153"><a href="#FileManager.copy_objects-153"><span class="linenos">153</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="FileManager.copy_objects-154"><a href="#FileManager.copy_objects-154"><span class="linenos">154</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
-</span><span id="FileManager.copy_objects-155"><a href="#FileManager.copy_objects-155"><span class="linenos">155</span></a>            <span class="n">destination_bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
-</span><span id="FileManager.copy_objects-156"><a href="#FileManager.copy_objects-156"><span class="linenos">156</span></a>            <span class="n">destination_object</span><span class="o">=</span><span class="n">destination_object</span><span class="p">,</span>
-</span><span id="FileManager.copy_objects-157"><a href="#FileManager.copy_objects-157"><span class="linenos">157</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
-</span><span id="FileManager.copy_objects-158"><a href="#FileManager.copy_objects-158"><span class="linenos">158</span></a>        <span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.copy_objects-224"><a href="#FileManager.copy_objects-224"><span class="linenos">224</span></a>    <span class="k">def</span> <span class="nf">copy_objects</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager.copy_objects-225"><a href="#FileManager.copy_objects-225"><span class="linenos">225</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Copies objects and &#39;directories&#39; in s3.&quot;&quot;&quot;</span>
+</span><span id="FileManager.copy_objects-226"><a href="#FileManager.copy_objects-226"><span class="linenos">226</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager.copy_objects-227"><a href="#FileManager.copy_objects-227"><span class="linenos">227</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
+</span><span id="FileManager.copy_objects-228"><a href="#FileManager.copy_objects-228"><span class="linenos">228</span></a>        <span class="n">destination_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager.copy_objects-229"><a href="#FileManager.copy_objects-229"><span class="linenos">229</span></a>        <span class="n">destination_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_object&quot;</span><span class="p">]</span>
+</span><span id="FileManager.copy_objects-230"><a href="#FileManager.copy_objects-230"><span class="linenos">230</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
+</span><span id="FileManager.copy_objects-231"><a href="#FileManager.copy_objects-231"><span class="linenos">231</span></a>
+</span><span id="FileManager.copy_objects-232"><a href="#FileManager.copy_objects-232"><span class="linenos">232</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_copy_objects</span><span class="p">(</span>
+</span><span id="FileManager.copy_objects-233"><a href="#FileManager.copy_objects-233"><span class="linenos">233</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="FileManager.copy_objects-234"><a href="#FileManager.copy_objects-234"><span class="linenos">234</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
+</span><span id="FileManager.copy_objects-235"><a href="#FileManager.copy_objects-235"><span class="linenos">235</span></a>            <span class="n">destination_bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
+</span><span id="FileManager.copy_objects-236"><a href="#FileManager.copy_objects-236"><span class="linenos">236</span></a>            <span class="n">destination_object</span><span class="o">=</span><span class="n">destination_object</span><span class="p">,</span>
+</span><span id="FileManager.copy_objects-237"><a href="#FileManager.copy_objects-237"><span class="linenos">237</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
+</span><span id="FileManager.copy_objects-238"><a href="#FileManager.copy_objects-238"><span class="linenos">238</span></a>        <span class="p">)</span>
 </span></pre></div>
 
 
@@ -1018,21 +1129,21 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#FileManager.request_restore"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.request_restore-160"><a href="#FileManager.request_restore-160"><span class="linenos">160</span></a>    <span class="k">def</span> <span class="nf">request_restore</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="FileManager.request_restore-161"><a href="#FileManager.request_restore-161"><span class="linenos">161</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request the restore of archived data.&quot;&quot;&quot;</span>
-</span><span id="FileManager.request_restore-162"><a href="#FileManager.request_restore-162"><span class="linenos">162</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager.request_restore-163"><a href="#FileManager.request_restore-163"><span class="linenos">163</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
-</span><span id="FileManager.request_restore-164"><a href="#FileManager.request_restore-164"><span class="linenos">164</span></a>        <span class="n">restore_expiration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;restore_expiration&quot;</span><span class="p">]</span>
-</span><span id="FileManager.request_restore-165"><a href="#FileManager.request_restore-165"><span class="linenos">165</span></a>        <span class="n">retrieval_tier</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;retrieval_tier&quot;</span><span class="p">]</span>
-</span><span id="FileManager.request_restore-166"><a href="#FileManager.request_restore-166"><span class="linenos">166</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
-</span><span id="FileManager.request_restore-167"><a href="#FileManager.request_restore-167"><span class="linenos">167</span></a>
-</span><span id="FileManager.request_restore-168"><a href="#FileManager.request_restore-168"><span class="linenos">168</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore</span><span class="p">(</span>
-</span><span id="FileManager.request_restore-169"><a href="#FileManager.request_restore-169"><span class="linenos">169</span></a>            <span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="FileManager.request_restore-170"><a href="#FileManager.request_restore-170"><span class="linenos">170</span></a>            <span class="n">source_object</span><span class="p">,</span>
-</span><span id="FileManager.request_restore-171"><a href="#FileManager.request_restore-171"><span class="linenos">171</span></a>            <span class="n">restore_expiration</span><span class="p">,</span>
-</span><span id="FileManager.request_restore-172"><a href="#FileManager.request_restore-172"><span class="linenos">172</span></a>            <span class="n">retrieval_tier</span><span class="p">,</span>
-</span><span id="FileManager.request_restore-173"><a href="#FileManager.request_restore-173"><span class="linenos">173</span></a>            <span class="n">dry_run</span><span class="p">,</span>
-</span><span id="FileManager.request_restore-174"><a href="#FileManager.request_restore-174"><span class="linenos">174</span></a>        <span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.request_restore-240"><a href="#FileManager.request_restore-240"><span class="linenos">240</span></a>    <span class="k">def</span> <span class="nf">request_restore</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager.request_restore-241"><a href="#FileManager.request_restore-241"><span class="linenos">241</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request the restore of archived data.&quot;&quot;&quot;</span>
+</span><span id="FileManager.request_restore-242"><a href="#FileManager.request_restore-242"><span class="linenos">242</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager.request_restore-243"><a href="#FileManager.request_restore-243"><span class="linenos">243</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
+</span><span id="FileManager.request_restore-244"><a href="#FileManager.request_restore-244"><span class="linenos">244</span></a>        <span class="n">restore_expiration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;restore_expiration&quot;</span><span class="p">]</span>
+</span><span id="FileManager.request_restore-245"><a href="#FileManager.request_restore-245"><span class="linenos">245</span></a>        <span class="n">retrieval_tier</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;retrieval_tier&quot;</span><span class="p">]</span>
+</span><span id="FileManager.request_restore-246"><a href="#FileManager.request_restore-246"><span class="linenos">246</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
+</span><span id="FileManager.request_restore-247"><a href="#FileManager.request_restore-247"><span class="linenos">247</span></a>
+</span><span id="FileManager.request_restore-248"><a href="#FileManager.request_restore-248"><span class="linenos">248</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore</span><span class="p">(</span>
+</span><span id="FileManager.request_restore-249"><a href="#FileManager.request_restore-249"><span class="linenos">249</span></a>            <span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="FileManager.request_restore-250"><a href="#FileManager.request_restore-250"><span class="linenos">250</span></a>            <span class="n">source_object</span><span class="p">,</span>
+</span><span id="FileManager.request_restore-251"><a href="#FileManager.request_restore-251"><span class="linenos">251</span></a>            <span class="n">restore_expiration</span><span class="p">,</span>
+</span><span id="FileManager.request_restore-252"><a href="#FileManager.request_restore-252"><span class="linenos">252</span></a>            <span class="n">retrieval_tier</span><span class="p">,</span>
+</span><span id="FileManager.request_restore-253"><a href="#FileManager.request_restore-253"><span class="linenos">253</span></a>            <span class="n">dry_run</span><span class="p">,</span>
+</span><span id="FileManager.request_restore-254"><a href="#FileManager.request_restore-254"><span class="linenos">254</span></a>        <span class="p">)</span>
 </span></pre></div>
 
 
@@ -1052,24 +1163,24 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#FileManager.check_restore_status"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.check_restore_status-176"><a href="#FileManager.check_restore_status-176"><span class="linenos">176</span></a>    <span class="k">def</span> <span class="nf">check_restore_status</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="FileManager.check_restore_status-177"><a href="#FileManager.check_restore_status-177"><span class="linenos">177</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of archived data.&quot;&quot;&quot;</span>
-</span><span id="FileManager.check_restore_status-178"><a href="#FileManager.check_restore_status-178"><span class="linenos">178</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager.check_restore_status-179"><a href="#FileManager.check_restore_status-179"><span class="linenos">179</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
-</span><span id="FileManager.check_restore_status-180"><a href="#FileManager.check_restore_status-180"><span class="linenos">180</span></a>
-</span><span id="FileManager.check_restore_status-181"><a href="#FileManager.check_restore_status-181"><span class="linenos">181</span></a>        <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
-</span><span id="FileManager.check_restore_status-182"><a href="#FileManager.check_restore_status-182"><span class="linenos">182</span></a>            <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
-</span><span id="FileManager.check_restore_status-183"><a href="#FileManager.check_restore_status-183"><span class="linenos">183</span></a>        <span class="p">)</span>
-</span><span id="FileManager.check_restore_status-184"><a href="#FileManager.check_restore_status-184"><span class="linenos">184</span></a>
-</span><span id="FileManager.check_restore_status-185"><a href="#FileManager.check_restore_status-185"><span class="linenos">185</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="FileManager.check_restore_status-186"><a href="#FileManager.check_restore_status-186"><span class="linenos">186</span></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span>
-</span><span id="FileManager.check_restore_status-187"><a href="#FileManager.check_restore_status-187"><span class="linenos">187</span></a><span class="s2">            Restore status:</span>
-</span><span id="FileManager.check_restore_status-188"><a href="#FileManager.check_restore_status-188"><span class="linenos">188</span></a><span class="s2">            - Not Started: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;not_started_objects&#39;</span><span class="p">)</span><span class="si">}</span>
-</span><span id="FileManager.check_restore_status-189"><a href="#FileManager.check_restore_status-189"><span class="linenos">189</span></a><span class="s2">            - Ongoing: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;ongoing_objects&#39;</span><span class="p">)</span><span class="si">}</span>
-</span><span id="FileManager.check_restore_status-190"><a href="#FileManager.check_restore_status-190"><span class="linenos">190</span></a><span class="s2">            - Restored: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;restored_objects&#39;</span><span class="p">)</span><span class="si">}</span>
-</span><span id="FileManager.check_restore_status-191"><a href="#FileManager.check_restore_status-191"><span class="linenos">191</span></a><span class="s2">            Total objects in this restore process: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;total_objects&#39;</span><span class="p">)</span><span class="si">}</span>
-</span><span id="FileManager.check_restore_status-192"><a href="#FileManager.check_restore_status-192"><span class="linenos">192</span></a><span class="s2">            &quot;&quot;&quot;</span>
-</span><span id="FileManager.check_restore_status-193"><a href="#FileManager.check_restore_status-193"><span class="linenos">193</span></a>        <span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.check_restore_status-256"><a href="#FileManager.check_restore_status-256"><span class="linenos">256</span></a>    <span class="k">def</span> <span class="nf">check_restore_status</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager.check_restore_status-257"><a href="#FileManager.check_restore_status-257"><span class="linenos">257</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of archived data.&quot;&quot;&quot;</span>
+</span><span id="FileManager.check_restore_status-258"><a href="#FileManager.check_restore_status-258"><span class="linenos">258</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager.check_restore_status-259"><a href="#FileManager.check_restore_status-259"><span class="linenos">259</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
+</span><span id="FileManager.check_restore_status-260"><a href="#FileManager.check_restore_status-260"><span class="linenos">260</span></a>
+</span><span id="FileManager.check_restore_status-261"><a href="#FileManager.check_restore_status-261"><span class="linenos">261</span></a>        <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
+</span><span id="FileManager.check_restore_status-262"><a href="#FileManager.check_restore_status-262"><span class="linenos">262</span></a>            <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
+</span><span id="FileManager.check_restore_status-263"><a href="#FileManager.check_restore_status-263"><span class="linenos">263</span></a>        <span class="p">)</span>
+</span><span id="FileManager.check_restore_status-264"><a href="#FileManager.check_restore_status-264"><span class="linenos">264</span></a>
+</span><span id="FileManager.check_restore_status-265"><a href="#FileManager.check_restore_status-265"><span class="linenos">265</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="FileManager.check_restore_status-266"><a href="#FileManager.check_restore_status-266"><span class="linenos">266</span></a>            <span class="sa">f</span><span class="s2">&quot;&quot;&quot;</span>
+</span><span id="FileManager.check_restore_status-267"><a href="#FileManager.check_restore_status-267"><span class="linenos">267</span></a><span class="s2">            Restore status:</span>
+</span><span id="FileManager.check_restore_status-268"><a href="#FileManager.check_restore_status-268"><span class="linenos">268</span></a><span class="s2">            - Not Started: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;not_started_objects&#39;</span><span class="p">)</span><span class="si">}</span>
+</span><span id="FileManager.check_restore_status-269"><a href="#FileManager.check_restore_status-269"><span class="linenos">269</span></a><span class="s2">            - Ongoing: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;ongoing_objects&#39;</span><span class="p">)</span><span class="si">}</span>
+</span><span id="FileManager.check_restore_status-270"><a href="#FileManager.check_restore_status-270"><span class="linenos">270</span></a><span class="s2">            - Restored: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;restored_objects&#39;</span><span class="p">)</span><span class="si">}</span>
+</span><span id="FileManager.check_restore_status-271"><a href="#FileManager.check_restore_status-271"><span class="linenos">271</span></a><span class="s2">            Total objects in this restore process: </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;total_objects&#39;</span><span class="p">)</span><span class="si">}</span>
+</span><span id="FileManager.check_restore_status-272"><a href="#FileManager.check_restore_status-272"><span class="linenos">272</span></a><span class="s2">            &quot;&quot;&quot;</span>
+</span><span id="FileManager.check_restore_status-273"><a href="#FileManager.check_restore_status-273"><span class="linenos">273</span></a>        <span class="p">)</span>
 </span></pre></div>
 
 
@@ -1089,45 +1200,45 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#FileManager.request_restore_to_destination_and_wait"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.request_restore_to_destination_and_wait-195"><a href="#FileManager.request_restore_to_destination_and_wait-195"><span class="linenos">195</span></a>    <span class="k">def</span> <span class="nf">request_restore_to_destination_and_wait</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-196"><a href="#FileManager.request_restore_to_destination_and_wait-196"><span class="linenos">196</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request and wait for the restore to complete, polling the restore status.</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-197"><a href="#FileManager.request_restore_to_destination_and_wait-197"><span class="linenos">197</span></a>
-</span><span id="FileManager.request_restore_to_destination_and_wait-198"><a href="#FileManager.request_restore_to_destination_and_wait-198"><span class="linenos">198</span></a><span class="sd">        After the restore is done, copy the restored files to destination</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-199"><a href="#FileManager.request_restore_to_destination_and_wait-199"><span class="linenos">199</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-200"><a href="#FileManager.request_restore_to_destination_and_wait-200"><span class="linenos">200</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-201"><a href="#FileManager.request_restore_to_destination_and_wait-201"><span class="linenos">201</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-202"><a href="#FileManager.request_restore_to_destination_and_wait-202"><span class="linenos">202</span></a>        <span class="n">destination_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_bucket&quot;</span><span class="p">]</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-203"><a href="#FileManager.request_restore_to_destination_and_wait-203"><span class="linenos">203</span></a>        <span class="n">destination_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_object&quot;</span><span class="p">]</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-204"><a href="#FileManager.request_restore_to_destination_and_wait-204"><span class="linenos">204</span></a>        <span class="n">restore_expiration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;restore_expiration&quot;</span><span class="p">]</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-205"><a href="#FileManager.request_restore_to_destination_and_wait-205"><span class="linenos">205</span></a>        <span class="n">retrieval_tier</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;retrieval_tier&quot;</span><span class="p">]</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-206"><a href="#FileManager.request_restore_to_destination_and_wait-206"><span class="linenos">206</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-207"><a href="#FileManager.request_restore_to_destination_and_wait-207"><span class="linenos">207</span></a>
-</span><span id="FileManager.request_restore_to_destination_and_wait-208"><a href="#FileManager.request_restore_to_destination_and_wait-208"><span class="linenos">208</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore_and_wait</span><span class="p">(</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-209"><a href="#FileManager.request_restore_to_destination_and_wait-209"><span class="linenos">209</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-210"><a href="#FileManager.request_restore_to_destination_and_wait-210"><span class="linenos">210</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-211"><a href="#FileManager.request_restore_to_destination_and_wait-211"><span class="linenos">211</span></a>            <span class="n">restore_expiration</span><span class="o">=</span><span class="n">restore_expiration</span><span class="p">,</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-212"><a href="#FileManager.request_restore_to_destination_and_wait-212"><span class="linenos">212</span></a>            <span class="n">retrieval_tier</span><span class="o">=</span><span class="n">retrieval_tier</span><span class="p">,</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-213"><a href="#FileManager.request_restore_to_destination_and_wait-213"><span class="linenos">213</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-214"><a href="#FileManager.request_restore_to_destination_and_wait-214"><span class="linenos">214</span></a>        <span class="p">)</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-215"><a href="#FileManager.request_restore_to_destination_and_wait-215"><span class="linenos">215</span></a>
-</span><span id="FileManager.request_restore_to_destination_and_wait-216"><a href="#FileManager.request_restore_to_destination_and_wait-216"><span class="linenos">216</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-217"><a href="#FileManager.request_restore_to_destination_and_wait-217"><span class="linenos">217</span></a>            <span class="sa">f</span><span class="s2">&quot;Restoration complete for </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2"> and </span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-218"><a href="#FileManager.request_restore_to_destination_and_wait-218"><span class="linenos">218</span></a>        <span class="p">)</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-219"><a href="#FileManager.request_restore_to_destination_and_wait-219"><span class="linenos">219</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-220"><a href="#FileManager.request_restore_to_destination_and_wait-220"><span class="linenos">220</span></a>            <span class="sa">f</span><span class="s2">&quot;Starting to copy data from </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2"> to &quot;</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-221"><a href="#FileManager.request_restore_to_destination_and_wait-221"><span class="linenos">221</span></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-222"><a href="#FileManager.request_restore_to_destination_and_wait-222"><span class="linenos">222</span></a>        <span class="p">)</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-223"><a href="#FileManager.request_restore_to_destination_and_wait-223"><span class="linenos">223</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_copy_objects</span><span class="p">(</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-224"><a href="#FileManager.request_restore_to_destination_and_wait-224"><span class="linenos">224</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-225"><a href="#FileManager.request_restore_to_destination_and_wait-225"><span class="linenos">225</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-226"><a href="#FileManager.request_restore_to_destination_and_wait-226"><span class="linenos">226</span></a>            <span class="n">destination_bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-227"><a href="#FileManager.request_restore_to_destination_and_wait-227"><span class="linenos">227</span></a>            <span class="n">destination_object</span><span class="o">=</span><span class="n">destination_object</span><span class="p">,</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-228"><a href="#FileManager.request_restore_to_destination_and_wait-228"><span class="linenos">228</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-229"><a href="#FileManager.request_restore_to_destination_and_wait-229"><span class="linenos">229</span></a>        <span class="p">)</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-230"><a href="#FileManager.request_restore_to_destination_and_wait-230"><span class="linenos">230</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-231"><a href="#FileManager.request_restore_to_destination_and_wait-231"><span class="linenos">231</span></a>            <span class="sa">f</span><span class="s2">&quot;Finished copying data, data should be available on </span><span class="si">{</span><span class="n">destination_bucket</span><span class="si">}</span><span class="s2">/&quot;</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-232"><a href="#FileManager.request_restore_to_destination_and_wait-232"><span class="linenos">232</span></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="FileManager.request_restore_to_destination_and_wait-233"><a href="#FileManager.request_restore_to_destination_and_wait-233"><span class="linenos">233</span></a>        <span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="FileManager.request_restore_to_destination_and_wait-275"><a href="#FileManager.request_restore_to_destination_and_wait-275"><span class="linenos">275</span></a>    <span class="k">def</span> <span class="nf">request_restore_to_destination_and_wait</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-276"><a href="#FileManager.request_restore_to_destination_and_wait-276"><span class="linenos">276</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request and wait for the restore to complete, polling the restore status.</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-277"><a href="#FileManager.request_restore_to_destination_and_wait-277"><span class="linenos">277</span></a>
+</span><span id="FileManager.request_restore_to_destination_and_wait-278"><a href="#FileManager.request_restore_to_destination_and_wait-278"><span class="linenos">278</span></a><span class="sd">        After the restore is done, copy the restored files to destination</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-279"><a href="#FileManager.request_restore_to_destination_and_wait-279"><span class="linenos">279</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-280"><a href="#FileManager.request_restore_to_destination_and_wait-280"><span class="linenos">280</span></a>        <span class="n">source_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-281"><a href="#FileManager.request_restore_to_destination_and_wait-281"><span class="linenos">281</span></a>        <span class="n">source_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;source_object&quot;</span><span class="p">]</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-282"><a href="#FileManager.request_restore_to_destination_and_wait-282"><span class="linenos">282</span></a>        <span class="n">destination_bucket</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_bucket&quot;</span><span class="p">]</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-283"><a href="#FileManager.request_restore_to_destination_and_wait-283"><span class="linenos">283</span></a>        <span class="n">destination_object</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;destination_object&quot;</span><span class="p">]</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-284"><a href="#FileManager.request_restore_to_destination_and_wait-284"><span class="linenos">284</span></a>        <span class="n">restore_expiration</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;restore_expiration&quot;</span><span class="p">]</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-285"><a href="#FileManager.request_restore_to_destination_and_wait-285"><span class="linenos">285</span></a>        <span class="n">retrieval_tier</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;retrieval_tier&quot;</span><span class="p">]</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-286"><a href="#FileManager.request_restore_to_destination_and_wait-286"><span class="linenos">286</span></a>        <span class="n">dry_run</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">configs</span><span class="p">[</span><span class="s2">&quot;dry_run&quot;</span><span class="p">]</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-287"><a href="#FileManager.request_restore_to_destination_and_wait-287"><span class="linenos">287</span></a>
+</span><span id="FileManager.request_restore_to_destination_and_wait-288"><a href="#FileManager.request_restore_to_destination_and_wait-288"><span class="linenos">288</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore_and_wait</span><span class="p">(</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-289"><a href="#FileManager.request_restore_to_destination_and_wait-289"><span class="linenos">289</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-290"><a href="#FileManager.request_restore_to_destination_and_wait-290"><span class="linenos">290</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-291"><a href="#FileManager.request_restore_to_destination_and_wait-291"><span class="linenos">291</span></a>            <span class="n">restore_expiration</span><span class="o">=</span><span class="n">restore_expiration</span><span class="p">,</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-292"><a href="#FileManager.request_restore_to_destination_and_wait-292"><span class="linenos">292</span></a>            <span class="n">retrieval_tier</span><span class="o">=</span><span class="n">retrieval_tier</span><span class="p">,</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-293"><a href="#FileManager.request_restore_to_destination_and_wait-293"><span class="linenos">293</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-294"><a href="#FileManager.request_restore_to_destination_and_wait-294"><span class="linenos">294</span></a>        <span class="p">)</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-295"><a href="#FileManager.request_restore_to_destination_and_wait-295"><span class="linenos">295</span></a>
+</span><span id="FileManager.request_restore_to_destination_and_wait-296"><a href="#FileManager.request_restore_to_destination_and_wait-296"><span class="linenos">296</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-297"><a href="#FileManager.request_restore_to_destination_and_wait-297"><span class="linenos">297</span></a>            <span class="sa">f</span><span class="s2">&quot;Restoration complete for </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2"> and </span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-298"><a href="#FileManager.request_restore_to_destination_and_wait-298"><span class="linenos">298</span></a>        <span class="p">)</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-299"><a href="#FileManager.request_restore_to_destination_and_wait-299"><span class="linenos">299</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-300"><a href="#FileManager.request_restore_to_destination_and_wait-300"><span class="linenos">300</span></a>            <span class="sa">f</span><span class="s2">&quot;Starting to copy data from </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">source_object</span><span class="si">}</span><span class="s2"> to &quot;</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-301"><a href="#FileManager.request_restore_to_destination_and_wait-301"><span class="linenos">301</span></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-302"><a href="#FileManager.request_restore_to_destination_and_wait-302"><span class="linenos">302</span></a>        <span class="p">)</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-303"><a href="#FileManager.request_restore_to_destination_and_wait-303"><span class="linenos">303</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_copy_objects</span><span class="p">(</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-304"><a href="#FileManager.request_restore_to_destination_and_wait-304"><span class="linenos">304</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-305"><a href="#FileManager.request_restore_to_destination_and_wait-305"><span class="linenos">305</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-306"><a href="#FileManager.request_restore_to_destination_and_wait-306"><span class="linenos">306</span></a>            <span class="n">destination_bucket</span><span class="o">=</span><span class="n">destination_bucket</span><span class="p">,</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-307"><a href="#FileManager.request_restore_to_destination_and_wait-307"><span class="linenos">307</span></a>            <span class="n">destination_object</span><span class="o">=</span><span class="n">destination_object</span><span class="p">,</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-308"><a href="#FileManager.request_restore_to_destination_and_wait-308"><span class="linenos">308</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-309"><a href="#FileManager.request_restore_to_destination_and_wait-309"><span class="linenos">309</span></a>        <span class="p">)</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-310"><a href="#FileManager.request_restore_to_destination_and_wait-310"><span class="linenos">310</span></a>        <span class="n">FileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-311"><a href="#FileManager.request_restore_to_destination_and_wait-311"><span class="linenos">311</span></a>            <span class="sa">f</span><span class="s2">&quot;Finished copying data, data should be available on </span><span class="si">{</span><span class="n">destination_bucket</span><span class="si">}</span><span class="s2">/&quot;</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-312"><a href="#FileManager.request_restore_to_destination_and_wait-312"><span class="linenos">312</span></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">destination_object</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="FileManager.request_restore_to_destination_and_wait-313"><a href="#FileManager.request_restore_to_destination_and_wait-313"><span class="linenos">313</span></a>        <span class="p">)</span>
 </span></pre></div>
 
 
@@ -1150,240 +1261,249 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#ArchiveFileManager"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="ArchiveFileManager-294"><a href="#ArchiveFileManager-294"><span class="linenos">294</span></a><span class="k">class</span> <span class="nc">ArchiveFileManager</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
-</span><span id="ArchiveFileManager-295"><a href="#ArchiveFileManager-295"><span class="linenos">295</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Set of actions to restore archives.&quot;&quot;&quot;</span>
-</span><span id="ArchiveFileManager-296"><a href="#ArchiveFileManager-296"><span class="linenos">296</span></a>
-</span><span id="ArchiveFileManager-297"><a href="#ArchiveFileManager-297"><span class="linenos">297</span></a>    <span class="n">_logger</span> <span class="o">=</span> <span class="n">LoggingHandler</span><span class="p">(</span><span class="vm">__name__</span><span class="p">)</span><span class="o">.</span><span class="n">get_logger</span><span class="p">()</span>
-</span><span id="ArchiveFileManager-298"><a href="#ArchiveFileManager-298"><span class="linenos">298</span></a>
-</span><span id="ArchiveFileManager-299"><a href="#ArchiveFileManager-299"><span class="linenos">299</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="ArchiveFileManager-300"><a href="#ArchiveFileManager-300"><span class="linenos">300</span></a>    <span class="k">def</span> <span class="nf">_get_archived_object</span><span class="p">(</span><span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_key</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Any</span><span class="p">]:</span>
-</span><span id="ArchiveFileManager-301"><a href="#ArchiveFileManager-301"><span class="linenos">301</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get the archived object if it&#39;s an object.</span>
-</span><span id="ArchiveFileManager-302"><a href="#ArchiveFileManager-302"><span class="linenos">302</span></a>
-</span><span id="ArchiveFileManager-303"><a href="#ArchiveFileManager-303"><span class="linenos">303</span></a><span class="sd">        Args:</span>
-</span><span id="ArchiveFileManager-304"><a href="#ArchiveFileManager-304"><span class="linenos">304</span></a><span class="sd">            bucket: name of bucket to check get the object.</span>
-</span><span id="ArchiveFileManager-305"><a href="#ArchiveFileManager-305"><span class="linenos">305</span></a><span class="sd">            object_key: object to get.</span>
-</span><span id="ArchiveFileManager-306"><a href="#ArchiveFileManager-306"><span class="linenos">306</span></a>
-</span><span id="ArchiveFileManager-307"><a href="#ArchiveFileManager-307"><span class="linenos">307</span></a><span class="sd">        Returns:</span>
-</span><span id="ArchiveFileManager-308"><a href="#ArchiveFileManager-308"><span class="linenos">308</span></a><span class="sd">            S3 Object if it&#39;s an archived object, otherwise None.</span>
-</span><span id="ArchiveFileManager-309"><a href="#ArchiveFileManager-309"><span class="linenos">309</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="ArchiveFileManager-310"><a href="#ArchiveFileManager-310"><span class="linenos">310</span></a>        <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">resource</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
-</span><span id="ArchiveFileManager-311"><a href="#ArchiveFileManager-311"><span class="linenos">311</span></a>        <span class="n">object_to_restore</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">Object</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">)</span>
-</span><span id="ArchiveFileManager-312"><a href="#ArchiveFileManager-312"><span class="linenos">312</span></a>
-</span><span id="ArchiveFileManager-313"><a href="#ArchiveFileManager-313"><span class="linenos">313</span></a>        <span class="k">if</span> <span class="p">(</span>
-</span><span id="ArchiveFileManager-314"><a href="#ArchiveFileManager-314"><span class="linenos">314</span></a>            <span class="n">object_to_restore</span><span class="o">.</span><span class="n">storage_class</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span>
-</span><span id="ArchiveFileManager-315"><a href="#ArchiveFileManager-315"><span class="linenos">315</span></a>            <span class="ow">and</span> <span class="n">object_to_restore</span><span class="o">.</span><span class="n">storage_class</span> <span class="ow">in</span> <span class="n">ARCHIVE_STORAGE_CLASS</span>
-</span><span id="ArchiveFileManager-316"><a href="#ArchiveFileManager-316"><span class="linenos">316</span></a>        <span class="p">):</span>
-</span><span id="ArchiveFileManager-317"><a href="#ArchiveFileManager-317"><span class="linenos">317</span></a>            <span class="k">return</span> <span class="n">object_to_restore</span>
-</span><span id="ArchiveFileManager-318"><a href="#ArchiveFileManager-318"><span class="linenos">318</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-319"><a href="#ArchiveFileManager-319"><span class="linenos">319</span></a>            <span class="k">return</span> <span class="kc">None</span>
-</span><span id="ArchiveFileManager-320"><a href="#ArchiveFileManager-320"><span class="linenos">320</span></a>
-</span><span id="ArchiveFileManager-321"><a href="#ArchiveFileManager-321"><span class="linenos">321</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="ArchiveFileManager-322"><a href="#ArchiveFileManager-322"><span class="linenos">322</span></a>    <span class="k">def</span> <span class="nf">_check_object_restore_status</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-323"><a href="#ArchiveFileManager-323"><span class="linenos">323</span></a>        <span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_key</span><span class="p">:</span> <span class="nb">str</span>
-</span><span id="ArchiveFileManager-324"><a href="#ArchiveFileManager-324"><span class="linenos">324</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">RestoreStatus</span><span class="p">]:</span>
-</span><span id="ArchiveFileManager-325"><a href="#ArchiveFileManager-325"><span class="linenos">325</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of the archive.</span>
-</span><span id="ArchiveFileManager-326"><a href="#ArchiveFileManager-326"><span class="linenos">326</span></a>
-</span><span id="ArchiveFileManager-327"><a href="#ArchiveFileManager-327"><span class="linenos">327</span></a><span class="sd">        Args:</span>
-</span><span id="ArchiveFileManager-328"><a href="#ArchiveFileManager-328"><span class="linenos">328</span></a><span class="sd">            bucket: name of bucket to check the restore status.</span>
-</span><span id="ArchiveFileManager-329"><a href="#ArchiveFileManager-329"><span class="linenos">329</span></a><span class="sd">            object_key: object to check the restore status.</span>
-</span><span id="ArchiveFileManager-330"><a href="#ArchiveFileManager-330"><span class="linenos">330</span></a>
-</span><span id="ArchiveFileManager-331"><a href="#ArchiveFileManager-331"><span class="linenos">331</span></a><span class="sd">        Returns:</span>
-</span><span id="ArchiveFileManager-332"><a href="#ArchiveFileManager-332"><span class="linenos">332</span></a><span class="sd">            The restore status represented by an enum, possible values are:</span>
-</span><span id="ArchiveFileManager-333"><a href="#ArchiveFileManager-333"><span class="linenos">333</span></a><span class="sd">                NOT_STARTED, ONGOING or RESTORED</span>
-</span><span id="ArchiveFileManager-334"><a href="#ArchiveFileManager-334"><span class="linenos">334</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="ArchiveFileManager-335"><a href="#ArchiveFileManager-335"><span class="linenos">335</span></a>        <span class="n">archived_object</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_get_archived_object</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">)</span>
-</span><span id="ArchiveFileManager-336"><a href="#ArchiveFileManager-336"><span class="linenos">336</span></a>
-</span><span id="ArchiveFileManager-337"><a href="#ArchiveFileManager-337"><span class="linenos">337</span></a>        <span class="k">if</span> <span class="n">archived_object</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-338"><a href="#ArchiveFileManager-338"><span class="linenos">338</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="ArchiveFileManager-339"><a href="#ArchiveFileManager-339"><span class="linenos">339</span></a>        <span class="k">elif</span> <span class="n">archived_object</span><span class="o">.</span><span class="n">restore</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-340"><a href="#ArchiveFileManager-340"><span class="linenos">340</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">NOT_STARTED</span>
-</span><span id="ArchiveFileManager-341"><a href="#ArchiveFileManager-341"><span class="linenos">341</span></a>        <span class="k">elif</span> <span class="s1">&#39;ongoing-request=&quot;true&quot;&#39;</span> <span class="ow">in</span> <span class="n">archived_object</span><span class="o">.</span><span class="n">restore</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-342"><a href="#ArchiveFileManager-342"><span class="linenos">342</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">ONGOING</span>
-</span><span id="ArchiveFileManager-343"><a href="#ArchiveFileManager-343"><span class="linenos">343</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-344"><a href="#ArchiveFileManager-344"><span class="linenos">344</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">RESTORED</span>
-</span><span id="ArchiveFileManager-345"><a href="#ArchiveFileManager-345"><span class="linenos">345</span></a>
-</span><span id="ArchiveFileManager-346"><a href="#ArchiveFileManager-346"><span class="linenos">346</span></a>        <span class="k">return</span> <span class="n">status</span>
-</span><span id="ArchiveFileManager-347"><a href="#ArchiveFileManager-347"><span class="linenos">347</span></a>
-</span><span id="ArchiveFileManager-348"><a href="#ArchiveFileManager-348"><span class="linenos">348</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="ArchiveFileManager-349"><a href="#ArchiveFileManager-349"><span class="linenos">349</span></a>    <span class="k">def</span> <span class="nf">check_restore_status</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-350"><a href="#ArchiveFileManager-350"><span class="linenos">350</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of archived data.</span>
-</span><span id="ArchiveFileManager-351"><a href="#ArchiveFileManager-351"><span class="linenos">351</span></a>
-</span><span id="ArchiveFileManager-352"><a href="#ArchiveFileManager-352"><span class="linenos">352</span></a><span class="sd">        Args:</span>
-</span><span id="ArchiveFileManager-353"><a href="#ArchiveFileManager-353"><span class="linenos">353</span></a><span class="sd">            source_bucket: name of bucket to check the restore status.</span>
-</span><span id="ArchiveFileManager-354"><a href="#ArchiveFileManager-354"><span class="linenos">354</span></a><span class="sd">            source_object: object to check the restore status.</span>
-</span><span id="ArchiveFileManager-355"><a href="#ArchiveFileManager-355"><span class="linenos">355</span></a>
-</span><span id="ArchiveFileManager-356"><a href="#ArchiveFileManager-356"><span class="linenos">356</span></a><span class="sd">        Returns:</span>
-</span><span id="ArchiveFileManager-357"><a href="#ArchiveFileManager-357"><span class="linenos">357</span></a><span class="sd">            A dict containing the amount of objects in each status.</span>
-</span><span id="ArchiveFileManager-358"><a href="#ArchiveFileManager-358"><span class="linenos">358</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="ArchiveFileManager-359"><a href="#ArchiveFileManager-359"><span class="linenos">359</span></a>        <span class="n">not_started_objects</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="ArchiveFileManager-360"><a href="#ArchiveFileManager-360"><span class="linenos">360</span></a>        <span class="n">ongoing_objects</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="ArchiveFileManager-361"><a href="#ArchiveFileManager-361"><span class="linenos">361</span></a>        <span class="n">restored_objects</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="ArchiveFileManager-362"><a href="#ArchiveFileManager-362"><span class="linenos">362</span></a>        <span class="n">total_objects</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="ArchiveFileManager-363"><a href="#ArchiveFileManager-363"><span class="linenos">363</span></a>
-</span><span id="ArchiveFileManager-364"><a href="#ArchiveFileManager-364"><span class="linenos">364</span></a>        <span class="n">objects_to_restore</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-365"><a href="#ArchiveFileManager-365"><span class="linenos">365</span></a>            <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
-</span><span id="ArchiveFileManager-366"><a href="#ArchiveFileManager-366"><span class="linenos">366</span></a>        <span class="p">)</span>
-</span><span id="ArchiveFileManager-367"><a href="#ArchiveFileManager-367"><span class="linenos">367</span></a>
-</span><span id="ArchiveFileManager-368"><a href="#ArchiveFileManager-368"><span class="linenos">368</span></a>        <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_to_restore</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-369"><a href="#ArchiveFileManager-369"><span class="linenos">369</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Checking restore status for: </span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="ArchiveFileManager-370"><a href="#ArchiveFileManager-370"><span class="linenos">370</span></a>
-</span><span id="ArchiveFileManager-371"><a href="#ArchiveFileManager-371"><span class="linenos">371</span></a>            <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_check_object_restore_status</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-372"><a href="#ArchiveFileManager-372"><span class="linenos">372</span></a>                <span class="n">source_bucket</span><span class="p">,</span> <span class="n">obj</span>
-</span><span id="ArchiveFileManager-373"><a href="#ArchiveFileManager-373"><span class="linenos">373</span></a>            <span class="p">)</span>
-</span><span id="ArchiveFileManager-374"><a href="#ArchiveFileManager-374"><span class="linenos">374</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">restore_status</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-375"><a href="#ArchiveFileManager-375"><span class="linenos">375</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-376"><a href="#ArchiveFileManager-376"><span class="linenos">376</span></a>                    <span class="sa">f</span><span class="s2">&quot;Restore status not found for </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="ArchiveFileManager-377"><a href="#ArchiveFileManager-377"><span class="linenos">377</span></a>                <span class="p">)</span>
-</span><span id="ArchiveFileManager-378"><a href="#ArchiveFileManager-378"><span class="linenos">378</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-379"><a href="#ArchiveFileManager-379"><span class="linenos">379</span></a>                <span class="n">total_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="ArchiveFileManager-378"><a href="#ArchiveFileManager-378"><span class="linenos">378</span></a><span class="k">class</span> <span class="nc">ArchiveFileManager</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
+</span><span id="ArchiveFileManager-379"><a href="#ArchiveFileManager-379"><span class="linenos">379</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Set of actions to restore archives.&quot;&quot;&quot;</span>
 </span><span id="ArchiveFileManager-380"><a href="#ArchiveFileManager-380"><span class="linenos">380</span></a>
-</span><span id="ArchiveFileManager-381"><a href="#ArchiveFileManager-381"><span class="linenos">381</span></a>                <span class="k">if</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">NOT_STARTED</span> <span class="o">==</span> <span class="n">restore_status</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-382"><a href="#ArchiveFileManager-382"><span class="linenos">382</span></a>                    <span class="n">not_started_objects</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="ArchiveFileManager-383"><a href="#ArchiveFileManager-383"><span class="linenos">383</span></a>                <span class="k">elif</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">ONGOING</span> <span class="o">==</span> <span class="n">restore_status</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-384"><a href="#ArchiveFileManager-384"><span class="linenos">384</span></a>                    <span class="n">ongoing_objects</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="ArchiveFileManager-385"><a href="#ArchiveFileManager-385"><span class="linenos">385</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-386"><a href="#ArchiveFileManager-386"><span class="linenos">386</span></a>                    <span class="n">restored_objects</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="ArchiveFileManager-387"><a href="#ArchiveFileManager-387"><span class="linenos">387</span></a>
-</span><span id="ArchiveFileManager-388"><a href="#ArchiveFileManager-388"><span class="linenos">388</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-389"><a href="#ArchiveFileManager-389"><span class="linenos">389</span></a>                    <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2"> restore status is </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">value</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="ArchiveFileManager-390"><a href="#ArchiveFileManager-390"><span class="linenos">390</span></a>                <span class="p">)</span>
-</span><span id="ArchiveFileManager-391"><a href="#ArchiveFileManager-391"><span class="linenos">391</span></a>
-</span><span id="ArchiveFileManager-392"><a href="#ArchiveFileManager-392"><span class="linenos">392</span></a>        <span class="k">return</span> <span class="p">{</span>
-</span><span id="ArchiveFileManager-393"><a href="#ArchiveFileManager-393"><span class="linenos">393</span></a>            <span class="s2">&quot;total_objects&quot;</span><span class="p">:</span> <span class="n">total_objects</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-394"><a href="#ArchiveFileManager-394"><span class="linenos">394</span></a>            <span class="s2">&quot;not_started_objects&quot;</span><span class="p">:</span> <span class="n">not_started_objects</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-395"><a href="#ArchiveFileManager-395"><span class="linenos">395</span></a>            <span class="s2">&quot;ongoing_objects&quot;</span><span class="p">:</span> <span class="n">ongoing_objects</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-396"><a href="#ArchiveFileManager-396"><span class="linenos">396</span></a>            <span class="s2">&quot;restored_objects&quot;</span><span class="p">:</span> <span class="n">restored_objects</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-397"><a href="#ArchiveFileManager-397"><span class="linenos">397</span></a>        <span class="p">}</span>
-</span><span id="ArchiveFileManager-398"><a href="#ArchiveFileManager-398"><span class="linenos">398</span></a>
-</span><span id="ArchiveFileManager-399"><a href="#ArchiveFileManager-399"><span class="linenos">399</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="ArchiveFileManager-400"><a href="#ArchiveFileManager-400"><span class="linenos">400</span></a>    <span class="k">def</span> <span class="nf">_request_restore_object</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-401"><a href="#ArchiveFileManager-401"><span class="linenos">401</span></a>        <span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_key</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span>
-</span><span id="ArchiveFileManager-402"><a href="#ArchiveFileManager-402"><span class="linenos">402</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-403"><a href="#ArchiveFileManager-403"><span class="linenos">403</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request a restore of the archive.</span>
+</span><span id="ArchiveFileManager-381"><a href="#ArchiveFileManager-381"><span class="linenos">381</span></a>    <span class="n">_logger</span> <span class="o">=</span> <span class="n">LoggingHandler</span><span class="p">(</span><span class="vm">__name__</span><span class="p">)</span><span class="o">.</span><span class="n">get_logger</span><span class="p">()</span>
+</span><span id="ArchiveFileManager-382"><a href="#ArchiveFileManager-382"><span class="linenos">382</span></a>
+</span><span id="ArchiveFileManager-383"><a href="#ArchiveFileManager-383"><span class="linenos">383</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="ArchiveFileManager-384"><a href="#ArchiveFileManager-384"><span class="linenos">384</span></a>    <span class="k">def</span> <span class="nf">_get_archived_object</span><span class="p">(</span><span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_key</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Any</span><span class="p">]:</span>
+</span><span id="ArchiveFileManager-385"><a href="#ArchiveFileManager-385"><span class="linenos">385</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Get the archived object if it&#39;s an object.</span>
+</span><span id="ArchiveFileManager-386"><a href="#ArchiveFileManager-386"><span class="linenos">386</span></a>
+</span><span id="ArchiveFileManager-387"><a href="#ArchiveFileManager-387"><span class="linenos">387</span></a><span class="sd">        Args:</span>
+</span><span id="ArchiveFileManager-388"><a href="#ArchiveFileManager-388"><span class="linenos">388</span></a><span class="sd">            bucket: name of bucket to check get the object.</span>
+</span><span id="ArchiveFileManager-389"><a href="#ArchiveFileManager-389"><span class="linenos">389</span></a><span class="sd">            object_key: object to get.</span>
+</span><span id="ArchiveFileManager-390"><a href="#ArchiveFileManager-390"><span class="linenos">390</span></a>
+</span><span id="ArchiveFileManager-391"><a href="#ArchiveFileManager-391"><span class="linenos">391</span></a><span class="sd">        Returns:</span>
+</span><span id="ArchiveFileManager-392"><a href="#ArchiveFileManager-392"><span class="linenos">392</span></a><span class="sd">            S3 Object if it&#39;s an archived object, otherwise None.</span>
+</span><span id="ArchiveFileManager-393"><a href="#ArchiveFileManager-393"><span class="linenos">393</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ArchiveFileManager-394"><a href="#ArchiveFileManager-394"><span class="linenos">394</span></a>        <span class="n">s3</span> <span class="o">=</span> <span class="n">boto3</span><span class="o">.</span><span class="n">resource</span><span class="p">(</span><span class="s2">&quot;s3&quot;</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-395"><a href="#ArchiveFileManager-395"><span class="linenos">395</span></a>        <span class="n">object_to_restore</span> <span class="o">=</span> <span class="n">s3</span><span class="o">.</span><span class="n">Object</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-396"><a href="#ArchiveFileManager-396"><span class="linenos">396</span></a>
+</span><span id="ArchiveFileManager-397"><a href="#ArchiveFileManager-397"><span class="linenos">397</span></a>        <span class="k">if</span> <span class="p">(</span>
+</span><span id="ArchiveFileManager-398"><a href="#ArchiveFileManager-398"><span class="linenos">398</span></a>            <span class="n">object_to_restore</span><span class="o">.</span><span class="n">storage_class</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span>
+</span><span id="ArchiveFileManager-399"><a href="#ArchiveFileManager-399"><span class="linenos">399</span></a>            <span class="ow">and</span> <span class="n">object_to_restore</span><span class="o">.</span><span class="n">storage_class</span> <span class="ow">in</span> <span class="n">ARCHIVE_STORAGE_CLASS</span>
+</span><span id="ArchiveFileManager-400"><a href="#ArchiveFileManager-400"><span class="linenos">400</span></a>        <span class="p">):</span>
+</span><span id="ArchiveFileManager-401"><a href="#ArchiveFileManager-401"><span class="linenos">401</span></a>            <span class="k">return</span> <span class="n">object_to_restore</span>
+</span><span id="ArchiveFileManager-402"><a href="#ArchiveFileManager-402"><span class="linenos">402</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-403"><a href="#ArchiveFileManager-403"><span class="linenos">403</span></a>            <span class="k">return</span> <span class="kc">None</span>
 </span><span id="ArchiveFileManager-404"><a href="#ArchiveFileManager-404"><span class="linenos">404</span></a>
-</span><span id="ArchiveFileManager-405"><a href="#ArchiveFileManager-405"><span class="linenos">405</span></a><span class="sd">        Args:</span>
-</span><span id="ArchiveFileManager-406"><a href="#ArchiveFileManager-406"><span class="linenos">406</span></a><span class="sd">            bucket: name of bucket to perform the restore.</span>
-</span><span id="ArchiveFileManager-407"><a href="#ArchiveFileManager-407"><span class="linenos">407</span></a><span class="sd">            object_key: object to be restored.</span>
-</span><span id="ArchiveFileManager-408"><a href="#ArchiveFileManager-408"><span class="linenos">408</span></a><span class="sd">            expiration: restore expiration.</span>
-</span><span id="ArchiveFileManager-409"><a href="#ArchiveFileManager-409"><span class="linenos">409</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
-</span><span id="ArchiveFileManager-410"><a href="#ArchiveFileManager-410"><span class="linenos">410</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
-</span><span id="ArchiveFileManager-411"><a href="#ArchiveFileManager-411"><span class="linenos">411</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="ArchiveFileManager-412"><a href="#ArchiveFileManager-412"><span class="linenos">412</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">RestoreType</span><span class="o">.</span><span class="n">exists</span><span class="p">(</span><span class="n">retrieval_tier</span><span class="p">):</span>
-</span><span id="ArchiveFileManager-413"><a href="#ArchiveFileManager-413"><span class="linenos">413</span></a>            <span class="k">raise</span> <span class="n">RestoreTypeNotFoundException</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-414"><a href="#ArchiveFileManager-414"><span class="linenos">414</span></a>                <span class="sa">f</span><span class="s2">&quot;Restore type </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not supported.&quot;</span>
-</span><span id="ArchiveFileManager-415"><a href="#ArchiveFileManager-415"><span class="linenos">415</span></a>            <span class="p">)</span>
-</span><span id="ArchiveFileManager-416"><a href="#ArchiveFileManager-416"><span class="linenos">416</span></a>
-</span><span id="ArchiveFileManager-417"><a href="#ArchiveFileManager-417"><span class="linenos">417</span></a>        <span class="n">archived_object</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_get_archived_object</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">)</span>
-</span><span id="ArchiveFileManager-418"><a href="#ArchiveFileManager-418"><span class="linenos">418</span></a>
-</span><span id="ArchiveFileManager-419"><a href="#ArchiveFileManager-419"><span class="linenos">419</span></a>        <span class="k">if</span> <span class="n">archived_object</span> <span class="ow">and</span> <span class="n">archived_object</span><span class="o">.</span><span class="n">restore</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-420"><a href="#ArchiveFileManager-420"><span class="linenos">420</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restoring archive </span><span class="si">{</span><span class="n">bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">object_key</span><span class="si">}</span><span class="s2">.&quot;</span><span class="p">)</span>
-</span><span id="ArchiveFileManager-421"><a href="#ArchiveFileManager-421"><span class="linenos">421</span></a>            <span class="n">archived_object</span><span class="o">.</span><span class="n">restore_object</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-422"><a href="#ArchiveFileManager-422"><span class="linenos">422</span></a>                <span class="n">RestoreRequest</span><span class="o">=</span><span class="p">{</span>
-</span><span id="ArchiveFileManager-423"><a href="#ArchiveFileManager-423"><span class="linenos">423</span></a>                    <span class="s2">&quot;Days&quot;</span><span class="p">:</span> <span class="n">expiration</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-424"><a href="#ArchiveFileManager-424"><span class="linenos">424</span></a>                    <span class="s2">&quot;GlacierJobParameters&quot;</span><span class="p">:</span> <span class="p">{</span><span class="s2">&quot;Tier&quot;</span><span class="p">:</span> <span class="n">retrieval_tier</span><span class="p">},</span>
-</span><span id="ArchiveFileManager-425"><a href="#ArchiveFileManager-425"><span class="linenos">425</span></a>                <span class="p">}</span>
-</span><span id="ArchiveFileManager-426"><a href="#ArchiveFileManager-426"><span class="linenos">426</span></a>            <span class="p">)</span>
+</span><span id="ArchiveFileManager-405"><a href="#ArchiveFileManager-405"><span class="linenos">405</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="ArchiveFileManager-406"><a href="#ArchiveFileManager-406"><span class="linenos">406</span></a>    <span class="k">def</span> <span class="nf">_check_object_restore_status</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-407"><a href="#ArchiveFileManager-407"><span class="linenos">407</span></a>        <span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_key</span><span class="p">:</span> <span class="nb">str</span>
+</span><span id="ArchiveFileManager-408"><a href="#ArchiveFileManager-408"><span class="linenos">408</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="n">RestoreStatus</span><span class="p">]:</span>
+</span><span id="ArchiveFileManager-409"><a href="#ArchiveFileManager-409"><span class="linenos">409</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of the archive.</span>
+</span><span id="ArchiveFileManager-410"><a href="#ArchiveFileManager-410"><span class="linenos">410</span></a>
+</span><span id="ArchiveFileManager-411"><a href="#ArchiveFileManager-411"><span class="linenos">411</span></a><span class="sd">        Args:</span>
+</span><span id="ArchiveFileManager-412"><a href="#ArchiveFileManager-412"><span class="linenos">412</span></a><span class="sd">            bucket: name of bucket to check the restore status.</span>
+</span><span id="ArchiveFileManager-413"><a href="#ArchiveFileManager-413"><span class="linenos">413</span></a><span class="sd">            object_key: object to check the restore status.</span>
+</span><span id="ArchiveFileManager-414"><a href="#ArchiveFileManager-414"><span class="linenos">414</span></a>
+</span><span id="ArchiveFileManager-415"><a href="#ArchiveFileManager-415"><span class="linenos">415</span></a><span class="sd">        Returns:</span>
+</span><span id="ArchiveFileManager-416"><a href="#ArchiveFileManager-416"><span class="linenos">416</span></a><span class="sd">            The restore status represented by an enum, possible values are:</span>
+</span><span id="ArchiveFileManager-417"><a href="#ArchiveFileManager-417"><span class="linenos">417</span></a><span class="sd">                NOT_STARTED, ONGOING or RESTORED</span>
+</span><span id="ArchiveFileManager-418"><a href="#ArchiveFileManager-418"><span class="linenos">418</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ArchiveFileManager-419"><a href="#ArchiveFileManager-419"><span class="linenos">419</span></a>        <span class="n">archived_object</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_get_archived_object</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-420"><a href="#ArchiveFileManager-420"><span class="linenos">420</span></a>
+</span><span id="ArchiveFileManager-421"><a href="#ArchiveFileManager-421"><span class="linenos">421</span></a>        <span class="k">if</span> <span class="n">archived_object</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-422"><a href="#ArchiveFileManager-422"><span class="linenos">422</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="ArchiveFileManager-423"><a href="#ArchiveFileManager-423"><span class="linenos">423</span></a>        <span class="k">elif</span> <span class="n">archived_object</span><span class="o">.</span><span class="n">restore</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-424"><a href="#ArchiveFileManager-424"><span class="linenos">424</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">NOT_STARTED</span>
+</span><span id="ArchiveFileManager-425"><a href="#ArchiveFileManager-425"><span class="linenos">425</span></a>        <span class="k">elif</span> <span class="s1">&#39;ongoing-request=&quot;true&quot;&#39;</span> <span class="ow">in</span> <span class="n">archived_object</span><span class="o">.</span><span class="n">restore</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-426"><a href="#ArchiveFileManager-426"><span class="linenos">426</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">ONGOING</span>
 </span><span id="ArchiveFileManager-427"><a href="#ArchiveFileManager-427"><span class="linenos">427</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-428"><a href="#ArchiveFileManager-428"><span class="linenos">428</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-429"><a href="#ArchiveFileManager-429"><span class="linenos">429</span></a>                <span class="sa">f</span><span class="s2">&quot;Restore request for </span><span class="si">{</span><span class="n">bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">object_key</span><span class="si">}</span><span class="s2"> not performed.&quot;</span>
-</span><span id="ArchiveFileManager-430"><a href="#ArchiveFileManager-430"><span class="linenos">430</span></a>            <span class="p">)</span>
+</span><span id="ArchiveFileManager-428"><a href="#ArchiveFileManager-428"><span class="linenos">428</span></a>            <span class="n">status</span> <span class="o">=</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">RESTORED</span>
+</span><span id="ArchiveFileManager-429"><a href="#ArchiveFileManager-429"><span class="linenos">429</span></a>
+</span><span id="ArchiveFileManager-430"><a href="#ArchiveFileManager-430"><span class="linenos">430</span></a>        <span class="k">return</span> <span class="n">status</span>
 </span><span id="ArchiveFileManager-431"><a href="#ArchiveFileManager-431"><span class="linenos">431</span></a>
 </span><span id="ArchiveFileManager-432"><a href="#ArchiveFileManager-432"><span class="linenos">432</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="ArchiveFileManager-433"><a href="#ArchiveFileManager-433"><span class="linenos">433</span></a>    <span class="k">def</span> <span class="nf">request_restore</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-434"><a href="#ArchiveFileManager-434"><span class="linenos">434</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-435"><a href="#ArchiveFileManager-435"><span class="linenos">435</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-436"><a href="#ArchiveFileManager-436"><span class="linenos">436</span></a>        <span class="n">restore_expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-437"><a href="#ArchiveFileManager-437"><span class="linenos">437</span></a>        <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-438"><a href="#ArchiveFileManager-438"><span class="linenos">438</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-439"><a href="#ArchiveFileManager-439"><span class="linenos">439</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-440"><a href="#ArchiveFileManager-440"><span class="linenos">440</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request the restore of archived data.</span>
-</span><span id="ArchiveFileManager-441"><a href="#ArchiveFileManager-441"><span class="linenos">441</span></a>
-</span><span id="ArchiveFileManager-442"><a href="#ArchiveFileManager-442"><span class="linenos">442</span></a><span class="sd">        Args:</span>
-</span><span id="ArchiveFileManager-443"><a href="#ArchiveFileManager-443"><span class="linenos">443</span></a><span class="sd">            source_bucket: name of bucket to perform the restore.</span>
-</span><span id="ArchiveFileManager-444"><a href="#ArchiveFileManager-444"><span class="linenos">444</span></a><span class="sd">            source_object: object to be restored.</span>
-</span><span id="ArchiveFileManager-445"><a href="#ArchiveFileManager-445"><span class="linenos">445</span></a><span class="sd">            restore_expiration: restore expiration in days.</span>
-</span><span id="ArchiveFileManager-446"><a href="#ArchiveFileManager-446"><span class="linenos">446</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
-</span><span id="ArchiveFileManager-447"><a href="#ArchiveFileManager-447"><span class="linenos">447</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
-</span><span id="ArchiveFileManager-448"><a href="#ArchiveFileManager-448"><span class="linenos">448</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
-</span><span id="ArchiveFileManager-449"><a href="#ArchiveFileManager-449"><span class="linenos">449</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
-</span><span id="ArchiveFileManager-450"><a href="#ArchiveFileManager-450"><span class="linenos">450</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="ArchiveFileManager-451"><a href="#ArchiveFileManager-451"><span class="linenos">451</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-452"><a href="#ArchiveFileManager-452"><span class="linenos">452</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="p">[</span><span class="n">source_object</span><span class="p">])</span>
-</span><span id="ArchiveFileManager-453"><a href="#ArchiveFileManager-453"><span class="linenos">453</span></a>
-</span><span id="ArchiveFileManager-454"><a href="#ArchiveFileManager-454"><span class="linenos">454</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be restored:&quot;</span><span class="p">)</span>
-</span><span id="ArchiveFileManager-455"><a href="#ArchiveFileManager-455"><span class="linenos">455</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
-</span><span id="ArchiveFileManager-456"><a href="#ArchiveFileManager-456"><span class="linenos">456</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-457"><a href="#ArchiveFileManager-457"><span class="linenos">457</span></a>            <span class="n">objects_to_restore</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-458"><a href="#ArchiveFileManager-458"><span class="linenos">458</span></a>                <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
-</span><span id="ArchiveFileManager-459"><a href="#ArchiveFileManager-459"><span class="linenos">459</span></a>            <span class="p">)</span>
-</span><span id="ArchiveFileManager-460"><a href="#ArchiveFileManager-460"><span class="linenos">460</span></a>
-</span><span id="ArchiveFileManager-461"><a href="#ArchiveFileManager-461"><span class="linenos">461</span></a>            <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_to_restore</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-462"><a href="#ArchiveFileManager-462"><span class="linenos">462</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_request_restore_object</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-463"><a href="#ArchiveFileManager-463"><span class="linenos">463</span></a>                    <span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-464"><a href="#ArchiveFileManager-464"><span class="linenos">464</span></a>                    <span class="n">obj</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-465"><a href="#ArchiveFileManager-465"><span class="linenos">465</span></a>                    <span class="n">restore_expiration</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-466"><a href="#ArchiveFileManager-466"><span class="linenos">466</span></a>                    <span class="n">retrieval_tier</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-467"><a href="#ArchiveFileManager-467"><span class="linenos">467</span></a>                <span class="p">)</span>
-</span><span id="ArchiveFileManager-468"><a href="#ArchiveFileManager-468"><span class="linenos">468</span></a>
-</span><span id="ArchiveFileManager-469"><a href="#ArchiveFileManager-469"><span class="linenos">469</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="ArchiveFileManager-470"><a href="#ArchiveFileManager-470"><span class="linenos">470</span></a>    <span class="k">def</span> <span class="nf">request_restore_and_wait</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-471"><a href="#ArchiveFileManager-471"><span class="linenos">471</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-472"><a href="#ArchiveFileManager-472"><span class="linenos">472</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-473"><a href="#ArchiveFileManager-473"><span class="linenos">473</span></a>        <span class="n">restore_expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-474"><a href="#ArchiveFileManager-474"><span class="linenos">474</span></a>        <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-475"><a href="#ArchiveFileManager-475"><span class="linenos">475</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-476"><a href="#ArchiveFileManager-476"><span class="linenos">476</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-477"><a href="#ArchiveFileManager-477"><span class="linenos">477</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request and wait for the restore to complete, polling the restore status.</span>
+</span><span id="ArchiveFileManager-433"><a href="#ArchiveFileManager-433"><span class="linenos">433</span></a>    <span class="k">def</span> <span class="nf">check_restore_status</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-434"><a href="#ArchiveFileManager-434"><span class="linenos">434</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of archived data.</span>
+</span><span id="ArchiveFileManager-435"><a href="#ArchiveFileManager-435"><span class="linenos">435</span></a>
+</span><span id="ArchiveFileManager-436"><a href="#ArchiveFileManager-436"><span class="linenos">436</span></a><span class="sd">        Args:</span>
+</span><span id="ArchiveFileManager-437"><a href="#ArchiveFileManager-437"><span class="linenos">437</span></a><span class="sd">            source_bucket: name of bucket to check the restore status.</span>
+</span><span id="ArchiveFileManager-438"><a href="#ArchiveFileManager-438"><span class="linenos">438</span></a><span class="sd">            source_object: object to check the restore status.</span>
+</span><span id="ArchiveFileManager-439"><a href="#ArchiveFileManager-439"><span class="linenos">439</span></a>
+</span><span id="ArchiveFileManager-440"><a href="#ArchiveFileManager-440"><span class="linenos">440</span></a><span class="sd">        Returns:</span>
+</span><span id="ArchiveFileManager-441"><a href="#ArchiveFileManager-441"><span class="linenos">441</span></a><span class="sd">            A dict containing the amount of objects in each status.</span>
+</span><span id="ArchiveFileManager-442"><a href="#ArchiveFileManager-442"><span class="linenos">442</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ArchiveFileManager-443"><a href="#ArchiveFileManager-443"><span class="linenos">443</span></a>        <span class="n">not_started_objects</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="ArchiveFileManager-444"><a href="#ArchiveFileManager-444"><span class="linenos">444</span></a>        <span class="n">ongoing_objects</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="ArchiveFileManager-445"><a href="#ArchiveFileManager-445"><span class="linenos">445</span></a>        <span class="n">restored_objects</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="ArchiveFileManager-446"><a href="#ArchiveFileManager-446"><span class="linenos">446</span></a>        <span class="n">total_objects</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="ArchiveFileManager-447"><a href="#ArchiveFileManager-447"><span class="linenos">447</span></a>
+</span><span id="ArchiveFileManager-448"><a href="#ArchiveFileManager-448"><span class="linenos">448</span></a>        <span class="k">if</span> <span class="n">_check_directory</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span><span class="p">):</span>
+</span><span id="ArchiveFileManager-449"><a href="#ArchiveFileManager-449"><span class="linenos">449</span></a>            <span class="n">source_object</span> <span class="o">=</span> <span class="n">_process_directory_path</span><span class="p">(</span><span class="n">source_object</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-450"><a href="#ArchiveFileManager-450"><span class="linenos">450</span></a>
+</span><span id="ArchiveFileManager-451"><a href="#ArchiveFileManager-451"><span class="linenos">451</span></a>        <span class="n">objects_to_restore</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-452"><a href="#ArchiveFileManager-452"><span class="linenos">452</span></a>            <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
+</span><span id="ArchiveFileManager-453"><a href="#ArchiveFileManager-453"><span class="linenos">453</span></a>        <span class="p">)</span>
+</span><span id="ArchiveFileManager-454"><a href="#ArchiveFileManager-454"><span class="linenos">454</span></a>
+</span><span id="ArchiveFileManager-455"><a href="#ArchiveFileManager-455"><span class="linenos">455</span></a>        <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_to_restore</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-456"><a href="#ArchiveFileManager-456"><span class="linenos">456</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Checking restore status for: </span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-457"><a href="#ArchiveFileManager-457"><span class="linenos">457</span></a>
+</span><span id="ArchiveFileManager-458"><a href="#ArchiveFileManager-458"><span class="linenos">458</span></a>            <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_check_object_restore_status</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-459"><a href="#ArchiveFileManager-459"><span class="linenos">459</span></a>                <span class="n">source_bucket</span><span class="p">,</span> <span class="n">obj</span>
+</span><span id="ArchiveFileManager-460"><a href="#ArchiveFileManager-460"><span class="linenos">460</span></a>            <span class="p">)</span>
+</span><span id="ArchiveFileManager-461"><a href="#ArchiveFileManager-461"><span class="linenos">461</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">restore_status</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-462"><a href="#ArchiveFileManager-462"><span class="linenos">462</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-463"><a href="#ArchiveFileManager-463"><span class="linenos">463</span></a>                    <span class="sa">f</span><span class="s2">&quot;Restore status not found for </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="ArchiveFileManager-464"><a href="#ArchiveFileManager-464"><span class="linenos">464</span></a>                <span class="p">)</span>
+</span><span id="ArchiveFileManager-465"><a href="#ArchiveFileManager-465"><span class="linenos">465</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-466"><a href="#ArchiveFileManager-466"><span class="linenos">466</span></a>                <span class="n">total_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="ArchiveFileManager-467"><a href="#ArchiveFileManager-467"><span class="linenos">467</span></a>
+</span><span id="ArchiveFileManager-468"><a href="#ArchiveFileManager-468"><span class="linenos">468</span></a>                <span class="k">if</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">NOT_STARTED</span> <span class="o">==</span> <span class="n">restore_status</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-469"><a href="#ArchiveFileManager-469"><span class="linenos">469</span></a>                    <span class="n">not_started_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="ArchiveFileManager-470"><a href="#ArchiveFileManager-470"><span class="linenos">470</span></a>                <span class="k">elif</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">ONGOING</span> <span class="o">==</span> <span class="n">restore_status</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-471"><a href="#ArchiveFileManager-471"><span class="linenos">471</span></a>                    <span class="n">ongoing_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="ArchiveFileManager-472"><a href="#ArchiveFileManager-472"><span class="linenos">472</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-473"><a href="#ArchiveFileManager-473"><span class="linenos">473</span></a>                    <span class="n">restored_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="ArchiveFileManager-474"><a href="#ArchiveFileManager-474"><span class="linenos">474</span></a>
+</span><span id="ArchiveFileManager-475"><a href="#ArchiveFileManager-475"><span class="linenos">475</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-476"><a href="#ArchiveFileManager-476"><span class="linenos">476</span></a>                    <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2"> restore status is </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">value</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="ArchiveFileManager-477"><a href="#ArchiveFileManager-477"><span class="linenos">477</span></a>                <span class="p">)</span>
 </span><span id="ArchiveFileManager-478"><a href="#ArchiveFileManager-478"><span class="linenos">478</span></a>
-</span><span id="ArchiveFileManager-479"><a href="#ArchiveFileManager-479"><span class="linenos">479</span></a><span class="sd">        Args:</span>
-</span><span id="ArchiveFileManager-480"><a href="#ArchiveFileManager-480"><span class="linenos">480</span></a><span class="sd">            source_bucket: name of bucket to perform the restore.</span>
-</span><span id="ArchiveFileManager-481"><a href="#ArchiveFileManager-481"><span class="linenos">481</span></a><span class="sd">            source_object: object to be restored.</span>
-</span><span id="ArchiveFileManager-482"><a href="#ArchiveFileManager-482"><span class="linenos">482</span></a><span class="sd">            restore_expiration: restore expiration in days.</span>
-</span><span id="ArchiveFileManager-483"><a href="#ArchiveFileManager-483"><span class="linenos">483</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
-</span><span id="ArchiveFileManager-484"><a href="#ArchiveFileManager-484"><span class="linenos">484</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
-</span><span id="ArchiveFileManager-485"><a href="#ArchiveFileManager-485"><span class="linenos">485</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
-</span><span id="ArchiveFileManager-486"><a href="#ArchiveFileManager-486"><span class="linenos">486</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
-</span><span id="ArchiveFileManager-487"><a href="#ArchiveFileManager-487"><span class="linenos">487</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="ArchiveFileManager-488"><a href="#ArchiveFileManager-488"><span class="linenos">488</span></a>        <span class="k">if</span> <span class="n">retrieval_tier</span> <span class="o">!=</span> <span class="n">RestoreType</span><span class="o">.</span><span class="n">EXPEDITED</span><span class="o">.</span><span class="n">value</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-489"><a href="#ArchiveFileManager-489"><span class="linenos">489</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-490"><a href="#ArchiveFileManager-490"><span class="linenos">490</span></a>                <span class="sa">f</span><span class="s2">&quot;Retrieval Tier </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not allowed on this operation! This &quot;</span>
-</span><span id="ArchiveFileManager-491"><a href="#ArchiveFileManager-491"><span class="linenos">491</span></a>                <span class="s2">&quot;kind of restore should be used just with `Expedited` retrieval tier &quot;</span>
-</span><span id="ArchiveFileManager-492"><a href="#ArchiveFileManager-492"><span class="linenos">492</span></a>                <span class="s2">&quot;to save cluster costs.&quot;</span>
-</span><span id="ArchiveFileManager-493"><a href="#ArchiveFileManager-493"><span class="linenos">493</span></a>            <span class="p">)</span>
-</span><span id="ArchiveFileManager-494"><a href="#ArchiveFileManager-494"><span class="linenos">494</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-495"><a href="#ArchiveFileManager-495"><span class="linenos">495</span></a>                <span class="sa">f</span><span class="s2">&quot;Retrieval Tier </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not allowed on this operation! This &quot;</span>
-</span><span id="ArchiveFileManager-496"><a href="#ArchiveFileManager-496"><span class="linenos">496</span></a>                <span class="s2">&quot;kind of restore should be used just with `Expedited` retrieval tier &quot;</span>
-</span><span id="ArchiveFileManager-497"><a href="#ArchiveFileManager-497"><span class="linenos">497</span></a>                <span class="s2">&quot;to save cluster costs.&quot;</span>
-</span><span id="ArchiveFileManager-498"><a href="#ArchiveFileManager-498"><span class="linenos">498</span></a>            <span class="p">)</span>
-</span><span id="ArchiveFileManager-499"><a href="#ArchiveFileManager-499"><span class="linenos">499</span></a>
-</span><span id="ArchiveFileManager-500"><a href="#ArchiveFileManager-500"><span class="linenos">500</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-501"><a href="#ArchiveFileManager-501"><span class="linenos">501</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-502"><a href="#ArchiveFileManager-502"><span class="linenos">502</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-503"><a href="#ArchiveFileManager-503"><span class="linenos">503</span></a>            <span class="n">restore_expiration</span><span class="o">=</span><span class="n">restore_expiration</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-504"><a href="#ArchiveFileManager-504"><span class="linenos">504</span></a>            <span class="n">retrieval_tier</span><span class="o">=</span><span class="n">retrieval_tier</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-505"><a href="#ArchiveFileManager-505"><span class="linenos">505</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
-</span><span id="ArchiveFileManager-506"><a href="#ArchiveFileManager-506"><span class="linenos">506</span></a>        <span class="p">)</span>
-</span><span id="ArchiveFileManager-507"><a href="#ArchiveFileManager-507"><span class="linenos">507</span></a>        <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-508"><a href="#ArchiveFileManager-508"><span class="linenos">508</span></a>            <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
-</span><span id="ArchiveFileManager-509"><a href="#ArchiveFileManager-509"><span class="linenos">509</span></a>        <span class="p">)</span>
-</span><span id="ArchiveFileManager-510"><a href="#ArchiveFileManager-510"><span class="linenos">510</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restore status: </span><span class="si">{</span><span class="n">restore_status</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="ArchiveFileManager-511"><a href="#ArchiveFileManager-511"><span class="linenos">511</span></a>
-</span><span id="ArchiveFileManager-512"><a href="#ArchiveFileManager-512"><span class="linenos">512</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">dry_run</span><span class="p">:</span>
-</span><span id="ArchiveFileManager-513"><a href="#ArchiveFileManager-513"><span class="linenos">513</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Checking the restore status in 5 minutes.&quot;</span><span class="p">)</span>
-</span><span id="ArchiveFileManager-514"><a href="#ArchiveFileManager-514"><span class="linenos">514</span></a>            <span class="n">wait_time</span> <span class="o">=</span> <span class="mi">300</span>
-</span><span id="ArchiveFileManager-515"><a href="#ArchiveFileManager-515"><span class="linenos">515</span></a>            <span class="k">while</span> <span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;total_objects&quot;</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-516"><a href="#ArchiveFileManager-516"><span class="linenos">516</span></a>                <span class="s2">&quot;restored_objects&quot;</span>
-</span><span id="ArchiveFileManager-517"><a href="#ArchiveFileManager-517"><span class="linenos">517</span></a>            <span class="p">):</span>
-</span><span id="ArchiveFileManager-518"><a href="#ArchiveFileManager-518"><span class="linenos">518</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-519"><a href="#ArchiveFileManager-519"><span class="linenos">519</span></a>                    <span class="s2">&quot;Not all objects have been restored yet, checking the status again &quot;</span>
-</span><span id="ArchiveFileManager-520"><a href="#ArchiveFileManager-520"><span class="linenos">520</span></a>                    <span class="sa">f</span><span class="s2">&quot;in </span><span class="si">{</span><span class="n">wait_time</span><span class="si">}</span><span class="s2"> seconds.&quot;</span>
-</span><span id="ArchiveFileManager-521"><a href="#ArchiveFileManager-521"><span class="linenos">521</span></a>                <span class="p">)</span>
-</span><span id="ArchiveFileManager-522"><a href="#ArchiveFileManager-522"><span class="linenos">522</span></a>                <span class="n">time</span><span class="o">.</span><span class="n">sleep</span><span class="p">(</span><span class="n">wait_time</span><span class="p">)</span>
-</span><span id="ArchiveFileManager-523"><a href="#ArchiveFileManager-523"><span class="linenos">523</span></a>                <span class="n">wait_time</span> <span class="o">=</span> <span class="mi">30</span>
-</span><span id="ArchiveFileManager-524"><a href="#ArchiveFileManager-524"><span class="linenos">524</span></a>                <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
-</span><span id="ArchiveFileManager-525"><a href="#ArchiveFileManager-525"><span class="linenos">525</span></a>                    <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
-</span><span id="ArchiveFileManager-526"><a href="#ArchiveFileManager-526"><span class="linenos">526</span></a>                <span class="p">)</span>
-</span><span id="ArchiveFileManager-527"><a href="#ArchiveFileManager-527"><span class="linenos">527</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restore status: </span><span class="si">{</span><span class="n">restore_status</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-479"><a href="#ArchiveFileManager-479"><span class="linenos">479</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="ArchiveFileManager-480"><a href="#ArchiveFileManager-480"><span class="linenos">480</span></a>            <span class="s2">&quot;total_objects&quot;</span><span class="p">:</span> <span class="n">total_objects</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-481"><a href="#ArchiveFileManager-481"><span class="linenos">481</span></a>            <span class="s2">&quot;not_started_objects&quot;</span><span class="p">:</span> <span class="n">not_started_objects</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-482"><a href="#ArchiveFileManager-482"><span class="linenos">482</span></a>            <span class="s2">&quot;ongoing_objects&quot;</span><span class="p">:</span> <span class="n">ongoing_objects</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-483"><a href="#ArchiveFileManager-483"><span class="linenos">483</span></a>            <span class="s2">&quot;restored_objects&quot;</span><span class="p">:</span> <span class="n">restored_objects</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-484"><a href="#ArchiveFileManager-484"><span class="linenos">484</span></a>        <span class="p">}</span>
+</span><span id="ArchiveFileManager-485"><a href="#ArchiveFileManager-485"><span class="linenos">485</span></a>
+</span><span id="ArchiveFileManager-486"><a href="#ArchiveFileManager-486"><span class="linenos">486</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="ArchiveFileManager-487"><a href="#ArchiveFileManager-487"><span class="linenos">487</span></a>    <span class="k">def</span> <span class="nf">_request_restore_object</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-488"><a href="#ArchiveFileManager-488"><span class="linenos">488</span></a>        <span class="n">bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">object_key</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span>
+</span><span id="ArchiveFileManager-489"><a href="#ArchiveFileManager-489"><span class="linenos">489</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-490"><a href="#ArchiveFileManager-490"><span class="linenos">490</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request a restore of the archive.</span>
+</span><span id="ArchiveFileManager-491"><a href="#ArchiveFileManager-491"><span class="linenos">491</span></a>
+</span><span id="ArchiveFileManager-492"><a href="#ArchiveFileManager-492"><span class="linenos">492</span></a><span class="sd">        Args:</span>
+</span><span id="ArchiveFileManager-493"><a href="#ArchiveFileManager-493"><span class="linenos">493</span></a><span class="sd">            bucket: name of bucket to perform the restore.</span>
+</span><span id="ArchiveFileManager-494"><a href="#ArchiveFileManager-494"><span class="linenos">494</span></a><span class="sd">            object_key: object to be restored.</span>
+</span><span id="ArchiveFileManager-495"><a href="#ArchiveFileManager-495"><span class="linenos">495</span></a><span class="sd">            expiration: restore expiration.</span>
+</span><span id="ArchiveFileManager-496"><a href="#ArchiveFileManager-496"><span class="linenos">496</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
+</span><span id="ArchiveFileManager-497"><a href="#ArchiveFileManager-497"><span class="linenos">497</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
+</span><span id="ArchiveFileManager-498"><a href="#ArchiveFileManager-498"><span class="linenos">498</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ArchiveFileManager-499"><a href="#ArchiveFileManager-499"><span class="linenos">499</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">RestoreType</span><span class="o">.</span><span class="n">exists</span><span class="p">(</span><span class="n">retrieval_tier</span><span class="p">):</span>
+</span><span id="ArchiveFileManager-500"><a href="#ArchiveFileManager-500"><span class="linenos">500</span></a>            <span class="k">raise</span> <span class="n">RestoreTypeNotFoundException</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-501"><a href="#ArchiveFileManager-501"><span class="linenos">501</span></a>                <span class="sa">f</span><span class="s2">&quot;Restore type </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not supported.&quot;</span>
+</span><span id="ArchiveFileManager-502"><a href="#ArchiveFileManager-502"><span class="linenos">502</span></a>            <span class="p">)</span>
+</span><span id="ArchiveFileManager-503"><a href="#ArchiveFileManager-503"><span class="linenos">503</span></a>
+</span><span id="ArchiveFileManager-504"><a href="#ArchiveFileManager-504"><span class="linenos">504</span></a>        <span class="k">if</span> <span class="n">_check_directory</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">):</span>
+</span><span id="ArchiveFileManager-505"><a href="#ArchiveFileManager-505"><span class="linenos">505</span></a>            <span class="n">object_key</span> <span class="o">=</span> <span class="n">_process_directory_path</span><span class="p">(</span><span class="n">object_key</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-506"><a href="#ArchiveFileManager-506"><span class="linenos">506</span></a>
+</span><span id="ArchiveFileManager-507"><a href="#ArchiveFileManager-507"><span class="linenos">507</span></a>        <span class="n">archived_object</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_get_archived_object</span><span class="p">(</span><span class="n">bucket</span><span class="p">,</span> <span class="n">object_key</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-508"><a href="#ArchiveFileManager-508"><span class="linenos">508</span></a>
+</span><span id="ArchiveFileManager-509"><a href="#ArchiveFileManager-509"><span class="linenos">509</span></a>        <span class="k">if</span> <span class="n">archived_object</span> <span class="ow">and</span> <span class="n">archived_object</span><span class="o">.</span><span class="n">restore</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-510"><a href="#ArchiveFileManager-510"><span class="linenos">510</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restoring archive </span><span class="si">{</span><span class="n">bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">object_key</span><span class="si">}</span><span class="s2">.&quot;</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-511"><a href="#ArchiveFileManager-511"><span class="linenos">511</span></a>            <span class="n">archived_object</span><span class="o">.</span><span class="n">restore_object</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-512"><a href="#ArchiveFileManager-512"><span class="linenos">512</span></a>                <span class="n">RestoreRequest</span><span class="o">=</span><span class="p">{</span>
+</span><span id="ArchiveFileManager-513"><a href="#ArchiveFileManager-513"><span class="linenos">513</span></a>                    <span class="s2">&quot;Days&quot;</span><span class="p">:</span> <span class="n">expiration</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-514"><a href="#ArchiveFileManager-514"><span class="linenos">514</span></a>                    <span class="s2">&quot;GlacierJobParameters&quot;</span><span class="p">:</span> <span class="p">{</span><span class="s2">&quot;Tier&quot;</span><span class="p">:</span> <span class="n">retrieval_tier</span><span class="p">},</span>
+</span><span id="ArchiveFileManager-515"><a href="#ArchiveFileManager-515"><span class="linenos">515</span></a>                <span class="p">}</span>
+</span><span id="ArchiveFileManager-516"><a href="#ArchiveFileManager-516"><span class="linenos">516</span></a>            <span class="p">)</span>
+</span><span id="ArchiveFileManager-517"><a href="#ArchiveFileManager-517"><span class="linenos">517</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-518"><a href="#ArchiveFileManager-518"><span class="linenos">518</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-519"><a href="#ArchiveFileManager-519"><span class="linenos">519</span></a>                <span class="sa">f</span><span class="s2">&quot;Restore request for </span><span class="si">{</span><span class="n">bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">object_key</span><span class="si">}</span><span class="s2"> not performed.&quot;</span>
+</span><span id="ArchiveFileManager-520"><a href="#ArchiveFileManager-520"><span class="linenos">520</span></a>            <span class="p">)</span>
+</span><span id="ArchiveFileManager-521"><a href="#ArchiveFileManager-521"><span class="linenos">521</span></a>
+</span><span id="ArchiveFileManager-522"><a href="#ArchiveFileManager-522"><span class="linenos">522</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="ArchiveFileManager-523"><a href="#ArchiveFileManager-523"><span class="linenos">523</span></a>    <span class="k">def</span> <span class="nf">request_restore</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-524"><a href="#ArchiveFileManager-524"><span class="linenos">524</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-525"><a href="#ArchiveFileManager-525"><span class="linenos">525</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-526"><a href="#ArchiveFileManager-526"><span class="linenos">526</span></a>        <span class="n">restore_expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-527"><a href="#ArchiveFileManager-527"><span class="linenos">527</span></a>        <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-528"><a href="#ArchiveFileManager-528"><span class="linenos">528</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-529"><a href="#ArchiveFileManager-529"><span class="linenos">529</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-530"><a href="#ArchiveFileManager-530"><span class="linenos">530</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request the restore of archived data.</span>
+</span><span id="ArchiveFileManager-531"><a href="#ArchiveFileManager-531"><span class="linenos">531</span></a>
+</span><span id="ArchiveFileManager-532"><a href="#ArchiveFileManager-532"><span class="linenos">532</span></a><span class="sd">        Args:</span>
+</span><span id="ArchiveFileManager-533"><a href="#ArchiveFileManager-533"><span class="linenos">533</span></a><span class="sd">            source_bucket: name of bucket to perform the restore.</span>
+</span><span id="ArchiveFileManager-534"><a href="#ArchiveFileManager-534"><span class="linenos">534</span></a><span class="sd">            source_object: object to be restored.</span>
+</span><span id="ArchiveFileManager-535"><a href="#ArchiveFileManager-535"><span class="linenos">535</span></a><span class="sd">            restore_expiration: restore expiration in days.</span>
+</span><span id="ArchiveFileManager-536"><a href="#ArchiveFileManager-536"><span class="linenos">536</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
+</span><span id="ArchiveFileManager-537"><a href="#ArchiveFileManager-537"><span class="linenos">537</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
+</span><span id="ArchiveFileManager-538"><a href="#ArchiveFileManager-538"><span class="linenos">538</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
+</span><span id="ArchiveFileManager-539"><a href="#ArchiveFileManager-539"><span class="linenos">539</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
+</span><span id="ArchiveFileManager-540"><a href="#ArchiveFileManager-540"><span class="linenos">540</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ArchiveFileManager-541"><a href="#ArchiveFileManager-541"><span class="linenos">541</span></a>        <span class="k">if</span> <span class="n">_check_directory</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span><span class="p">):</span>
+</span><span id="ArchiveFileManager-542"><a href="#ArchiveFileManager-542"><span class="linenos">542</span></a>            <span class="n">source_object</span> <span class="o">=</span> <span class="n">_process_directory_path</span><span class="p">(</span><span class="n">source_object</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-543"><a href="#ArchiveFileManager-543"><span class="linenos">543</span></a>
+</span><span id="ArchiveFileManager-544"><a href="#ArchiveFileManager-544"><span class="linenos">544</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-545"><a href="#ArchiveFileManager-545"><span class="linenos">545</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="p">[</span><span class="n">source_object</span><span class="p">])</span>
+</span><span id="ArchiveFileManager-546"><a href="#ArchiveFileManager-546"><span class="linenos">546</span></a>
+</span><span id="ArchiveFileManager-547"><a href="#ArchiveFileManager-547"><span class="linenos">547</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be restored:&quot;</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-548"><a href="#ArchiveFileManager-548"><span class="linenos">548</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-549"><a href="#ArchiveFileManager-549"><span class="linenos">549</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-550"><a href="#ArchiveFileManager-550"><span class="linenos">550</span></a>            <span class="n">objects_to_restore</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-551"><a href="#ArchiveFileManager-551"><span class="linenos">551</span></a>                <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
+</span><span id="ArchiveFileManager-552"><a href="#ArchiveFileManager-552"><span class="linenos">552</span></a>            <span class="p">)</span>
+</span><span id="ArchiveFileManager-553"><a href="#ArchiveFileManager-553"><span class="linenos">553</span></a>
+</span><span id="ArchiveFileManager-554"><a href="#ArchiveFileManager-554"><span class="linenos">554</span></a>            <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_to_restore</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-555"><a href="#ArchiveFileManager-555"><span class="linenos">555</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_request_restore_object</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-556"><a href="#ArchiveFileManager-556"><span class="linenos">556</span></a>                    <span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-557"><a href="#ArchiveFileManager-557"><span class="linenos">557</span></a>                    <span class="n">obj</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-558"><a href="#ArchiveFileManager-558"><span class="linenos">558</span></a>                    <span class="n">restore_expiration</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-559"><a href="#ArchiveFileManager-559"><span class="linenos">559</span></a>                    <span class="n">retrieval_tier</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-560"><a href="#ArchiveFileManager-560"><span class="linenos">560</span></a>                <span class="p">)</span>
+</span><span id="ArchiveFileManager-561"><a href="#ArchiveFileManager-561"><span class="linenos">561</span></a>
+</span><span id="ArchiveFileManager-562"><a href="#ArchiveFileManager-562"><span class="linenos">562</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="ArchiveFileManager-563"><a href="#ArchiveFileManager-563"><span class="linenos">563</span></a>    <span class="k">def</span> <span class="nf">request_restore_and_wait</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-564"><a href="#ArchiveFileManager-564"><span class="linenos">564</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-565"><a href="#ArchiveFileManager-565"><span class="linenos">565</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-566"><a href="#ArchiveFileManager-566"><span class="linenos">566</span></a>        <span class="n">restore_expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-567"><a href="#ArchiveFileManager-567"><span class="linenos">567</span></a>        <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-568"><a href="#ArchiveFileManager-568"><span class="linenos">568</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-569"><a href="#ArchiveFileManager-569"><span class="linenos">569</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-570"><a href="#ArchiveFileManager-570"><span class="linenos">570</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request and wait for the restore to complete, polling the restore status.</span>
+</span><span id="ArchiveFileManager-571"><a href="#ArchiveFileManager-571"><span class="linenos">571</span></a>
+</span><span id="ArchiveFileManager-572"><a href="#ArchiveFileManager-572"><span class="linenos">572</span></a><span class="sd">        Args:</span>
+</span><span id="ArchiveFileManager-573"><a href="#ArchiveFileManager-573"><span class="linenos">573</span></a><span class="sd">            source_bucket: name of bucket to perform the restore.</span>
+</span><span id="ArchiveFileManager-574"><a href="#ArchiveFileManager-574"><span class="linenos">574</span></a><span class="sd">            source_object: object to be restored.</span>
+</span><span id="ArchiveFileManager-575"><a href="#ArchiveFileManager-575"><span class="linenos">575</span></a><span class="sd">            restore_expiration: restore expiration in days.</span>
+</span><span id="ArchiveFileManager-576"><a href="#ArchiveFileManager-576"><span class="linenos">576</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
+</span><span id="ArchiveFileManager-577"><a href="#ArchiveFileManager-577"><span class="linenos">577</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
+</span><span id="ArchiveFileManager-578"><a href="#ArchiveFileManager-578"><span class="linenos">578</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
+</span><span id="ArchiveFileManager-579"><a href="#ArchiveFileManager-579"><span class="linenos">579</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
+</span><span id="ArchiveFileManager-580"><a href="#ArchiveFileManager-580"><span class="linenos">580</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ArchiveFileManager-581"><a href="#ArchiveFileManager-581"><span class="linenos">581</span></a>        <span class="k">if</span> <span class="n">retrieval_tier</span> <span class="o">!=</span> <span class="n">RestoreType</span><span class="o">.</span><span class="n">EXPEDITED</span><span class="o">.</span><span class="n">value</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-582"><a href="#ArchiveFileManager-582"><span class="linenos">582</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-583"><a href="#ArchiveFileManager-583"><span class="linenos">583</span></a>                <span class="sa">f</span><span class="s2">&quot;Retrieval Tier </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not allowed on this operation! This &quot;</span>
+</span><span id="ArchiveFileManager-584"><a href="#ArchiveFileManager-584"><span class="linenos">584</span></a>                <span class="s2">&quot;kind of restore should be used just with `Expedited` retrieval tier &quot;</span>
+</span><span id="ArchiveFileManager-585"><a href="#ArchiveFileManager-585"><span class="linenos">585</span></a>                <span class="s2">&quot;to save cluster costs.&quot;</span>
+</span><span id="ArchiveFileManager-586"><a href="#ArchiveFileManager-586"><span class="linenos">586</span></a>            <span class="p">)</span>
+</span><span id="ArchiveFileManager-587"><a href="#ArchiveFileManager-587"><span class="linenos">587</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-588"><a href="#ArchiveFileManager-588"><span class="linenos">588</span></a>                <span class="sa">f</span><span class="s2">&quot;Retrieval Tier </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not allowed on this operation! This &quot;</span>
+</span><span id="ArchiveFileManager-589"><a href="#ArchiveFileManager-589"><span class="linenos">589</span></a>                <span class="s2">&quot;kind of restore should be used just with `Expedited` retrieval tier &quot;</span>
+</span><span id="ArchiveFileManager-590"><a href="#ArchiveFileManager-590"><span class="linenos">590</span></a>                <span class="s2">&quot;to save cluster costs.&quot;</span>
+</span><span id="ArchiveFileManager-591"><a href="#ArchiveFileManager-591"><span class="linenos">591</span></a>            <span class="p">)</span>
+</span><span id="ArchiveFileManager-592"><a href="#ArchiveFileManager-592"><span class="linenos">592</span></a>
+</span><span id="ArchiveFileManager-593"><a href="#ArchiveFileManager-593"><span class="linenos">593</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-594"><a href="#ArchiveFileManager-594"><span class="linenos">594</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-595"><a href="#ArchiveFileManager-595"><span class="linenos">595</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-596"><a href="#ArchiveFileManager-596"><span class="linenos">596</span></a>            <span class="n">restore_expiration</span><span class="o">=</span><span class="n">restore_expiration</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-597"><a href="#ArchiveFileManager-597"><span class="linenos">597</span></a>            <span class="n">retrieval_tier</span><span class="o">=</span><span class="n">retrieval_tier</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-598"><a href="#ArchiveFileManager-598"><span class="linenos">598</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
+</span><span id="ArchiveFileManager-599"><a href="#ArchiveFileManager-599"><span class="linenos">599</span></a>        <span class="p">)</span>
+</span><span id="ArchiveFileManager-600"><a href="#ArchiveFileManager-600"><span class="linenos">600</span></a>        <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-601"><a href="#ArchiveFileManager-601"><span class="linenos">601</span></a>            <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
+</span><span id="ArchiveFileManager-602"><a href="#ArchiveFileManager-602"><span class="linenos">602</span></a>        <span class="p">)</span>
+</span><span id="ArchiveFileManager-603"><a href="#ArchiveFileManager-603"><span class="linenos">603</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restore status: </span><span class="si">{</span><span class="n">restore_status</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-604"><a href="#ArchiveFileManager-604"><span class="linenos">604</span></a>
+</span><span id="ArchiveFileManager-605"><a href="#ArchiveFileManager-605"><span class="linenos">605</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">dry_run</span><span class="p">:</span>
+</span><span id="ArchiveFileManager-606"><a href="#ArchiveFileManager-606"><span class="linenos">606</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Checking the restore status in 5 minutes.&quot;</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-607"><a href="#ArchiveFileManager-607"><span class="linenos">607</span></a>            <span class="n">wait_time</span> <span class="o">=</span> <span class="mi">300</span>
+</span><span id="ArchiveFileManager-608"><a href="#ArchiveFileManager-608"><span class="linenos">608</span></a>            <span class="k">while</span> <span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;total_objects&quot;</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-609"><a href="#ArchiveFileManager-609"><span class="linenos">609</span></a>                <span class="s2">&quot;restored_objects&quot;</span>
+</span><span id="ArchiveFileManager-610"><a href="#ArchiveFileManager-610"><span class="linenos">610</span></a>            <span class="p">):</span>
+</span><span id="ArchiveFileManager-611"><a href="#ArchiveFileManager-611"><span class="linenos">611</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-612"><a href="#ArchiveFileManager-612"><span class="linenos">612</span></a>                    <span class="s2">&quot;Not all objects have been restored yet, checking the status again &quot;</span>
+</span><span id="ArchiveFileManager-613"><a href="#ArchiveFileManager-613"><span class="linenos">613</span></a>                    <span class="sa">f</span><span class="s2">&quot;in </span><span class="si">{</span><span class="n">wait_time</span><span class="si">}</span><span class="s2"> seconds.&quot;</span>
+</span><span id="ArchiveFileManager-614"><a href="#ArchiveFileManager-614"><span class="linenos">614</span></a>                <span class="p">)</span>
+</span><span id="ArchiveFileManager-615"><a href="#ArchiveFileManager-615"><span class="linenos">615</span></a>                <span class="n">time</span><span class="o">.</span><span class="n">sleep</span><span class="p">(</span><span class="n">wait_time</span><span class="p">)</span>
+</span><span id="ArchiveFileManager-616"><a href="#ArchiveFileManager-616"><span class="linenos">616</span></a>                <span class="n">wait_time</span> <span class="o">=</span> <span class="mi">30</span>
+</span><span id="ArchiveFileManager-617"><a href="#ArchiveFileManager-617"><span class="linenos">617</span></a>                <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
+</span><span id="ArchiveFileManager-618"><a href="#ArchiveFileManager-618"><span class="linenos">618</span></a>                    <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
+</span><span id="ArchiveFileManager-619"><a href="#ArchiveFileManager-619"><span class="linenos">619</span></a>                <span class="p">)</span>
+</span><span id="ArchiveFileManager-620"><a href="#ArchiveFileManager-620"><span class="linenos">620</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restore status: </span><span class="si">{</span><span class="n">restore_status</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
 </span></pre></div>
 
 
@@ -1403,56 +1523,59 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#ArchiveFileManager.check_restore_status"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="ArchiveFileManager.check_restore_status-348"><a href="#ArchiveFileManager.check_restore_status-348"><span class="linenos">348</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="ArchiveFileManager.check_restore_status-349"><a href="#ArchiveFileManager.check_restore_status-349"><span class="linenos">349</span></a>    <span class="k">def</span> <span class="nf">check_restore_status</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.check_restore_status-350"><a href="#ArchiveFileManager.check_restore_status-350"><span class="linenos">350</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of archived data.</span>
-</span><span id="ArchiveFileManager.check_restore_status-351"><a href="#ArchiveFileManager.check_restore_status-351"><span class="linenos">351</span></a>
-</span><span id="ArchiveFileManager.check_restore_status-352"><a href="#ArchiveFileManager.check_restore_status-352"><span class="linenos">352</span></a><span class="sd">        Args:</span>
-</span><span id="ArchiveFileManager.check_restore_status-353"><a href="#ArchiveFileManager.check_restore_status-353"><span class="linenos">353</span></a><span class="sd">            source_bucket: name of bucket to check the restore status.</span>
-</span><span id="ArchiveFileManager.check_restore_status-354"><a href="#ArchiveFileManager.check_restore_status-354"><span class="linenos">354</span></a><span class="sd">            source_object: object to check the restore status.</span>
-</span><span id="ArchiveFileManager.check_restore_status-355"><a href="#ArchiveFileManager.check_restore_status-355"><span class="linenos">355</span></a>
-</span><span id="ArchiveFileManager.check_restore_status-356"><a href="#ArchiveFileManager.check_restore_status-356"><span class="linenos">356</span></a><span class="sd">        Returns:</span>
-</span><span id="ArchiveFileManager.check_restore_status-357"><a href="#ArchiveFileManager.check_restore_status-357"><span class="linenos">357</span></a><span class="sd">            A dict containing the amount of objects in each status.</span>
-</span><span id="ArchiveFileManager.check_restore_status-358"><a href="#ArchiveFileManager.check_restore_status-358"><span class="linenos">358</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="ArchiveFileManager.check_restore_status-359"><a href="#ArchiveFileManager.check_restore_status-359"><span class="linenos">359</span></a>        <span class="n">not_started_objects</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="ArchiveFileManager.check_restore_status-360"><a href="#ArchiveFileManager.check_restore_status-360"><span class="linenos">360</span></a>        <span class="n">ongoing_objects</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="ArchiveFileManager.check_restore_status-361"><a href="#ArchiveFileManager.check_restore_status-361"><span class="linenos">361</span></a>        <span class="n">restored_objects</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="ArchiveFileManager.check_restore_status-362"><a href="#ArchiveFileManager.check_restore_status-362"><span class="linenos">362</span></a>        <span class="n">total_objects</span> <span class="o">=</span> <span class="mi">0</span>
-</span><span id="ArchiveFileManager.check_restore_status-363"><a href="#ArchiveFileManager.check_restore_status-363"><span class="linenos">363</span></a>
-</span><span id="ArchiveFileManager.check_restore_status-364"><a href="#ArchiveFileManager.check_restore_status-364"><span class="linenos">364</span></a>        <span class="n">objects_to_restore</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.check_restore_status-365"><a href="#ArchiveFileManager.check_restore_status-365"><span class="linenos">365</span></a>            <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
-</span><span id="ArchiveFileManager.check_restore_status-366"><a href="#ArchiveFileManager.check_restore_status-366"><span class="linenos">366</span></a>        <span class="p">)</span>
-</span><span id="ArchiveFileManager.check_restore_status-367"><a href="#ArchiveFileManager.check_restore_status-367"><span class="linenos">367</span></a>
-</span><span id="ArchiveFileManager.check_restore_status-368"><a href="#ArchiveFileManager.check_restore_status-368"><span class="linenos">368</span></a>        <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_to_restore</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.check_restore_status-369"><a href="#ArchiveFileManager.check_restore_status-369"><span class="linenos">369</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Checking restore status for: </span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="ArchiveFileManager.check_restore_status-370"><a href="#ArchiveFileManager.check_restore_status-370"><span class="linenos">370</span></a>
-</span><span id="ArchiveFileManager.check_restore_status-371"><a href="#ArchiveFileManager.check_restore_status-371"><span class="linenos">371</span></a>            <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_check_object_restore_status</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.check_restore_status-372"><a href="#ArchiveFileManager.check_restore_status-372"><span class="linenos">372</span></a>                <span class="n">source_bucket</span><span class="p">,</span> <span class="n">obj</span>
-</span><span id="ArchiveFileManager.check_restore_status-373"><a href="#ArchiveFileManager.check_restore_status-373"><span class="linenos">373</span></a>            <span class="p">)</span>
-</span><span id="ArchiveFileManager.check_restore_status-374"><a href="#ArchiveFileManager.check_restore_status-374"><span class="linenos">374</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">restore_status</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.check_restore_status-375"><a href="#ArchiveFileManager.check_restore_status-375"><span class="linenos">375</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.check_restore_status-376"><a href="#ArchiveFileManager.check_restore_status-376"><span class="linenos">376</span></a>                    <span class="sa">f</span><span class="s2">&quot;Restore status not found for </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="ArchiveFileManager.check_restore_status-377"><a href="#ArchiveFileManager.check_restore_status-377"><span class="linenos">377</span></a>                <span class="p">)</span>
-</span><span id="ArchiveFileManager.check_restore_status-378"><a href="#ArchiveFileManager.check_restore_status-378"><span class="linenos">378</span></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.check_restore_status-379"><a href="#ArchiveFileManager.check_restore_status-379"><span class="linenos">379</span></a>                <span class="n">total_objects</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="ArchiveFileManager.check_restore_status-380"><a href="#ArchiveFileManager.check_restore_status-380"><span class="linenos">380</span></a>
-</span><span id="ArchiveFileManager.check_restore_status-381"><a href="#ArchiveFileManager.check_restore_status-381"><span class="linenos">381</span></a>                <span class="k">if</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">NOT_STARTED</span> <span class="o">==</span> <span class="n">restore_status</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.check_restore_status-382"><a href="#ArchiveFileManager.check_restore_status-382"><span class="linenos">382</span></a>                    <span class="n">not_started_objects</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="ArchiveFileManager.check_restore_status-383"><a href="#ArchiveFileManager.check_restore_status-383"><span class="linenos">383</span></a>                <span class="k">elif</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">ONGOING</span> <span class="o">==</span> <span class="n">restore_status</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.check_restore_status-384"><a href="#ArchiveFileManager.check_restore_status-384"><span class="linenos">384</span></a>                    <span class="n">ongoing_objects</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="ArchiveFileManager.check_restore_status-385"><a href="#ArchiveFileManager.check_restore_status-385"><span class="linenos">385</span></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.check_restore_status-386"><a href="#ArchiveFileManager.check_restore_status-386"><span class="linenos">386</span></a>                    <span class="n">restored_objects</span> <span class="o">+=</span> <span class="mi">1</span>
-</span><span id="ArchiveFileManager.check_restore_status-387"><a href="#ArchiveFileManager.check_restore_status-387"><span class="linenos">387</span></a>
-</span><span id="ArchiveFileManager.check_restore_status-388"><a href="#ArchiveFileManager.check_restore_status-388"><span class="linenos">388</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.check_restore_status-389"><a href="#ArchiveFileManager.check_restore_status-389"><span class="linenos">389</span></a>                    <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2"> restore status is </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">value</span><span class="si">}</span><span class="s2">&quot;</span>
-</span><span id="ArchiveFileManager.check_restore_status-390"><a href="#ArchiveFileManager.check_restore_status-390"><span class="linenos">390</span></a>                <span class="p">)</span>
-</span><span id="ArchiveFileManager.check_restore_status-391"><a href="#ArchiveFileManager.check_restore_status-391"><span class="linenos">391</span></a>
-</span><span id="ArchiveFileManager.check_restore_status-392"><a href="#ArchiveFileManager.check_restore_status-392"><span class="linenos">392</span></a>        <span class="k">return</span> <span class="p">{</span>
-</span><span id="ArchiveFileManager.check_restore_status-393"><a href="#ArchiveFileManager.check_restore_status-393"><span class="linenos">393</span></a>            <span class="s2">&quot;total_objects&quot;</span><span class="p">:</span> <span class="n">total_objects</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.check_restore_status-394"><a href="#ArchiveFileManager.check_restore_status-394"><span class="linenos">394</span></a>            <span class="s2">&quot;not_started_objects&quot;</span><span class="p">:</span> <span class="n">not_started_objects</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.check_restore_status-395"><a href="#ArchiveFileManager.check_restore_status-395"><span class="linenos">395</span></a>            <span class="s2">&quot;ongoing_objects&quot;</span><span class="p">:</span> <span class="n">ongoing_objects</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.check_restore_status-396"><a href="#ArchiveFileManager.check_restore_status-396"><span class="linenos">396</span></a>            <span class="s2">&quot;restored_objects&quot;</span><span class="p">:</span> <span class="n">restored_objects</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.check_restore_status-397"><a href="#ArchiveFileManager.check_restore_status-397"><span class="linenos">397</span></a>        <span class="p">}</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="ArchiveFileManager.check_restore_status-432"><a href="#ArchiveFileManager.check_restore_status-432"><span class="linenos">432</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="ArchiveFileManager.check_restore_status-433"><a href="#ArchiveFileManager.check_restore_status-433"><span class="linenos">433</span></a>    <span class="k">def</span> <span class="nf">check_restore_status</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.check_restore_status-434"><a href="#ArchiveFileManager.check_restore_status-434"><span class="linenos">434</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Check the restore status of archived data.</span>
+</span><span id="ArchiveFileManager.check_restore_status-435"><a href="#ArchiveFileManager.check_restore_status-435"><span class="linenos">435</span></a>
+</span><span id="ArchiveFileManager.check_restore_status-436"><a href="#ArchiveFileManager.check_restore_status-436"><span class="linenos">436</span></a><span class="sd">        Args:</span>
+</span><span id="ArchiveFileManager.check_restore_status-437"><a href="#ArchiveFileManager.check_restore_status-437"><span class="linenos">437</span></a><span class="sd">            source_bucket: name of bucket to check the restore status.</span>
+</span><span id="ArchiveFileManager.check_restore_status-438"><a href="#ArchiveFileManager.check_restore_status-438"><span class="linenos">438</span></a><span class="sd">            source_object: object to check the restore status.</span>
+</span><span id="ArchiveFileManager.check_restore_status-439"><a href="#ArchiveFileManager.check_restore_status-439"><span class="linenos">439</span></a>
+</span><span id="ArchiveFileManager.check_restore_status-440"><a href="#ArchiveFileManager.check_restore_status-440"><span class="linenos">440</span></a><span class="sd">        Returns:</span>
+</span><span id="ArchiveFileManager.check_restore_status-441"><a href="#ArchiveFileManager.check_restore_status-441"><span class="linenos">441</span></a><span class="sd">            A dict containing the amount of objects in each status.</span>
+</span><span id="ArchiveFileManager.check_restore_status-442"><a href="#ArchiveFileManager.check_restore_status-442"><span class="linenos">442</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ArchiveFileManager.check_restore_status-443"><a href="#ArchiveFileManager.check_restore_status-443"><span class="linenos">443</span></a>        <span class="n">not_started_objects</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="ArchiveFileManager.check_restore_status-444"><a href="#ArchiveFileManager.check_restore_status-444"><span class="linenos">444</span></a>        <span class="n">ongoing_objects</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="ArchiveFileManager.check_restore_status-445"><a href="#ArchiveFileManager.check_restore_status-445"><span class="linenos">445</span></a>        <span class="n">restored_objects</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="ArchiveFileManager.check_restore_status-446"><a href="#ArchiveFileManager.check_restore_status-446"><span class="linenos">446</span></a>        <span class="n">total_objects</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="ArchiveFileManager.check_restore_status-447"><a href="#ArchiveFileManager.check_restore_status-447"><span class="linenos">447</span></a>
+</span><span id="ArchiveFileManager.check_restore_status-448"><a href="#ArchiveFileManager.check_restore_status-448"><span class="linenos">448</span></a>        <span class="k">if</span> <span class="n">_check_directory</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span><span class="p">):</span>
+</span><span id="ArchiveFileManager.check_restore_status-449"><a href="#ArchiveFileManager.check_restore_status-449"><span class="linenos">449</span></a>            <span class="n">source_object</span> <span class="o">=</span> <span class="n">_process_directory_path</span><span class="p">(</span><span class="n">source_object</span><span class="p">)</span>
+</span><span id="ArchiveFileManager.check_restore_status-450"><a href="#ArchiveFileManager.check_restore_status-450"><span class="linenos">450</span></a>
+</span><span id="ArchiveFileManager.check_restore_status-451"><a href="#ArchiveFileManager.check_restore_status-451"><span class="linenos">451</span></a>        <span class="n">objects_to_restore</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.check_restore_status-452"><a href="#ArchiveFileManager.check_restore_status-452"><span class="linenos">452</span></a>            <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
+</span><span id="ArchiveFileManager.check_restore_status-453"><a href="#ArchiveFileManager.check_restore_status-453"><span class="linenos">453</span></a>        <span class="p">)</span>
+</span><span id="ArchiveFileManager.check_restore_status-454"><a href="#ArchiveFileManager.check_restore_status-454"><span class="linenos">454</span></a>
+</span><span id="ArchiveFileManager.check_restore_status-455"><a href="#ArchiveFileManager.check_restore_status-455"><span class="linenos">455</span></a>        <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_to_restore</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.check_restore_status-456"><a href="#ArchiveFileManager.check_restore_status-456"><span class="linenos">456</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Checking restore status for: </span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="ArchiveFileManager.check_restore_status-457"><a href="#ArchiveFileManager.check_restore_status-457"><span class="linenos">457</span></a>
+</span><span id="ArchiveFileManager.check_restore_status-458"><a href="#ArchiveFileManager.check_restore_status-458"><span class="linenos">458</span></a>            <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_check_object_restore_status</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.check_restore_status-459"><a href="#ArchiveFileManager.check_restore_status-459"><span class="linenos">459</span></a>                <span class="n">source_bucket</span><span class="p">,</span> <span class="n">obj</span>
+</span><span id="ArchiveFileManager.check_restore_status-460"><a href="#ArchiveFileManager.check_restore_status-460"><span class="linenos">460</span></a>            <span class="p">)</span>
+</span><span id="ArchiveFileManager.check_restore_status-461"><a href="#ArchiveFileManager.check_restore_status-461"><span class="linenos">461</span></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">restore_status</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.check_restore_status-462"><a href="#ArchiveFileManager.check_restore_status-462"><span class="linenos">462</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.check_restore_status-463"><a href="#ArchiveFileManager.check_restore_status-463"><span class="linenos">463</span></a>                    <span class="sa">f</span><span class="s2">&quot;Restore status not found for </span><span class="si">{</span><span class="n">source_bucket</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="ArchiveFileManager.check_restore_status-464"><a href="#ArchiveFileManager.check_restore_status-464"><span class="linenos">464</span></a>                <span class="p">)</span>
+</span><span id="ArchiveFileManager.check_restore_status-465"><a href="#ArchiveFileManager.check_restore_status-465"><span class="linenos">465</span></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.check_restore_status-466"><a href="#ArchiveFileManager.check_restore_status-466"><span class="linenos">466</span></a>                <span class="n">total_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="ArchiveFileManager.check_restore_status-467"><a href="#ArchiveFileManager.check_restore_status-467"><span class="linenos">467</span></a>
+</span><span id="ArchiveFileManager.check_restore_status-468"><a href="#ArchiveFileManager.check_restore_status-468"><span class="linenos">468</span></a>                <span class="k">if</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">NOT_STARTED</span> <span class="o">==</span> <span class="n">restore_status</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.check_restore_status-469"><a href="#ArchiveFileManager.check_restore_status-469"><span class="linenos">469</span></a>                    <span class="n">not_started_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="ArchiveFileManager.check_restore_status-470"><a href="#ArchiveFileManager.check_restore_status-470"><span class="linenos">470</span></a>                <span class="k">elif</span> <span class="n">RestoreStatus</span><span class="o">.</span><span class="n">ONGOING</span> <span class="o">==</span> <span class="n">restore_status</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.check_restore_status-471"><a href="#ArchiveFileManager.check_restore_status-471"><span class="linenos">471</span></a>                    <span class="n">ongoing_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="ArchiveFileManager.check_restore_status-472"><a href="#ArchiveFileManager.check_restore_status-472"><span class="linenos">472</span></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.check_restore_status-473"><a href="#ArchiveFileManager.check_restore_status-473"><span class="linenos">473</span></a>                    <span class="n">restored_objects</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="ArchiveFileManager.check_restore_status-474"><a href="#ArchiveFileManager.check_restore_status-474"><span class="linenos">474</span></a>
+</span><span id="ArchiveFileManager.check_restore_status-475"><a href="#ArchiveFileManager.check_restore_status-475"><span class="linenos">475</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.check_restore_status-476"><a href="#ArchiveFileManager.check_restore_status-476"><span class="linenos">476</span></a>                    <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">obj</span><span class="si">}</span><span class="s2"> restore status is </span><span class="si">{</span><span class="n">restore_status</span><span class="o">.</span><span class="n">value</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="ArchiveFileManager.check_restore_status-477"><a href="#ArchiveFileManager.check_restore_status-477"><span class="linenos">477</span></a>                <span class="p">)</span>
+</span><span id="ArchiveFileManager.check_restore_status-478"><a href="#ArchiveFileManager.check_restore_status-478"><span class="linenos">478</span></a>
+</span><span id="ArchiveFileManager.check_restore_status-479"><a href="#ArchiveFileManager.check_restore_status-479"><span class="linenos">479</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="ArchiveFileManager.check_restore_status-480"><a href="#ArchiveFileManager.check_restore_status-480"><span class="linenos">480</span></a>            <span class="s2">&quot;total_objects&quot;</span><span class="p">:</span> <span class="n">total_objects</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.check_restore_status-481"><a href="#ArchiveFileManager.check_restore_status-481"><span class="linenos">481</span></a>            <span class="s2">&quot;not_started_objects&quot;</span><span class="p">:</span> <span class="n">not_started_objects</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.check_restore_status-482"><a href="#ArchiveFileManager.check_restore_status-482"><span class="linenos">482</span></a>            <span class="s2">&quot;ongoing_objects&quot;</span><span class="p">:</span> <span class="n">ongoing_objects</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.check_restore_status-483"><a href="#ArchiveFileManager.check_restore_status-483"><span class="linenos">483</span></a>            <span class="s2">&quot;restored_objects&quot;</span><span class="p">:</span> <span class="n">restored_objects</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.check_restore_status-484"><a href="#ArchiveFileManager.check_restore_status-484"><span class="linenos">484</span></a>        <span class="p">}</span>
 </span></pre></div>
 
 
@@ -1480,42 +1603,45 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#ArchiveFileManager.request_restore"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="ArchiveFileManager.request_restore-432"><a href="#ArchiveFileManager.request_restore-432"><span class="linenos">432</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="ArchiveFileManager.request_restore-433"><a href="#ArchiveFileManager.request_restore-433"><span class="linenos">433</span></a>    <span class="k">def</span> <span class="nf">request_restore</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.request_restore-434"><a href="#ArchiveFileManager.request_restore-434"><span class="linenos">434</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore-435"><a href="#ArchiveFileManager.request_restore-435"><span class="linenos">435</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore-436"><a href="#ArchiveFileManager.request_restore-436"><span class="linenos">436</span></a>        <span class="n">restore_expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore-437"><a href="#ArchiveFileManager.request_restore-437"><span class="linenos">437</span></a>        <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore-438"><a href="#ArchiveFileManager.request_restore-438"><span class="linenos">438</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore-439"><a href="#ArchiveFileManager.request_restore-439"><span class="linenos">439</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.request_restore-440"><a href="#ArchiveFileManager.request_restore-440"><span class="linenos">440</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request the restore of archived data.</span>
-</span><span id="ArchiveFileManager.request_restore-441"><a href="#ArchiveFileManager.request_restore-441"><span class="linenos">441</span></a>
-</span><span id="ArchiveFileManager.request_restore-442"><a href="#ArchiveFileManager.request_restore-442"><span class="linenos">442</span></a><span class="sd">        Args:</span>
-</span><span id="ArchiveFileManager.request_restore-443"><a href="#ArchiveFileManager.request_restore-443"><span class="linenos">443</span></a><span class="sd">            source_bucket: name of bucket to perform the restore.</span>
-</span><span id="ArchiveFileManager.request_restore-444"><a href="#ArchiveFileManager.request_restore-444"><span class="linenos">444</span></a><span class="sd">            source_object: object to be restored.</span>
-</span><span id="ArchiveFileManager.request_restore-445"><a href="#ArchiveFileManager.request_restore-445"><span class="linenos">445</span></a><span class="sd">            restore_expiration: restore expiration in days.</span>
-</span><span id="ArchiveFileManager.request_restore-446"><a href="#ArchiveFileManager.request_restore-446"><span class="linenos">446</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
-</span><span id="ArchiveFileManager.request_restore-447"><a href="#ArchiveFileManager.request_restore-447"><span class="linenos">447</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
-</span><span id="ArchiveFileManager.request_restore-448"><a href="#ArchiveFileManager.request_restore-448"><span class="linenos">448</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
-</span><span id="ArchiveFileManager.request_restore-449"><a href="#ArchiveFileManager.request_restore-449"><span class="linenos">449</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
-</span><span id="ArchiveFileManager.request_restore-450"><a href="#ArchiveFileManager.request_restore-450"><span class="linenos">450</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="ArchiveFileManager.request_restore-451"><a href="#ArchiveFileManager.request_restore-451"><span class="linenos">451</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.request_restore-452"><a href="#ArchiveFileManager.request_restore-452"><span class="linenos">452</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="p">[</span><span class="n">source_object</span><span class="p">])</span>
-</span><span id="ArchiveFileManager.request_restore-453"><a href="#ArchiveFileManager.request_restore-453"><span class="linenos">453</span></a>
-</span><span id="ArchiveFileManager.request_restore-454"><a href="#ArchiveFileManager.request_restore-454"><span class="linenos">454</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be restored:&quot;</span><span class="p">)</span>
-</span><span id="ArchiveFileManager.request_restore-455"><a href="#ArchiveFileManager.request_restore-455"><span class="linenos">455</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
-</span><span id="ArchiveFileManager.request_restore-456"><a href="#ArchiveFileManager.request_restore-456"><span class="linenos">456</span></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.request_restore-457"><a href="#ArchiveFileManager.request_restore-457"><span class="linenos">457</span></a>            <span class="n">objects_to_restore</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.request_restore-458"><a href="#ArchiveFileManager.request_restore-458"><span class="linenos">458</span></a>                <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
-</span><span id="ArchiveFileManager.request_restore-459"><a href="#ArchiveFileManager.request_restore-459"><span class="linenos">459</span></a>            <span class="p">)</span>
-</span><span id="ArchiveFileManager.request_restore-460"><a href="#ArchiveFileManager.request_restore-460"><span class="linenos">460</span></a>
-</span><span id="ArchiveFileManager.request_restore-461"><a href="#ArchiveFileManager.request_restore-461"><span class="linenos">461</span></a>            <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_to_restore</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.request_restore-462"><a href="#ArchiveFileManager.request_restore-462"><span class="linenos">462</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_request_restore_object</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.request_restore-463"><a href="#ArchiveFileManager.request_restore-463"><span class="linenos">463</span></a>                    <span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore-464"><a href="#ArchiveFileManager.request_restore-464"><span class="linenos">464</span></a>                    <span class="n">obj</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore-465"><a href="#ArchiveFileManager.request_restore-465"><span class="linenos">465</span></a>                    <span class="n">restore_expiration</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore-466"><a href="#ArchiveFileManager.request_restore-466"><span class="linenos">466</span></a>                    <span class="n">retrieval_tier</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore-467"><a href="#ArchiveFileManager.request_restore-467"><span class="linenos">467</span></a>                <span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="ArchiveFileManager.request_restore-522"><a href="#ArchiveFileManager.request_restore-522"><span class="linenos">522</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="ArchiveFileManager.request_restore-523"><a href="#ArchiveFileManager.request_restore-523"><span class="linenos">523</span></a>    <span class="k">def</span> <span class="nf">request_restore</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.request_restore-524"><a href="#ArchiveFileManager.request_restore-524"><span class="linenos">524</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore-525"><a href="#ArchiveFileManager.request_restore-525"><span class="linenos">525</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore-526"><a href="#ArchiveFileManager.request_restore-526"><span class="linenos">526</span></a>        <span class="n">restore_expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore-527"><a href="#ArchiveFileManager.request_restore-527"><span class="linenos">527</span></a>        <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore-528"><a href="#ArchiveFileManager.request_restore-528"><span class="linenos">528</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore-529"><a href="#ArchiveFileManager.request_restore-529"><span class="linenos">529</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.request_restore-530"><a href="#ArchiveFileManager.request_restore-530"><span class="linenos">530</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request the restore of archived data.</span>
+</span><span id="ArchiveFileManager.request_restore-531"><a href="#ArchiveFileManager.request_restore-531"><span class="linenos">531</span></a>
+</span><span id="ArchiveFileManager.request_restore-532"><a href="#ArchiveFileManager.request_restore-532"><span class="linenos">532</span></a><span class="sd">        Args:</span>
+</span><span id="ArchiveFileManager.request_restore-533"><a href="#ArchiveFileManager.request_restore-533"><span class="linenos">533</span></a><span class="sd">            source_bucket: name of bucket to perform the restore.</span>
+</span><span id="ArchiveFileManager.request_restore-534"><a href="#ArchiveFileManager.request_restore-534"><span class="linenos">534</span></a><span class="sd">            source_object: object to be restored.</span>
+</span><span id="ArchiveFileManager.request_restore-535"><a href="#ArchiveFileManager.request_restore-535"><span class="linenos">535</span></a><span class="sd">            restore_expiration: restore expiration in days.</span>
+</span><span id="ArchiveFileManager.request_restore-536"><a href="#ArchiveFileManager.request_restore-536"><span class="linenos">536</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
+</span><span id="ArchiveFileManager.request_restore-537"><a href="#ArchiveFileManager.request_restore-537"><span class="linenos">537</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
+</span><span id="ArchiveFileManager.request_restore-538"><a href="#ArchiveFileManager.request_restore-538"><span class="linenos">538</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
+</span><span id="ArchiveFileManager.request_restore-539"><a href="#ArchiveFileManager.request_restore-539"><span class="linenos">539</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
+</span><span id="ArchiveFileManager.request_restore-540"><a href="#ArchiveFileManager.request_restore-540"><span class="linenos">540</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ArchiveFileManager.request_restore-541"><a href="#ArchiveFileManager.request_restore-541"><span class="linenos">541</span></a>        <span class="k">if</span> <span class="n">_check_directory</span><span class="p">(</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span><span class="p">):</span>
+</span><span id="ArchiveFileManager.request_restore-542"><a href="#ArchiveFileManager.request_restore-542"><span class="linenos">542</span></a>            <span class="n">source_object</span> <span class="o">=</span> <span class="n">_process_directory_path</span><span class="p">(</span><span class="n">source_object</span><span class="p">)</span>
+</span><span id="ArchiveFileManager.request_restore-543"><a href="#ArchiveFileManager.request_restore-543"><span class="linenos">543</span></a>
+</span><span id="ArchiveFileManager.request_restore-544"><a href="#ArchiveFileManager.request_restore-544"><span class="linenos">544</span></a>        <span class="k">if</span> <span class="n">dry_run</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.request_restore-545"><a href="#ArchiveFileManager.request_restore-545"><span class="linenos">545</span></a>            <span class="n">response</span> <span class="o">=</span> <span class="n">_dry_run</span><span class="p">(</span><span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">object_paths</span><span class="o">=</span><span class="p">[</span><span class="n">source_object</span><span class="p">])</span>
+</span><span id="ArchiveFileManager.request_restore-546"><a href="#ArchiveFileManager.request_restore-546"><span class="linenos">546</span></a>
+</span><span id="ArchiveFileManager.request_restore-547"><a href="#ArchiveFileManager.request_restore-547"><span class="linenos">547</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Paths that would be restored:&quot;</span><span class="p">)</span>
+</span><span id="ArchiveFileManager.request_restore-548"><a href="#ArchiveFileManager.request_restore-548"><span class="linenos">548</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
+</span><span id="ArchiveFileManager.request_restore-549"><a href="#ArchiveFileManager.request_restore-549"><span class="linenos">549</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.request_restore-550"><a href="#ArchiveFileManager.request_restore-550"><span class="linenos">550</span></a>            <span class="n">objects_to_restore</span> <span class="o">=</span> <span class="n">_list_objects_recursively</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.request_restore-551"><a href="#ArchiveFileManager.request_restore-551"><span class="linenos">551</span></a>                <span class="n">bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span> <span class="n">path</span><span class="o">=</span><span class="n">source_object</span>
+</span><span id="ArchiveFileManager.request_restore-552"><a href="#ArchiveFileManager.request_restore-552"><span class="linenos">552</span></a>            <span class="p">)</span>
+</span><span id="ArchiveFileManager.request_restore-553"><a href="#ArchiveFileManager.request_restore-553"><span class="linenos">553</span></a>
+</span><span id="ArchiveFileManager.request_restore-554"><a href="#ArchiveFileManager.request_restore-554"><span class="linenos">554</span></a>            <span class="k">for</span> <span class="n">obj</span> <span class="ow">in</span> <span class="n">objects_to_restore</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.request_restore-555"><a href="#ArchiveFileManager.request_restore-555"><span class="linenos">555</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_request_restore_object</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.request_restore-556"><a href="#ArchiveFileManager.request_restore-556"><span class="linenos">556</span></a>                    <span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore-557"><a href="#ArchiveFileManager.request_restore-557"><span class="linenos">557</span></a>                    <span class="n">obj</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore-558"><a href="#ArchiveFileManager.request_restore-558"><span class="linenos">558</span></a>                    <span class="n">restore_expiration</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore-559"><a href="#ArchiveFileManager.request_restore-559"><span class="linenos">559</span></a>                    <span class="n">retrieval_tier</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore-560"><a href="#ArchiveFileManager.request_restore-560"><span class="linenos">560</span></a>                <span class="p">)</span>
 </span></pre></div>
 
 
@@ -1545,65 +1671,65 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#ArchiveFileManager.request_restore_and_wait"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="ArchiveFileManager.request_restore_and_wait-469"><a href="#ArchiveFileManager.request_restore_and_wait-469"><span class="linenos">469</span></a>    <span class="nd">@staticmethod</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-470"><a href="#ArchiveFileManager.request_restore_and_wait-470"><span class="linenos">470</span></a>    <span class="k">def</span> <span class="nf">request_restore_and_wait</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-471"><a href="#ArchiveFileManager.request_restore_and_wait-471"><span class="linenos">471</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-472"><a href="#ArchiveFileManager.request_restore_and_wait-472"><span class="linenos">472</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-473"><a href="#ArchiveFileManager.request_restore_and_wait-473"><span class="linenos">473</span></a>        <span class="n">restore_expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-474"><a href="#ArchiveFileManager.request_restore_and_wait-474"><span class="linenos">474</span></a>        <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-475"><a href="#ArchiveFileManager.request_restore_and_wait-475"><span class="linenos">475</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-476"><a href="#ArchiveFileManager.request_restore_and_wait-476"><span class="linenos">476</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-477"><a href="#ArchiveFileManager.request_restore_and_wait-477"><span class="linenos">477</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request and wait for the restore to complete, polling the restore status.</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-478"><a href="#ArchiveFileManager.request_restore_and_wait-478"><span class="linenos">478</span></a>
-</span><span id="ArchiveFileManager.request_restore_and_wait-479"><a href="#ArchiveFileManager.request_restore_and_wait-479"><span class="linenos">479</span></a><span class="sd">        Args:</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-480"><a href="#ArchiveFileManager.request_restore_and_wait-480"><span class="linenos">480</span></a><span class="sd">            source_bucket: name of bucket to perform the restore.</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-481"><a href="#ArchiveFileManager.request_restore_and_wait-481"><span class="linenos">481</span></a><span class="sd">            source_object: object to be restored.</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-482"><a href="#ArchiveFileManager.request_restore_and_wait-482"><span class="linenos">482</span></a><span class="sd">            restore_expiration: restore expiration in days.</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-483"><a href="#ArchiveFileManager.request_restore_and_wait-483"><span class="linenos">483</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-484"><a href="#ArchiveFileManager.request_restore_and_wait-484"><span class="linenos">484</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-485"><a href="#ArchiveFileManager.request_restore_and_wait-485"><span class="linenos">485</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-486"><a href="#ArchiveFileManager.request_restore_and_wait-486"><span class="linenos">486</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-487"><a href="#ArchiveFileManager.request_restore_and_wait-487"><span class="linenos">487</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-488"><a href="#ArchiveFileManager.request_restore_and_wait-488"><span class="linenos">488</span></a>        <span class="k">if</span> <span class="n">retrieval_tier</span> <span class="o">!=</span> <span class="n">RestoreType</span><span class="o">.</span><span class="n">EXPEDITED</span><span class="o">.</span><span class="n">value</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-489"><a href="#ArchiveFileManager.request_restore_and_wait-489"><span class="linenos">489</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-490"><a href="#ArchiveFileManager.request_restore_and_wait-490"><span class="linenos">490</span></a>                <span class="sa">f</span><span class="s2">&quot;Retrieval Tier </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not allowed on this operation! This &quot;</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-491"><a href="#ArchiveFileManager.request_restore_and_wait-491"><span class="linenos">491</span></a>                <span class="s2">&quot;kind of restore should be used just with `Expedited` retrieval tier &quot;</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-492"><a href="#ArchiveFileManager.request_restore_and_wait-492"><span class="linenos">492</span></a>                <span class="s2">&quot;to save cluster costs.&quot;</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-493"><a href="#ArchiveFileManager.request_restore_and_wait-493"><span class="linenos">493</span></a>            <span class="p">)</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-494"><a href="#ArchiveFileManager.request_restore_and_wait-494"><span class="linenos">494</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-495"><a href="#ArchiveFileManager.request_restore_and_wait-495"><span class="linenos">495</span></a>                <span class="sa">f</span><span class="s2">&quot;Retrieval Tier </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not allowed on this operation! This &quot;</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-496"><a href="#ArchiveFileManager.request_restore_and_wait-496"><span class="linenos">496</span></a>                <span class="s2">&quot;kind of restore should be used just with `Expedited` retrieval tier &quot;</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-497"><a href="#ArchiveFileManager.request_restore_and_wait-497"><span class="linenos">497</span></a>                <span class="s2">&quot;to save cluster costs.&quot;</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-498"><a href="#ArchiveFileManager.request_restore_and_wait-498"><span class="linenos">498</span></a>            <span class="p">)</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-499"><a href="#ArchiveFileManager.request_restore_and_wait-499"><span class="linenos">499</span></a>
-</span><span id="ArchiveFileManager.request_restore_and_wait-500"><a href="#ArchiveFileManager.request_restore_and_wait-500"><span class="linenos">500</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-501"><a href="#ArchiveFileManager.request_restore_and_wait-501"><span class="linenos">501</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-502"><a href="#ArchiveFileManager.request_restore_and_wait-502"><span class="linenos">502</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-503"><a href="#ArchiveFileManager.request_restore_and_wait-503"><span class="linenos">503</span></a>            <span class="n">restore_expiration</span><span class="o">=</span><span class="n">restore_expiration</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-504"><a href="#ArchiveFileManager.request_restore_and_wait-504"><span class="linenos">504</span></a>            <span class="n">retrieval_tier</span><span class="o">=</span><span class="n">retrieval_tier</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-505"><a href="#ArchiveFileManager.request_restore_and_wait-505"><span class="linenos">505</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-506"><a href="#ArchiveFileManager.request_restore_and_wait-506"><span class="linenos">506</span></a>        <span class="p">)</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-507"><a href="#ArchiveFileManager.request_restore_and_wait-507"><span class="linenos">507</span></a>        <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-508"><a href="#ArchiveFileManager.request_restore_and_wait-508"><span class="linenos">508</span></a>            <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-509"><a href="#ArchiveFileManager.request_restore_and_wait-509"><span class="linenos">509</span></a>        <span class="p">)</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-510"><a href="#ArchiveFileManager.request_restore_and_wait-510"><span class="linenos">510</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restore status: </span><span class="si">{</span><span class="n">restore_status</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-511"><a href="#ArchiveFileManager.request_restore_and_wait-511"><span class="linenos">511</span></a>
-</span><span id="ArchiveFileManager.request_restore_and_wait-512"><a href="#ArchiveFileManager.request_restore_and_wait-512"><span class="linenos">512</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">dry_run</span><span class="p">:</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-513"><a href="#ArchiveFileManager.request_restore_and_wait-513"><span class="linenos">513</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Checking the restore status in 5 minutes.&quot;</span><span class="p">)</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-514"><a href="#ArchiveFileManager.request_restore_and_wait-514"><span class="linenos">514</span></a>            <span class="n">wait_time</span> <span class="o">=</span> <span class="mi">300</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-515"><a href="#ArchiveFileManager.request_restore_and_wait-515"><span class="linenos">515</span></a>            <span class="k">while</span> <span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;total_objects&quot;</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-516"><a href="#ArchiveFileManager.request_restore_and_wait-516"><span class="linenos">516</span></a>                <span class="s2">&quot;restored_objects&quot;</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-517"><a href="#ArchiveFileManager.request_restore_and_wait-517"><span class="linenos">517</span></a>            <span class="p">):</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-518"><a href="#ArchiveFileManager.request_restore_and_wait-518"><span class="linenos">518</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-519"><a href="#ArchiveFileManager.request_restore_and_wait-519"><span class="linenos">519</span></a>                    <span class="s2">&quot;Not all objects have been restored yet, checking the status again &quot;</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-520"><a href="#ArchiveFileManager.request_restore_and_wait-520"><span class="linenos">520</span></a>                    <span class="sa">f</span><span class="s2">&quot;in </span><span class="si">{</span><span class="n">wait_time</span><span class="si">}</span><span class="s2"> seconds.&quot;</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-521"><a href="#ArchiveFileManager.request_restore_and_wait-521"><span class="linenos">521</span></a>                <span class="p">)</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-522"><a href="#ArchiveFileManager.request_restore_and_wait-522"><span class="linenos">522</span></a>                <span class="n">time</span><span class="o">.</span><span class="n">sleep</span><span class="p">(</span><span class="n">wait_time</span><span class="p">)</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-523"><a href="#ArchiveFileManager.request_restore_and_wait-523"><span class="linenos">523</span></a>                <span class="n">wait_time</span> <span class="o">=</span> <span class="mi">30</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-524"><a href="#ArchiveFileManager.request_restore_and_wait-524"><span class="linenos">524</span></a>                <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-525"><a href="#ArchiveFileManager.request_restore_and_wait-525"><span class="linenos">525</span></a>                    <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-526"><a href="#ArchiveFileManager.request_restore_and_wait-526"><span class="linenos">526</span></a>                <span class="p">)</span>
-</span><span id="ArchiveFileManager.request_restore_and_wait-527"><a href="#ArchiveFileManager.request_restore_and_wait-527"><span class="linenos">527</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restore status: </span><span class="si">{</span><span class="n">restore_status</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="ArchiveFileManager.request_restore_and_wait-562"><a href="#ArchiveFileManager.request_restore_and_wait-562"><span class="linenos">562</span></a>    <span class="nd">@staticmethod</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-563"><a href="#ArchiveFileManager.request_restore_and_wait-563"><span class="linenos">563</span></a>    <span class="k">def</span> <span class="nf">request_restore_and_wait</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-564"><a href="#ArchiveFileManager.request_restore_and_wait-564"><span class="linenos">564</span></a>        <span class="n">source_bucket</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-565"><a href="#ArchiveFileManager.request_restore_and_wait-565"><span class="linenos">565</span></a>        <span class="n">source_object</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-566"><a href="#ArchiveFileManager.request_restore_and_wait-566"><span class="linenos">566</span></a>        <span class="n">restore_expiration</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-567"><a href="#ArchiveFileManager.request_restore_and_wait-567"><span class="linenos">567</span></a>        <span class="n">retrieval_tier</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-568"><a href="#ArchiveFileManager.request_restore_and_wait-568"><span class="linenos">568</span></a>        <span class="n">dry_run</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-569"><a href="#ArchiveFileManager.request_restore_and_wait-569"><span class="linenos">569</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-570"><a href="#ArchiveFileManager.request_restore_and_wait-570"><span class="linenos">570</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Request and wait for the restore to complete, polling the restore status.</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-571"><a href="#ArchiveFileManager.request_restore_and_wait-571"><span class="linenos">571</span></a>
+</span><span id="ArchiveFileManager.request_restore_and_wait-572"><a href="#ArchiveFileManager.request_restore_and_wait-572"><span class="linenos">572</span></a><span class="sd">        Args:</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-573"><a href="#ArchiveFileManager.request_restore_and_wait-573"><span class="linenos">573</span></a><span class="sd">            source_bucket: name of bucket to perform the restore.</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-574"><a href="#ArchiveFileManager.request_restore_and_wait-574"><span class="linenos">574</span></a><span class="sd">            source_object: object to be restored.</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-575"><a href="#ArchiveFileManager.request_restore_and_wait-575"><span class="linenos">575</span></a><span class="sd">            restore_expiration: restore expiration in days.</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-576"><a href="#ArchiveFileManager.request_restore_and_wait-576"><span class="linenos">576</span></a><span class="sd">            retrieval_tier: type of restore, possible values are:</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-577"><a href="#ArchiveFileManager.request_restore_and_wait-577"><span class="linenos">577</span></a><span class="sd">                Bulk, Standard or Expedited.</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-578"><a href="#ArchiveFileManager.request_restore_and_wait-578"><span class="linenos">578</span></a><span class="sd">            dry_run: if dry_run is set to True the function will print a dict with</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-579"><a href="#ArchiveFileManager.request_restore_and_wait-579"><span class="linenos">579</span></a><span class="sd">                all the paths that would be deleted based on the given keys.</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-580"><a href="#ArchiveFileManager.request_restore_and_wait-580"><span class="linenos">580</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-581"><a href="#ArchiveFileManager.request_restore_and_wait-581"><span class="linenos">581</span></a>        <span class="k">if</span> <span class="n">retrieval_tier</span> <span class="o">!=</span> <span class="n">RestoreType</span><span class="o">.</span><span class="n">EXPEDITED</span><span class="o">.</span><span class="n">value</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-582"><a href="#ArchiveFileManager.request_restore_and_wait-582"><span class="linenos">582</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-583"><a href="#ArchiveFileManager.request_restore_and_wait-583"><span class="linenos">583</span></a>                <span class="sa">f</span><span class="s2">&quot;Retrieval Tier </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not allowed on this operation! This &quot;</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-584"><a href="#ArchiveFileManager.request_restore_and_wait-584"><span class="linenos">584</span></a>                <span class="s2">&quot;kind of restore should be used just with `Expedited` retrieval tier &quot;</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-585"><a href="#ArchiveFileManager.request_restore_and_wait-585"><span class="linenos">585</span></a>                <span class="s2">&quot;to save cluster costs.&quot;</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-586"><a href="#ArchiveFileManager.request_restore_and_wait-586"><span class="linenos">586</span></a>            <span class="p">)</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-587"><a href="#ArchiveFileManager.request_restore_and_wait-587"><span class="linenos">587</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-588"><a href="#ArchiveFileManager.request_restore_and_wait-588"><span class="linenos">588</span></a>                <span class="sa">f</span><span class="s2">&quot;Retrieval Tier </span><span class="si">{</span><span class="n">retrieval_tier</span><span class="si">}</span><span class="s2"> not allowed on this operation! This &quot;</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-589"><a href="#ArchiveFileManager.request_restore_and_wait-589"><span class="linenos">589</span></a>                <span class="s2">&quot;kind of restore should be used just with `Expedited` retrieval tier &quot;</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-590"><a href="#ArchiveFileManager.request_restore_and_wait-590"><span class="linenos">590</span></a>                <span class="s2">&quot;to save cluster costs.&quot;</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-591"><a href="#ArchiveFileManager.request_restore_and_wait-591"><span class="linenos">591</span></a>            <span class="p">)</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-592"><a href="#ArchiveFileManager.request_restore_and_wait-592"><span class="linenos">592</span></a>
+</span><span id="ArchiveFileManager.request_restore_and_wait-593"><a href="#ArchiveFileManager.request_restore_and_wait-593"><span class="linenos">593</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">request_restore</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-594"><a href="#ArchiveFileManager.request_restore_and_wait-594"><span class="linenos">594</span></a>            <span class="n">source_bucket</span><span class="o">=</span><span class="n">source_bucket</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-595"><a href="#ArchiveFileManager.request_restore_and_wait-595"><span class="linenos">595</span></a>            <span class="n">source_object</span><span class="o">=</span><span class="n">source_object</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-596"><a href="#ArchiveFileManager.request_restore_and_wait-596"><span class="linenos">596</span></a>            <span class="n">restore_expiration</span><span class="o">=</span><span class="n">restore_expiration</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-597"><a href="#ArchiveFileManager.request_restore_and_wait-597"><span class="linenos">597</span></a>            <span class="n">retrieval_tier</span><span class="o">=</span><span class="n">retrieval_tier</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-598"><a href="#ArchiveFileManager.request_restore_and_wait-598"><span class="linenos">598</span></a>            <span class="n">dry_run</span><span class="o">=</span><span class="n">dry_run</span><span class="p">,</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-599"><a href="#ArchiveFileManager.request_restore_and_wait-599"><span class="linenos">599</span></a>        <span class="p">)</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-600"><a href="#ArchiveFileManager.request_restore_and_wait-600"><span class="linenos">600</span></a>        <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-601"><a href="#ArchiveFileManager.request_restore_and_wait-601"><span class="linenos">601</span></a>            <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-602"><a href="#ArchiveFileManager.request_restore_and_wait-602"><span class="linenos">602</span></a>        <span class="p">)</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-603"><a href="#ArchiveFileManager.request_restore_and_wait-603"><span class="linenos">603</span></a>        <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restore status: </span><span class="si">{</span><span class="n">restore_status</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-604"><a href="#ArchiveFileManager.request_restore_and_wait-604"><span class="linenos">604</span></a>
+</span><span id="ArchiveFileManager.request_restore_and_wait-605"><a href="#ArchiveFileManager.request_restore_and_wait-605"><span class="linenos">605</span></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">dry_run</span><span class="p">:</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-606"><a href="#ArchiveFileManager.request_restore_and_wait-606"><span class="linenos">606</span></a>            <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Checking the restore status in 5 minutes.&quot;</span><span class="p">)</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-607"><a href="#ArchiveFileManager.request_restore_and_wait-607"><span class="linenos">607</span></a>            <span class="n">wait_time</span> <span class="o">=</span> <span class="mi">300</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-608"><a href="#ArchiveFileManager.request_restore_and_wait-608"><span class="linenos">608</span></a>            <span class="k">while</span> <span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;total_objects&quot;</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">restore_status</span><span class="o">.</span><span class="n">get</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-609"><a href="#ArchiveFileManager.request_restore_and_wait-609"><span class="linenos">609</span></a>                <span class="s2">&quot;restored_objects&quot;</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-610"><a href="#ArchiveFileManager.request_restore_and_wait-610"><span class="linenos">610</span></a>            <span class="p">):</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-611"><a href="#ArchiveFileManager.request_restore_and_wait-611"><span class="linenos">611</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-612"><a href="#ArchiveFileManager.request_restore_and_wait-612"><span class="linenos">612</span></a>                    <span class="s2">&quot;Not all objects have been restored yet, checking the status again &quot;</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-613"><a href="#ArchiveFileManager.request_restore_and_wait-613"><span class="linenos">613</span></a>                    <span class="sa">f</span><span class="s2">&quot;in </span><span class="si">{</span><span class="n">wait_time</span><span class="si">}</span><span class="s2"> seconds.&quot;</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-614"><a href="#ArchiveFileManager.request_restore_and_wait-614"><span class="linenos">614</span></a>                <span class="p">)</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-615"><a href="#ArchiveFileManager.request_restore_and_wait-615"><span class="linenos">615</span></a>                <span class="n">time</span><span class="o">.</span><span class="n">sleep</span><span class="p">(</span><span class="n">wait_time</span><span class="p">)</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-616"><a href="#ArchiveFileManager.request_restore_and_wait-616"><span class="linenos">616</span></a>                <span class="n">wait_time</span> <span class="o">=</span> <span class="mi">30</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-617"><a href="#ArchiveFileManager.request_restore_and_wait-617"><span class="linenos">617</span></a>                <span class="n">restore_status</span> <span class="o">=</span> <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">check_restore_status</span><span class="p">(</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-618"><a href="#ArchiveFileManager.request_restore_and_wait-618"><span class="linenos">618</span></a>                    <span class="n">source_bucket</span><span class="p">,</span> <span class="n">source_object</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-619"><a href="#ArchiveFileManager.request_restore_and_wait-619"><span class="linenos">619</span></a>                <span class="p">)</span>
+</span><span id="ArchiveFileManager.request_restore_and_wait-620"><a href="#ArchiveFileManager.request_restore_and_wait-620"><span class="linenos">620</span></a>                <span class="n">ArchiveFileManager</span><span class="o">.</span><span class="n">_logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Restore status: </span><span class="si">{</span><span class="n">restore_status</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
 </span></pre></div>
 
 
diff --git a/lakehouse_engine/transformers/data_maskers.html b/lakehouse_engine/transformers/data_maskers.html
index f60bde2..26960f6 100644
--- a/lakehouse_engine/transformers/data_maskers.html
+++ b/lakehouse_engine/transformers/data_maskers.html
@@ -111,32 +111,29 @@ <h1 class="modulename">
 </span><span id="L-44"><a href="#L-44"><span class="linenos">44</span></a>                <span class="k">else</span><span class="p">:</span>
 </span><span id="L-45"><a href="#L-45"><span class="linenos">45</span></a>                    <span class="k">raise</span> <span class="n">WrongArgumentsException</span><span class="p">(</span><span class="s2">&quot;Hashing approach is not supported.&quot;</span><span class="p">)</span>
 </span><span id="L-46"><a href="#L-46"><span class="linenos">46</span></a>
-</span><span id="L-47"><a href="#L-47"><span class="linenos">47</span></a>                <span class="k">if</span> <span class="n">suffix</span> <span class="ow">and</span> <span class="n">suffix</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span><span class="p">:</span>
-</span><span id="L-48"><a href="#L-48"><span class="linenos">48</span></a>                    <span class="n">masked_df</span> <span class="o">=</span> <span class="n">masked_df</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">)</span>
-</span><span id="L-49"><a href="#L-49"><span class="linenos">49</span></a>
-</span><span id="L-50"><a href="#L-50"><span class="linenos">50</span></a>            <span class="k">return</span> <span class="n">masked_df</span>
-</span><span id="L-51"><a href="#L-51"><span class="linenos">51</span></a>
-</span><span id="L-52"><a href="#L-52"><span class="linenos">52</span></a>        <span class="k">return</span> <span class="n">inner</span>
-</span><span id="L-53"><a href="#L-53"><span class="linenos">53</span></a>
-</span><span id="L-54"><a href="#L-54"><span class="linenos">54</span></a>    <span class="nd">@classmethod</span>
-</span><span id="L-55"><a href="#L-55"><span class="linenos">55</span></a>    <span class="k">def</span> <span class="nf">column_dropper</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">cols</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Callable</span><span class="p">:</span>
-</span><span id="L-56"><a href="#L-56"><span class="linenos">56</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Drop specific columns.</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos">47</span></a>            <span class="k">return</span> <span class="n">masked_df</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos">48</span></a>
+</span><span id="L-49"><a href="#L-49"><span class="linenos">49</span></a>        <span class="k">return</span> <span class="n">inner</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos">50</span></a>
+</span><span id="L-51"><a href="#L-51"><span class="linenos">51</span></a>    <span class="nd">@classmethod</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos">52</span></a>    <span class="k">def</span> <span class="nf">column_dropper</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">cols</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Callable</span><span class="p">:</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos">53</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Drop specific columns.</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos">54</span></a>
+</span><span id="L-55"><a href="#L-55"><span class="linenos">55</span></a><span class="sd">        Args:</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos">56</span></a><span class="sd">            cols: list of column names to drop.</span>
 </span><span id="L-57"><a href="#L-57"><span class="linenos">57</span></a>
-</span><span id="L-58"><a href="#L-58"><span class="linenos">58</span></a><span class="sd">        Args:</span>
-</span><span id="L-59"><a href="#L-59"><span class="linenos">59</span></a><span class="sd">            cols: list of column names to drop.</span>
-</span><span id="L-60"><a href="#L-60"><span class="linenos">60</span></a>
-</span><span id="L-61"><a href="#L-61"><span class="linenos">61</span></a><span class="sd">        Returns:</span>
-</span><span id="L-62"><a href="#L-62"><span class="linenos">62</span></a><span class="sd">            A function to be called in .transform() spark function.</span>
-</span><span id="L-63"><a href="#L-63"><span class="linenos">63</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="L-64"><a href="#L-64"><span class="linenos">64</span></a>
-</span><span id="L-65"><a href="#L-65"><span class="linenos">65</span></a>        <span class="k">def</span> <span class="nf">inner</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">DataFrame</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="L-66"><a href="#L-66"><span class="linenos">66</span></a>            <span class="n">drop_df</span> <span class="o">=</span> <span class="n">df</span>
-</span><span id="L-67"><a href="#L-67"><span class="linenos">67</span></a>            <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">cols</span><span class="p">:</span>
-</span><span id="L-68"><a href="#L-68"><span class="linenos">68</span></a>                <span class="n">drop_df</span> <span class="o">=</span> <span class="n">drop_df</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">)</span>
-</span><span id="L-69"><a href="#L-69"><span class="linenos">69</span></a>
-</span><span id="L-70"><a href="#L-70"><span class="linenos">70</span></a>            <span class="k">return</span> <span class="n">drop_df</span>
-</span><span id="L-71"><a href="#L-71"><span class="linenos">71</span></a>
-</span><span id="L-72"><a href="#L-72"><span class="linenos">72</span></a>        <span class="k">return</span> <span class="n">inner</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos">58</span></a><span class="sd">        Returns:</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos">59</span></a><span class="sd">            A function to be called in .transform() spark function.</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos">60</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos">61</span></a>
+</span><span id="L-62"><a href="#L-62"><span class="linenos">62</span></a>        <span class="k">def</span> <span class="nf">inner</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">DataFrame</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos">63</span></a>            <span class="n">drop_df</span> <span class="o">=</span> <span class="n">df</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos">64</span></a>            <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">cols</span><span class="p">:</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos">65</span></a>                <span class="n">drop_df</span> <span class="o">=</span> <span class="n">drop_df</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">)</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos">66</span></a>
+</span><span id="L-67"><a href="#L-67"><span class="linenos">67</span></a>            <span class="k">return</span> <span class="n">drop_df</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos">68</span></a>
+</span><span id="L-69"><a href="#L-69"><span class="linenos">69</span></a>        <span class="k">return</span> <span class="n">inner</span>
 </span></pre></div>
 
 
@@ -188,32 +185,29 @@ <h1 class="modulename">
 </span><span id="DataMaskers-45"><a href="#DataMaskers-45"><span class="linenos">45</span></a>                <span class="k">else</span><span class="p">:</span>
 </span><span id="DataMaskers-46"><a href="#DataMaskers-46"><span class="linenos">46</span></a>                    <span class="k">raise</span> <span class="n">WrongArgumentsException</span><span class="p">(</span><span class="s2">&quot;Hashing approach is not supported.&quot;</span><span class="p">)</span>
 </span><span id="DataMaskers-47"><a href="#DataMaskers-47"><span class="linenos">47</span></a>
-</span><span id="DataMaskers-48"><a href="#DataMaskers-48"><span class="linenos">48</span></a>                <span class="k">if</span> <span class="n">suffix</span> <span class="ow">and</span> <span class="n">suffix</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span><span class="p">:</span>
-</span><span id="DataMaskers-49"><a href="#DataMaskers-49"><span class="linenos">49</span></a>                    <span class="n">masked_df</span> <span class="o">=</span> <span class="n">masked_df</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">)</span>
-</span><span id="DataMaskers-50"><a href="#DataMaskers-50"><span class="linenos">50</span></a>
-</span><span id="DataMaskers-51"><a href="#DataMaskers-51"><span class="linenos">51</span></a>            <span class="k">return</span> <span class="n">masked_df</span>
-</span><span id="DataMaskers-52"><a href="#DataMaskers-52"><span class="linenos">52</span></a>
-</span><span id="DataMaskers-53"><a href="#DataMaskers-53"><span class="linenos">53</span></a>        <span class="k">return</span> <span class="n">inner</span>
-</span><span id="DataMaskers-54"><a href="#DataMaskers-54"><span class="linenos">54</span></a>
-</span><span id="DataMaskers-55"><a href="#DataMaskers-55"><span class="linenos">55</span></a>    <span class="nd">@classmethod</span>
-</span><span id="DataMaskers-56"><a href="#DataMaskers-56"><span class="linenos">56</span></a>    <span class="k">def</span> <span class="nf">column_dropper</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">cols</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Callable</span><span class="p">:</span>
-</span><span id="DataMaskers-57"><a href="#DataMaskers-57"><span class="linenos">57</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Drop specific columns.</span>
+</span><span id="DataMaskers-48"><a href="#DataMaskers-48"><span class="linenos">48</span></a>            <span class="k">return</span> <span class="n">masked_df</span>
+</span><span id="DataMaskers-49"><a href="#DataMaskers-49"><span class="linenos">49</span></a>
+</span><span id="DataMaskers-50"><a href="#DataMaskers-50"><span class="linenos">50</span></a>        <span class="k">return</span> <span class="n">inner</span>
+</span><span id="DataMaskers-51"><a href="#DataMaskers-51"><span class="linenos">51</span></a>
+</span><span id="DataMaskers-52"><a href="#DataMaskers-52"><span class="linenos">52</span></a>    <span class="nd">@classmethod</span>
+</span><span id="DataMaskers-53"><a href="#DataMaskers-53"><span class="linenos">53</span></a>    <span class="k">def</span> <span class="nf">column_dropper</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">cols</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Callable</span><span class="p">:</span>
+</span><span id="DataMaskers-54"><a href="#DataMaskers-54"><span class="linenos">54</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Drop specific columns.</span>
+</span><span id="DataMaskers-55"><a href="#DataMaskers-55"><span class="linenos">55</span></a>
+</span><span id="DataMaskers-56"><a href="#DataMaskers-56"><span class="linenos">56</span></a><span class="sd">        Args:</span>
+</span><span id="DataMaskers-57"><a href="#DataMaskers-57"><span class="linenos">57</span></a><span class="sd">            cols: list of column names to drop.</span>
 </span><span id="DataMaskers-58"><a href="#DataMaskers-58"><span class="linenos">58</span></a>
-</span><span id="DataMaskers-59"><a href="#DataMaskers-59"><span class="linenos">59</span></a><span class="sd">        Args:</span>
-</span><span id="DataMaskers-60"><a href="#DataMaskers-60"><span class="linenos">60</span></a><span class="sd">            cols: list of column names to drop.</span>
-</span><span id="DataMaskers-61"><a href="#DataMaskers-61"><span class="linenos">61</span></a>
-</span><span id="DataMaskers-62"><a href="#DataMaskers-62"><span class="linenos">62</span></a><span class="sd">        Returns:</span>
-</span><span id="DataMaskers-63"><a href="#DataMaskers-63"><span class="linenos">63</span></a><span class="sd">            A function to be called in .transform() spark function.</span>
-</span><span id="DataMaskers-64"><a href="#DataMaskers-64"><span class="linenos">64</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="DataMaskers-65"><a href="#DataMaskers-65"><span class="linenos">65</span></a>
-</span><span id="DataMaskers-66"><a href="#DataMaskers-66"><span class="linenos">66</span></a>        <span class="k">def</span> <span class="nf">inner</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">DataFrame</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="DataMaskers-67"><a href="#DataMaskers-67"><span class="linenos">67</span></a>            <span class="n">drop_df</span> <span class="o">=</span> <span class="n">df</span>
-</span><span id="DataMaskers-68"><a href="#DataMaskers-68"><span class="linenos">68</span></a>            <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">cols</span><span class="p">:</span>
-</span><span id="DataMaskers-69"><a href="#DataMaskers-69"><span class="linenos">69</span></a>                <span class="n">drop_df</span> <span class="o">=</span> <span class="n">drop_df</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">)</span>
-</span><span id="DataMaskers-70"><a href="#DataMaskers-70"><span class="linenos">70</span></a>
-</span><span id="DataMaskers-71"><a href="#DataMaskers-71"><span class="linenos">71</span></a>            <span class="k">return</span> <span class="n">drop_df</span>
-</span><span id="DataMaskers-72"><a href="#DataMaskers-72"><span class="linenos">72</span></a>
-</span><span id="DataMaskers-73"><a href="#DataMaskers-73"><span class="linenos">73</span></a>        <span class="k">return</span> <span class="n">inner</span>
+</span><span id="DataMaskers-59"><a href="#DataMaskers-59"><span class="linenos">59</span></a><span class="sd">        Returns:</span>
+</span><span id="DataMaskers-60"><a href="#DataMaskers-60"><span class="linenos">60</span></a><span class="sd">            A function to be called in .transform() spark function.</span>
+</span><span id="DataMaskers-61"><a href="#DataMaskers-61"><span class="linenos">61</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DataMaskers-62"><a href="#DataMaskers-62"><span class="linenos">62</span></a>
+</span><span id="DataMaskers-63"><a href="#DataMaskers-63"><span class="linenos">63</span></a>        <span class="k">def</span> <span class="nf">inner</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">DataFrame</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="DataMaskers-64"><a href="#DataMaskers-64"><span class="linenos">64</span></a>            <span class="n">drop_df</span> <span class="o">=</span> <span class="n">df</span>
+</span><span id="DataMaskers-65"><a href="#DataMaskers-65"><span class="linenos">65</span></a>            <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">cols</span><span class="p">:</span>
+</span><span id="DataMaskers-66"><a href="#DataMaskers-66"><span class="linenos">66</span></a>                <span class="n">drop_df</span> <span class="o">=</span> <span class="n">drop_df</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">)</span>
+</span><span id="DataMaskers-67"><a href="#DataMaskers-67"><span class="linenos">67</span></a>
+</span><span id="DataMaskers-68"><a href="#DataMaskers-68"><span class="linenos">68</span></a>            <span class="k">return</span> <span class="n">drop_df</span>
+</span><span id="DataMaskers-69"><a href="#DataMaskers-69"><span class="linenos">69</span></a>
+</span><span id="DataMaskers-70"><a href="#DataMaskers-70"><span class="linenos">70</span></a>        <span class="k">return</span> <span class="n">inner</span>
 </span></pre></div>
 
 
@@ -264,12 +258,9 @@ <h1 class="modulename">
 </span><span id="DataMaskers.hash_masker-45"><a href="#DataMaskers.hash_masker-45"><span class="linenos">45</span></a>                <span class="k">else</span><span class="p">:</span>
 </span><span id="DataMaskers.hash_masker-46"><a href="#DataMaskers.hash_masker-46"><span class="linenos">46</span></a>                    <span class="k">raise</span> <span class="n">WrongArgumentsException</span><span class="p">(</span><span class="s2">&quot;Hashing approach is not supported.&quot;</span><span class="p">)</span>
 </span><span id="DataMaskers.hash_masker-47"><a href="#DataMaskers.hash_masker-47"><span class="linenos">47</span></a>
-</span><span id="DataMaskers.hash_masker-48"><a href="#DataMaskers.hash_masker-48"><span class="linenos">48</span></a>                <span class="k">if</span> <span class="n">suffix</span> <span class="ow">and</span> <span class="n">suffix</span> <span class="o">!=</span> <span class="s2">&quot;&quot;</span><span class="p">:</span>
-</span><span id="DataMaskers.hash_masker-49"><a href="#DataMaskers.hash_masker-49"><span class="linenos">49</span></a>                    <span class="n">masked_df</span> <span class="o">=</span> <span class="n">masked_df</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">)</span>
-</span><span id="DataMaskers.hash_masker-50"><a href="#DataMaskers.hash_masker-50"><span class="linenos">50</span></a>
-</span><span id="DataMaskers.hash_masker-51"><a href="#DataMaskers.hash_masker-51"><span class="linenos">51</span></a>            <span class="k">return</span> <span class="n">masked_df</span>
-</span><span id="DataMaskers.hash_masker-52"><a href="#DataMaskers.hash_masker-52"><span class="linenos">52</span></a>
-</span><span id="DataMaskers.hash_masker-53"><a href="#DataMaskers.hash_masker-53"><span class="linenos">53</span></a>        <span class="k">return</span> <span class="n">inner</span>
+</span><span id="DataMaskers.hash_masker-48"><a href="#DataMaskers.hash_masker-48"><span class="linenos">48</span></a>            <span class="k">return</span> <span class="n">masked_df</span>
+</span><span id="DataMaskers.hash_masker-49"><a href="#DataMaskers.hash_masker-49"><span class="linenos">49</span></a>
+</span><span id="DataMaskers.hash_masker-50"><a href="#DataMaskers.hash_masker-50"><span class="linenos">50</span></a>        <span class="k">return</span> <span class="n">inner</span>
 </span></pre></div>
 
 
@@ -321,25 +312,25 @@ <h1 class="modulename">
 
     </div>
     <a class="headerlink" href="#DataMaskers.column_dropper"></a>
-            <div class="pdoc-code codehilite"><pre><span></span><span id="DataMaskers.column_dropper-55"><a href="#DataMaskers.column_dropper-55"><span class="linenos">55</span></a>    <span class="nd">@classmethod</span>
-</span><span id="DataMaskers.column_dropper-56"><a href="#DataMaskers.column_dropper-56"><span class="linenos">56</span></a>    <span class="k">def</span> <span class="nf">column_dropper</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">cols</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Callable</span><span class="p">:</span>
-</span><span id="DataMaskers.column_dropper-57"><a href="#DataMaskers.column_dropper-57"><span class="linenos">57</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Drop specific columns.</span>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DataMaskers.column_dropper-52"><a href="#DataMaskers.column_dropper-52"><span class="linenos">52</span></a>    <span class="nd">@classmethod</span>
+</span><span id="DataMaskers.column_dropper-53"><a href="#DataMaskers.column_dropper-53"><span class="linenos">53</span></a>    <span class="k">def</span> <span class="nf">column_dropper</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">cols</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Callable</span><span class="p">:</span>
+</span><span id="DataMaskers.column_dropper-54"><a href="#DataMaskers.column_dropper-54"><span class="linenos">54</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Drop specific columns.</span>
+</span><span id="DataMaskers.column_dropper-55"><a href="#DataMaskers.column_dropper-55"><span class="linenos">55</span></a>
+</span><span id="DataMaskers.column_dropper-56"><a href="#DataMaskers.column_dropper-56"><span class="linenos">56</span></a><span class="sd">        Args:</span>
+</span><span id="DataMaskers.column_dropper-57"><a href="#DataMaskers.column_dropper-57"><span class="linenos">57</span></a><span class="sd">            cols: list of column names to drop.</span>
 </span><span id="DataMaskers.column_dropper-58"><a href="#DataMaskers.column_dropper-58"><span class="linenos">58</span></a>
-</span><span id="DataMaskers.column_dropper-59"><a href="#DataMaskers.column_dropper-59"><span class="linenos">59</span></a><span class="sd">        Args:</span>
-</span><span id="DataMaskers.column_dropper-60"><a href="#DataMaskers.column_dropper-60"><span class="linenos">60</span></a><span class="sd">            cols: list of column names to drop.</span>
-</span><span id="DataMaskers.column_dropper-61"><a href="#DataMaskers.column_dropper-61"><span class="linenos">61</span></a>
-</span><span id="DataMaskers.column_dropper-62"><a href="#DataMaskers.column_dropper-62"><span class="linenos">62</span></a><span class="sd">        Returns:</span>
-</span><span id="DataMaskers.column_dropper-63"><a href="#DataMaskers.column_dropper-63"><span class="linenos">63</span></a><span class="sd">            A function to be called in .transform() spark function.</span>
-</span><span id="DataMaskers.column_dropper-64"><a href="#DataMaskers.column_dropper-64"><span class="linenos">64</span></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="DataMaskers.column_dropper-65"><a href="#DataMaskers.column_dropper-65"><span class="linenos">65</span></a>
-</span><span id="DataMaskers.column_dropper-66"><a href="#DataMaskers.column_dropper-66"><span class="linenos">66</span></a>        <span class="k">def</span> <span class="nf">inner</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">DataFrame</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">DataFrame</span><span class="p">:</span>
-</span><span id="DataMaskers.column_dropper-67"><a href="#DataMaskers.column_dropper-67"><span class="linenos">67</span></a>            <span class="n">drop_df</span> <span class="o">=</span> <span class="n">df</span>
-</span><span id="DataMaskers.column_dropper-68"><a href="#DataMaskers.column_dropper-68"><span class="linenos">68</span></a>            <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">cols</span><span class="p">:</span>
-</span><span id="DataMaskers.column_dropper-69"><a href="#DataMaskers.column_dropper-69"><span class="linenos">69</span></a>                <span class="n">drop_df</span> <span class="o">=</span> <span class="n">drop_df</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">)</span>
-</span><span id="DataMaskers.column_dropper-70"><a href="#DataMaskers.column_dropper-70"><span class="linenos">70</span></a>
-</span><span id="DataMaskers.column_dropper-71"><a href="#DataMaskers.column_dropper-71"><span class="linenos">71</span></a>            <span class="k">return</span> <span class="n">drop_df</span>
-</span><span id="DataMaskers.column_dropper-72"><a href="#DataMaskers.column_dropper-72"><span class="linenos">72</span></a>
-</span><span id="DataMaskers.column_dropper-73"><a href="#DataMaskers.column_dropper-73"><span class="linenos">73</span></a>        <span class="k">return</span> <span class="n">inner</span>
+</span><span id="DataMaskers.column_dropper-59"><a href="#DataMaskers.column_dropper-59"><span class="linenos">59</span></a><span class="sd">        Returns:</span>
+</span><span id="DataMaskers.column_dropper-60"><a href="#DataMaskers.column_dropper-60"><span class="linenos">60</span></a><span class="sd">            A function to be called in .transform() spark function.</span>
+</span><span id="DataMaskers.column_dropper-61"><a href="#DataMaskers.column_dropper-61"><span class="linenos">61</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DataMaskers.column_dropper-62"><a href="#DataMaskers.column_dropper-62"><span class="linenos">62</span></a>
+</span><span id="DataMaskers.column_dropper-63"><a href="#DataMaskers.column_dropper-63"><span class="linenos">63</span></a>        <span class="k">def</span> <span class="nf">inner</span><span class="p">(</span><span class="n">df</span><span class="p">:</span> <span class="n">DataFrame</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">DataFrame</span><span class="p">:</span>
+</span><span id="DataMaskers.column_dropper-64"><a href="#DataMaskers.column_dropper-64"><span class="linenos">64</span></a>            <span class="n">drop_df</span> <span class="o">=</span> <span class="n">df</span>
+</span><span id="DataMaskers.column_dropper-65"><a href="#DataMaskers.column_dropper-65"><span class="linenos">65</span></a>            <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="n">cols</span><span class="p">:</span>
+</span><span id="DataMaskers.column_dropper-66"><a href="#DataMaskers.column_dropper-66"><span class="linenos">66</span></a>                <span class="n">drop_df</span> <span class="o">=</span> <span class="n">drop_df</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">)</span>
+</span><span id="DataMaskers.column_dropper-67"><a href="#DataMaskers.column_dropper-67"><span class="linenos">67</span></a>
+</span><span id="DataMaskers.column_dropper-68"><a href="#DataMaskers.column_dropper-68"><span class="linenos">68</span></a>            <span class="k">return</span> <span class="n">drop_df</span>
+</span><span id="DataMaskers.column_dropper-69"><a href="#DataMaskers.column_dropper-69"><span class="linenos">69</span></a>
+</span><span id="DataMaskers.column_dropper-70"><a href="#DataMaskers.column_dropper-70"><span class="linenos">70</span></a>        <span class="k">return</span> <span class="n">inner</span>
 </span></pre></div>
 
 
diff --git a/lakehouse_engine/utils/extraction/jdbc_extraction_utils.html b/lakehouse_engine/utils/extraction/jdbc_extraction_utils.html
index 791bbc3..2980331 100644
--- a/lakehouse_engine/utils/extraction/jdbc_extraction_utils.html
+++ b/lakehouse_engine/utils/extraction/jdbc_extraction_utils.html
@@ -667,7 +667,7 @@ <h5>Inherited Members</h5>
                     <div id="JDBCExtraction.__init__" class="classattr">
                         <div class="attr function">
             
-        <span class="name">JDBCExtraction</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">user</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">password</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">url</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">dbtable</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">calc_upper_bound_schema</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">changelog_table</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">partition_column</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">latest_timestamp_data_location</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">latest_timestamp_data_format</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;delta&#39;</span>,</span><span class="param">	<span class="n">extraction_type</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;delta&#39;</span>,</span><span class="param">	<span class="n">driver</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;com.sap.db.jdbc.Driver&#39;</span>,</span><span class="param">	<span class="n">num_partitions</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">lower_bound</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="n">NoneType</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">upper_bound</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="n">NoneType</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">default_upper_bound</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;1&#39;</span>,</span><span class="param">	<span class="n">fetch_size</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;100000&#39;</span>,</span><span class="param">	<span class="n">compress</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">custom_schema</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">min_timestamp</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">max_timestamp</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">generate_predicates</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">predicates</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">List</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">predicates_add_null</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">extraction_timestamp</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;20231012165159&#39;</span>,</span><span class="param">	<span class="n">max_timestamp_custom_schema</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span></span>)</span>
+        <span class="name">JDBCExtraction</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">user</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">password</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">url</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">dbtable</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">calc_upper_bound_schema</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">changelog_table</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">partition_column</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">latest_timestamp_data_location</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">latest_timestamp_data_format</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;delta&#39;</span>,</span><span class="param">	<span class="n">extraction_type</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;delta&#39;</span>,</span><span class="param">	<span class="n">driver</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;com.sap.db.jdbc.Driver&#39;</span>,</span><span class="param">	<span class="n">num_partitions</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">lower_bound</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="n">NoneType</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">upper_bound</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="n">NoneType</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">default_upper_bound</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;1&#39;</span>,</span><span class="param">	<span class="n">fetch_size</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;100000&#39;</span>,</span><span class="param">	<span class="n">compress</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">custom_schema</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">min_timestamp</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">max_timestamp</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">generate_predicates</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">predicates</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">List</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">predicates_add_null</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">extraction_timestamp</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;20231018182628&#39;</span>,</span><span class="param">	<span class="n">max_timestamp_custom_schema</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span></span>)</span>
 
         
     </div>
diff --git a/lakehouse_engine/utils/extraction/sap_b4_extraction_utils.html b/lakehouse_engine/utils/extraction/sap_b4_extraction_utils.html
index 8d456b6..1fc9f3e 100644
--- a/lakehouse_engine/utils/extraction/sap_b4_extraction_utils.html
+++ b/lakehouse_engine/utils/extraction/sap_b4_extraction_utils.html
@@ -536,7 +536,7 @@ <h5>Inherited Members</h5>
                     <div id="SAPB4Extraction.__init__" class="classattr">
                         <div class="attr function">
             
-        <span class="name">SAPB4Extraction</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">user</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">password</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">url</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">dbtable</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">calc_upper_bound_schema</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">changelog_table</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">partition_column</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">latest_timestamp_data_location</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">latest_timestamp_data_format</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;delta&#39;</span>,</span><span class="param">	<span class="n">extraction_type</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;delta&#39;</span>,</span><span class="param">	<span class="n">driver</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;com.sap.db.jdbc.Driver&#39;</span>,</span><span class="param">	<span class="n">num_partitions</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">lower_bound</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="n">NoneType</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">upper_bound</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="n">NoneType</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">default_upper_bound</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;1&#39;</span>,</span><span class="param">	<span class="n">fetch_size</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;100000&#39;</span>,</span><span class="param">	<span class="n">compress</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">custom_schema</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;REQTSN DECIMAL(23,0)&#39;</span>,</span><span class="param">	<span class="n">min_timestamp</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">max_timestamp</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">generate_predicates</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">predicates</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">List</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">predicates_add_null</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">extraction_timestamp</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;20231012165159&#39;</span>,</span><span class="param">	<span class="n">max_timestamp_custom_schema</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;timestamp DECIMAL(23,0)&#39;</span>,</span><span class="param">	<span class="n">latest_timestamp_input_col</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;REQTSN&#39;</span>,</span><span class="param">	<span class="n">request_status_tbl</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;SAPHANADB.RSPMREQUEST&#39;</span>,</span><span class="param">	<span class="n">request_col_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;REQUEST_TSN&#39;</span>,</span><span class="param">	<span class="n">data_target</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">act_req_join_condition</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">include_changelog_tech_cols</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">bool</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">extra_cols_req_status_tbl</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">request_status_tbl_filter</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">adso_type</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">default_max_timestamp</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;1970000000000000000000&#39;</span></span>)</span>
+        <span class="name">SAPB4Extraction</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">user</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">password</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">url</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">dbtable</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">calc_upper_bound_schema</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">changelog_table</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">partition_column</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">latest_timestamp_data_location</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">latest_timestamp_data_format</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;delta&#39;</span>,</span><span class="param">	<span class="n">extraction_type</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;delta&#39;</span>,</span><span class="param">	<span class="n">driver</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;com.sap.db.jdbc.Driver&#39;</span>,</span><span class="param">	<span class="n">num_partitions</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">lower_bound</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="n">NoneType</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">upper_bound</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="n">NoneType</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">default_upper_bound</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;1&#39;</span>,</span><span class="param">	<span class="n">fetch_size</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;100000&#39;</span>,</span><span class="param">	<span class="n">compress</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">custom_schema</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;REQTSN DECIMAL(23,0)&#39;</span>,</span><span class="param">	<span class="n">min_timestamp</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">max_timestamp</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">generate_predicates</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">predicates</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">List</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">predicates_add_null</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">extraction_timestamp</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;20231018182628&#39;</span>,</span><span class="param">	<span class="n">max_timestamp_custom_schema</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;timestamp DECIMAL(23,0)&#39;</span>,</span><span class="param">	<span class="n">latest_timestamp_input_col</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;REQTSN&#39;</span>,</span><span class="param">	<span class="n">request_status_tbl</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;SAPHANADB.RSPMREQUEST&#39;</span>,</span><span class="param">	<span class="n">request_col_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;REQUEST_TSN&#39;</span>,</span><span class="param">	<span class="n">data_target</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">act_req_join_condition</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">include_changelog_tech_cols</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">bool</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">extra_cols_req_status_tbl</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">request_status_tbl_filter</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">adso_type</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">default_max_timestamp</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;1970000000000000000000&#39;</span></span>)</span>
 
         
     </div>
diff --git a/lakehouse_engine/utils/extraction/sap_bw_extraction_utils.html b/lakehouse_engine/utils/extraction/sap_bw_extraction_utils.html
index f0d1aba..1506a30 100644
--- a/lakehouse_engine/utils/extraction/sap_bw_extraction_utils.html
+++ b/lakehouse_engine/utils/extraction/sap_bw_extraction_utils.html
@@ -511,7 +511,7 @@ <h1 class="modulename">
                     <div id="SAPBWExtraction.__init__" class="classattr">
                         <div class="attr function">
             
-        <span class="name">SAPBWExtraction</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">user</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">password</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">url</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">dbtable</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">calc_upper_bound_schema</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">changelog_table</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">partition_column</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">latest_timestamp_data_location</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">latest_timestamp_data_format</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;delta&#39;</span>,</span><span class="param">	<span class="n">extraction_type</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;delta&#39;</span>,</span><span class="param">	<span class="n">driver</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;com.sap.db.jdbc.Driver&#39;</span>,</span><span class="param">	<span class="n">num_partitions</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">lower_bound</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="n">NoneType</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">upper_bound</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="n">NoneType</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">default_upper_bound</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;1&#39;</span>,</span><span class="param">	<span class="n">fetch_size</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;100000&#39;</span>,</span><span class="param">	<span class="n">compress</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">custom_schema</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">min_timestamp</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">max_timestamp</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">generate_predicates</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">predicates</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">List</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">predicates_add_null</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">extraction_timestamp</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;20231012165159&#39;</span>,</span><span class="param">	<span class="n">max_timestamp_custom_schema</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;timestamp DECIMAL(15,0)&#39;</span>,</span><span class="param">	<span class="n">latest_timestamp_input_col</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;actrequest_timestamp&#39;</span>,</span><span class="param">	<span class="n">act_request_table</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;SAPPHA.RSODSACTREQ&#39;</span>,</span><span class="param">	<span class="n">request_col_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;actrequest&#39;</span>,</span><span class="param">	<span class="n">act_req_join_condition</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">odsobject</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">include_changelog_tech_cols</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">extra_cols_act_request</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">get_timestamp_from_act_request</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">sap_bw_schema</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;SAPPHA&#39;</span>,</span><span class="param">	<span class="n">default_max_timestamp</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;197000000000000&#39;</span></span>)</span>
+        <span class="name">SAPBWExtraction</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">user</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">password</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">url</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">dbtable</span><span class="p">:</span> <span class="nb">str</span>,</span><span class="param">	<span class="n">calc_upper_bound_schema</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">changelog_table</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">partition_column</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">latest_timestamp_data_location</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">latest_timestamp_data_format</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;delta&#39;</span>,</span><span class="param">	<span class="n">extraction_type</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;delta&#39;</span>,</span><span class="param">	<span class="n">driver</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;com.sap.db.jdbc.Driver&#39;</span>,</span><span class="param">	<span class="n">num_partitions</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">lower_bound</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="n">NoneType</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">upper_bound</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">float</span><span class="p">,</span> <span class="nb">str</span><span class="p">,</span> <span class="n">NoneType</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">default_upper_bound</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;1&#39;</span>,</span><span class="param">	<span class="n">fetch_size</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;100000&#39;</span>,</span><span class="param">	<span class="n">compress</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">custom_schema</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">min_timestamp</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">max_timestamp</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">generate_predicates</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">predicates</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">List</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">predicates_add_null</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">extraction_timestamp</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;20231018182628&#39;</span>,</span><span class="param">	<span class="n">max_timestamp_custom_schema</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;timestamp DECIMAL(15,0)&#39;</span>,</span><span class="param">	<span class="n">latest_timestamp_input_col</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;actrequest_timestamp&#39;</span>,</span><span class="param">	<span class="n">act_request_table</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;SAPPHA.RSODSACTREQ&#39;</span>,</span><span class="param">	<span class="n">request_col_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;actrequest&#39;</span>,</span><span class="param">	<span class="n">act_req_join_condition</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">odsobject</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">include_changelog_tech_cols</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">extra_cols_act_request</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">get_timestamp_from_act_request</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">sap_bw_schema</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;SAPPHA&#39;</span>,</span><span class="param">	<span class="n">default_max_timestamp</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;197000000000000&#39;</span></span>)</span>
 
         
     </div>
diff --git a/search.js b/search.js
index fad226a..4de7dca 100644
--- a/search.js
+++ b/search.js
@@ -1,6 +1,6 @@
 window.pdocSearch = (function(){
 /** elasticlunr - http://weixsong.github.io * Copyright (C) 2017 Oliver Nightingale * Copyright (C) 2017 Wei Song * MIT Licensed */!function(){function e(e){if(null===e||"object"!=typeof e)return e;var t=e.constructor();for(var n in e)e.hasOwnProperty(n)&&(t[n]=e[n]);return t}var t=function(e){var n=new t.Index;return n.pipeline.add(t.trimmer,t.stopWordFilter,t.stemmer),e&&e.call(n,n),n};t.version="0.9.5",lunr=t,t.utils={},t.utils.warn=function(e){return function(t){e.console&&console.warn&&console.warn(t)}}(this),t.utils.toString=function(e){return void 0===e||null===e?"":e.toString()},t.EventEmitter=function(){this.events={}},t.EventEmitter.prototype.addListener=function(){var e=Array.prototype.slice.call(arguments),t=e.pop(),n=e;if("function"!=typeof t)throw new TypeError("last argument must be a function");n.forEach(function(e){this.hasHandler(e)||(this.events[e]=[]),this.events[e].push(t)},this)},t.EventEmitter.prototype.removeListener=function(e,t){if(this.hasHandler(e)){var n=this.events[e].indexOf(t);-1!==n&&(this.events[e].splice(n,1),0==this.events[e].length&&delete this.events[e])}},t.EventEmitter.prototype.emit=function(e){if(this.hasHandler(e)){var t=Array.prototype.slice.call(arguments,1);this.events[e].forEach(function(e){e.apply(void 0,t)},this)}},t.EventEmitter.prototype.hasHandler=function(e){return e in this.events},t.tokenizer=function(e){if(!arguments.length||null===e||void 0===e)return[];if(Array.isArray(e)){var n=e.filter(function(e){return null===e||void 0===e?!1:!0});n=n.map(function(e){return t.utils.toString(e).toLowerCase()});var i=[];return n.forEach(function(e){var n=e.split(t.tokenizer.seperator);i=i.concat(n)},this),i}return e.toString().trim().toLowerCase().split(t.tokenizer.seperator)},t.tokenizer.defaultSeperator=/[\s\-]+/,t.tokenizer.seperator=t.tokenizer.defaultSeperator,t.tokenizer.setSeperator=function(e){null!==e&&void 0!==e&&"object"==typeof e&&(t.tokenizer.seperator=e)},t.tokenizer.resetSeperator=function(){t.tokenizer.seperator=t.tokenizer.defaultSeperator},t.tokenizer.getSeperator=function(){return t.tokenizer.seperator},t.Pipeline=function(){this._queue=[]},t.Pipeline.registeredFunctions={},t.Pipeline.registerFunction=function(e,n){n in t.Pipeline.registeredFunctions&&t.utils.warn("Overwriting existing registered function: "+n),e.label=n,t.Pipeline.registeredFunctions[n]=e},t.Pipeline.getRegisteredFunction=function(e){return e in t.Pipeline.registeredFunctions!=!0?null:t.Pipeline.registeredFunctions[e]},t.Pipeline.warnIfFunctionNotRegistered=function(e){var n=e.label&&e.label in this.registeredFunctions;n||t.utils.warn("Function is not registered with pipeline. This may cause problems when serialising the index.\n",e)},t.Pipeline.load=function(e){var n=new t.Pipeline;return e.forEach(function(e){var i=t.Pipeline.getRegisteredFunction(e);if(!i)throw new Error("Cannot load un-registered function: "+e);n.add(i)}),n},t.Pipeline.prototype.add=function(){var e=Array.prototype.slice.call(arguments);e.forEach(function(e){t.Pipeline.warnIfFunctionNotRegistered(e),this._queue.push(e)},this)},t.Pipeline.prototype.after=function(e,n){t.Pipeline.warnIfFunctionNotRegistered(n);var i=this._queue.indexOf(e);if(-1===i)throw new Error("Cannot find existingFn");this._queue.splice(i+1,0,n)},t.Pipeline.prototype.before=function(e,n){t.Pipeline.warnIfFunctionNotRegistered(n);var i=this._queue.indexOf(e);if(-1===i)throw new Error("Cannot find existingFn");this._queue.splice(i,0,n)},t.Pipeline.prototype.remove=function(e){var t=this._queue.indexOf(e);-1!==t&&this._queue.splice(t,1)},t.Pipeline.prototype.run=function(e){for(var t=[],n=e.length,i=this._queue.length,o=0;n>o;o++){for(var r=e[o],s=0;i>s&&(r=this._queue[s](r,o,e),void 0!==r&&null!==r);s++);void 0!==r&&null!==r&&t.push(r)}return t},t.Pipeline.prototype.reset=function(){this._queue=[]},t.Pipeline.prototype.get=function(){return this._queue},t.Pipeline.prototype.toJSON=function(){return this._queue.map(function(e){return t.Pipeline.warnIfFunctionNotRegistered(e),e.label})},t.Index=function(){this._fields=[],this._ref="id",this.pipeline=new t.Pipeline,this.documentStore=new t.DocumentStore,this.index={},this.eventEmitter=new t.EventEmitter,this._idfCache={},this.on("add","remove","update",function(){this._idfCache={}}.bind(this))},t.Index.prototype.on=function(){var e=Array.prototype.slice.call(arguments);return this.eventEmitter.addListener.apply(this.eventEmitter,e)},t.Index.prototype.off=function(e,t){return this.eventEmitter.removeListener(e,t)},t.Index.load=function(e){e.version!==t.version&&t.utils.warn("version mismatch: current "+t.version+" importing "+e.version);var n=new this;n._fields=e.fields,n._ref=e.ref,n.documentStore=t.DocumentStore.load(e.documentStore),n.pipeline=t.Pipeline.load(e.pipeline),n.index={};for(var i in e.index)n.index[i]=t.InvertedIndex.load(e.index[i]);return n},t.Index.prototype.addField=function(e){return this._fields.push(e),this.index[e]=new t.InvertedIndex,this},t.Index.prototype.setRef=function(e){return this._ref=e,this},t.Index.prototype.saveDocument=function(e){return this.documentStore=new t.DocumentStore(e),this},t.Index.prototype.addDoc=function(e,n){if(e){var n=void 0===n?!0:n,i=e[this._ref];this.documentStore.addDoc(i,e),this._fields.forEach(function(n){var o=this.pipeline.run(t.tokenizer(e[n]));this.documentStore.addFieldLength(i,n,o.length);var r={};o.forEach(function(e){e in r?r[e]+=1:r[e]=1},this);for(var s in r){var u=r[s];u=Math.sqrt(u),this.index[n].addToken(s,{ref:i,tf:u})}},this),n&&this.eventEmitter.emit("add",e,this)}},t.Index.prototype.removeDocByRef=function(e){if(e&&this.documentStore.isDocStored()!==!1&&this.documentStore.hasDoc(e)){var t=this.documentStore.getDoc(e);this.removeDoc(t,!1)}},t.Index.prototype.removeDoc=function(e,n){if(e){var n=void 0===n?!0:n,i=e[this._ref];this.documentStore.hasDoc(i)&&(this.documentStore.removeDoc(i),this._fields.forEach(function(n){var o=this.pipeline.run(t.tokenizer(e[n]));o.forEach(function(e){this.index[n].removeToken(e,i)},this)},this),n&&this.eventEmitter.emit("remove",e,this))}},t.Index.prototype.updateDoc=function(e,t){var t=void 0===t?!0:t;this.removeDocByRef(e[this._ref],!1),this.addDoc(e,!1),t&&this.eventEmitter.emit("update",e,this)},t.Index.prototype.idf=function(e,t){var n="@"+t+"/"+e;if(Object.prototype.hasOwnProperty.call(this._idfCache,n))return this._idfCache[n];var i=this.index[t].getDocFreq(e),o=1+Math.log(this.documentStore.length/(i+1));return this._idfCache[n]=o,o},t.Index.prototype.getFields=function(){return this._fields.slice()},t.Index.prototype.search=function(e,n){if(!e)return[];e="string"==typeof e?{any:e}:JSON.parse(JSON.stringify(e));var i=null;null!=n&&(i=JSON.stringify(n));for(var o=new t.Configuration(i,this.getFields()).get(),r={},s=Object.keys(e),u=0;u<s.length;u++){var a=s[u];r[a]=this.pipeline.run(t.tokenizer(e[a]))}var l={};for(var c in o){var d=r[c]||r.any;if(d){var f=this.fieldSearch(d,c,o),h=o[c].boost;for(var p in f)f[p]=f[p]*h;for(var p in f)p in l?l[p]+=f[p]:l[p]=f[p]}}var v,g=[];for(var p in l)v={ref:p,score:l[p]},this.documentStore.hasDoc(p)&&(v.doc=this.documentStore.getDoc(p)),g.push(v);return g.sort(function(e,t){return t.score-e.score}),g},t.Index.prototype.fieldSearch=function(e,t,n){var i=n[t].bool,o=n[t].expand,r=n[t].boost,s=null,u={};return 0!==r?(e.forEach(function(e){var n=[e];1==o&&(n=this.index[t].expandToken(e));var r={};n.forEach(function(n){var o=this.index[t].getDocs(n),a=this.idf(n,t);if(s&&"AND"==i){var l={};for(var c in s)c in o&&(l[c]=o[c]);o=l}n==e&&this.fieldSearchStats(u,n,o);for(var c in o){var d=this.index[t].getTermFrequency(n,c),f=this.documentStore.getFieldLength(c,t),h=1;0!=f&&(h=1/Math.sqrt(f));var p=1;n!=e&&(p=.15*(1-(n.length-e.length)/n.length));var v=d*a*h*p;c in r?r[c]+=v:r[c]=v}},this),s=this.mergeScores(s,r,i)},this),s=this.coordNorm(s,u,e.length)):void 0},t.Index.prototype.mergeScores=function(e,t,n){if(!e)return t;if("AND"==n){var i={};for(var o in t)o in e&&(i[o]=e[o]+t[o]);return i}for(var o in t)o in e?e[o]+=t[o]:e[o]=t[o];return e},t.Index.prototype.fieldSearchStats=function(e,t,n){for(var i in n)i in e?e[i].push(t):e[i]=[t]},t.Index.prototype.coordNorm=function(e,t,n){for(var i in e)if(i in t){var o=t[i].length;e[i]=e[i]*o/n}return e},t.Index.prototype.toJSON=function(){var e={};return this._fields.forEach(function(t){e[t]=this.index[t].toJSON()},this),{version:t.version,fields:this._fields,ref:this._ref,documentStore:this.documentStore.toJSON(),index:e,pipeline:this.pipeline.toJSON()}},t.Index.prototype.use=function(e){var t=Array.prototype.slice.call(arguments,1);t.unshift(this),e.apply(this,t)},t.DocumentStore=function(e){this._save=null===e||void 0===e?!0:e,this.docs={},this.docInfo={},this.length=0},t.DocumentStore.load=function(e){var t=new this;return t.length=e.length,t.docs=e.docs,t.docInfo=e.docInfo,t._save=e.save,t},t.DocumentStore.prototype.isDocStored=function(){return this._save},t.DocumentStore.prototype.addDoc=function(t,n){this.hasDoc(t)||this.length++,this.docs[t]=this._save===!0?e(n):null},t.DocumentStore.prototype.getDoc=function(e){return this.hasDoc(e)===!1?null:this.docs[e]},t.DocumentStore.prototype.hasDoc=function(e){return e in this.docs},t.DocumentStore.prototype.removeDoc=function(e){this.hasDoc(e)&&(delete this.docs[e],delete this.docInfo[e],this.length--)},t.DocumentStore.prototype.addFieldLength=function(e,t,n){null!==e&&void 0!==e&&0!=this.hasDoc(e)&&(this.docInfo[e]||(this.docInfo[e]={}),this.docInfo[e][t]=n)},t.DocumentStore.prototype.updateFieldLength=function(e,t,n){null!==e&&void 0!==e&&0!=this.hasDoc(e)&&this.addFieldLength(e,t,n)},t.DocumentStore.prototype.getFieldLength=function(e,t){return null===e||void 0===e?0:e in this.docs&&t in this.docInfo[e]?this.docInfo[e][t]:0},t.DocumentStore.prototype.toJSON=function(){return{docs:this.docs,docInfo:this.docInfo,length:this.length,save:this._save}},t.stemmer=function(){var e={ational:"ate",tional:"tion",enci:"ence",anci:"ance",izer:"ize",bli:"ble",alli:"al",entli:"ent",eli:"e",ousli:"ous",ization:"ize",ation:"ate",ator:"ate",alism:"al",iveness:"ive",fulness:"ful",ousness:"ous",aliti:"al",iviti:"ive",biliti:"ble",logi:"log"},t={icate:"ic",ative:"",alize:"al",iciti:"ic",ical:"ic",ful:"",ness:""},n="[^aeiou]",i="[aeiouy]",o=n+"[^aeiouy]*",r=i+"[aeiou]*",s="^("+o+")?"+r+o,u="^("+o+")?"+r+o+"("+r+")?$",a="^("+o+")?"+r+o+r+o,l="^("+o+")?"+i,c=new RegExp(s),d=new RegExp(a),f=new RegExp(u),h=new RegExp(l),p=/^(.+?)(ss|i)es$/,v=/^(.+?)([^s])s$/,g=/^(.+?)eed$/,m=/^(.+?)(ed|ing)$/,y=/.$/,S=/(at|bl|iz)$/,x=new RegExp("([^aeiouylsz])\\1$"),w=new RegExp("^"+o+i+"[^aeiouwxy]$"),I=/^(.+?[^aeiou])y$/,b=/^(.+?)(ational|tional|enci|anci|izer|bli|alli|entli|eli|ousli|ization|ation|ator|alism|iveness|fulness|ousness|aliti|iviti|biliti|logi)$/,E=/^(.+?)(icate|ative|alize|iciti|ical|ful|ness)$/,D=/^(.+?)(al|ance|ence|er|ic|able|ible|ant|ement|ment|ent|ou|ism|ate|iti|ous|ive|ize)$/,F=/^(.+?)(s|t)(ion)$/,_=/^(.+?)e$/,P=/ll$/,k=new RegExp("^"+o+i+"[^aeiouwxy]$"),z=function(n){var i,o,r,s,u,a,l;if(n.length<3)return n;if(r=n.substr(0,1),"y"==r&&(n=r.toUpperCase()+n.substr(1)),s=p,u=v,s.test(n)?n=n.replace(s,"$1$2"):u.test(n)&&(n=n.replace(u,"$1$2")),s=g,u=m,s.test(n)){var z=s.exec(n);s=c,s.test(z[1])&&(s=y,n=n.replace(s,""))}else if(u.test(n)){var z=u.exec(n);i=z[1],u=h,u.test(i)&&(n=i,u=S,a=x,l=w,u.test(n)?n+="e":a.test(n)?(s=y,n=n.replace(s,"")):l.test(n)&&(n+="e"))}if(s=I,s.test(n)){var z=s.exec(n);i=z[1],n=i+"i"}if(s=b,s.test(n)){var z=s.exec(n);i=z[1],o=z[2],s=c,s.test(i)&&(n=i+e[o])}if(s=E,s.test(n)){var z=s.exec(n);i=z[1],o=z[2],s=c,s.test(i)&&(n=i+t[o])}if(s=D,u=F,s.test(n)){var z=s.exec(n);i=z[1],s=d,s.test(i)&&(n=i)}else if(u.test(n)){var z=u.exec(n);i=z[1]+z[2],u=d,u.test(i)&&(n=i)}if(s=_,s.test(n)){var z=s.exec(n);i=z[1],s=d,u=f,a=k,(s.test(i)||u.test(i)&&!a.test(i))&&(n=i)}return s=P,u=d,s.test(n)&&u.test(n)&&(s=y,n=n.replace(s,"")),"y"==r&&(n=r.toLowerCase()+n.substr(1)),n};return z}(),t.Pipeline.registerFunction(t.stemmer,"stemmer"),t.stopWordFilter=function(e){return e&&t.stopWordFilter.stopWords[e]!==!0?e:void 0},t.clearStopWords=function(){t.stopWordFilter.stopWords={}},t.addStopWords=function(e){null!=e&&Array.isArray(e)!==!1&&e.forEach(function(e){t.stopWordFilter.stopWords[e]=!0},this)},t.resetStopWords=function(){t.stopWordFilter.stopWords=t.defaultStopWords},t.defaultStopWords={"":!0,a:!0,able:!0,about:!0,across:!0,after:!0,all:!0,almost:!0,also:!0,am:!0,among:!0,an:!0,and:!0,any:!0,are:!0,as:!0,at:!0,be:!0,because:!0,been:!0,but:!0,by:!0,can:!0,cannot:!0,could:!0,dear:!0,did:!0,"do":!0,does:!0,either:!0,"else":!0,ever:!0,every:!0,"for":!0,from:!0,get:!0,got:!0,had:!0,has:!0,have:!0,he:!0,her:!0,hers:!0,him:!0,his:!0,how:!0,however:!0,i:!0,"if":!0,"in":!0,into:!0,is:!0,it:!0,its:!0,just:!0,least:!0,let:!0,like:!0,likely:!0,may:!0,me:!0,might:!0,most:!0,must:!0,my:!0,neither:!0,no:!0,nor:!0,not:!0,of:!0,off:!0,often:!0,on:!0,only:!0,or:!0,other:!0,our:!0,own:!0,rather:!0,said:!0,say:!0,says:!0,she:!0,should:!0,since:!0,so:!0,some:!0,than:!0,that:!0,the:!0,their:!0,them:!0,then:!0,there:!0,these:!0,they:!0,"this":!0,tis:!0,to:!0,too:!0,twas:!0,us:!0,wants:!0,was:!0,we:!0,were:!0,what:!0,when:!0,where:!0,which:!0,"while":!0,who:!0,whom:!0,why:!0,will:!0,"with":!0,would:!0,yet:!0,you:!0,your:!0},t.stopWordFilter.stopWords=t.defaultStopWords,t.Pipeline.registerFunction(t.stopWordFilter,"stopWordFilter"),t.trimmer=function(e){if(null===e||void 0===e)throw new Error("token should not be undefined");return e.replace(/^\W+/,"").replace(/\W+$/,"")},t.Pipeline.registerFunction(t.trimmer,"trimmer"),t.InvertedIndex=function(){this.root={docs:{},df:0}},t.InvertedIndex.load=function(e){var t=new this;return t.root=e.root,t},t.InvertedIndex.prototype.addToken=function(e,t,n){for(var n=n||this.root,i=0;i<=e.length-1;){var o=e[i];o in n||(n[o]={docs:{},df:0}),i+=1,n=n[o]}var r=t.ref;n.docs[r]?n.docs[r]={tf:t.tf}:(n.docs[r]={tf:t.tf},n.df+=1)},t.InvertedIndex.prototype.hasToken=function(e){if(!e)return!1;for(var t=this.root,n=0;n<e.length;n++){if(!t[e[n]])return!1;t=t[e[n]]}return!0},t.InvertedIndex.prototype.getNode=function(e){if(!e)return null;for(var t=this.root,n=0;n<e.length;n++){if(!t[e[n]])return null;t=t[e[n]]}return t},t.InvertedIndex.prototype.getDocs=function(e){var t=this.getNode(e);return null==t?{}:t.docs},t.InvertedIndex.prototype.getTermFrequency=function(e,t){var n=this.getNode(e);return null==n?0:t in n.docs?n.docs[t].tf:0},t.InvertedIndex.prototype.getDocFreq=function(e){var t=this.getNode(e);return null==t?0:t.df},t.InvertedIndex.prototype.removeToken=function(e,t){if(e){var n=this.getNode(e);null!=n&&t in n.docs&&(delete n.docs[t],n.df-=1)}},t.InvertedIndex.prototype.expandToken=function(e,t,n){if(null==e||""==e)return[];var t=t||[];if(void 0==n&&(n=this.getNode(e),null==n))return t;n.df>0&&t.push(e);for(var i in n)"docs"!==i&&"df"!==i&&this.expandToken(e+i,t,n[i]);return t},t.InvertedIndex.prototype.toJSON=function(){return{root:this.root}},t.Configuration=function(e,n){var e=e||"";if(void 0==n||null==n)throw new Error("fields should not be null");this.config={};var i;try{i=JSON.parse(e),this.buildUserConfig(i,n)}catch(o){t.utils.warn("user configuration parse failed, will use default configuration"),this.buildDefaultConfig(n)}},t.Configuration.prototype.buildDefaultConfig=function(e){this.reset(),e.forEach(function(e){this.config[e]={boost:1,bool:"OR",expand:!1}},this)},t.Configuration.prototype.buildUserConfig=function(e,n){var i="OR",o=!1;if(this.reset(),"bool"in e&&(i=e.bool||i),"expand"in e&&(o=e.expand||o),"fields"in e)for(var r in e.fields)if(n.indexOf(r)>-1){var s=e.fields[r],u=o;void 0!=s.expand&&(u=s.expand),this.config[r]={boost:s.boost||0===s.boost?s.boost:1,bool:s.bool||i,expand:u}}else t.utils.warn("field name in user configuration not found in index instance fields");else this.addAllFields2UserConfig(i,o,n)},t.Configuration.prototype.addAllFields2UserConfig=function(e,t,n){n.forEach(function(n){this.config[n]={boost:1,bool:e,expand:t}},this)},t.Configuration.prototype.get=function(){return this.config},t.Configuration.prototype.reset=function(){this.config={}},lunr.SortedSet=function(){this.length=0,this.elements=[]},lunr.SortedSet.load=function(e){var t=new this;return t.elements=e,t.length=e.length,t},lunr.SortedSet.prototype.add=function(){var e,t;for(e=0;e<arguments.length;e++)t=arguments[e],~this.indexOf(t)||this.elements.splice(this.locationFor(t),0,t);this.length=this.elements.length},lunr.SortedSet.prototype.toArray=function(){return this.elements.slice()},lunr.SortedSet.prototype.map=function(e,t){return this.elements.map(e,t)},lunr.SortedSet.prototype.forEach=function(e,t){return this.elements.forEach(e,t)},lunr.SortedSet.prototype.indexOf=function(e){for(var t=0,n=this.elements.length,i=n-t,o=t+Math.floor(i/2),r=this.elements[o];i>1;){if(r===e)return o;e>r&&(t=o),r>e&&(n=o),i=n-t,o=t+Math.floor(i/2),r=this.elements[o]}return r===e?o:-1},lunr.SortedSet.prototype.locationFor=function(e){for(var t=0,n=this.elements.length,i=n-t,o=t+Math.floor(i/2),r=this.elements[o];i>1;)e>r&&(t=o),r>e&&(n=o),i=n-t,o=t+Math.floor(i/2),r=this.elements[o];return r>e?o:e>r?o+1:void 0},lunr.SortedSet.prototype.intersect=function(e){for(var t=new lunr.SortedSet,n=0,i=0,o=this.length,r=e.length,s=this.elements,u=e.elements;;){if(n>o-1||i>r-1)break;s[n]!==u[i]?s[n]<u[i]?n++:s[n]>u[i]&&i++:(t.add(s[n]),n++,i++)}return t},lunr.SortedSet.prototype.clone=function(){var e=new lunr.SortedSet;return e.elements=this.toArray(),e.length=e.elements.length,e},lunr.SortedSet.prototype.union=function(e){var t,n,i;this.length>=e.length?(t=this,n=e):(t=e,n=this),i=t.clone();for(var o=0,r=n.toArray();o<r.length;o++)i.add(r[o]);return i},lunr.SortedSet.prototype.toJSON=function(){return this.toArray()},function(e,t){"function"==typeof define&&define.amd?define(t):"object"==typeof exports?module.exports=t():e.elasticlunr=t()}(this,function(){return t})}();
-    /** pdoc search index */const docs = [{"fullname": "lakehouse_engine", "modulename": "lakehouse_engine", "kind": "module", "doc": "<p>Lakehouse engine package containing all the system subpackages.</p>\n"}, {"fullname": "lakehouse_engine.algorithms", "modulename": "lakehouse_engine.algorithms", "kind": "module", "doc": "<p>Package containing all the lakehouse engine algorithms.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.algorithm", "modulename": "lakehouse_engine.algorithms.algorithm", "kind": "module", "doc": "<p>Module containing the Algorithm class.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.algorithm.Algorithm", "modulename": "lakehouse_engine.algorithms.algorithm", "qualname": "Algorithm", "kind": "class", "doc": "<p>Class to define the behavior of every algorithm based on ACONs.</p>\n", "bases": "lakehouse_engine.core.executable.Executable"}, {"fullname": "lakehouse_engine.algorithms.algorithm.Algorithm.__init__", "modulename": "lakehouse_engine.algorithms.algorithm", "qualname": "Algorithm.__init__", "kind": "function", "doc": "<p>Construct Algorithm instances.</p>\n\n<p>Args:\n    acon: algorithm configuration.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.algorithms.algorithm.Algorithm.get_dq_spec", "modulename": "lakehouse_engine.algorithms.algorithm", "qualname": "Algorithm.get_dq_spec", "kind": "function", "doc": "<p>Get data quality specification object from acon.</p>\n\n<p>Args:\n    spec: data quality specifications.</p>\n\n<p>Returns:\n    The DQSpec and the List of DQ Functions Specs.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Tuple</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQSpec</span><span class=\"p\">,</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQFunctionSpec</span><span class=\"p\">],</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQFunctionSpec</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.data_loader", "modulename": "lakehouse_engine.algorithms.data_loader", "kind": "module", "doc": "<p>Module to define DataLoader class.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader", "kind": "class", "doc": "<p>Load data using an algorithm configuration (ACON represented as dict).</p>\n\n<p>This algorithm focuses on the cases where users will be specifying all the algorithm\nsteps and configurations through a dict based configuration, which we name ACON\nin our framework.</p>\n\n<p>Since an ACON is a dict you can pass a custom transformer through a python function\nand, therefore, the DataLoader can also be used to load data with custom\ntransformations not provided in our transformers package.</p>\n\n<p>As the algorithm base class of the lakehouse-engine framework is based on the\nconcept of ACON, this DataLoader algorithm simply inherits from Algorithm,\nwithout overriding anything. We designed the codebase like this to avoid\ninstantiating the Algorithm class directly, which was always meant to be an\nabstraction for any specific algorithm included in the lakehouse-engine framework.</p>\n", "bases": "lakehouse_engine.algorithms.algorithm.Algorithm"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.__init__", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.__init__", "kind": "function", "doc": "<p>Construct DataLoader algorithm instances.</p>\n\n<p>A data loader needs several specifications to work properly,\nbut some of them might be optional. The available specifications are:</p>\n\n<pre><code>- input specifications (mandatory): specify how to read data.\n- transform specifications (optional): specify how to transform data.\n- data quality specifications (optional): specify how to execute the data\n    quality process.\n- output specifications (mandatory): specify how to write data to the\n    target.\n- terminate specifications (optional): specify what to do after writing into\n    the target (e.g., optimizing target table, vacuum, compute stats, etc).\n</code></pre>\n\n<p>Args:\n    acon: algorithm configuration.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.read", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.read", "kind": "function", "doc": "<p>Read data from an input location into a distributed dataframe.</p>\n\n<p>Returns:\n     An ordered dict with all the dataframes that were read.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.transform", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.transform", "kind": "function", "doc": "<p>Transform (optionally) the data that was read.</p>\n\n<p>If there isn't a transformation specification this step will be skipped, and the\noriginal dataframes that were read will be returned.\nTransformations can have dependency from another transformation result, however\nwe need to keep in mind if we are using streaming source and for some reason we\nneed to enable micro batch processing, this result cannot be used as input to\nanother transformation. Micro batch processing in pyspark streaming is only\navailable in .write(), which means this transformation with micro batch needs\nto be the end of the process.</p>\n\n<p>Args:\n    data: input dataframes in an ordered dict.</p>\n\n<p>Returns:\n    Another ordered dict with the transformed dataframes, according to the\n    transformation specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.process_dq", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.process_dq", "kind": "function", "doc": "<p>Process the data quality tasks for the data that was read and/or transformed.</p>\n\n<p>It supports multiple input dataframes. Although just one is advisable.</p>\n\n<p>It is possible to use data quality validators/expectations that will validate\nyour data and fail the process in case the expectations are not met. The DQ\nprocess also generates and keeps updating a site containing the results of the\nexpectations that were done on your data. The location of the site is\nconfigurable and can either be on file system or S3. If you define it to be\nstored on S3, you can even configure your S3 bucket to serve the site so that\npeople can easily check the quality of your data. Moreover, it is also\npossible to store the result of the DQ process into a defined result sink.</p>\n\n<p>Args:\n    data: dataframes from previous steps of the algorithm that we which to\n        run the DQ process on.</p>\n\n<p>Returns:\n    Another ordered dict with the validated dataframes.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.write", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.write", "kind": "function", "doc": "<p>Write the data that was read and transformed (if applicable).</p>\n\n<p>It supports writing multiple datasets. However, we only recommend to write one\ndataframe. This recommendation is based on easy debugging and reproducibility,\nsince if we start mixing several datasets being fueled by the same algorithm, it\nwould unleash an infinite sea of reproducibility issues plus tight coupling and\ndependencies between datasets. Having said that, there may be cases where\nwriting multiple datasets is desirable according to the use case requirements.\nUse it accordingly.</p>\n\n<p>Args:\n    data: dataframes that were read and transformed (if applicable).</p>\n\n<p>Returns:\n    Dataframes that were written.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.terminate", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.terminate", "kind": "function", "doc": "<p>Terminate the algorithm.</p>\n\n<p>Args:\n    data: dataframes that were written.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.execute", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.execute", "kind": "function", "doc": "<p>Define the algorithm execution behaviour.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.dq_validator", "modulename": "lakehouse_engine.algorithms.dq_validator", "kind": "module", "doc": "<p>Module to define Data Validator class.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.dq_validator.DQValidator", "modulename": "lakehouse_engine.algorithms.dq_validator", "qualname": "DQValidator", "kind": "class", "doc": "<p>Validate data using an algorithm configuration (ACON represented as dict).</p>\n\n<p>This algorithm focuses on isolate Data Quality Validations from loading,\napplying a set of data quality functions to a specific input dataset,\nwithout the need to define any output specification.\nYou can use any input specification compatible with the lakehouse engine\n(dataframe, table, files, etc).</p>\n", "bases": "lakehouse_engine.algorithms.algorithm.Algorithm"}, {"fullname": "lakehouse_engine.algorithms.dq_validator.DQValidator.__init__", "modulename": "lakehouse_engine.algorithms.dq_validator", "qualname": "DQValidator.__init__", "kind": "function", "doc": "<p>Construct DQValidator algorithm instances.</p>\n\n<p>A data quality validator needs the following specifications to work\nproperly:\n    - input specification (mandatory): specify how and what data to\n    read.\n    - data quality specification (mandatory): specify how to execute\n    the data quality process.\n    - restore_prev_version (optional): specify if, having\n    delta table/files as input, they should be restored to the\n    previous version if the data quality process fails. Note: this\n    is only considered if fail_on_error is kept as True.</p>\n\n<p>Args:\n    acon: algorithm configuration.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.algorithms.dq_validator.DQValidator.read", "modulename": "lakehouse_engine.algorithms.dq_validator", "qualname": "DQValidator.read", "kind": "function", "doc": "<p>Read data from an input location into a distributed dataframe.</p>\n\n<p>Returns:\n     Dataframe with data that was read.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.dq_validator.DQValidator.process_dq", "modulename": "lakehouse_engine.algorithms.dq_validator", "qualname": "DQValidator.process_dq", "kind": "function", "doc": "<p>Process the data quality tasks for the data that was read.</p>\n\n<p>It supports a single input dataframe.</p>\n\n<p>It is possible to use data quality validators/expectations that will validate\nyour data and fail the process in case the expectations are not met. The DQ\nprocess also generates and keeps updating a site containing the results of the\nexpectations that were done on your data. The location of the site is\nconfigurable and can either be on file system or S3. If you define it to be\nstored on S3, you can even configure your S3 bucket to serve the site so that\npeople can easily check the quality of your data. Moreover, it is also\npossible to store the result of the DQ process into a defined result sink.</p>\n\n<p>Args:\n    data: input dataframe on which to run the DQ process.</p>\n\n<p>Returns:\n    Validated dataframe.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.dq_validator.DQValidator.execute", "modulename": "lakehouse_engine.algorithms.dq_validator", "qualname": "DQValidator.execute", "kind": "function", "doc": "<p>Define the algorithm execution behaviour.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.exceptions", "modulename": "lakehouse_engine.algorithms.exceptions", "kind": "module", "doc": "<p>Package defining all the algorithm custom exceptions.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.exceptions.ReconciliationFailedException", "modulename": "lakehouse_engine.algorithms.exceptions", "qualname": "ReconciliationFailedException", "kind": "class", "doc": "<p>Exception for when the reconciliation process fails.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.algorithms.exceptions.NoNewDataException", "modulename": "lakehouse_engine.algorithms.exceptions", "qualname": "NoNewDataException", "kind": "class", "doc": "<p>Exception for when no new data is available.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.algorithms.exceptions.SensorAlreadyExistsException", "modulename": "lakehouse_engine.algorithms.exceptions", "qualname": "SensorAlreadyExistsException", "kind": "class", "doc": "<p>Exception for when a sensor with same sensor id already exists.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.algorithms.exceptions.RestoreTypeNotFoundException", "modulename": "lakehouse_engine.algorithms.exceptions", "qualname": "RestoreTypeNotFoundException", "kind": "class", "doc": "<p>Exception for when the restore type is not found.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.algorithms.reconciliator", "modulename": "lakehouse_engine.algorithms.reconciliator", "kind": "module", "doc": "<p>Module containing the Reconciliator class.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.ReconciliationType", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "ReconciliationType", "kind": "class", "doc": "<p>Type of Reconciliation.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.ReconciliationType.PCT", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "ReconciliationType.PCT", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReconciliationType.PCT: &#x27;percentage&#x27;&gt;"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.ReconciliationType.ABS", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "ReconciliationType.ABS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReconciliationType.ABS: &#x27;absolute&#x27;&gt;"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.ReconciliationTransformers", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "ReconciliationTransformers", "kind": "class", "doc": "<p>Transformers Available for the Reconciliation Algorithm.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.ReconciliationTransformers.AVAILABLE_TRANSFORMERS", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "ReconciliationTransformers.AVAILABLE_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict", "default_value": "&lt;ReconciliationTransformers.AVAILABLE_TRANSFORMERS: {&#x27;cache&#x27;: &lt;bound method Optimizers.cache of &lt;class &#x27;lakehouse_engine.transformers.optimizers.Optimizers&#x27;&gt;&gt;, &#x27;persist&#x27;: &lt;bound method Optimizers.persist of &lt;class &#x27;lakehouse_engine.transformers.optimizers.Optimizers&#x27;&gt;&gt;}&gt;"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.Reconciliator", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "Reconciliator", "kind": "class", "doc": "<p>Class to define the behavior of an algorithm that checks if data reconciles.</p>\n\n<p>Checking if data reconciles, using this algorithm, is a matter of reading the\n'truth' data and the 'current' data. You can use any input specification compatible\nwith the lakehouse engine to read 'truth' or 'current' data. On top of that, you\ncan pass a 'truth_preprocess_query' and a 'current_preprocess_query' so you can\npreprocess the data before it goes into the actual reconciliation process.\nMoreover, you can use the 'truth_preprocess_query_args' and\n'current_preprocess_query_args' to pass additional arguments to be used to apply\nadditional operations on top of the dataframe, resulting from the previous steps.\nWith these arguments you can apply additional operations like caching or persisting\nthe Dataframe. The way to pass the additional arguments for the operations is\nsimilar to the TransformSpec, but only a few operations are allowed. Those are\ndefined in ReconciliationTransformers.AVAILABLE_TRANSFORMERS.</p>\n\n<p>The reconciliation process is focused on joining 'truth' with 'current' by all\nprovided columns except the ones passed as 'metrics'. After that it calculates the\ndifferences in the metrics attributes (either percentage or absolute difference).\nFinally, it aggregates the differences, using the supplied aggregation function\n(e.g., sum, avg, min, max, etc).</p>\n\n<p>All of these configurations are passed via the ACON to instantiate a\nReconciliatorSpec object.</p>\n\n<p>Notes:\n    - It is crucial that both the current and truth datasets have exactly the same\n        structure.\n    - You should not use 0 as yellow or red threshold, as the algorithm will verify\n        if the difference between the truth and current values is bigger\n        or equal than those thresholds.\n    - The reconciliation does not produce any negative values or percentages, as we\n        use the absolute value of the differences. This means that the recon result\n        will not indicate if it was the current values that were bigger or smaller\n        than the truth values, or vice versa.</p>\n", "bases": "lakehouse_engine.core.executable.Executable"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.Reconciliator.__init__", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "Reconciliator.__init__", "kind": "function", "doc": "<p>Construct Algorithm instances.</p>\n\n<p>Args:\n    acon: algorithm configuration.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.Reconciliator.get_source_of_truth", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "Reconciliator.get_source_of_truth", "kind": "function", "doc": "<p>Get the source of truth (expected result) for the reconciliation process.</p>\n\n<p>Returns:\n    DataFrame containing the source of truth.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.Reconciliator.get_current_results", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "Reconciliator.get_current_results", "kind": "function", "doc": "<p>Get the current results from the table that we are checking if it reconciles.</p>\n\n<p>Returns:\n    DataFrame containing the current results.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.Reconciliator.execute", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "Reconciliator.execute", "kind": "function", "doc": "<p>Reconcile the current results against the truth dataset.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.sensor", "modulename": "lakehouse_engine.algorithms.sensor", "kind": "module", "doc": "<p>Module to define Sensor algorithm behavior.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.sensor.Sensor", "modulename": "lakehouse_engine.algorithms.sensor", "qualname": "Sensor", "kind": "class", "doc": "<p>Class representing a sensor to check if the upstream has new data.</p>\n", "bases": "lakehouse_engine.algorithms.algorithm.Algorithm"}, {"fullname": "lakehouse_engine.algorithms.sensor.Sensor.__init__", "modulename": "lakehouse_engine.algorithms.sensor", "qualname": "Sensor.__init__", "kind": "function", "doc": "<p>Construct Sensor instances.</p>\n\n<p>Args:\n    acon: algorithm configuration.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.algorithms.sensor.Sensor.execute", "modulename": "lakehouse_engine.algorithms.sensor", "qualname": "Sensor.execute", "kind": "function", "doc": "<p>Execute the sensor.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.configs", "modulename": "lakehouse_engine.configs", "kind": "module", "doc": "<p>This module receives a config file which is included in the wheel.</p>\n"}, {"fullname": "lakehouse_engine.core", "modulename": "lakehouse_engine.core", "kind": "module", "doc": "<p>Package with the core behaviour of the lakehouse engine.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions", "modulename": "lakehouse_engine.core.definitions", "kind": "module", "doc": "<p>Definitions of standard values and structures for core components.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat", "kind": "class", "doc": "<p>Formats of algorithm input.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.JDBC", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.JDBC", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.JDBC: &#x27;jdbc&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.AVRO", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.AVRO", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.AVRO: &#x27;avro&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.JSON", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.JSON", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.JSON: &#x27;json&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.CSV", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.CSV", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.CSV: &#x27;csv&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.PARQUET", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.PARQUET", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.PARQUET: &#x27;parquet&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.DELTAFILES", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.DELTAFILES", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.DELTAFILES: &#x27;delta&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.CLOUDFILES", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.CLOUDFILES", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.CLOUDFILES: &#x27;cloudfiles&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.KAFKA", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.KAFKA", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.KAFKA: &#x27;kafka&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.SQL", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.SQL", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.SQL: &#x27;sql&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.SAP_BW", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.SAP_BW", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.SAP_BW: &#x27;sap_bw&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.SAP_B4", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.SAP_B4", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.SAP_B4: &#x27;sap_b4&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.DATAFRAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.DATAFRAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.DATAFRAME: &#x27;dataframe&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.SFTP", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.SFTP", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.SFTP: &#x27;sftp&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.values", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.values", "kind": "function", "doc": "<p>Generates a list containing all enum values.</p>\n\n<p>Return:\n    A list with all enum values.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.exists", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.exists", "kind": "function", "doc": "<p>Checks if the input format exists in the enum values.</p>\n\n<p>Args:\n    input_format: format to check if exists.</p>\n\n<p>Return:\n    If the input format exists in our enum.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">input_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat", "kind": "class", "doc": "<p>Formats of algorithm output.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.JDBC", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.JDBC", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.JDBC: &#x27;jdbc&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.AVRO", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.AVRO", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.AVRO: &#x27;avro&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.JSON", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.JSON", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.JSON: &#x27;json&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.CSV", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.CSV", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.CSV: &#x27;csv&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.PARQUET", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.PARQUET", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.PARQUET: &#x27;parquet&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.DELTAFILES", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.DELTAFILES", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.DELTAFILES: &#x27;delta&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.KAFKA", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.KAFKA", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.KAFKA: &#x27;kafka&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.CONSOLE", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.CONSOLE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.CONSOLE: &#x27;console&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.NOOP", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.NOOP", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.NOOP: &#x27;noop&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.DATAFRAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.DATAFRAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.DATAFRAME: &#x27;dataframe&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.FILE", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.FILE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.FILE: &#x27;file&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.TABLE", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.TABLE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.TABLE: &#x27;table&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.NotifierType", "modulename": "lakehouse_engine.core.definitions", "qualname": "NotifierType", "kind": "class", "doc": "<p>Type of notifier available.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.NotifierType.EMAIL", "modulename": "lakehouse_engine.core.definitions", "qualname": "NotifierType.EMAIL", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;NotifierType.EMAIL: &#x27;email&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.NotificationEmailServers", "modulename": "lakehouse_engine.core.definitions", "qualname": "NotificationEmailServers", "kind": "class", "doc": "<p>Types of email server with special behaviour.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.NotificationRuntimeParameters", "modulename": "lakehouse_engine.core.definitions", "qualname": "NotificationRuntimeParameters", "kind": "class", "doc": "<p>Parameters to be replaced in runtime.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.NotificationRuntimeParameters.DATABRICKS_JOB_NAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "NotificationRuntimeParameters.DATABRICKS_JOB_NAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;NotificationRuntimeParameters.DATABRICKS_JOB_NAME: &#x27;databricks_job_name&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.NotificationRuntimeParameters.DATABRICKS_WORKSPACE_ID", "modulename": "lakehouse_engine.core.definitions", "qualname": "NotificationRuntimeParameters.DATABRICKS_WORKSPACE_ID", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;NotificationRuntimeParameters.DATABRICKS_WORKSPACE_ID: &#x27;databricks_workspace_id&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.ReadType", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadType", "kind": "class", "doc": "<p>Define the types of read operations.</p>\n\n<p>BATCH - read the data in batch mode (e.g., Spark batch).\nSTREAMING - read the data in streaming mode (e.g., Spark streaming).</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.ReadType.BATCH", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadType.BATCH", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReadType.BATCH: &#x27;batch&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.ReadType.STREAMING", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadType.STREAMING", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReadType.STREAMING: &#x27;streaming&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.ReadMode", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadMode", "kind": "class", "doc": "<p>Different modes that control how we handle compliance to the provided schema.</p>\n\n<p>These read modes map to Spark's read modes at the moment.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.ReadMode.PERMISSIVE", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadMode.PERMISSIVE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReadMode.PERMISSIVE: &#x27;PERMISSIVE&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.ReadMode.FAILFAST", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadMode.FAILFAST", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReadMode.FAILFAST: &#x27;FAILFAST&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.ReadMode.DROPMALFORMED", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadMode.DROPMALFORMED", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReadMode.DROPMALFORMED: &#x27;DROPMALFORMED&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults", "kind": "class", "doc": "<p>Defaults used on the data quality process.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.FILE_SYSTEM_STORE", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.FILE_SYSTEM_STORE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.FILE_SYSTEM_STORE: &#x27;file_system&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.FILE_SYSTEM_S3_STORE", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.FILE_SYSTEM_S3_STORE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.FILE_SYSTEM_S3_STORE: &#x27;s3&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DQ_BATCH_IDENTIFIERS", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DQ_BATCH_IDENTIFIERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DQ_BATCH_IDENTIFIERS: [&#x27;spec_id&#x27;, &#x27;input_id&#x27;, &#x27;timestamp&#x27;]&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATASOURCE_CLASS_NAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATASOURCE_CLASS_NAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATASOURCE_CLASS_NAME: &#x27;Datasource&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATASOURCE_EXECUTION_ENGINE", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATASOURCE_EXECUTION_ENGINE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATASOURCE_EXECUTION_ENGINE: &#x27;SparkDFExecutionEngine&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATA_CONNECTORS_CLASS_NAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATA_CONNECTORS_CLASS_NAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATA_CONNECTORS_CLASS_NAME: &#x27;RuntimeDataConnector&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATA_CONNECTORS_MODULE_NAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATA_CONNECTORS_MODULE_NAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATA_CONNECTORS_MODULE_NAME: &#x27;great_expectations.datasource.data_connector&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATA_CHECKPOINTS_CLASS_NAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATA_CHECKPOINTS_CLASS_NAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATA_CHECKPOINTS_CLASS_NAME: &#x27;SimpleCheckpoint&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATA_CHECKPOINTS_CONFIG_VERSION", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATA_CHECKPOINTS_CONFIG_VERSION", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATA_CHECKPOINTS_CONFIG_VERSION: 1.0&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.STORE_BACKEND", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.STORE_BACKEND", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.FILE_SYSTEM_S3_STORE: &#x27;s3&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.EXPECTATIONS_STORE_PREFIX", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.EXPECTATIONS_STORE_PREFIX", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.EXPECTATIONS_STORE_PREFIX: &#x27;dq/expectations/&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.VALIDATIONS_STORE_PREFIX", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.VALIDATIONS_STORE_PREFIX", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.VALIDATIONS_STORE_PREFIX: &#x27;dq/validations/&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATA_DOCS_PREFIX", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATA_DOCS_PREFIX", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATA_DOCS_PREFIX: &#x27;dq/data_docs/site/&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.CHECKPOINT_STORE_PREFIX", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.CHECKPOINT_STORE_PREFIX", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.CHECKPOINT_STORE_PREFIX: &#x27;dq/checkpoints/&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.VALIDATION_COLUMN_IDENTIFIER", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.VALIDATION_COLUMN_IDENTIFIER", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.VALIDATION_COLUMN_IDENTIFIER: &#x27;validationresultidentifier&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.CUSTOM_EXPECTATION_LIST", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.CUSTOM_EXPECTATION_LIST", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.CUSTOM_EXPECTATION_LIST: [&#x27;expect_column_values_to_be_date_not_older_than&#x27;, &#x27;expect_column_pair_a_to_be_smaller_or_equal_than_b&#x27;, &#x27;expect_multicolumn_column_a_must_equal_b_or_c&#x27;, &#x27;expect_queried_column_agg_value_to_be&#x27;]&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DQ_VALIDATIONS_SCHEMA", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DQ_VALIDATIONS_SCHEMA", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DQ_VALIDATIONS_SCHEMA: StructType([StructField(&#x27;dq_validations&#x27;, StructType([StructField(&#x27;run_name&#x27;, StringType(), True), StructField(&#x27;run_success&#x27;, BooleanType(), True), StructField(&#x27;raised_exceptions&#x27;, BooleanType(), True), StructField(&#x27;run_row_success&#x27;, BooleanType(), True), StructField(&#x27;dq_failure_details&#x27;, ArrayType(StructType([StructField(&#x27;expectation_type&#x27;, StringType(), True), StructField(&#x27;kwargs&#x27;, StringType(), True)]), True), True)]), True)])&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType", "kind": "class", "doc": "<p>Types of write operations.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.OVERWRITE", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.OVERWRITE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.OVERWRITE: &#x27;overwrite&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.COMPLETE", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.COMPLETE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.COMPLETE: &#x27;complete&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.APPEND", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.APPEND", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.APPEND: &#x27;append&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.UPDATE", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.UPDATE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.UPDATE: &#x27;update&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.MERGE", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.MERGE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.MERGE: &#x27;merge&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.ERROR_IF_EXISTS", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.ERROR_IF_EXISTS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.ERROR_IF_EXISTS: &#x27;error&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.IGNORE_IF_EXISTS", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.IGNORE_IF_EXISTS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.IGNORE_IF_EXISTS: &#x27;ignore&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputSpec", "kind": "class", "doc": "<p>Specification of an algorithm input.</p>\n\n<p>This is very aligned with the way the execution environment connects to the sources\n(e.g., spark sources).</p>\n\n<p>spec_id: spec_id of the input specification read_type: ReadType type of read\noperation.\ndata_format: format of the input.\nsftp_files_format: format of the files (csv, fwf, json, xml...) in a sftp\n    directory.\ndf_name: dataframe name.\ndb_table: table name in the form of <db>.<table>.\nlocation: uri that identifies from where to read data in the specified format.\nenforce_schema_from_table: if we want to enforce the table schema or not, by\n    providing a table name in the form of <db>.<table>.\nquery: sql query to execute and return the dataframe. Use it if you do not want to\n    read from a file system nor from a table, but rather from a sql query instead.\nschema: dict representation of a schema of the input (e.g., Spark struct type\n    schema).\nschema_path: path to a file with a representation of a schema of the input (e.g.,\n    Spark struct type schema).\nwith_filepath: if we want to include the path of the file that is being read. Only\n    works with the file reader (batch and streaming modes are supported).\noptions: dict with other relevant options according to the execution\n    environment (e.g., spark) possible sources.\ncalculate_upper_bound: when to calculate upper bound to extract from SAP BW or not.\ncalc_upper_bound_schema: specific schema for the calculated upper_bound.\ngenerate_predicates: when to generate predicates to extract from SAP BW or not.\npredicates_add_null: if we want to include is null on partition by predicates.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.InputSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">spec_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">read_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">data_format</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">sftp_files_format</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">df_name</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">db_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">query</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">enforce_schema_from_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">schema_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">with_filepath</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">options</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">jdbc_args</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">calculate_upper_bound</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">calc_upper_bound_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">generate_predicates</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">predicates_add_null</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.TransformerSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "TransformerSpec", "kind": "class", "doc": "<p>Transformer Specification, i.e., a single transformation amongst many.</p>\n\n<p>function: name of the function (or callable function) to be executed.\nargs: (not applicable if using a callable function) dict with the arguments to pass\nto the function <k,v> pairs with the name of the parameter of the function and the\nrespective value.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.TransformerSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "TransformerSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">function</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.TransformSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "TransformSpec", "kind": "class", "doc": "<p>Transformation Specification.</p>\n\n<p>I.e., the specification that defines the many transformations to be done to the data\nthat was read.</p>\n\n<p>spec_id: id of the terminate specification input_id: id of the corresponding input\nspecification.\ntransformers: list of transformers to execute.\nforce_streaming_foreach_batch_processing: sometimes, when using streaming, we want\n    to force the transform to be executed in the foreachBatch function to ensure\n    non-supported streaming operations can be properly executed.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.TransformSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "TransformSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">spec_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">input_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">transformers</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TransformerSpec</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">force_streaming_foreach_batch_processing</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.DQType", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQType", "kind": "class", "doc": "<p>Available data quality tasks.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.DQType.VALIDATOR", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQType.VALIDATOR", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQType.VALIDATOR: &#x27;validator&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQType.ASSISTANT", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQType.ASSISTANT", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQType.ASSISTANT: &#x27;assistant&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQFunctionSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQFunctionSpec", "kind": "class", "doc": "<p>Defines a data quality function specification.</p>\n\n<p>function - name of the data quality function (expectation) to execute.\nIt follows the great_expectations api <a href=\"https://greatexpectations.io/expectations/\">https://greatexpectations.io/expectations/</a>.\nargs - args of the function (expectation). Follow the same api as above.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.DQFunctionSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQFunctionSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">function</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.DQSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQSpec", "kind": "class", "doc": "<p>Data quality overall specification.</p>\n\n<pre><code>spec_id - id of the specification.\ninput_id - id of the input specification.\ndq_type - type of DQ process to execute (e.g. validator).\ndq_functions - list of function specifications to execute.\nunexpected_rows_pk - the list of columns composing the primary key of the\n    source data to identify the rows failing the DQ validations. Note: only one\n    of tbl_to_derive_pk or unexpected_rows_pk arguments need to be provided. It\n    is mandatory to provide one of these arguments when using tag_source_data\n    as True. When tag_source_data is False, this is not mandatory, but still\n    recommended.\ntbl_to_derive_pk - db.table to automatically derive the unexpected_rows_pk from.\n    Note: only one of tbl_to_derive_pk or unexpected_rows_pk arguments need to\n    be provided. It is mandatory to provide one of these arguments when using\n    tag_source_data as True. hen tag_source_data is False, this is not\n    mandatory, but still recommended.\ngx_result_format - great expectations result format. Default: \"COMPLETE\".\n</code></pre>\n\n<p>\u00b4   tag_source_data - when set to true, this will ensure that the DQ process ends by\n        tagging the source data with an additional column with information about the\n        DQ results. This column makes it possible to identify if the DQ run was\n        succeeded in general and, if not, it unlocks the insights to know what\n        specific rows have made the DQ validations fail and why. Default: False.\n        Note: it only works if result_sink_explode is True, gx_result_format is\n        COMPLETE, fail_on_error is False (which is done automatically when\n        you specify tag_source_data as True) and tbl_to_derive_pk or\n        unexpected_rows_pk is configured.\n    store_backend - which store_backend to use (e.g. s3 or file_system).\n    local_fs_root_dir - path of the root directory. Note: only applicable for\n        store_backend file_system.\n    bucket - the bucket name to consider for the store_backend (store DQ artefacts).\n        Note: only applicable for store_backend s3.\n    data_docs_bucket - the bucket name for data docs only. When defined, it will\n        supersede bucket parameter.\n    expectations_store_prefix - prefix where to store expectations' data. Note: only\n        applicable for store_backend s3.\n    validations_store_prefix - prefix where to store validations' data. Note: only\n        applicable for store_backend s3.\n    data_docs_prefix - prefix where to store data_docs' data. Note: only applicable\n        for store_backend s3.\n    checkpoint_store_prefix - prefix where to store checkpoints' data. Note: only\n        applicable for store_backend s3.\n    data_asset_name - name of the data asset to consider when configuring the great\n        expectations' data source.\n    expectation_suite_name - name to consider for great expectations' suite.\n    assistant_options - additional options to pass to the DQ assistant processor.\n    result_sink_db_table - db.table_name indicating the database and table in which\n        to save the results of the DQ process.\n    result_sink_location - file system location in which to save the results of the\n        DQ process.\n    result_sink_partitions - the list of partitions to consider.\n    result_sink_format - format of the result table (e.g. delta, parquet, kafka...).\n    result_sink_options - extra spark options for configuring the result sink.\n        E.g: can be used to configure a Kafka sink if result_sink_format is kafka.\n    result_sink_explode - flag to determine if the output table/location should have\n        the columns exploded (as True) or not (as False). Default: True.\n    result_sink_extra_columns - list of extra columns to be exploded (following\n        the pattern \"<name>.*\") or columns to be selected. It is only used when\n        result_sink_explode is set to True.\n    source - name of data source, to be easier to identify in analysis. If not\n        specified, it is set as default <input_id>. This will be only used\n        when result_sink_explode is set to True.\n    fail_on_error - whether to fail the algorithm if the validations of your data in\n        the DQ process failed.\n    cache_df - whether to cache the dataframe before running the DQ process or not.\n    critical_functions - functions that should not fail. When this argument is\n        defined, fail_on_error is nullified.\n    max_percentage_failure - percentage of failure that should be allowed.\n        This argument has priority over both fail_on_error and critical_functions.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.DQSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">spec_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">input_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dq_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dq_functions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQFunctionSpec</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">unexpected_rows_pk</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">tbl_to_derive_pk</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">gx_result_format</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;COMPLETE&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">tag_source_data</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">assistant_options</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">store_backend</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;s3&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">local_fs_root_dir</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">bucket</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">data_docs_bucket</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">expectations_store_prefix</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;dq/expectations/&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">validations_store_prefix</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;dq/validations/&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">data_docs_prefix</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;dq/data_docs/site/&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">checkpoint_store_prefix</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;dq/checkpoints/&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">data_asset_name</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">expectation_suite_name</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_db_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_partitions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_options</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_explode</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_extra_columns</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">source</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">fail_on_error</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">cache_df</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">critical_functions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQFunctionSpec</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">max_percentage_failure</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">float</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.MergeOptions", "modulename": "lakehouse_engine.core.definitions", "qualname": "MergeOptions", "kind": "class", "doc": "<p>Options for a merge operation.</p>\n\n<p>merge_predicate: predicate to apply to the merge operation so that we can check if a\n    new record corresponds to a record already included in the historical data.\ninsert_only: indicates if the merge should only insert data (e.g., deduplicate\n    scenarios).\ndelete_predicate: predicate to apply to the delete operation.\nupdate_predicate: predicate to apply to the update operation.\ninsert_predicate: predicate to apply to the insert operation.\nupdate_column_set: rules to apply to the update operation which allows to set the\n    value for each column to be updated.\n    (e.g. {\"data\": \"new.data\", \"count\": \"current.count + 1\"} )\ninsert_column_set: rules to apply to the insert operation which allows to set the\n    value for each column to be inserted.\n    (e.g. {\"date\": \"updates.date\", \"count\": \"1\"} )</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.MergeOptions.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "MergeOptions.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">merge_predicate</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">insert_only</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">delete_predicate</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">update_predicate</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">insert_predicate</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">update_column_set</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">insert_column_set</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.OutputSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputSpec", "kind": "class", "doc": "<p>Specification of an algorithm output.</p>\n\n<p>This is very aligned with the way the execution environment connects to the output\nsystems (e.g., spark outputs).</p>\n\n<p>spec_id: id of the output specification.\ninput_id: id of the corresponding input specification.\nwrite_type: type of write operation.\ndata_format: format of the output. Defaults to DELTA.\ndb_table: table name in the form of <db>.<table>.\nlocation: uri that identifies from where to write data in the specified format.\npartitions: list of partition input_col names.\nmerge_opts: options to apply to the merge operation.\nstreaming_micro_batch_transformers: transformers to invoke for each streaming micro\n    batch, before writing (i.e., in Spark's foreachBatch structured\n    streaming function). Note: the lakehouse engine manages this for you, so\n    you don't have to manually specify streaming transformations here, so we don't\n    advise you to manually specify transformations through this parameter. Supply\n    them as regular transformers in the transform_specs sections of an ACON.\nstreaming_once: if the streaming query is to be executed just once, or not,\n    generating just one micro batch.\nstreaming_processing_time: if streaming query is to be kept alive, this indicates\n    the processing time of each micro batch.\nstreaming_available_now: if set to True, set a trigger that processes all available\n    data in multiple batches then terminates the query.\n    When using streaming, this is the default trigger that the lakehouse-engine will\n    use, unless you configure a different one.\nstreaming_continuous: set a trigger that runs a continuous query with a given\n    checkpoint interval.\nstreaming_await_termination: whether to wait (True) for the termination of the\n    streaming query (e.g. timeout or exception) or not (False). Default: True.\nstreaming_await_termination_timeout: a timeout to set to the\n    streaming_await_termination. Default: None.\nwith_batch_id: whether to include the streaming batch id in the final data, or not.\n    It only takes effect in streaming mode.\noptions: dict with other relevant options according to the execution environment\n    (e.g., spark) possible outputs.  E.g.,: JDBC options, checkpoint location for\n    streaming, etc.\nstreaming_micro_batch_dq_processors: similar to streaming_micro_batch_transformers\n    but for the DQ functions to be executed. Used internally by the lakehouse\n    engine, so you don't have to supply DQ functions through this parameter. Use the\n    dq_specs of the acon instead.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.OutputSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">spec_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">input_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">write_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">data_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">db_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">merge_opts</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">MergeOptions</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">partitions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_micro_batch_transformers</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TransformerSpec</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_once</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_processing_time</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_available_now</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_continuous</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_await_termination</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_await_termination_timeout</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">with_batch_id</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">options</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_micro_batch_dq_processors</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQSpec</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.TerminatorSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "TerminatorSpec", "kind": "class", "doc": "<p>Terminator Specification.</p>\n\n<p>I.e., the specification that defines a terminator operation to be executed. Examples\nare compute statistics, vacuum, optimize, etc.</p>\n\n<p>spec_id: id of the terminate specification.\nfunction: terminator function to execute.\nargs: arguments of the terminator function.\ninput_id: id of the corresponding output specification (Optional).</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.TerminatorSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "TerminatorSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">function</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">input_id</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.ReconciliatorSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReconciliatorSpec", "kind": "class", "doc": "<p>Reconciliator Specification.</p>\n\n<p>metrics: list of metrics in the form of:\n    [{\n        metric: name of the column present in both truth and current datasets,\n        aggregation: sum, avg, max, min, ...,\n        type: percentage or absolute,\n        yellow: value,\n        red: value\n    }].\nrecon_type: reconciliation type (percentage or absolute). Percentage calculates\n    the difference between truth and current results as a percentage (x-y/x), and\n    absolute calculates the raw difference (x - y).\ntruth_input_spec: input specification of the truth data.\ncurrent_input_spec: input specification of the current results data\ntruth_preprocess_query: additional query on top of the truth input data to\n    preprocess the truth data before it gets fueled into the reconciliation process.\n    Important note: you need to assume that the data out of\n    the truth_input_spec is referencable by a table called 'truth'.\ntruth_preprocess_query_args: optional dict having the functions/transformations to\n    apply on top of the truth_preprocess_query and respective arguments. Note: cache\n    is being applied on the Dataframe, by default. For turning the default behavior\n    off, pass <code>\"truth_preprocess_query_args\": []</code>.\ncurrent_preprocess_query: additional query on top of the current results input data\n    to preprocess the current results data before it gets fueled into the\n    reconciliation process. Important note: you need to assume that the data out of\n    the current_results_input_spec is referencable by a table called 'current'.\ncurrent_preprocess_query_args: optional dict having the functions/transformations to\n    apply on top of the current_preprocess_query and respective arguments. Note:\n    cache is being applied on the Dataframe, by default. For turning the default\n    behavior off, pass <code>\"current_preprocess_query_args\": []</code>.\nignore_empty_df: optional boolean, to ignore the recon process if source &amp; target\n   dataframes are empty, recon will exit success code (passed)</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.ReconciliatorSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReconciliatorSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">metrics</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">truth_input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">current_input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">truth_preprocess_query</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">truth_preprocess_query_args</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">current_preprocess_query</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">current_preprocess_query_args</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">ignore_empty_df</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.DQValidatorSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQValidatorSpec", "kind": "class", "doc": "<p>Data Quality Validator Specification.</p>\n\n<p>input_spec: input specification of the data to be checked/validated.\ndq_spec: data quality specification.\nrestore_prev_version: specify if, having\ndelta table/files as input, they should be restored to the\nprevious version if the data quality process fails. Note: this\nis only considered if fail_on_error is kept as True.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.DQValidatorSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQValidatorSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">dq_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQSpec</span>,</span><span class=\"param\">\t<span class=\"n\">restore_prev_version</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions", "kind": "class", "doc": "<p>SQL definitions statements.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.compute_table_stats", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.compute_table_stats", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.compute_table_stats: &#x27;ANALYZE TABLE {} COMPUTE STATISTICS&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.drop_table_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.drop_table_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.drop_table_stmt: &#x27;DROP TABLE IF EXISTS&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.drop_view_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.drop_view_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.drop_view_stmt: &#x27;DROP VIEW IF EXISTS&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.truncate_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.truncate_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.truncate_stmt: &#x27;TRUNCATE TABLE&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.describe_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.describe_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.describe_stmt: &#x27;DESCRIBE TABLE&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.optimize_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.optimize_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.optimize_stmt: &#x27;OPTIMIZE&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.show_tbl_props_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.show_tbl_props_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.show_tbl_props_stmt: &#x27;SHOW TBLPROPERTIES&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.delete_where_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.delete_where_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.delete_where_stmt: &#x27;DELETE FROM {} WHERE {}&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.FileManagerAPIKeys", "modulename": "lakehouse_engine.core.definitions", "qualname": "FileManagerAPIKeys", "kind": "class", "doc": "<p>File Manager s3 api keys.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.FileManagerAPIKeys.CONTENTS", "modulename": "lakehouse_engine.core.definitions", "qualname": "FileManagerAPIKeys.CONTENTS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;FileManagerAPIKeys.CONTENTS: &#x27;Contents&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.FileManagerAPIKeys.KEY", "modulename": "lakehouse_engine.core.definitions", "qualname": "FileManagerAPIKeys.KEY", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;FileManagerAPIKeys.KEY: &#x27;Key&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.FileManagerAPIKeys.CONTINUATION", "modulename": "lakehouse_engine.core.definitions", "qualname": "FileManagerAPIKeys.CONTINUATION", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;FileManagerAPIKeys.CONTINUATION: &#x27;NextContinuationToken&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.FileManagerAPIKeys.BUCKET", "modulename": "lakehouse_engine.core.definitions", "qualname": "FileManagerAPIKeys.BUCKET", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;FileManagerAPIKeys.BUCKET: &#x27;Bucket&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.FileManagerAPIKeys.OBJECTS", "modulename": "lakehouse_engine.core.definitions", "qualname": "FileManagerAPIKeys.OBJECTS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;FileManagerAPIKeys.OBJECTS: &#x27;Objects&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SensorSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "SensorSpec", "kind": "class", "doc": "<p>Sensor Specification.</p>\n\n<p>sensor_id: sensor id.\nassets: a list of assets that are considered as available to\n    consume downstream after this sensor has status\n    PROCESSED_NEW_DATA.\ncontrol_db_table_name: db.table to store sensor metadata.\ninput_spec: input specification of the source to be checked for new data.\npreprocess_query: SQL query to transform/filter the result from the\n    upstream. Consider that we should refer to 'new_data' whenever\n    we are referring to the input of the sensor. E.g.:\n        \"SELECT dummy_col FROM new_data WHERE ...\"\ncheckpoint_location: optional location to store checkpoints to resume\n    from. These checkpoints use the same as Spark checkpoint strategy.\n    For Spark readers that do not support checkpoints, use the\n    preprocess_query parameter to form a SQL query to filter the result\n    from the upstream accordingly.\nfail_on_empty_result: if the sensor should throw an error if there is no new\n    data in the upstream. Default: True.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.SensorSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "SensorSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">assets</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">preprocess_query</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">checkpoint_location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">fail_on_empty_result</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.SensorSpec.create_from_acon", "modulename": "lakehouse_engine.core.definitions", "qualname": "SensorSpec.create_from_acon", "kind": "function", "doc": "<p>Create SensorSpec from acon.</p>\n\n<p>Args:\n    acon: sensor ACON.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.definitions.SensorStatus", "modulename": "lakehouse_engine.core.definitions", "qualname": "SensorStatus", "kind": "class", "doc": "<p>Status for a sensor.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.SensorStatus.ACQUIRED_NEW_DATA", "modulename": "lakehouse_engine.core.definitions", "qualname": "SensorStatus.ACQUIRED_NEW_DATA", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SensorStatus.ACQUIRED_NEW_DATA: &#x27;ACQUIRED_NEW_DATA&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SensorStatus.PROCESSED_NEW_DATA", "modulename": "lakehouse_engine.core.definitions", "qualname": "SensorStatus.PROCESSED_NEW_DATA", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SensorStatus.PROCESSED_NEW_DATA: &#x27;PROCESSED_NEW_DATA&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SAPLogchain", "modulename": "lakehouse_engine.core.definitions", "qualname": "SAPLogchain", "kind": "class", "doc": "<p>Defaults used on consuming data from SAP Logchain.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.SAPLogchain.DBTABLE", "modulename": "lakehouse_engine.core.definitions", "qualname": "SAPLogchain.DBTABLE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SAPLogchain.DBTABLE: &#x27;SAPPHA.RSPCLOGCHAIN&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SAPLogchain.GREEN_STATUS", "modulename": "lakehouse_engine.core.definitions", "qualname": "SAPLogchain.GREEN_STATUS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SAPLogchain.GREEN_STATUS: &#x27;G&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SAPLogchain.ENGINE_TABLE", "modulename": "lakehouse_engine.core.definitions", "qualname": "SAPLogchain.ENGINE_TABLE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SAPLogchain.ENGINE_TABLE: &#x27;sensor_new_data&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.RestoreType", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreType", "kind": "class", "doc": "<p>Archive types.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.RestoreType.BULK", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreType.BULK", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;RestoreType.BULK: &#x27;Bulk&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.RestoreType.STANDARD", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreType.STANDARD", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;RestoreType.STANDARD: &#x27;Standard&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.RestoreType.EXPEDITED", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreType.EXPEDITED", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;RestoreType.EXPEDITED: &#x27;Expedited&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.RestoreType.values", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreType.values", "kind": "function", "doc": "<p>Generates a list containing all enum values.</p>\n\n<p>Return:\n    A list with all enum values.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.definitions.RestoreType.exists", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreType.exists", "kind": "function", "doc": "<p>Checks if the restore type exists in the enum values.</p>\n\n<p>Args:\n    restore_type: restore type to check if exists.</p>\n\n<p>Return:\n    If the restore type exists in our enum.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">restore_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.definitions.RestoreStatus", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreStatus", "kind": "class", "doc": "<p>Archive types.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.RestoreStatus.NOT_STARTED", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreStatus.NOT_STARTED", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;RestoreStatus.NOT_STARTED: &#x27;not_started&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.RestoreStatus.ONGOING", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreStatus.ONGOING", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;RestoreStatus.ONGOING: &#x27;ongoing&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.RestoreStatus.RESTORED", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreStatus.RESTORED", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;RestoreStatus.RESTORED: &#x27;restored&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.exec_env", "modulename": "lakehouse_engine.core.exec_env", "kind": "module", "doc": "<p>Module to take care of creating a singleton of the execution environment class.</p>\n"}, {"fullname": "lakehouse_engine.core.exec_env.ExecEnv", "modulename": "lakehouse_engine.core.exec_env", "qualname": "ExecEnv", "kind": "class", "doc": "<p>Represents the basic resources regarding the engine execution environment.</p>\n\n<p>Currently, it is solely used to encapsulate the logic to get a Spark session.</p>\n"}, {"fullname": "lakehouse_engine.core.exec_env.ExecEnv.get_or_create", "modulename": "lakehouse_engine.core.exec_env", "qualname": "ExecEnv.get_or_create", "kind": "function", "doc": "<p>Get or create an execution environment session (currently Spark).</p>\n\n<p>It instantiates a singleton session that can be accessed anywhere from the\nlakehouse engine.</p>\n\n<p>Args:\n    session: spark session.\n    enable_hive_support: whether to enable hive support or not.\n    app_name: application name.\n    config: extra spark configs to supply to the spark session.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">session</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">session</span><span class=\"o\">.</span><span class=\"n\">SparkSession</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">enable_hive_support</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">app_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">config</span><span class=\"p\">:</span> <span class=\"nb\">dict</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.executable", "modulename": "lakehouse_engine.core.executable", "kind": "module", "doc": "<p>Module representing an executable lakehouse engine component.</p>\n"}, {"fullname": "lakehouse_engine.core.executable.Executable", "modulename": "lakehouse_engine.core.executable", "qualname": "Executable", "kind": "class", "doc": "<p>Abstract class defining the behaviour of an executable component.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.core.executable.Executable.execute", "modulename": "lakehouse_engine.core.executable", "qualname": "Executable.execute", "kind": "function", "doc": "<p>Define the executable component behaviour.</p>\n\n<p>E.g., the behaviour of an algorithm inheriting from this.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager", "modulename": "lakehouse_engine.core.file_manager", "kind": "module", "doc": "<p>File manager module.</p>\n"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager", "kind": "class", "doc": "<p>Set of actions to manipulate files in several ways.</p>\n"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.__init__", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.__init__", "kind": "function", "doc": "<p>Construct FileManager algorithm instances.</p>\n\n<p>Args:\n    configs: configurations for the FileManager algorithm.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">configs</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.get_function", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.get_function", "kind": "function", "doc": "<p>Get a specific function to execute.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.delete_objects", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.delete_objects", "kind": "function", "doc": "<p>Delete objects and 'directories' in s3.</p>\n\n<p>If dry_run is set to True the function will print a dict with all the\npaths that would be deleted based on the given keys.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.copy_objects", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.copy_objects", "kind": "function", "doc": "<p>Copies objects and 'directories' in s3.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.request_restore", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.request_restore", "kind": "function", "doc": "<p>Request the restore of archived data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.check_restore_status", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.check_restore_status", "kind": "function", "doc": "<p>Check the restore status of archived data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.request_restore_to_destination_and_wait", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.request_restore_to_destination_and_wait", "kind": "function", "doc": "<p>Request and wait for the restore to complete, polling the restore status.</p>\n\n<p>After the restore is done, copy the restored files to destination</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.ArchiveFileManager", "modulename": "lakehouse_engine.core.file_manager", "qualname": "ArchiveFileManager", "kind": "class", "doc": "<p>Set of actions to restore archives.</p>\n"}, {"fullname": "lakehouse_engine.core.file_manager.ArchiveFileManager.check_restore_status", "modulename": "lakehouse_engine.core.file_manager", "qualname": "ArchiveFileManager.check_restore_status", "kind": "function", "doc": "<p>Check the restore status of archived data.</p>\n\n<p>Args:\n    source_bucket: name of bucket to check the restore status.\n    source_object: object to check the restore status.</p>\n\n<p>Returns:\n    A dict containing the amount of objects in each status.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">source_bucket</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">source_object</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.ArchiveFileManager.request_restore", "modulename": "lakehouse_engine.core.file_manager", "qualname": "ArchiveFileManager.request_restore", "kind": "function", "doc": "<p>Request the restore of archived data.</p>\n\n<p>Args:\n    source_bucket: name of bucket to perform the restore.\n    source_object: object to be restored.\n    restore_expiration: restore expiration in days.\n    retrieval_tier: type of restore, possible values are:\n        Bulk, Standard or Expedited.\n    dry_run: if dry_run is set to True the function will print a dict with\n        all the paths that would be deleted based on the given keys.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">source_bucket</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">source_object</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">restore_expiration</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">retrieval_tier</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dry_run</span><span class=\"p\">:</span> <span class=\"nb\">bool</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.ArchiveFileManager.request_restore_and_wait", "modulename": "lakehouse_engine.core.file_manager", "qualname": "ArchiveFileManager.request_restore_and_wait", "kind": "function", "doc": "<p>Request and wait for the restore to complete, polling the restore status.</p>\n\n<p>Args:\n    source_bucket: name of bucket to perform the restore.\n    source_object: object to be restored.\n    restore_expiration: restore expiration in days.\n    retrieval_tier: type of restore, possible values are:\n        Bulk, Standard or Expedited.\n    dry_run: if dry_run is set to True the function will print a dict with\n        all the paths that would be deleted based on the given keys.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">source_bucket</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">source_object</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">restore_expiration</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">retrieval_tier</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dry_run</span><span class=\"p\">:</span> <span class=\"nb\">bool</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager", "modulename": "lakehouse_engine.core.sensor_manager", "kind": "module", "doc": "<p>Module to define Sensor Manager classes.</p>\n"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorControlTableManager", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorControlTableManager", "kind": "class", "doc": "<p>Class to control the Sensor execution.</p>\n"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorControlTableManager.check_if_sensor_has_acquired_data", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorControlTableManager.check_if_sensor_has_acquired_data", "kind": "function", "doc": "<p>Check if sensor has acquired new data.</p>\n\n<p>Args:\n    sensor_id: sensor id.\n    control_db_table_name: db.table to control sensor runs.</p>\n\n<p>Returns:\n    True if acquired new data, otherwise False</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorControlTableManager.update_sensor_status", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorControlTableManager.update_sensor_status", "kind": "function", "doc": "<p>Control sensor execution storing the execution data in a delta table.</p>\n\n<p>Args:\n    sensor_spec: sensor spec containing all sensor\n        information we need to update the control status.\n    status: status of the sensor.\n    upstream_key: upstream key (e.g., used to store an attribute\n        name from the upstream so that new data can be detected\n        automatically).\n    upstream_value: upstream value (e.g., used to store the max\n        attribute value from the upstream so that new data can be\n        detected automatically).</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">sensor_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">SensorSpec</span>,</span><span class=\"param\">\t<span class=\"n\">status</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_key</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_value</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorControlTableManager.read_sensor_table_data", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorControlTableManager.read_sensor_table_data", "kind": "function", "doc": "<p>Read data from delta table containing sensor status info.</p>\n\n<p>Args:\n    sensor_id: sensor id. If this parameter is defined search occurs\n        only considering this parameter. Otherwise, it considers sensor\n        assets and checkpoint location.\n    control_db_table_name: db.table to control sensor runs.\n    assets: list of assets that are fueled by the pipeline\n        where this sensor is.</p>\n\n<p>Return:\n    Row containing the data for the provided sensor_id.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">assets</span><span class=\"p\">:</span> <span class=\"nb\">list</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">Row</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorUpstreamManager", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorUpstreamManager", "kind": "class", "doc": "<p>Class to deal with Sensor Upstream data.</p>\n"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorUpstreamManager.generate_filter_exp_query", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorUpstreamManager.generate_filter_exp_query", "kind": "function", "doc": "<p>Generates a sensor preprocess query based on timestamp logic.</p>\n\n<p>Args:\n    sensor_id: sensor id.\n    filter_exp: expression to filter incoming new data.\n        You can use the placeholder <code>?upstream_value</code> so that\n        it can be replaced by the upstream_value in the\n        control_db_table_name for this specific sensor_id.\n    control_db_table_name: db.table to retrieve the last status change\n        timestamp. This is only relevant for the jdbc sensor.\n    upstream_key: the key of custom sensor information\n        to control how to identify new data from the\n        upstream (e.g., a time column in the upstream).\n    upstream_value: value for custom sensor\n        to identify new data from the upstream\n        (e.g., the value of a time present in the upstream)\n        If none we will set the default value.\n        Note: This parameter is used just to override the\n        default value <code>-2147483647</code>.\n    upstream_table_name: value for custom sensor\n        to query new data from the upstream.\n        If none we will set the default value,\n        our <code>sensor_new_data</code> view.</p>\n\n<p>Return:\n    The query string.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">filter_exp</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_key</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_value</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorUpstreamManager.generate_sensor_table_preprocess_query", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorUpstreamManager.generate_sensor_table_preprocess_query", "kind": "function", "doc": "<p>Generates a query to be used for a sensor having other sensor as upstream.</p>\n\n<p>Args:\n    sensor_id: sensor id.</p>\n\n<p>Return:\n    The query string.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorUpstreamManager.read_new_data", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorUpstreamManager.read_new_data", "kind": "function", "doc": "<p>Read new data from the upstream into the sensor 'new_data_df'.</p>\n\n<p>Args:\n    sensor_spec: sensor spec containing all sensor information.</p>\n\n<p>Return:\n    An empty dataframe if it doesn't have new data otherwise the new data</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">sensor_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">SensorSpec</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorUpstreamManager.get_new_data", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorUpstreamManager.get_new_data", "kind": "function", "doc": "<p>Get new data from upstream df if it's present.</p>\n\n<p>Args:\n    new_data_df: DataFrame possibly containing new data.</p>\n\n<p>Return:\n    Optional row, present if there is new data in the upstream,\n    absent otherwise.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">new_data_df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">Row</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorUpstreamManager.generate_sensor_sap_logchain_query", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorUpstreamManager.generate_sensor_sap_logchain_query", "kind": "function", "doc": "<p>Generates a sensor query based in the SAP Logchain table.</p>\n\n<p>Args:\n    chain_id: chain id to query the status on SAP.\n    dbtable: db.table to retrieve the data to\n        check if the sap chain is already finished.\n    status: db.table to retrieve the last status change\n        timestamp.\n    engine_table_name: table name exposed with the SAP LOGCHAIN data.\n        This table will be used in the jdbc query.</p>\n\n<p>Return:\n    The query string.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">chain_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dbtable</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;SAPPHA.RSPCLOGCHAIN&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">status</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;G&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">engine_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;sensor_new_data&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager", "modulename": "lakehouse_engine.core.table_manager", "kind": "module", "doc": "<p>Table manager module.</p>\n"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager", "kind": "class", "doc": "<p>Set of actions to manipulate tables/views in several ways.</p>\n"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.__init__", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.__init__", "kind": "function", "doc": "<p>Construct TableManager algorithm instances.</p>\n\n<p>Args:\n    configs: configurations for the TableManager algorithm.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">configs</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.get_function", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.get_function", "kind": "function", "doc": "<p>Get a specific function to execute.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.create", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.create", "kind": "function", "doc": "<p>Create a new table or view on metastore.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.create_many", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.create_many", "kind": "function", "doc": "<p>Create multiple tables or views on metastore.</p>\n\n<p>In this function the path to the ddl files can be separated by comma.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.compute_table_statistics", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.compute_table_statistics", "kind": "function", "doc": "<p>Compute table statistics.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.drop_table", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.drop_table", "kind": "function", "doc": "<p>Delete table function deletes table from metastore and erases all data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.drop_view", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.drop_view", "kind": "function", "doc": "<p>Delete view function deletes view from metastore and erases all data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.truncate", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.truncate", "kind": "function", "doc": "<p>Truncate function erases all data but keeps metadata.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.vacuum", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.vacuum", "kind": "function", "doc": "<p>Vacuum function erases older versions from Delta Lake tables or locations.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.describe", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.describe", "kind": "function", "doc": "<p>Describe function describes metadata from some table or view.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.optimize", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.optimize", "kind": "function", "doc": "<p>Optimize function optimizes the layout of Delta Lake data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.execute_multiple_sql_files", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.execute_multiple_sql_files", "kind": "function", "doc": "<p>Execute multiple statements in multiple sql files.</p>\n\n<p>In this function the path to the files is separated by comma.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.execute_sql", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.execute_sql", "kind": "function", "doc": "<p>Execute sql commands separated by semicolon (;).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.show_tbl_properties", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.show_tbl_properties", "kind": "function", "doc": "<p>Show Table Properties.</p>\n\n<p>Returns: a dataframe with the table properties.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.get_tbl_pk", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.get_tbl_pk", "kind": "function", "doc": "<p>Get the primary key of a particular table.</p>\n\n<p>Returns: the list of columns that are part of the primary key.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.repair_table", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.repair_table", "kind": "function", "doc": "<p>Run the repair table command.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.delete_where", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.delete_where", "kind": "function", "doc": "<p>Run the delete where command.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.dq_processors", "modulename": "lakehouse_engine.dq_processors", "kind": "module", "doc": "<p>Package to define data quality processes available in the lakehouse engine.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.assistant", "modulename": "lakehouse_engine.dq_processors.assistant", "kind": "module", "doc": "<p>Module containing the definition of a data assistant.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.assistant.Assistant", "modulename": "lakehouse_engine.dq_processors.assistant", "qualname": "Assistant", "kind": "class", "doc": "<p>Class containing the data assistant.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.assistant.Assistant.run_data_assistant", "modulename": "lakehouse_engine.dq_processors.assistant", "qualname": "Assistant.run_data_assistant", "kind": "function", "doc": "<p>Entrypoint to run the data assistant.</p>\n\n<p>Based on the data, it uses GE Onboarding Data Assistant to generate expectations\nthat can be applied to the data. Then, it returns the generated expectations\nand, depending on your configuration, it can display plots of the metrics,\nexpectations and also display or store the profiling of the data, for you to get\na better sense of it.</p>\n\n<p>Args:\n    context: the BaseDataContext containing the configurations for the data\n    source and store backend.\n    batch_request: batch request to be able to query underlying data.\n    expectation_suite_name: name of the expectation suite.\n    assistant_options: additional options to pass to the DQ assistant processor.\n    data: the input dataframe for which the DQ is running.\n    profile_file_name: file name for storing the profiling html file.</p>\n\n<p>Returns:\n    The context with the expectation suite stored.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">context</span><span class=\"p\">:</span> <span class=\"o\">&lt;</span><span class=\"n\">function</span> <span class=\"n\">BaseDataContext</span><span class=\"o\">&gt;</span>,</span><span class=\"param\">\t<span class=\"n\">batch_request</span><span class=\"p\">:</span> <span class=\"n\">great_expectations</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">batch</span><span class=\"o\">.</span><span class=\"n\">RuntimeBatchRequest</span>,</span><span class=\"param\">\t<span class=\"n\">expectation_suite_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">assistant_options</span><span class=\"p\">:</span> <span class=\"nb\">dict</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">profile_file_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations", "modulename": "lakehouse_engine.dq_processors.custom_expectations", "kind": "module", "doc": "<p>Package containing custom DQ expectations available in the lakehouse engine.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_column_pair_a_to_be_smaller_or_equal_than_b", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_column_pair_a_to_be_smaller_or_equal_than_b", "kind": "module", "doc": "<p>Expectation to check if column 'a' is lower or equal than column 'b'.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_column_pair_a_to_be_smaller_or_equal_than_b.ColumnPairCustom", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_column_pair_a_to_be_smaller_or_equal_than_b", "qualname": "ColumnPairCustom", "kind": "class", "doc": "<p>Asserts that column 'A' is lower or equal than column 'B'.</p>\n\n<p>Additionally, the 'margin' parameter can be used to add a margin to the\ncheck between column 'A' and 'B': 'A' &lt;= 'B' + 'margin'.</p>\n", "bases": "great_expectations.expectations.metrics.map_metric_provider.column_pair_map_metric_provider.ColumnPairMapMetricProvider"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_column_pair_a_to_be_smaller_or_equal_than_b.ExpectColumnPairAToBeSmallerOrEqualThanB", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_column_pair_a_to_be_smaller_or_equal_than_b", "qualname": "ExpectColumnPairAToBeSmallerOrEqualThanB", "kind": "class", "doc": "<p>Expect values in column A to be lower or equal than column B.</p>\n\n<p>Args:\n    column_A: The first column name.\n    column_B: The second column name.\n    margin: additional approximation to column B value.</p>\n\n<p>Keyword Args:\n    allow_cross_type_comparisons: If True, allow\n        comparisons between types (e.g. integer and string).\n        Otherwise, attempting such comparisons will raise an exception.\n    ignore_row_if: \"both_values_are_missing\",\n        \"either_value_is_missing\", \"neither\" (default).\n    result_format: Which output mode to use:\n        <code>BOOLEAN_ONLY</code>, <code>BASIC</code> (default), <code>COMPLETE</code>, or <code>SUMMARY</code>.\n    include_config: If True (default), then include the expectation config\n        as part of the result object.\n    catch_exceptions: If True, then catch exceptions and\n        include them as part of the result object. Default: False.\n    meta: A JSON-serializable dictionary (nesting allowed)\n        that will be included in the output without modification.</p>\n\n<p>Returns:\n    An ExpectationSuiteValidationResult.</p>\n", "bases": "great_expectations.expectations.expectation.ColumnPairMapExpectation"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_column_values_to_be_date_not_older_than", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_column_values_to_be_date_not_older_than", "kind": "module", "doc": "<p>Expectation to check if column value is a date within a timeframe.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_column_values_to_be_date_not_older_than.ColumnValuesDateNotOlderThan", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_column_values_to_be_date_not_older_than", "qualname": "ColumnValuesDateNotOlderThan", "kind": "class", "doc": "<p>Asserts that column values are a date that isn't older than a given date.</p>\n", "bases": "great_expectations.expectations.metrics.map_metric_provider.column_map_metric_provider.ColumnMapMetricProvider"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_column_values_to_be_date_not_older_than.ExpectColumnValuesToBeDateNotOlderThan", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_column_values_to_be_date_not_older_than", "qualname": "ExpectColumnValuesToBeDateNotOlderThan", "kind": "class", "doc": "<p>Expect value in column to be date that is not older than a given time.</p>\n\n<p>Since timedelta can only define an interval up to weeks, a month is defined\nas 4 weeks and a year is defined as 52 weeks.</p>\n\n<p>Args:\n    column: Name of column to validate\n    Note: Column must be of type Date, Timestamp or String (with Timestamp format).\n    Format: yyyy-MM-ddTHH:mm:ss\n    timeframe: dict with the definition of the timeframe.\n    kwargs: dict with additional parameters.</p>\n\n<p>Keyword Args:\n    allow_cross_type_comparisons: If True, allow\n        comparisons between types (e.g. integer and string).\n        Otherwise, attempting such comparisons will raise an exception.\n    ignore_row_if: \"both_values_are_missing\",\n        \"either_value_is_missing\", \"neither\" (default).\n    result_format: Which output mode to use:\n        <code>BOOLEAN_ONLY</code>, <code>BASIC</code> (default), <code>COMPLETE</code>, or <code>SUMMARY</code>.\n    include_config: If True (default), then include the expectation config\n        as part of the result object.\n    catch_exceptions: If True, then catch exceptions and\n        include them as part of the result object. Default: False.\n    meta: A JSON-serializable dictionary (nesting allowed)\n        that will be included in the output without modification.</p>\n\n<p>Returns:\n    An ExpectationSuiteValidationResult.</p>\n", "bases": "great_expectations.expectations.expectation.ColumnMapExpectation"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_multicolumn_column_a_must_equal_b_or_c", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_multicolumn_column_a_must_equal_b_or_c", "kind": "module", "doc": "<p>Expectation to check if column 'a' equals 'b', or 'c'.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_multicolumn_column_a_must_equal_b_or_c.MulticolumnCustomMetric", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_multicolumn_column_a_must_equal_b_or_c", "qualname": "MulticolumnCustomMetric", "kind": "class", "doc": "<p>Expectation metric definition.</p>\n\n<p>This expectation asserts that column 'a' must equal to column 'b' or column 'c'.\nIn addition to this it is possible to validate that column 'b' or 'c' match a regex.</p>\n", "bases": "great_expectations.expectations.metrics.map_metric_provider.multicolumn_map_metric_provider.MulticolumnMapMetricProvider"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_multicolumn_column_a_must_equal_b_or_c.ExpectMulticolumnColumnAMustEqualBOrC", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_multicolumn_column_a_must_equal_b_or_c", "qualname": "ExpectMulticolumnColumnAMustEqualBOrC", "kind": "class", "doc": "<p>MultiColumn Expectation.</p>\n\n<p>Expect that the column 'a' is equal to 'b' when this is\nnot empty; otherwise 'a' must be equal to 'c'.</p>\n\n<p>Args:\n    column_list: The column names to evaluate.</p>\n\n<p>Keyword Args:\n    ignore_row_if: default to \"never\".\n    result_format:  Which output mode to use:\n       <code>BOOLEAN_ONLY</code>, <code>BASIC</code>, <code>COMPLETE</code>, or <code>SUMMARY</code>.\n       Default set to <code>BASIC</code>.\n    include_config: If True, then include the expectation\n       config as part of the result object.\n       Default set to True.\n    catch_exceptions: If True, then catch exceptions\n       and include them as part of the result object.\n       Default set to False.</p>\n\n<p>Returns:\n    An ExpectationSuiteValidationResult.</p>\n", "bases": "great_expectations.expectations.expectation.MulticolumnMapExpectation"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_queried_column_agg_value_to_be", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_queried_column_agg_value_to_be", "kind": "module", "doc": "<p>Expectation to check if aggregated column satisfy the condition.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_queried_column_agg_value_to_be.ExpectQueriedColumnAggValueToBe", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_queried_column_agg_value_to_be", "qualname": "ExpectQueriedColumnAggValueToBe", "kind": "class", "doc": "<p>Expect agg of column to satisfy the condition specified.</p>\n\n<p>Args:\n    template_dict: dict with the following keys:\n        column (column to check sum).\n        group_column_list (group by column names to be listed).\n        condition (how to validate the aggregated value eg: between,\n        greater, lesser).\n        max_value (maximum allowed value).\n        min_value (minimum allowed value).\n        agg_type (sum/count/max/min).</p>\n", "bases": "great_expectations.expectations.expectation.QueryExpectation"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_queried_column_agg_value_to_be.ExpectQueriedColumnAggValueToBe.validate_configuration", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_queried_column_agg_value_to_be", "qualname": "ExpectQueriedColumnAggValueToBe.validate_configuration", "kind": "function", "doc": "<p>Validates that a configuration has been set.</p>\n\n<p>Args:\n    configuration (OPTIONAL[ExpectationConfiguration]):\n    An optional Expectation Configuration entry.</p>\n\n<p>Returns:\n    None. Raises InvalidExpectationConfigurationError</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">configuration</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">great_expectations</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">expectation_configuration</span><span class=\"o\">.</span><span class=\"n\">ExpectationConfiguration</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.dq_processors.dq_factory", "modulename": "lakehouse_engine.dq_processors.dq_factory", "kind": "module", "doc": "<p>Module containing the class definition of the Data Quality Factory.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.dq_factory.DQFactory", "modulename": "lakehouse_engine.dq_processors.dq_factory", "qualname": "DQFactory", "kind": "class", "doc": "<p>Class for the Data Quality Factory.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.dq_factory.DQFactory.run_dq_process", "modulename": "lakehouse_engine.dq_processors.dq_factory", "qualname": "DQFactory.run_dq_process", "kind": "function", "doc": "<p>Run the specified data quality process on a dataframe.</p>\n\n<p>Based on the dq_specs we apply the defined expectations on top of the dataframe\nin order to apply the necessary validations and then output the result of\nthe data quality process.</p>\n\n<p>Args:\n    dq_spec: data quality specification.\n    data: input dataframe to run the dq process on.</p>\n\n<p>Returns:\n    The DataFrame containing the results of the DQ process.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">dq_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQSpec</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.dq_processors.exceptions", "modulename": "lakehouse_engine.dq_processors.exceptions", "kind": "module", "doc": "<p>Package defining all the DQ custom exceptions.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.exceptions.DQValidationsFailedException", "modulename": "lakehouse_engine.dq_processors.exceptions", "qualname": "DQValidationsFailedException", "kind": "class", "doc": "<p>Exception for when the data quality validations fail.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.dq_processors.exceptions.DQCheckpointsResultsException", "modulename": "lakehouse_engine.dq_processors.exceptions", "qualname": "DQCheckpointsResultsException", "kind": "class", "doc": "<p>Exception for when the checkpoint results parsing fail.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.dq_processors.validator", "modulename": "lakehouse_engine.dq_processors.validator", "kind": "module", "doc": "<p>Module containing the definition of a data quality validator.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.validator.Validator", "modulename": "lakehouse_engine.dq_processors.validator", "qualname": "Validator", "kind": "class", "doc": "<p>Class containing the data quality validator.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.validator.Validator.get_dq_validator", "modulename": "lakehouse_engine.dq_processors.validator", "qualname": "Validator.get_dq_validator", "kind": "function", "doc": "<p>Get a validator according to the specification.</p>\n\n<p>We use getattr to dynamically execute any expectation available.\ngetattr(validator, function) is similar to validator.function(). With this\napproach, we can execute any expectation supported.</p>\n\n<p>Args:\n    context: the BaseDataContext containing the configurations for the data\n    source and store backend.\n    batch_request: run time batch request to be able to query underlying data.\n    expectation_suite_name: name of the expectation suite.\n    dq_functions: a list of DQFunctionSpec to consider in the expectation suite.\n    critical_functions: list of critical expectations in the expectation suite.</p>\n\n<p>Returns:\n    The validator with the expectation suite stored.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">context</span><span class=\"p\">:</span> <span class=\"o\">&lt;</span><span class=\"n\">function</span> <span class=\"n\">BaseDataContext</span><span class=\"o\">&gt;</span>,</span><span class=\"param\">\t<span class=\"n\">batch_request</span><span class=\"p\">:</span> <span class=\"n\">great_expectations</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">batch</span><span class=\"o\">.</span><span class=\"n\">RuntimeBatchRequest</span>,</span><span class=\"param\">\t<span class=\"n\">expectation_suite_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dq_functions</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQFunctionSpec</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">critical_functions</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQFunctionSpec</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.dq_processors.validator.Validator.tag_source_with_dq", "modulename": "lakehouse_engine.dq_processors.validator", "qualname": "Validator.tag_source_with_dq", "kind": "function", "doc": "<p>Tags the source dataframe with a new column having the DQ results.</p>\n\n<p>Args:\n    source_pk: the primary key of the source data.\n    source_df: the source dataframe to be tagged with DQ results.\n    results_df: dq results dataframe.</p>\n\n<p>Returns: a dataframe tagged with the DQ results.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">source_pk</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">source_df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">results_df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine", "modulename": "lakehouse_engine.engine", "kind": "module", "doc": "<p>Contract of the lakehouse engine with all the available functions to be executed.</p>\n"}, {"fullname": "lakehouse_engine.engine.load_data", "modulename": "lakehouse_engine.engine", "qualname": "load_data", "kind": "function", "doc": "<p>Load data using the DataLoader algorithm.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks or other\n        apps).</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">OrderedDict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.execute_reconciliation", "modulename": "lakehouse_engine.engine", "qualname": "execute_reconciliation", "kind": "function", "doc": "<p>Execute the Reconciliator algorithm.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks or other\n        apps).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>, </span><span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.execute_dq_validation", "modulename": "lakehouse_engine.engine", "qualname": "execute_dq_validation", "kind": "function", "doc": "<p>Execute the DQValidator algorithm.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks or other\n        apps).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>, </span><span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.manage_table", "modulename": "lakehouse_engine.engine", "qualname": "manage_table", "kind": "function", "doc": "<p>Manipulate tables/views using Table Manager algorithm.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks\n        or other apps).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>, </span><span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.manage_files", "modulename": "lakehouse_engine.engine", "qualname": "manage_files", "kind": "function", "doc": "<p>Manipulate s3 files using File Manager algorithm.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks\n        or other apps).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>, </span><span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.execute_sensor", "modulename": "lakehouse_engine.engine", "qualname": "execute_sensor", "kind": "function", "doc": "<p>Execute a sensor based on a Sensor Algorithm Configuration.</p>\n\n<p>A sensor is useful to check if an upstream system has new data.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks\n        or other apps).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>, </span><span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.update_sensor_status", "modulename": "lakehouse_engine.engine", "qualname": "update_sensor_status", "kind": "function", "doc": "<p>Update internal sensor status.</p>\n\n<p>Update the sensor status in the control table,\nit should be used to tell the system\nthat the sensor has processed all new data that was previously identified,\nhence updating the shifted sensor status.\nUsually used to move from <code>SensorStatus.ACQUIRED_NEW_DATA</code> to\n<code>SensorStatus.PROCESSED_NEW_DATA</code>,\nbut there might be scenarios - still to identify -\nwhere we can update the sensor status from/to different statuses.</p>\n\n<p>Args:\n    sensor_id: sensor id.\n    control_db_table_name: db.table to store sensor checkpoints.\n    status: status of the sensor.\n    assets: a list of assets that are considered as available to\n        consume downstream after this sensor has status\n        PROCESSED_NEW_DATA.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">status</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;PROCESSED_NEW_DATA&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">assets</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.generate_sensor_query", "modulename": "lakehouse_engine.engine", "qualname": "generate_sensor_query", "kind": "function", "doc": "<p>Generates a preprocess query to be used in a sensor configuration.</p>\n\n<p>Args:\n    sensor_id: sensor id.\n    filter_exp: expression to filter incoming new data.\n        You can use the placeholder ?default_upstream_key and\n        ?default_upstream_value, so that it can be replaced by the\n        respective values in the control_db_table_name for this specific\n        sensor_id.\n    control_db_table_name: db.table to retrieve the last status change\n        timestamp. This is only relevant for the jdbc sensor.\n    upstream_key: the key of custom sensor information to control how to\n        identify new data from the upstream (e.g., a time column in the\n        upstream).\n    upstream_value: the upstream value\n        to identify new data from the upstream (e.g., the value of a time\n        present in the upstream).\n    upstream_table_name: value for custom sensor\n            to query new data from the upstream\n            If none we will set the default value,\n            our <code>sensor_new_data</code> view.</p>\n\n<p>Return:\n    The query string.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">filter_exp</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_key</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_value</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.generate_sensor_sap_logchain_query", "modulename": "lakehouse_engine.engine", "qualname": "generate_sensor_sap_logchain_query", "kind": "function", "doc": "<p>Generates a sensor query based in the SAP Logchain table.</p>\n\n<p>Args:\n    chain_id: chain id to query the status on SAP.\n    dbtable: db.table to retrieve the data to\n            check if the sap chain is already finished.\n    status: db.table to retrieve the last status change\n            timestamp.\n    engine_table_name: table name exposed with the SAP LOGCHAIN data.\n            This table will be used in the jdbc query.</p>\n\n<p>Return:\n    The query string.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">chain_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dbtable</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;SAPPHA.RSPCLOGCHAIN&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">status</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;G&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">engine_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;sensor_new_data&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.send_notification", "modulename": "lakehouse_engine.engine", "qualname": "send_notification", "kind": "function", "doc": "<p>Send a notification using a notifier.</p>\n\n<p>Args:\n    args: arguments for the notifier.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io", "modulename": "lakehouse_engine.io", "kind": "module", "doc": "<p>Input and Output package responsible for the behaviour of reading and writing.</p>\n"}, {"fullname": "lakehouse_engine.io.exceptions", "modulename": "lakehouse_engine.io.exceptions", "kind": "module", "doc": "<p>Package defining all the io custom exceptions.</p>\n"}, {"fullname": "lakehouse_engine.io.exceptions.IncrementalFilterInputNotFoundException", "modulename": "lakehouse_engine.io.exceptions", "qualname": "IncrementalFilterInputNotFoundException", "kind": "class", "doc": "<p>Exception for when the input of an incremental filter is not found.</p>\n\n<p>This may occur when tables are being loaded in incremental way, taking the increment\ndefinition out of a specific table, but the table still does not exist, mainly\nbecause probably it was not loaded for the first time yet.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.io.exceptions.WrongIOFormatException", "modulename": "lakehouse_engine.io.exceptions", "qualname": "WrongIOFormatException", "kind": "class", "doc": "<p>Exception for when a user provides a wrong I/O format.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.io.exceptions.NotSupportedException", "modulename": "lakehouse_engine.io.exceptions", "qualname": "NotSupportedException", "kind": "class", "doc": "<p>Exception for when a user provides a not supported operation.</p>\n", "bases": "builtins.RuntimeError"}, {"fullname": "lakehouse_engine.io.reader", "modulename": "lakehouse_engine.io.reader", "kind": "module", "doc": "<p>Defines abstract reader behaviour.</p>\n"}, {"fullname": "lakehouse_engine.io.reader.Reader", "modulename": "lakehouse_engine.io.reader", "qualname": "Reader", "kind": "class", "doc": "<p>Abstract Reader class.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.io.reader.Reader.__init__", "modulename": "lakehouse_engine.io.reader", "qualname": "Reader.__init__", "kind": "function", "doc": "<p>Construct Reader instances.</p>\n\n<p>Args:\n    input_spec: input specification for reading data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.reader.Reader.read", "modulename": "lakehouse_engine.io.reader", "qualname": "Reader.read", "kind": "function", "doc": "<p>Abstract read method.</p>\n\n<p>Returns:\n    A dataframe read according to the input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.reader_factory", "modulename": "lakehouse_engine.io.reader_factory", "kind": "module", "doc": "<p>Module for reader factory.</p>\n"}, {"fullname": "lakehouse_engine.io.reader_factory.ReaderFactory", "modulename": "lakehouse_engine.io.reader_factory", "qualname": "ReaderFactory", "kind": "class", "doc": "<p>Class for reader factory.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.io.reader_factory.ReaderFactory.get_data", "modulename": "lakehouse_engine.io.reader_factory", "qualname": "ReaderFactory.get_data", "kind": "function", "doc": "<p>Get data according to the input specification following a factory pattern.</p>\n\n<p>Args:\n    spec: input specification to get the data.</p>\n\n<p>Returns:\n    A dataframe containing the data.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers", "modulename": "lakehouse_engine.io.readers", "kind": "module", "doc": "<p>Readers package to define reading behaviour.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.dataframe_reader", "modulename": "lakehouse_engine.io.readers.dataframe_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from dataframes.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.dataframe_reader.DataFrameReader", "modulename": "lakehouse_engine.io.readers.dataframe_reader", "qualname": "DataFrameReader", "kind": "class", "doc": "<p>Class to read data from a dataframe.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.dataframe_reader.DataFrameReader.__init__", "modulename": "lakehouse_engine.io.readers.dataframe_reader", "qualname": "DataFrameReader.__init__", "kind": "function", "doc": "<p>Construct DataFrameReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.dataframe_reader.DataFrameReader.read", "modulename": "lakehouse_engine.io.readers.dataframe_reader", "qualname": "DataFrameReader.read", "kind": "function", "doc": "<p>Read data from a dataframe.</p>\n\n<p>Returns:\n    A dataframe containing the data from a dataframe previously\n    computed.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.file_reader", "modulename": "lakehouse_engine.io.readers.file_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from files.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.file_reader.FileReader", "modulename": "lakehouse_engine.io.readers.file_reader", "qualname": "FileReader", "kind": "class", "doc": "<p>Class to read from files.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.file_reader.FileReader.__init__", "modulename": "lakehouse_engine.io.readers.file_reader", "qualname": "FileReader.__init__", "kind": "function", "doc": "<p>Construct FileReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.file_reader.FileReader.read", "modulename": "lakehouse_engine.io.readers.file_reader", "qualname": "FileReader.read", "kind": "function", "doc": "<p>Read file data.</p>\n\n<p>Returns:\n    A dataframe containing the data from the files.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.jdbc_reader", "modulename": "lakehouse_engine.io.readers.jdbc_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from JDBC sources.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.jdbc_reader.JDBCReader", "modulename": "lakehouse_engine.io.readers.jdbc_reader", "qualname": "JDBCReader", "kind": "class", "doc": "<p>Class to read from JDBC source.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.jdbc_reader.JDBCReader.__init__", "modulename": "lakehouse_engine.io.readers.jdbc_reader", "qualname": "JDBCReader.__init__", "kind": "function", "doc": "<p>Construct JDBCReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.jdbc_reader.JDBCReader.read", "modulename": "lakehouse_engine.io.readers.jdbc_reader", "qualname": "JDBCReader.read", "kind": "function", "doc": "<p>Read data from JDBC source.</p>\n\n<p>Returns:\n    A dataframe containing the data from the JDBC source.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.kafka_reader", "modulename": "lakehouse_engine.io.readers.kafka_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from Kafka.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.kafka_reader.KafkaReader", "modulename": "lakehouse_engine.io.readers.kafka_reader", "qualname": "KafkaReader", "kind": "class", "doc": "<p>Class to read from Kafka.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.kafka_reader.KafkaReader.__init__", "modulename": "lakehouse_engine.io.readers.kafka_reader", "qualname": "KafkaReader.__init__", "kind": "function", "doc": "<p>Construct KafkaReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.kafka_reader.KafkaReader.read", "modulename": "lakehouse_engine.io.readers.kafka_reader", "qualname": "KafkaReader.read", "kind": "function", "doc": "<p>Read Kafka data.</p>\n\n<p>Returns:\n    A dataframe containing the data from Kafka.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.query_reader", "modulename": "lakehouse_engine.io.readers.query_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from a query.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.query_reader.QueryReader", "modulename": "lakehouse_engine.io.readers.query_reader", "qualname": "QueryReader", "kind": "class", "doc": "<p>Class to read data from a query.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.query_reader.QueryReader.__init__", "modulename": "lakehouse_engine.io.readers.query_reader", "qualname": "QueryReader.__init__", "kind": "function", "doc": "<p>Construct QueryReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.query_reader.QueryReader.read", "modulename": "lakehouse_engine.io.readers.query_reader", "qualname": "QueryReader.read", "kind": "function", "doc": "<p>Read data from a query.</p>\n\n<p>Returns:\n    A dataframe containing the data from the query.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.sap_b4_reader", "modulename": "lakehouse_engine.io.readers.sap_b4_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from SAP B4 sources.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.sap_b4_reader.SAPB4Reader", "modulename": "lakehouse_engine.io.readers.sap_b4_reader", "qualname": "SAPB4Reader", "kind": "class", "doc": "<p>Class to read from SAP B4 source.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.sap_b4_reader.SAPB4Reader.__init__", "modulename": "lakehouse_engine.io.readers.sap_b4_reader", "qualname": "SAPB4Reader.__init__", "kind": "function", "doc": "<p>Construct SAPB4Reader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.sap_b4_reader.SAPB4Reader.read", "modulename": "lakehouse_engine.io.readers.sap_b4_reader", "qualname": "SAPB4Reader.read", "kind": "function", "doc": "<p>Read data from SAP B4 source.</p>\n\n<p>Returns:\n    A dataframe containing the data from the SAP B4 source.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.sap_bw_reader", "modulename": "lakehouse_engine.io.readers.sap_bw_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from SAP BW sources.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.sap_bw_reader.SAPBWReader", "modulename": "lakehouse_engine.io.readers.sap_bw_reader", "qualname": "SAPBWReader", "kind": "class", "doc": "<p>Class to read from SAP BW source.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.sap_bw_reader.SAPBWReader.__init__", "modulename": "lakehouse_engine.io.readers.sap_bw_reader", "qualname": "SAPBWReader.__init__", "kind": "function", "doc": "<p>Construct SAPBWReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.sap_bw_reader.SAPBWReader.read", "modulename": "lakehouse_engine.io.readers.sap_bw_reader", "qualname": "SAPBWReader.read", "kind": "function", "doc": "<p>Read data from SAP BW source.</p>\n\n<p>Returns:\n    A dataframe containing the data from the SAP BW source.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.sftp_reader", "modulename": "lakehouse_engine.io.readers.sftp_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from SFTP.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.sftp_reader.SFTPReader", "modulename": "lakehouse_engine.io.readers.sftp_reader", "qualname": "SFTPReader", "kind": "class", "doc": "<p>Class to read from SFTP.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.sftp_reader.SFTPReader.__init__", "modulename": "lakehouse_engine.io.readers.sftp_reader", "qualname": "SFTPReader.__init__", "kind": "function", "doc": "<p>Construct SFTPReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.sftp_reader.SFTPReader.read", "modulename": "lakehouse_engine.io.readers.sftp_reader", "qualname": "SFTPReader.read", "kind": "function", "doc": "<p>Read SFTP data.</p>\n\n<p>Returns:\n    A dataframe containing the data from SFTP.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.table_reader", "modulename": "lakehouse_engine.io.readers.table_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from tables.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.table_reader.TableReader", "modulename": "lakehouse_engine.io.readers.table_reader", "qualname": "TableReader", "kind": "class", "doc": "<p>Class to read data from a table.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.table_reader.TableReader.__init__", "modulename": "lakehouse_engine.io.readers.table_reader", "qualname": "TableReader.__init__", "kind": "function", "doc": "<p>Construct TableReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.table_reader.TableReader.read", "modulename": "lakehouse_engine.io.readers.table_reader", "qualname": "TableReader.read", "kind": "function", "doc": "<p>Read data from a table.</p>\n\n<p>Returns:\n    A dataframe containing the data from the table.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writer", "modulename": "lakehouse_engine.io.writer", "kind": "module", "doc": "<p>Defines abstract writer behaviour.</p>\n"}, {"fullname": "lakehouse_engine.io.writer.Writer", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer", "kind": "class", "doc": "<p>Abstract Writer class.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.io.writer.Writer.__init__", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer.__init__", "kind": "function", "doc": "<p>Construct Writer instances.</p>\n\n<p>Args:\n    output_spec: output specification to write data.\n    df: dataframe to write.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writer.Writer.write", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer.write", "kind": "function", "doc": "<p>Abstract write method.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">OrderedDict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writer.Writer.write_transformed_micro_batch", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer.write_transformed_micro_batch", "kind": "function", "doc": "<p>Define how to write a streaming micro batch after transforming it.</p>\n\n<p>This function must define an inner function that manipulates a streaming batch,\nand then return that function. Look for concrete implementations of this\nfunction for more clarity.</p>\n\n<p>Args:\n    kwargs: any keyword arguments.</p>\n\n<p>Returns:\n    A function to be executed in the foreachBatch spark write method.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"o\">**</span><span class=\"n\">kwargs</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writer.Writer.get_transformed_micro_batch", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer.get_transformed_micro_batch", "kind": "function", "doc": "<p>Get the result of the transformations applied to a micro batch dataframe.</p>\n\n<p>Args:\n    output_spec: output specification associated with the writer.\n    batch_df: batch dataframe (given from streaming foreachBatch).\n    batch_id: if of the batch (given from streaming foreachBatch).\n    data: list of all dfs generated on previous steps before writer\n    to be available on micro batch transforms.</p>\n\n<p>Returns:\n    The transformed dataframe.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">batch_df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">batch_id</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writer.Writer.get_streaming_trigger", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer.get_streaming_trigger", "kind": "function", "doc": "<p>Define which streaming trigger will be used.</p>\n\n<p>Args:\n    output_spec: output specification.</p>\n\n<p>Returns:\n    A dict containing streaming trigger.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Dict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writer.Writer.run_micro_batch_dq_process", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer.run_micro_batch_dq_process", "kind": "function", "doc": "<p>Run the data quality process in a streaming micro batch dataframe.</p>\n\n<p>Iterates over the specs and performs the checks or analysis depending on the\ndata quality specification provided in the configuration.</p>\n\n<p>Args:\n    df: the dataframe in which to run the dq process on.\n    dq_spec: data quality specification.</p>\n\n<p>Returns: the validated dataframe.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">dq_spec</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQSpec</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writer_factory", "modulename": "lakehouse_engine.io.writer_factory", "kind": "module", "doc": "<p>Module for writer factory.</p>\n"}, {"fullname": "lakehouse_engine.io.writer_factory.WriterFactory", "modulename": "lakehouse_engine.io.writer_factory", "qualname": "WriterFactory", "kind": "class", "doc": "<p>Class for writer factory.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.io.writer_factory.WriterFactory.get_writer", "modulename": "lakehouse_engine.io.writer_factory", "qualname": "WriterFactory.get_writer", "kind": "function", "doc": "<p>Get a writer according to the output specification using a factory pattern.</p>\n\n<p>Args:\n    OutputSpec spec: output specification to write data.\n    DataFrame df: dataframe to be written.\n    OrderedDict data: list of all dfs generated on previous steps before writer.</p>\n\n<p>Returns:\n    Writer: writer that will write the data.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">io</span><span class=\"o\">.</span><span class=\"n\">writer</span><span class=\"o\">.</span><span class=\"n\">Writer</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers", "modulename": "lakehouse_engine.io.writers", "kind": "module", "doc": "<p>Package containing the writers responsible for writing data.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.console_writer", "modulename": "lakehouse_engine.io.writers.console_writer", "kind": "module", "doc": "<p>Module to define behaviour to write to console.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.console_writer.ConsoleWriter", "modulename": "lakehouse_engine.io.writers.console_writer", "qualname": "ConsoleWriter", "kind": "class", "doc": "<p>Class to write data to console.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.console_writer.ConsoleWriter.__init__", "modulename": "lakehouse_engine.io.writers.console_writer", "qualname": "ConsoleWriter.__init__", "kind": "function", "doc": "<p>Construct ConsoleWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification\n    df: dataframe to be written.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.console_writer.ConsoleWriter.write", "modulename": "lakehouse_engine.io.writers.console_writer", "qualname": "ConsoleWriter.write", "kind": "function", "doc": "<p>Write data to console.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers.dataframe_writer", "modulename": "lakehouse_engine.io.writers.dataframe_writer", "kind": "module", "doc": "<p>Module to define behaviour to write to dataframe.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.dataframe_writer.DataFrameWriter", "modulename": "lakehouse_engine.io.writers.dataframe_writer", "qualname": "DataFrameWriter", "kind": "class", "doc": "<p>Class to write data to dataframe.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.dataframe_writer.DataFrameWriter.__init__", "modulename": "lakehouse_engine.io.writers.dataframe_writer", "qualname": "DataFrameWriter.__init__", "kind": "function", "doc": "<p>Construct DataFrameWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification.\n    df: dataframe to be written.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.dataframe_writer.DataFrameWriter.write", "modulename": "lakehouse_engine.io.writers.dataframe_writer", "qualname": "DataFrameWriter.write", "kind": "function", "doc": "<p>Write data to dataframe.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">OrderedDict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers.delta_merge_writer", "modulename": "lakehouse_engine.io.writers.delta_merge_writer", "kind": "module", "doc": "<p>Module to define the behaviour of delta merges.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.delta_merge_writer.DeltaMergeWriter", "modulename": "lakehouse_engine.io.writers.delta_merge_writer", "qualname": "DeltaMergeWriter", "kind": "class", "doc": "<p>Class to merge data using delta lake.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.delta_merge_writer.DeltaMergeWriter.__init__", "modulename": "lakehouse_engine.io.writers.delta_merge_writer", "qualname": "DeltaMergeWriter.__init__", "kind": "function", "doc": "<p>Construct DeltaMergeWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification containing merge options and\n        relevant information.\n    df: the dataframe containing the new data to be merged.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.delta_merge_writer.DeltaMergeWriter.write", "modulename": "lakehouse_engine.io.writers.delta_merge_writer", "qualname": "DeltaMergeWriter.write", "kind": "function", "doc": "<p>Merge new data with current data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers.file_writer", "modulename": "lakehouse_engine.io.writers.file_writer", "kind": "module", "doc": "<p>Module to define behaviour to write to files.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.file_writer.FileWriter", "modulename": "lakehouse_engine.io.writers.file_writer", "qualname": "FileWriter", "kind": "class", "doc": "<p>Class to write data to files.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.file_writer.FileWriter.__init__", "modulename": "lakehouse_engine.io.writers.file_writer", "qualname": "FileWriter.__init__", "kind": "function", "doc": "<p>Construct FileWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification\n    df: dataframe to be written.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.file_writer.FileWriter.write", "modulename": "lakehouse_engine.io.writers.file_writer", "qualname": "FileWriter.write", "kind": "function", "doc": "<p>Write data to files.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers.jdbc_writer", "modulename": "lakehouse_engine.io.writers.jdbc_writer", "kind": "module", "doc": "<p>Module that defines the behaviour to write to JDBC targets.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.jdbc_writer.JDBCWriter", "modulename": "lakehouse_engine.io.writers.jdbc_writer", "qualname": "JDBCWriter", "kind": "class", "doc": "<p>Class to write to JDBC targets.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.jdbc_writer.JDBCWriter.__init__", "modulename": "lakehouse_engine.io.writers.jdbc_writer", "qualname": "JDBCWriter.__init__", "kind": "function", "doc": "<p>Construct JDBCWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification.\n    df: dataframe to be writen.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.jdbc_writer.JDBCWriter.write", "modulename": "lakehouse_engine.io.writers.jdbc_writer", "qualname": "JDBCWriter.write", "kind": "function", "doc": "<p>Write data into JDBC target.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers.kafka_writer", "modulename": "lakehouse_engine.io.writers.kafka_writer", "kind": "module", "doc": "<p>Module that defines the behaviour to write to Kafka.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.kafka_writer.KafkaWriter", "modulename": "lakehouse_engine.io.writers.kafka_writer", "qualname": "KafkaWriter", "kind": "class", "doc": "<p>Class to write to a Kafka target.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.kafka_writer.KafkaWriter.__init__", "modulename": "lakehouse_engine.io.writers.kafka_writer", "qualname": "KafkaWriter.__init__", "kind": "function", "doc": "<p>Construct KafkaWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification.\n    df: dataframe to be written.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.kafka_writer.KafkaWriter.write", "modulename": "lakehouse_engine.io.writers.kafka_writer", "qualname": "KafkaWriter.write", "kind": "function", "doc": "<p>Write data to Kafka.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers.table_writer", "modulename": "lakehouse_engine.io.writers.table_writer", "kind": "module", "doc": "<p>Module that defines the behaviour to write to tables.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.table_writer.TableWriter", "modulename": "lakehouse_engine.io.writers.table_writer", "qualname": "TableWriter", "kind": "class", "doc": "<p>Class to write to a table.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.table_writer.TableWriter.__init__", "modulename": "lakehouse_engine.io.writers.table_writer", "qualname": "TableWriter.__init__", "kind": "function", "doc": "<p>Construct TableWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification.\n    df: dataframe to be written.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.table_writer.TableWriter.write", "modulename": "lakehouse_engine.io.writers.table_writer", "qualname": "TableWriter.write", "kind": "function", "doc": "<p>Write data to a table.</p>\n\n<p>After the write operation we repair the table (e.g., update partitions).\nHowever, there's a caveat to this, which is the fact that this repair\noperation is not reachable if we are running long-running streaming mode.\nTherefore, we recommend not using the TableWriter with formats other than\ndelta lake for those scenarios (as delta lake does not need msck repair).\nSo, you can: 1) use delta lake format for the table; 2) use the FileWriter\nand run the repair with a certain frequency in a separate task of your\npipeline.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators", "modulename": "lakehouse_engine.terminators", "kind": "module", "doc": "<p>Package to define algorithm terminators (e.g., vacuum, optimize, compute stats).</p>\n"}, {"fullname": "lakehouse_engine.terminators.cdf_processor", "modulename": "lakehouse_engine.terminators.cdf_processor", "kind": "module", "doc": "<p>Defines change data feed processor behaviour.</p>\n"}, {"fullname": "lakehouse_engine.terminators.cdf_processor.CDFProcessor", "modulename": "lakehouse_engine.terminators.cdf_processor", "qualname": "CDFProcessor", "kind": "class", "doc": "<p>Change data feed processor class.</p>\n"}, {"fullname": "lakehouse_engine.terminators.cdf_processor.CDFProcessor.expose_cdf", "modulename": "lakehouse_engine.terminators.cdf_processor", "qualname": "CDFProcessor.expose_cdf", "kind": "function", "doc": "<p>Expose CDF to external location.</p>\n\n<p>Args:\n    spec: terminator specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.cdf_processor.CDFProcessor.delete_old_data", "modulename": "lakehouse_engine.terminators.cdf_processor", "qualname": "CDFProcessor.delete_old_data", "kind": "function", "doc": "<p>Delete old data from cdf delta table.</p>\n\n<p>Args:\n    spec: terminator specifications.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.cdf_processor.CDFProcessor.vacuum_cdf_data", "modulename": "lakehouse_engine.terminators.cdf_processor", "qualname": "CDFProcessor.vacuum_cdf_data", "kind": "function", "doc": "<p>Vacuum old data from cdf delta table.</p>\n\n<p>Args:\n    spec: terminator specifications.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.dataset_optimizer", "modulename": "lakehouse_engine.terminators.dataset_optimizer", "kind": "module", "doc": "<p>Module with dataset optimizer terminator.</p>\n"}, {"fullname": "lakehouse_engine.terminators.dataset_optimizer.DatasetOptimizer", "modulename": "lakehouse_engine.terminators.dataset_optimizer", "qualname": "DatasetOptimizer", "kind": "class", "doc": "<p>Class with dataset optimizer terminator.</p>\n"}, {"fullname": "lakehouse_engine.terminators.dataset_optimizer.DatasetOptimizer.optimize_dataset", "modulename": "lakehouse_engine.terminators.dataset_optimizer", "qualname": "DatasetOptimizer.optimize_dataset", "kind": "function", "doc": "<p>Optimize a dataset based on a set of pre-conceived optimizations.</p>\n\n<p>Most of the times the dataset is a table, but it can be a file-based one only.</p>\n\n<p>Args:\n    db_table: database_name.table_name.\n    location: dataset/table filesystem location.\n    compute_table_stats: to compute table statistics or not.\n    vacuum: (delta lake tables only) whether to vacuum the delta lake\n        table or not.\n    vacuum_hours: (delta lake tables only) number of hours to consider\n        in vacuum operation.\n    optimize: (delta lake tables only) whether to optimize the table or\n        not. Custom optimize parameters can be supplied through ExecEnv (Spark)\n        configs\n    optimize_where: expression to use in the optimize function.\n    optimize_zorder_col_list: (delta lake tables only) list of\n        columns to consider in the zorder optimization process. Custom optimize\n        parameters can be supplied through ExecEnv (Spark) configs.\n    debug: flag indicating if we are just debugging this for local\n        tests and therefore pass through all the exceptions to perform some\n        assertions in local tests.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">db_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">compute_table_stats</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">vacuum</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">vacuum_hours</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">720</span>,</span><span class=\"param\">\t<span class=\"n\">optimize</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">optimize_where</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">optimize_zorder_col_list</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">debug</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifier", "modulename": "lakehouse_engine.terminators.notifier", "kind": "module", "doc": "<p>Module with notification terminator.</p>\n"}, {"fullname": "lakehouse_engine.terminators.notifier.Notifier", "modulename": "lakehouse_engine.terminators.notifier", "qualname": "Notifier", "kind": "class", "doc": "<p>Abstract Notification class.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.terminators.notifier.Notifier.__init__", "modulename": "lakehouse_engine.terminators.notifier", "qualname": "Notifier.__init__", "kind": "function", "doc": "<p>Construct Notification instances.</p>\n\n<p>Args:\n    notification_spec: notification specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">notification_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.terminators.notifier.Notifier.create_notification", "modulename": "lakehouse_engine.terminators.notifier", "qualname": "Notifier.create_notification", "kind": "function", "doc": "<p>Abstract create notification method.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifier.Notifier.send_notification", "modulename": "lakehouse_engine.terminators.notifier", "qualname": "Notifier.send_notification", "kind": "function", "doc": "<p>Abstract send notification method.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifier.Notifier.check_if_notification_is_failure_notification", "modulename": "lakehouse_engine.terminators.notifier", "qualname": "Notifier.check_if_notification_is_failure_notification", "kind": "function", "doc": "<p>Check if given notification is a failure notification.</p>\n\n<p>Args:\n    spec: spec to validate if it is a failure notification.</p>\n\n<p>Returns:\n    A boolean telling if the notification is a failure notification</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifier_factory", "modulename": "lakehouse_engine.terminators.notifier_factory", "kind": "module", "doc": "<p>Module for notifier factory.</p>\n"}, {"fullname": "lakehouse_engine.terminators.notifier_factory.NotifierFactory", "modulename": "lakehouse_engine.terminators.notifier_factory", "qualname": "NotifierFactory", "kind": "class", "doc": "<p>Class for notification factory.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.terminators.notifier_factory.NotifierFactory.get_notifier", "modulename": "lakehouse_engine.terminators.notifier_factory", "qualname": "NotifierFactory.get_notifier", "kind": "function", "doc": "<p>Get a notifier according to the terminator specs using a factory.</p>\n\n<p>Args:\n    spec: terminator specification.</p>\n\n<p>Returns:\n    Notifier: notifier that will handle notifications.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span><span class=\"return-annotation\">) -> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">terminators</span><span class=\"o\">.</span><span class=\"n\">notifier</span><span class=\"o\">.</span><span class=\"n\">Notifier</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifier_factory.NotifierFactory.generate_failure_notification", "modulename": "lakehouse_engine.terminators.notifier_factory", "qualname": "NotifierFactory.generate_failure_notification", "kind": "function", "doc": "<p>Check if it is necessary to send a failure notification and generate it.</p>\n\n<p>Args:\n    spec: List of termination specs\n    exception: Exception that caused the failure.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"nb\">list</span>, </span><span class=\"param\"><span class=\"n\">exception</span><span class=\"p\">:</span> <span class=\"ne\">Exception</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifiers", "modulename": "lakehouse_engine.terminators.notifiers", "kind": "module", "doc": "<p>Notifications module.</p>\n"}, {"fullname": "lakehouse_engine.terminators.notifiers.email_notifier", "modulename": "lakehouse_engine.terminators.notifiers.email_notifier", "kind": "module", "doc": "<p>Module with email notifier.</p>\n"}, {"fullname": "lakehouse_engine.terminators.notifiers.email_notifier.EmailNotifier", "modulename": "lakehouse_engine.terminators.notifiers.email_notifier", "qualname": "EmailNotifier", "kind": "class", "doc": "<p>Base Notification class.</p>\n", "bases": "lakehouse_engine.terminators.notifier.Notifier"}, {"fullname": "lakehouse_engine.terminators.notifiers.email_notifier.EmailNotifier.__init__", "modulename": "lakehouse_engine.terminators.notifiers.email_notifier", "qualname": "EmailNotifier.__init__", "kind": "function", "doc": "<p>Construct Email Notification instance.</p>\n\n<p>Args:\n    notification_spec: notification specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">notification_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.terminators.notifiers.email_notifier.EmailNotifier.create_notification", "modulename": "lakehouse_engine.terminators.notifiers.email_notifier", "qualname": "EmailNotifier.create_notification", "kind": "function", "doc": "<p>Creates the notification to be sent.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifiers.email_notifier.EmailNotifier.send_notification", "modulename": "lakehouse_engine.terminators.notifiers.email_notifier", "qualname": "EmailNotifier.send_notification", "kind": "function", "doc": "<p>Sends the notification by using a series of methods.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifiers.notification_templates", "modulename": "lakehouse_engine.terminators.notifiers.notification_templates", "kind": "module", "doc": "<p>Email notification templates.</p>\n"}, {"fullname": "lakehouse_engine.terminators.notifiers.notification_templates.NotificationsTemplates", "modulename": "lakehouse_engine.terminators.notifiers.notification_templates", "qualname": "NotificationsTemplates", "kind": "class", "doc": "<p>Templates for notifications.</p>\n"}, {"fullname": "lakehouse_engine.terminators.sensor_terminator", "modulename": "lakehouse_engine.terminators.sensor_terminator", "kind": "module", "doc": "<p>Defines terminator behaviour.</p>\n"}, {"fullname": "lakehouse_engine.terminators.sensor_terminator.SensorTerminator", "modulename": "lakehouse_engine.terminators.sensor_terminator", "qualname": "SensorTerminator", "kind": "class", "doc": "<p>Sensor Terminator class.</p>\n"}, {"fullname": "lakehouse_engine.terminators.sensor_terminator.SensorTerminator.update_sensor_status", "modulename": "lakehouse_engine.terminators.sensor_terminator", "qualname": "SensorTerminator.update_sensor_status", "kind": "function", "doc": "<p>Update internal sensor status.</p>\n\n<p>Update the sensor status in the control table, it should be used to tell the\nsystem that the sensor has processed all new data that was previously\nidentified, hence updating the shifted sensor status.\nUsually used to move from <code>SensorStatus.ACQUIRED_NEW_DATA</code> to\n<code>SensorStatus.PROCESSED_NEW_DATA</code>, but there might be scenarios - still\nto identify - where we can update the sensor status from/to different statuses.</p>\n\n<p>Args:\n    sensor_id: sensor id.\n    control_db_table_name: db.table to store sensor checkpoints.\n    status: status of the sensor.\n    assets: a list of assets that are considered as available to\n        consume downstream after this sensor has status\n        PROCESSED_NEW_DATA.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">status</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;PROCESSED_NEW_DATA&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">assets</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.spark_terminator", "modulename": "lakehouse_engine.terminators.spark_terminator", "kind": "module", "doc": "<p>Defines terminator behaviour.</p>\n"}, {"fullname": "lakehouse_engine.terminators.spark_terminator.SparkTerminator", "modulename": "lakehouse_engine.terminators.spark_terminator", "qualname": "SparkTerminator", "kind": "class", "doc": "<p>Spark Terminator class.</p>\n"}, {"fullname": "lakehouse_engine.terminators.spark_terminator.SparkTerminator.terminate_spark", "modulename": "lakehouse_engine.terminators.spark_terminator", "qualname": "SparkTerminator.terminate_spark", "kind": "function", "doc": "<p>Terminate spark session.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.terminator_factory", "modulename": "lakehouse_engine.terminators.terminator_factory", "kind": "module", "doc": "<p>Module with the factory pattern to return terminators.</p>\n"}, {"fullname": "lakehouse_engine.terminators.terminator_factory.TerminatorFactory", "modulename": "lakehouse_engine.terminators.terminator_factory", "qualname": "TerminatorFactory", "kind": "class", "doc": "<p>TerminatorFactory class following the factory pattern.</p>\n"}, {"fullname": "lakehouse_engine.terminators.terminator_factory.TerminatorFactory.execute_terminator", "modulename": "lakehouse_engine.terminators.terminator_factory", "qualname": "TerminatorFactory.execute_terminator", "kind": "function", "doc": "<p>Execute a terminator following the factory pattern.</p>\n\n<p>Args:\n    spec: terminator specification.\n    df: dataframe to be used in the terminator. Needed when a\n        terminator requires one dataframe as input.</p>\n\n<p>Returns:\n    Transformer function to be executed in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers", "modulename": "lakehouse_engine.transformers", "kind": "module", "doc": "<p>Package to define transformers available in the lakehouse engine.</p>\n"}, {"fullname": "lakehouse_engine.transformers.aggregators", "modulename": "lakehouse_engine.transformers.aggregators", "kind": "module", "doc": "<p>Aggregators module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.aggregators.Aggregators", "modulename": "lakehouse_engine.transformers.aggregators", "qualname": "Aggregators", "kind": "class", "doc": "<p>Class containing all aggregation functions.</p>\n"}, {"fullname": "lakehouse_engine.transformers.aggregators.Aggregators.get_max_value", "modulename": "lakehouse_engine.transformers.aggregators", "qualname": "Aggregators.get_max_value", "kind": "function", "doc": "<p>Get the maximum value of a given column of a dataframe.</p>\n\n<p>Args:\n    input_col: name of the input column.\n    output_col: name of the output column (defaults to \"latest\").</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">output_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;latest&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_creators", "modulename": "lakehouse_engine.transformers.column_creators", "kind": "module", "doc": "<p>Column creators transformers module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.column_creators.ColumnCreators", "modulename": "lakehouse_engine.transformers.column_creators", "qualname": "ColumnCreators", "kind": "class", "doc": "<p>Class containing all functions that can create columns to add value.</p>\n"}, {"fullname": "lakehouse_engine.transformers.column_creators.ColumnCreators.with_row_id", "modulename": "lakehouse_engine.transformers.column_creators", "qualname": "ColumnCreators.with_row_id", "kind": "function", "doc": "<p>Create a sequential but not consecutive id.</p>\n\n<p>Args:\n    output_col: optional name of the output column.</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">output_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;lhe_row_id&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_creators.ColumnCreators.with_auto_increment_id", "modulename": "lakehouse_engine.transformers.column_creators", "qualname": "ColumnCreators.with_auto_increment_id", "kind": "function", "doc": "<p>Create a sequential and consecutive id.</p>\n\n<p>Args:\n    output_col: optional name of the output column.</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">output_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;lhe_row_id&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_creators.ColumnCreators.with_literals", "modulename": "lakehouse_engine.transformers.column_creators", "qualname": "ColumnCreators.with_literals", "kind": "function", "doc": "<p>Create columns given a map of column names and literal values (constants).</p>\n\n<p>Args:\n    Dict[str, Any] literals: map of column names and literal values (constants).</p>\n\n<p>Returns:\n    Callable: A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">literals</span><span class=\"p\">:</span> <span class=\"n\">Dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">Any</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers", "modulename": "lakehouse_engine.transformers.column_reshapers", "kind": "module", "doc": "<p>Module with column reshaping transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers", "kind": "class", "doc": "<p>Class containing column reshaping transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.cast", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.cast", "kind": "function", "doc": "<p>Cast specific columns into the designated type.</p>\n\n<p>Args:\n    cols: dict with columns and respective target types.\n        Target types need to have the exact name of spark types:\n        <a href=\"https://spark.apache.org/docs/latest/sql-ref-datatypes.html\">https://spark.apache.org/docs/latest/sql-ref-datatypes.html</a></p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">Dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.column_selector", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.column_selector", "kind": "function", "doc": "<p>Select specific columns with specific output aliases.</p>\n\n<p>Args:\n    cols: dict with columns to select and respective aliases.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.flatten_schema", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.flatten_schema", "kind": "function", "doc": "<p>Flatten the schema of the dataframe.</p>\n\n<p>Args:\n    max_level: level until which you want to flatten the schema.\n        Default: None.\n    shorten_names: whether to shorten the names of the prefixes\n        of the fields being flattened or not. Default: False.\n    alias: whether to define alias for the columns being flattened\n        or not. Default: True.\n    num_chars: number of characters to consider when shortening\n        the names of the fields. Default: 7.\n    ignore_cols: columns which you don't want to flatten.\n        Default: None.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">max_level</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">shorten_names</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">alias</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">num_chars</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">7</span>,</span><span class=\"param\">\t<span class=\"n\">ignore_cols</span><span class=\"p\">:</span> <span class=\"n\">List</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.explode_columns", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.explode_columns", "kind": "function", "doc": "<p>Explode columns with types like ArrayType and MapType.</p>\n\n<p>After it can be applied the flatten_schema transformation,\nif we desired for example to explode the map (as we explode a StructType)\nor to explode a StructType inside the array.\nWe recommend you to specify always the columns desired to explode\nand not explode all columns.</p>\n\n<p>Args:\n    explode_arrays: whether you want to explode array columns (True)\n        or not (False). Default: False.\n    array_cols_to_explode: array columns which you want to explode.\n        If you don't specify it will get all array columns and explode them.\n        Default: None.\n    explode_maps: whether you want to explode map columns (True)\n        or not (False). Default: False.\n    map_cols_to_explode: map columns which you want to explode.\n        If you don't specify it will get all map columns and explode them.\n        Default: None.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">explode_arrays</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">array_cols_to_explode</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">explode_maps</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">map_cols_to_explode</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.with_expressions", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.with_expressions", "kind": "function", "doc": "<p>Execute Spark SQL expressions to create the specified columns.</p>\n\n<p>This function uses the Spark expr function:\n<a href=\"https://spark.apache.org/docs/latest/api/python/reference/api/\">https://spark.apache.org/docs/latest/api/python/reference/api/</a>\npyspark.sql.functions.expr.html</p>\n\n<p>Args:\n    cols_and_exprs: dict with columns and respective expressions to compute\n        (Spark SQL expressions).</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">cols_and_exprs</span><span class=\"p\">:</span> <span class=\"n\">Dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.rename", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.rename", "kind": "function", "doc": "<p>Rename specific columns into the designated name.</p>\n\n<p>Args:\n    cols: dict with columns and respective target names.\n    escape_col_names: whether to escape column names (e.g. <code>/BIC/COL1</code>) or not.\n    If True it creates a column with the new name and drop the old one.\n    If False, uses the native withColumnRenamed Spark function. Default: True.</p>\n\n<p>Returns:\n    Function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">Dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">escape_col_names</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.from_avro", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.from_avro", "kind": "function", "doc": "<p>Select all attributes from avro.</p>\n\n<p>Args:\n    schema: the schema string.\n    key_col: the name of the key column.\n    value_col: the name of the value column.\n    options: extra options (e.g., mode: \"PERMISSIVE\").\n    expand_key: whether you want to expand the content inside the key\n    column or not. Default: false.\n    expand_value: whether you want to expand the content inside the value\n    column or not. Default: true.</p>\n\n<p>Returns:\n    Function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">key_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;key&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">value_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;value&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">options</span><span class=\"p\">:</span> <span class=\"nb\">dict</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">expand_key</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">expand_value</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.from_avro_with_registry", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.from_avro_with_registry", "kind": "function", "doc": "<p>Select all attributes from avro using a schema registry.</p>\n\n<p>Args:\n    schema_registry: the url to the schema registry.\n    value_schema: the name of the value schema entry in the schema registry.\n    value_col: the name of the value column.\n    key_schema: the name of the key schema entry in the schema\n    registry. Default: None.\n    key_col: the name of the key column.\n    expand_key: whether you want to expand the content inside the key\n    column or not. Default: false.\n    expand_value: whether you want to expand the content inside the value\n    column or not. Default: true.</p>\n\n<p>Returns:\n    Function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">schema_registry</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">value_schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">value_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;value&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">key_schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">key_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;key&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">expand_key</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">expand_value</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.from_json", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.from_json", "kind": "function", "doc": "<p>Convert a json string into a json column (struct).</p>\n\n<p>The new json column can be added to the existing columns (default) or it can\nreplace all the others, being the only one to output. The new column gets the\nsame name as the original one suffixed with '_json'.</p>\n\n<p>Args:\n    input_col: dict with columns and respective target names.\n    schema_path: path to the StructType schema (spark schema).\n    schema: dict with the StructType schema (spark schema).\n    json_options: options to parse the json value.\n    drop_all_cols: whether to drop all the input columns or not.\n        Defaults to False.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">input_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">schema_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">json_options</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">drop_all_cols</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.to_json", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.to_json", "kind": "function", "doc": "<p>Convert dataframe columns into a json value.</p>\n\n<p>Args:\n    in_cols: name(s) of the input column(s).\n        Example values:\n        \"*\" - all\n        columns; \"my_col\" - one column named \"my_col\";\n        \"my_col1, my_col2\" - two columns.\n    out_col: name of the output column.\n    json_options: options to parse the json value.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">in_cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">out_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">json_options</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.condensers", "modulename": "lakehouse_engine.transformers.condensers", "kind": "module", "doc": "<p>Condensers module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.condensers.Condensers", "modulename": "lakehouse_engine.transformers.condensers", "qualname": "Condensers", "kind": "class", "doc": "<p>Class containing all the functions to condensate data for later merges.</p>\n"}, {"fullname": "lakehouse_engine.transformers.condensers.Condensers.condense_record_mode_cdc", "modulename": "lakehouse_engine.transformers.condensers", "qualname": "Condensers.condense_record_mode_cdc", "kind": "function", "doc": "<p>Condense Change Data Capture (CDC) based on record_mode strategy.</p>\n\n<p>This CDC data is particularly seen in some CDC enabled systems. Other systems\nmay have different CDC strategies.</p>\n\n<p>Args:\n    business_key: The business key (logical primary key) of the data.\n    ranking_key_desc: In this type of CDC condensation the data needs to be\n        ordered descendingly in a certain way, using columns specified in this\n        parameter.\n    ranking_key_asc: In this type of CDC condensation the data needs to be\n        ordered ascendingly in a certain way, using columns specified in\n        this parameter.\n    record_mode_col: Name of the record mode input_col.\n    valid_record_modes: Depending on the context, not all record modes may be\n        considered for condensation. Use this parameter to skip those.</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">business_key</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">record_mode_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">valid_record_modes</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">ranking_key_desc</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">ranking_key_asc</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.condensers.Condensers.group_and_rank", "modulename": "lakehouse_engine.transformers.condensers", "qualname": "Condensers.group_and_rank", "kind": "function", "doc": "<p>Condense data based on a simple group by + take latest mechanism.</p>\n\n<p>Args:\n    group_key: list of column names to use in the group by.\n    ranking_key: the data needs to be ordered descendingly using columns\n        specified in this parameter.\n    descending: if the ranking considers descending order or not. Defaults to\n        True.</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">group_key</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">ranking_key</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">descending</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.custom_transformers", "modulename": "lakehouse_engine.transformers.custom_transformers", "kind": "module", "doc": "<p>Custom transformers module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.custom_transformers.CustomTransformers", "modulename": "lakehouse_engine.transformers.custom_transformers", "qualname": "CustomTransformers", "kind": "class", "doc": "<p>Class representing a CustomTransformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.custom_transformers.CustomTransformers.custom_transformation", "modulename": "lakehouse_engine.transformers.custom_transformers", "qualname": "CustomTransformers.custom_transformation", "kind": "function", "doc": "<p>Execute a custom transformation provided by the user.</p>\n\n<p>This transformer can be very useful whenever the user cannot use our provided\ntransformers, or they want to write complex logic in the transform step of the\nalgorithm.</p>\n\n<p>Attention!!! Please bare in mind that the custom_transformer function provided\nas argument needs to receive a DataFrame and return a DataFrame, because it is\nhow Spark's .transform method is able to chain the transformations.\nExample:\n    def my_custom_logic(df: DataFrame) -> DataFrame:</p>\n\n<p>Args:\n    custom_transformer: custom transformer function. A python function with all\n        required pyspark logic provided by the user.</p>\n\n<p>Returns:\n    Callable: the same function provided as parameter, in order to e called\n        later in the TransformerFactory.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">custom_transformer</span><span class=\"p\">:</span> <span class=\"n\">Callable</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.data_maskers", "modulename": "lakehouse_engine.transformers.data_maskers", "kind": "module", "doc": "<p>Module with data masking transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.data_maskers.DataMaskers", "modulename": "lakehouse_engine.transformers.data_maskers", "qualname": "DataMaskers", "kind": "class", "doc": "<p>Class containing data masking transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.data_maskers.DataMaskers.hash_masker", "modulename": "lakehouse_engine.transformers.data_maskers", "qualname": "DataMaskers.hash_masker", "kind": "function", "doc": "<p>Mask specific columns using an hashing approach.</p>\n\n<p>Args:\n    cols: list of column names to mask.\n    approach: hashing approach. Defaults to 'SHA'. There's \"MURMUR3\" as well.\n    num_bits: number of bits of the SHA approach. Only applies to SHA approach.\n    suffix: suffix to apply to new column name. Defaults to \"_hash\".\n        Note: you can pass an empty suffix to have the original column replaced.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">approach</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;SHA&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">num_bits</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">256</span>,</span><span class=\"param\">\t<span class=\"n\">suffix</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;_hash&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.data_maskers.DataMaskers.column_dropper", "modulename": "lakehouse_engine.transformers.data_maskers", "qualname": "DataMaskers.column_dropper", "kind": "function", "doc": "<p>Drop specific columns.</p>\n\n<p>Args:\n    cols: list of column names to drop.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.date_transformers", "modulename": "lakehouse_engine.transformers.date_transformers", "kind": "module", "doc": "<p>Module containing date transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.date_transformers.DateTransformers", "modulename": "lakehouse_engine.transformers.date_transformers", "qualname": "DateTransformers", "kind": "class", "doc": "<p>Class with set of transformers to transform dates in several forms.</p>\n"}, {"fullname": "lakehouse_engine.transformers.date_transformers.DateTransformers.add_current_date", "modulename": "lakehouse_engine.transformers.date_transformers", "qualname": "DateTransformers.add_current_date", "kind": "function", "doc": "<p>Add column with current date.</p>\n\n<p>The current date comes from the driver as a constant, not from every executor.</p>\n\n<p>Args:\n    output_col: name of the output column.</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">output_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.date_transformers.DateTransformers.convert_to_date", "modulename": "lakehouse_engine.transformers.date_transformers", "qualname": "DateTransformers.convert_to_date", "kind": "function", "doc": "<p>Convert multiple string columns with a source format into dates.</p>\n\n<p>Args:\n    cols: list of names of the string columns to convert.\n    source_format: dates source format (e.g., YYYY-MM-dd). Check here:\n        <a href=\"https://docs.oracle.com/javase/10/docs/api/java/time/format/\">https://docs.oracle.com/javase/10/docs/api/java/time/format/</a>\n        DateTimeFormatter.html</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">source_format</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.date_transformers.DateTransformers.convert_to_timestamp", "modulename": "lakehouse_engine.transformers.date_transformers", "qualname": "DateTransformers.convert_to_timestamp", "kind": "function", "doc": "<p>Convert multiple string columns with a source format into timestamps.</p>\n\n<p>Args:\n    cols: list of names of the string columns to convert.\n    source_format: dates source format (e.g., MM-dd-yyyy HH:mm:ss.SSS). Check\n        here: <a href=\"https://docs.oracle.com/javase/10/docs/api/java/time/format/\">https://docs.oracle.com/javase/10/docs/api/java/time/format/</a>\n        DateTimeFormatter.html</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">source_format</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.date_transformers.DateTransformers.format_date", "modulename": "lakehouse_engine.transformers.date_transformers", "qualname": "DateTransformers.format_date", "kind": "function", "doc": "<p>Convert multiple date/timestamp columns into strings with the target format.</p>\n\n<p>Args:\n    cols: list of names of the string columns to convert.\n    target_format: strings target format (e.g., YYYY-MM-dd). Check here:\n        <a href=\"https://docs.oracle.com/javase/10/docs/api/java/time/format/\">https://docs.oracle.com/javase/10/docs/api/java/time/format/</a>\n        DateTimeFormatter.html</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">target_format</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.date_transformers.DateTransformers.get_date_hierarchy", "modulename": "lakehouse_engine.transformers.date_transformers", "qualname": "DateTransformers.get_date_hierarchy", "kind": "function", "doc": "<p>Create day/month/week/quarter/year hierarchy for the provided date columns.</p>\n\n<p>Uses Spark's extract function.</p>\n\n<p>Args:\n    cols: list of names of the date columns to create the hierarchy.\n    formats: dict with the correspondence between the hierarchy and the format\n        to apply.\n        Example: {\n            \"year\": \"year\",\n            \"month\": \"month\",\n            \"day\": \"day\",\n            \"week\": \"week\",\n            \"quarter\": \"quarter\"\n        }\n        Check here: <a href=\"https://docs.oracle.com/javase/10/docs/api/java/time/format/\">https://docs.oracle.com/javase/10/docs/api/java/time/format/</a>\n        DateTimeFormatter.html</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">formats</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.exceptions", "modulename": "lakehouse_engine.transformers.exceptions", "kind": "module", "doc": "<p>Module for all the transformers exceptions.</p>\n"}, {"fullname": "lakehouse_engine.transformers.exceptions.WrongArgumentsException", "modulename": "lakehouse_engine.transformers.exceptions", "qualname": "WrongArgumentsException", "kind": "class", "doc": "<p>Exception for when a user provides wrong arguments to a transformer.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.transformers.exceptions.UnsupportedStreamingTransformerException", "modulename": "lakehouse_engine.transformers.exceptions", "qualname": "UnsupportedStreamingTransformerException", "kind": "class", "doc": "<p>Exception for when a user requests a transformer not supported in streaming.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.transformers.filters", "modulename": "lakehouse_engine.transformers.filters", "kind": "module", "doc": "<p>Module containing the filters transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.filters.Filters", "modulename": "lakehouse_engine.transformers.filters", "qualname": "Filters", "kind": "class", "doc": "<p>Class containing the filters transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.filters.Filters.incremental_filter", "modulename": "lakehouse_engine.transformers.filters", "qualname": "Filters.incremental_filter", "kind": "function", "doc": "<p>Incrementally Filter a certain dataframe given an increment logic.</p>\n\n<p>This logic can either be an increment value or an increment dataframe from which\nthe get the latest value from. By default the operator for the filtering process\nis greater or equal to cover cases where we receive late arriving data not cover\nin a previous load. You can change greater_or_equal to false to use greater,\nwhen you trust the source will never output more data with the increment after\nyou have load the data (e.g., you will never load data until the source is still\ndumping data, which may cause you to get an incomplete picture of the last\narrived data).</p>\n\n<p>Args:\n    input_col: input column name\n    increment_value: value to which to filter the data, considering the\n        provided input_Col.\n    increment_df: a dataframe to get the increment value from.\n        you either specify this or the increment_value (this takes precedence).\n        This is a good approach to get the latest value from a given dataframe\n        that was read and apply that value as filter here. In this way you can\n        perform incremental loads based on the last value of a given dataframe\n        (e.g., table or file based). Can be used together with the\n        get_max_value transformer to accomplish these incremental based loads.\n        See our append load feature tests  to see how to provide an acon for\n        incremental loads, taking advantage of the scenario explained here.\n    increment_col: name of the column from which to get the increment\n        value from from (when using increment_df approach). This assumes there's\n        only one row in the increment_df, reason why is a good idea to use\n        together with the get_max_value transformer. Defaults to \"latest\"\n        because that's the default output column name provided by the\n        get_max_value transformer.\n    greater_or_equal: if filtering should be done by also including the\n        increment value or not (useful for scenarios where you are performing\n        increment loads but still want to include data considering the increment\n        value, and not only values greater than that increment... examples may\n        include scenarios where you already loaded data including those values,\n        but the source produced more data containing those values).\n        Defaults to false.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">input_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">increment_value</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">increment_df</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">increment_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;latest&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">greater_or_equal</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.filters.Filters.expression_filter", "modulename": "lakehouse_engine.transformers.filters", "qualname": "Filters.expression_filter", "kind": "function", "doc": "<p>Filter a dataframe based on an expression.</p>\n\n<p>Args:\n    exp: filter expression.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">exp</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.filters.Filters.column_filter_exp", "modulename": "lakehouse_engine.transformers.filters", "qualname": "Filters.column_filter_exp", "kind": "function", "doc": "<p>Filter a dataframe's columns based on a list of SQL expressions.</p>\n\n<p>Args:\n    exp: column filter expressions.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">exp</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.filters.Filters.drop_duplicate_rows", "modulename": "lakehouse_engine.transformers.filters", "qualname": "Filters.drop_duplicate_rows", "kind": "function", "doc": "<p>Drop duplicate rows using spark function dropDuplicates().</p>\n\n<p>This transformer can be used with or without arguments.\nThe provided argument needs to be a list of columns.\nFor example: [\u201cName\u201d,\u201dVAT\u201d] will drop duplicate records within\n\"Name\" and \"VAT\" columns.\nIf the transformer is used without providing any columns list or providing\nan empty list, such as [] the result will be the same as using\nthe distinct() pyspark function. If the watermark dict is present it will\nensure that the drop operation will apply to rows within the watermark timeline\nwindow.</p>\n\n<p>Args:\n    cols: column names.\n    watermarker: properties to apply watermarker to the transformer.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>, </span><span class=\"param\"><span class=\"n\">watermarker</span><span class=\"p\">:</span> <span class=\"nb\">dict</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.joiners", "modulename": "lakehouse_engine.transformers.joiners", "kind": "module", "doc": "<p>Module with join transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.joiners.Joiners", "modulename": "lakehouse_engine.transformers.joiners", "qualname": "Joiners", "kind": "class", "doc": "<p>Class containing join transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.joiners.Joiners.join", "modulename": "lakehouse_engine.transformers.joiners", "qualname": "Joiners.join", "kind": "function", "doc": "<p>Join two dataframes based on specified type and columns.</p>\n\n<p>Some stream to stream joins are only possible if you apply Watermark, so this\nmethod also provides a parameter to enable watermarking specification.</p>\n\n<p>Args:\n    left_df_alias: alias of the first dataframe.\n    join_with: right dataframe.\n    right_df_alias: alias of the second dataframe.\n    join_condition: condition to join dataframes.\n    join_type: type of join. Defaults to inner.\n        Available values: inner, cross, outer, full, full outer,\n        left, left outer, right, right outer, semi,\n        left semi, anti, and left anti.\n    broadcast_join: whether to perform a broadcast join or not.\n    select_cols: list of columns to select at the end.\n    watermarker: properties to apply watermarking.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">join_with</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">join_condition</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">left_df_alias</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;a&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">right_df_alias</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;b&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">join_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;inner&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">broadcast_join</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">select_cols</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">watermarker</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.null_handlers", "modulename": "lakehouse_engine.transformers.null_handlers", "kind": "module", "doc": "<p>Module with null handlers transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.null_handlers.NullHandlers", "modulename": "lakehouse_engine.transformers.null_handlers", "qualname": "NullHandlers", "kind": "class", "doc": "<p>Class containing null handler transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.null_handlers.NullHandlers.replace_nulls", "modulename": "lakehouse_engine.transformers.null_handlers", "qualname": "NullHandlers.replace_nulls", "kind": "function", "doc": "<p>Replace nulls in a dataframe.</p>\n\n<p>Args:\n    replace_on_nums: if it is to replace nulls on numeric columns.\n        Applies to ints, longs and floats.\n    default_num_value: default integer value to use as replacement.\n    replace_on_strings: if it is to replace nulls on string columns.\n    default_string_value: default string value to use as replacement.\n    subset_cols: list of columns in which to replace nulls. If not\n        provided, all nulls in all columns will be replaced as specified.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">replace_on_nums</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">default_num_value</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"o\">-</span><span class=\"mi\">999</span>,</span><span class=\"param\">\t<span class=\"n\">replace_on_strings</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">default_string_value</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;UNKNOWN&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">subset_cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.optimizers", "modulename": "lakehouse_engine.transformers.optimizers", "kind": "module", "doc": "<p>Optimizers module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.optimizers.Optimizers", "modulename": "lakehouse_engine.transformers.optimizers", "qualname": "Optimizers", "kind": "class", "doc": "<p>Class containing all the functions that can provide optimizations.</p>\n"}, {"fullname": "lakehouse_engine.transformers.optimizers.Optimizers.cache", "modulename": "lakehouse_engine.transformers.optimizers", "qualname": "Optimizers.cache", "kind": "function", "doc": "<p>Caches the current dataframe.</p>\n\n<p>The default storage level used is MEMORY_AND_DISK.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.optimizers.Optimizers.persist", "modulename": "lakehouse_engine.transformers.optimizers", "qualname": "Optimizers.persist", "kind": "function", "doc": "<p>Caches the current dataframe with a specific StorageLevel.</p>\n\n<p>Args:\n    storage_level: the type of StorageLevel, as default MEMORY_AND_DISK_DESER.\n        More options here: <a href=\"https://spark.apache.org/docs/latest/api/python/\">https://spark.apache.org/docs/latest/api/python/</a>\n        reference/api/pyspark.StorageLevel.html</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">storage_level</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.optimizers.Optimizers.unpersist", "modulename": "lakehouse_engine.transformers.optimizers", "qualname": "Optimizers.unpersist", "kind": "function", "doc": "<p>Removes the dataframe from the disk and memory.</p>\n\n<p>Args:\n    blocking: whether to block until all the data blocks are\n        removed from disk/memory or run asynchronously.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">blocking</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.regex_transformers", "modulename": "lakehouse_engine.transformers.regex_transformers", "kind": "module", "doc": "<p>Regex transformers module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.regex_transformers.RegexTransformers", "modulename": "lakehouse_engine.transformers.regex_transformers", "qualname": "RegexTransformers", "kind": "class", "doc": "<p>Class containing all regex functions.</p>\n"}, {"fullname": "lakehouse_engine.transformers.regex_transformers.RegexTransformers.with_regex_value", "modulename": "lakehouse_engine.transformers.regex_transformers", "qualname": "RegexTransformers.with_regex_value", "kind": "function", "doc": "<p>Get the result of applying a regex to an input column (via regexp_extract).</p>\n\n<p>Args:\n    input_col: name of the input column.\n    output_col: name of the output column.\n    regex: regular expression.\n    drop_input_col: whether to drop input_col or not.\n    idx: index to return.</p>\n\n<p>Returns:\n     A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">output_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">regex</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">drop_input_col</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">idx</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">1</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.repartitioners", "modulename": "lakehouse_engine.transformers.repartitioners", "kind": "module", "doc": "<p>Module with repartitioners transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.repartitioners.Repartitioners", "modulename": "lakehouse_engine.transformers.repartitioners", "qualname": "Repartitioners", "kind": "class", "doc": "<p>Class containing repartitioners transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.repartitioners.Repartitioners.coalesce", "modulename": "lakehouse_engine.transformers.repartitioners", "qualname": "Repartitioners.coalesce", "kind": "function", "doc": "<p>Coalesce a dataframe into n partitions.</p>\n\n<p>Args:\n    num_partitions: num of partitions to coalesce.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">num_partitions</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.repartitioners.Repartitioners.repartition", "modulename": "lakehouse_engine.transformers.repartitioners", "qualname": "Repartitioners.repartition", "kind": "function", "doc": "<p>Repartition a dataframe into n partitions.</p>\n\n<p>If num_partitions is provided repartitioning happens based on the provided\nnumber, otherwise it happens based on the values of the provided cols (columns).</p>\n\n<p>Args:\n    num_partitions: num of partitions to repartition.\n    cols: list of columns to use for repartitioning.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">num_partitions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.transformer_factory", "modulename": "lakehouse_engine.transformers.transformer_factory", "kind": "module", "doc": "<p>Module with the factory pattern to return transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.transformer_factory.TransformerFactory", "modulename": "lakehouse_engine.transformers.transformer_factory", "qualname": "TransformerFactory", "kind": "class", "doc": "<p>TransformerFactory class following the factory pattern.</p>\n"}, {"fullname": "lakehouse_engine.transformers.transformer_factory.TransformerFactory.get_transformer", "modulename": "lakehouse_engine.transformers.transformer_factory", "qualname": "TransformerFactory.get_transformer", "kind": "function", "doc": "<p>Get a transformer following the factory pattern.</p>\n\n<p>Args:\n    spec: transformer specification (individual transformation... not to be\n        confused with list of all transformations).\n    data: ordered dict of dataframes to be transformed. Needed when a\n        transformer requires more than one dataframe as input.</p>\n\n<p>Returns:\n    Transformer function to be executed in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TransformerSpec</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.unions", "modulename": "lakehouse_engine.transformers.unions", "kind": "module", "doc": "<p>Module with union transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.unions.Unions", "modulename": "lakehouse_engine.transformers.unions", "qualname": "Unions", "kind": "class", "doc": "<p>Class containing union transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.unions.Unions.union", "modulename": "lakehouse_engine.transformers.unions", "qualname": "Unions.union", "kind": "function", "doc": "<p>Union dataframes, resolving columns by position (not by name).</p>\n\n<p>Args:\n    union_with: list of dataframes to union.\n    deduplication: whether to perform deduplication of elements or not.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">union_with</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">deduplication</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.unions.Unions.union_by_name", "modulename": "lakehouse_engine.transformers.unions", "qualname": "Unions.union_by_name", "kind": "function", "doc": "<p>Union dataframes, resolving columns by name (not by position).</p>\n\n<p>Args:\n    union_with: list of dataframes to union.\n    deduplication: whether to perform deduplication of elements or not.\n    allow_missing_columns: allow the union of DataFrames with different\n        schemas.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">union_with</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">deduplication</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">allow_missing_columns</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.watermarker", "modulename": "lakehouse_engine.transformers.watermarker", "kind": "module", "doc": "<p>Watermarker module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.watermarker.Watermarker", "modulename": "lakehouse_engine.transformers.watermarker", "qualname": "Watermarker", "kind": "class", "doc": "<p>Class containing all watermarker transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.watermarker.Watermarker.with_watermark", "modulename": "lakehouse_engine.transformers.watermarker", "qualname": "Watermarker.with_watermark", "kind": "function", "doc": "<p>Get the dataframe with watermarker defined.</p>\n\n<p>Args:\n    watermarker_column: name of the input column to be considered for\n     the watermarking. Note: it must be a timestamp.\n    watermarker_time: time window to define the watermark value.</p>\n\n<p>Returns:\n    A function to be executed on other transformers.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">watermarker_column</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">watermarker_time</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils", "modulename": "lakehouse_engine.utils", "kind": "module", "doc": "<p>Utilities package.</p>\n"}, {"fullname": "lakehouse_engine.utils.configs", "modulename": "lakehouse_engine.utils.configs", "kind": "module", "doc": "<p>Config utilities package.</p>\n"}, {"fullname": "lakehouse_engine.utils.configs.config_utils", "modulename": "lakehouse_engine.utils.configs.config_utils", "kind": "module", "doc": "<p>Module to read configurations.</p>\n"}, {"fullname": "lakehouse_engine.utils.configs.config_utils.ConfigUtils", "modulename": "lakehouse_engine.utils.configs.config_utils", "qualname": "ConfigUtils", "kind": "class", "doc": "<p>Config utilities class.</p>\n"}, {"fullname": "lakehouse_engine.utils.configs.config_utils.ConfigUtils.get_acon", "modulename": "lakehouse_engine.utils.configs.config_utils", "qualname": "ConfigUtils.get_acon", "kind": "function", "doc": "<p>Get acon based on a filesystem path or on a dict.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks\n        or other apps).</p>\n\n<p>Returns:\n    Dict representation of an acon.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.configs.config_utils.ConfigUtils.get_config", "modulename": "lakehouse_engine.utils.configs.config_utils", "qualname": "ConfigUtils.get_config", "kind": "function", "doc": "<p>Get Lakehouse Engine configurations.</p>\n\n<p>Returns:\n     A dictionary with the engine configurations.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">) -> <span class=\"nb\">dict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.configs.config_utils.ConfigUtils.read_json_acon", "modulename": "lakehouse_engine.utils.configs.config_utils", "qualname": "ConfigUtils.read_json_acon", "kind": "function", "doc": "<p>Read an acon (algorithm configuration) file.</p>\n\n<p>Args:\n    path: path to the acon file.</p>\n\n<p>Returns:\n    The acon file content as a dict.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.configs.config_utils.ConfigUtils.read_sql", "modulename": "lakehouse_engine.utils.configs.config_utils", "qualname": "ConfigUtils.read_sql", "kind": "function", "doc": "<p>Read a DDL file in Spark SQL format from a cloud object storage system.</p>\n\n<p>Args:\n    path: path to the acon (algorithm configuration) file.</p>\n\n<p>Returns:\n    Content of the SQL file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.databricks_utils", "modulename": "lakehouse_engine.utils.databricks_utils", "kind": "module", "doc": "<p>Utilities for databricks operations.</p>\n"}, {"fullname": "lakehouse_engine.utils.databricks_utils.DatabricksUtils", "modulename": "lakehouse_engine.utils.databricks_utils", "qualname": "DatabricksUtils", "kind": "class", "doc": "<p>Databricks utilities class.</p>\n"}, {"fullname": "lakehouse_engine.utils.databricks_utils.DatabricksUtils.get_db_utils", "modulename": "lakehouse_engine.utils.databricks_utils", "qualname": "DatabricksUtils.get_db_utils", "kind": "function", "doc": "<p>Get db utils on databricks.</p>\n\n<p>Args:\n    spark: spark session.</p>\n\n<p>Returns:\n    Dbutils from databricks.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">spark</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">session</span><span class=\"o\">.</span><span class=\"n\">SparkSession</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.databricks_utils.DatabricksUtils.get_databricks_job_information", "modulename": "lakehouse_engine.utils.databricks_utils", "qualname": "DatabricksUtils.get_databricks_job_information", "kind": "function", "doc": "<p>Get notebook context from running acon.</p>\n\n<p>Returns:\n    Dict containing databricks notebook context.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">) -> <span class=\"n\">Tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.expectations_utils", "modulename": "lakehouse_engine.utils.expectations_utils", "kind": "module", "doc": "<p>Utilities to be used by custom expectations.</p>\n"}, {"fullname": "lakehouse_engine.utils.expectations_utils.validate_result", "modulename": "lakehouse_engine.utils.expectations_utils", "qualname": "validate_result", "kind": "function", "doc": "<p>Validates the test results of the custom expectations.</p>\n\n<p>If you need to make additional validations on your custom expectation\nand/or require additional fields to be returned you can add them before\ncalling this function. The partial_success and partial_result\noptional parameters can be used to pass the result of additional\nvalidations and add more information to the result key of the\nreturned dict respectively.</p>\n\n<p>Args:\n    expectation: Expectation to validate.\n    configuration: Configuration used in the test.\n    metrics: Test result metrics.\n    partial_success: Result of validations done before calling this method.\n    partial_result: Extra fields to be returned to the user.</p>\n\n<p>Returns:\n     The result of the validation.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">expectation</span><span class=\"p\">:</span> <span class=\"n\">great_expectations</span><span class=\"o\">.</span><span class=\"n\">expectations</span><span class=\"o\">.</span><span class=\"n\">expectation</span><span class=\"o\">.</span><span class=\"n\">Expectation</span>,</span><span class=\"param\">\t<span class=\"n\">configuration</span><span class=\"p\">:</span> <span class=\"n\">great_expectations</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">expectation_configuration</span><span class=\"o\">.</span><span class=\"n\">ExpectationConfiguration</span>,</span><span class=\"param\">\t<span class=\"n\">metrics</span><span class=\"p\">:</span> <span class=\"n\">Dict</span>,</span><span class=\"param\">\t<span class=\"n\">partial_success</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">partial_result</span><span class=\"p\">:</span> <span class=\"nb\">dict</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction", "modulename": "lakehouse_engine.utils.extraction", "kind": "module", "doc": "<p>Extraction utilities package.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "kind": "module", "doc": "<p>Utilities module for JDBC extraction processes.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionType", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionType", "kind": "class", "doc": "<p>Standardize the types of extractions we can have from a JDBC source.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionType.INIT", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionType.INIT", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;JDBCExtractionType.INIT: &#x27;init&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionType.DELTA", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionType.DELTA", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;JDBCExtractionType.DELTA: &#x27;delta&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtraction", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtraction", "kind": "class", "doc": "<p>Configurations available for an Extraction from a JDBC source.</p>\n\n<p>These configurations cover:\n    user: username to connect to JDBC source.\n    password: password to connect to JDBC source (always use secrets,\n        don't use text passwords in your code).\n    url: url to connect to JDBC source.\n    dbtable: database.table to extract data from.\n    calc_upper_bound_schema: custom schema used for the upper bound calculation.\n    changelog_table: table of type changelog from which to extract data,\n        when the extraction type is delta.\n    partition_column: column used to split the extraction.\n    latest_timestamp_data_location: data location (e.g., s3) containing the data\n        to get the latest timestamp already loaded into bronze.\n    latest_timestamp_data_format: the format of the dataset in\n        latest_timestamp_data_location. Default: delta.\n    extraction_type: type of extraction (delta or init). Default: \"delta\".\n    driver: JDBC driver name. Default: \"com.sap.db.jdbc.Driver\".\n    num_partitions: number of Spark partitions to split the extraction.\n    lower_bound: lower bound to decide the partition stride.\n    upper_bound: upper bound to decide the partition stride. If\n        calculate_upper_bound is True, then upperBound will be\n        derived by our upper bound optimizer, using the partition column.\n    default_upper_bound: the value to use as default upper bound in case\n        the result of the upper bound calculation is None. Default: \"1\".\n    fetch_size: how many rows to fetch per round trip. Default: \"100000\".\n    compress: enable network compression. Default: True.\n    custom_schema: specify custom_schema for particular columns of the\n        returned dataframe in the init/delta extraction of the source table.\n    min_timestamp: min timestamp to consider to filter the changelog data.\n        Default: None and automatically derived from the location provided.\n        In case this one is provided it has precedence and the calculation\n        is not done.\n    max_timestamp: max timestamp to consider to filter the changelog data.\n        Default: None and automatically derived from the table having information\n        about the extraction requests, their timestamps and their status.\n        In case this one is provided it has precedence and the calculation\n        is not done.\n    generate_predicates: whether to generate predicates automatically or not.\n        Default: False.\n    predicates: list containing all values to partition (if generate_predicates\n        is used, the manual values provided are ignored). Default: None.\n    predicates_add_null: whether to consider null on predicates list.\n        Default: True.\n    extraction_timestamp: the timestamp of the extraction. Default: current time\n        following the format \"%Y%m%d%H%M%S\".\n    max_timestamp_custom_schema: custom schema used on the max_timestamp derivation\n        from the table holding the extraction requests information.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtraction.__init__", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtraction.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">user</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">password</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dbtable</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">calc_upper_bound_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">changelog_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">partition_column</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_data_location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_data_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">extraction_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">driver</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;com.sap.db.jdbc.Driver&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">num_partitions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">lower_bound</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upper_bound</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">default_upper_bound</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;1&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">fetch_size</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;100000&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">compress</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">custom_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">min_timestamp</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">max_timestamp</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">generate_predicates</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">predicates</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">predicates_add_null</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">extraction_timestamp</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;20231012165159&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">max_timestamp_custom_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionUtils", "kind": "class", "doc": "<p>Utils for managing data extraction from particularly relevant JDBC sources.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils.__init__", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionUtils.__init__", "kind": "function", "doc": "<p>Construct JDBCExtractionUtils.</p>\n\n<p>Args:\n    jdbc_extraction: JDBC Extraction configurations. Can be of type:\n        JDBCExtraction, SAPB4Extraction or SAPBWExtraction.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">jdbc_extraction</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils.get_additional_spark_options", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionUtils.get_additional_spark_options", "kind": "function", "doc": "<p>Helper to get additional Spark Options initially passed.</p>\n\n<p>If people provide additional Spark options, not covered by the util function\narguments (get_spark_jdbc_options), we need to consider them.\nThus, we update the options retrieved by the utils, by checking if there is\nany Spark option initially provided that is not yet considered in the retrieved\noptions or function arguments and if the value for the key is not None.\nIf these conditions are filled, we add the options and return the complete dict.</p>\n\n<p>Args:\n    input_spec: the input specification.\n    options: dict with Spark options.\n    ignore_options: list of options to be ignored by the process.\n        Spark read has two different approaches to parallelize\n        reading process, one of them is using upper/lower bound,\n        another one is using predicates, those process can't be\n        executed at the same time, you must choose one of them.\n        By choosing predicates you can't pass lower and upper bound,\n        also can't pass number of partitions and partition column\n        otherwise spark will interpret the execution partitioned by\n        upper and lower bound and will expect to fill all variables.\n        To avoid fill all predicates hardcoded at the acon, there is\n        a feature that automatically generates all predicates for init\n        or delta load based on input partition column, but at the end\n        of the process, partition column can't be passed to the options,\n        because we are choosing predicates execution, that is why to\n        generate predicates we need to pass some options to ignore.</p>\n\n<p>Returns:\n     a dict with all the options passed as argument, plus the options that\n     were initially provided, but were not used in the util\n     (get_spark_jdbc_options).</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">options</span><span class=\"p\">:</span> <span class=\"nb\">dict</span>,</span><span class=\"param\">\t<span class=\"n\">ignore_options</span><span class=\"p\">:</span> <span class=\"n\">List</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils.get_predicates", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionUtils.get_predicates", "kind": "function", "doc": "<p>Get the predicates list, based on a predicates query.</p>\n\n<p>Args:\n    predicates_query: query to use as the basis to get the distinct values for\n        a specified column, based on which predicates are generated.</p>\n\n<p>Returns:\n    List containing the predicates to use to split the extraction from\n    JDBC sources.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">predicates_query</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">List</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils.get_spark_jdbc_options", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionUtils.get_spark_jdbc_options", "kind": "function", "doc": "<p>Get the Spark options to extract data from a JDBC source.</p>\n\n<p>Returns:\n    The Spark jdbc args dictionary, including the query to submit\n    and also options args dictionary.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Tuple</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils.get_spark_jdbc_optimal_upper_bound", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionUtils.get_spark_jdbc_optimal_upper_bound", "kind": "function", "doc": "<p>Get an optimal upperBound to properly split a Spark JDBC extraction.</p>\n\n<p>Returns:\n     Either an int, date or timestamp to serve as upperBound Spark JDBC option.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "kind": "module", "doc": "<p>Utilities module for SAP B4 extraction processes.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.ADSOTypes", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "ADSOTypes", "kind": "class", "doc": "<p>Standardise the types of ADSOs we can have for Extractions from SAP B4.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.ADSOTypes.AQ", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "ADSOTypes.AQ", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str", "default_value": "&lt;ADSOTypes.AQ: &#x27;AQ&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.ADSOTypes.CL", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "ADSOTypes.CL", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str", "default_value": "&lt;ADSOTypes.CL: &#x27;CL&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.ADSOTypes.SUPPORTED_TYPES", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "ADSOTypes.SUPPORTED_TYPES", "kind": "variable", "doc": "<p></p>\n", "annotation": ": list", "default_value": "&lt;ADSOTypes.SUPPORTED_TYPES: [&#x27;AQ&#x27;, &#x27;CL&#x27;]&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.SAPB4Extraction", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "SAPB4Extraction", "kind": "class", "doc": "<p>Configurations available for an Extraction from SAP B4.</p>\n\n<p>It inherits from JDBCExtraction configurations, so it can use\nand/or overwrite those configurations.</p>\n\n<p>These configurations cover:\n    latest_timestamp_input_col: the column containing the request timestamps\n        in the dataset in latest_timestamp_data_location. Default: REQTSN.\n    request_status_tbl: the name of the SAP B4 table having information\n        about the extraction requests. Composed of database.table.\n        Default: SAPHANADB.RSPMREQUEST.\n    request_col_name: name of the column having the request timestamp to join\n        with the request status table. Default: REQUEST_TSN.\n    data_target: the data target to extract from. User in the join operation with\n        the request status table.\n    act_req_join_condition: the join condition into activation table\n        can be changed using this property.\n        Default: 'tbl.reqtsn = req.request_col_name'.\n    include_changelog_tech_cols: whether to include the technical columns\n        (usually coming from the changelog) table or not.\n    extra_cols_req_status_tbl: columns to be added from request status table.\n        It needs to contain the prefix \"req.\". E.g. \"req.col1 as column_one,\n        req.col2 as column_two\".\n    request_status_tbl_filter: filter to use for filtering the request status table,\n        influencing the calculation of the max timestamps and the delta extractions.\n    adso_type: the type of ADSO that you are extracting from. Can be \"AQ\" or \"CL\".\n    max_timestamp_custom_schema: the custom schema to apply on the calculation of\n        the max timestamp to consider for the delta extractions.\n        Default: timestamp DECIMAL(23,0).\n    default_max_timestamp: the timestamp to use as default, when it is not possible\n        to derive one.\n    custom_schema: specify custom_schema for particular columns of the\n        returned dataframe in the init/delta extraction of the source table.</p>\n", "bases": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtraction"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.SAPB4Extraction.__init__", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "SAPB4Extraction.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">user</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">password</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dbtable</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">calc_upper_bound_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">changelog_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">partition_column</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_data_location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_data_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">extraction_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">driver</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;com.sap.db.jdbc.Driver&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">num_partitions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">lower_bound</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upper_bound</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">default_upper_bound</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;1&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">fetch_size</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;100000&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">compress</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">custom_schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;REQTSN DECIMAL(23,0)&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">min_timestamp</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">max_timestamp</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">generate_predicates</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">predicates</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">predicates_add_null</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">extraction_timestamp</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;20231012165159&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">max_timestamp_custom_schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;timestamp DECIMAL(23,0)&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_input_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;REQTSN&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">request_status_tbl</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;SAPHANADB.RSPMREQUEST&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">request_col_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;REQUEST_TSN&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">data_target</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">act_req_join_condition</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">include_changelog_tech_cols</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">extra_cols_req_status_tbl</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">request_status_tbl_filter</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">adso_type</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">default_max_timestamp</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;1970000000000000000000&#39;</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.SAPB4ExtractionUtils", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "SAPB4ExtractionUtils", "kind": "class", "doc": "<p>Utils for managing data extraction from SAP B4.</p>\n", "bases": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.SAPB4ExtractionUtils.__init__", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "SAPB4ExtractionUtils.__init__", "kind": "function", "doc": "<p>Construct SAPB4ExtractionUtils.</p>\n\n<p>Args:\n    sap_b4_extraction: SAP B4 Extraction configurations.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">sap_b4_extraction</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">utils</span><span class=\"o\">.</span><span class=\"n\">extraction</span><span class=\"o\">.</span><span class=\"n\">sap_b4_extraction_utils</span><span class=\"o\">.</span><span class=\"n\">SAPB4Extraction</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.SAPB4ExtractionUtils.get_data_target", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "SAPB4ExtractionUtils.get_data_target", "kind": "function", "doc": "<p>Get the data_target from the data_target option or derive it.</p>\n\n<p>By definition data_target is the same for the table and changelog table and\nis the same string ignoring everything before / and the first and last\ncharacter after /. E.g. for a dbtable /BIC/abtable12, the data_target\nwould be btable1.</p>\n\n<p>Args:\n    input_spec_opt: options from the input_spec.</p>\n\n<p>Returns:\n    A string with the data_target.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec_opt</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "kind": "module", "doc": "<p>Utilities module for SAP BW extraction processes.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils.SAPBWExtraction", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "qualname": "SAPBWExtraction", "kind": "class", "doc": "<p>Configurations available for an Extraction from SAP BW.</p>\n\n<p>It inherits from SAPBWExtraction configurations, so it can use\nand/or overwrite those configurations.</p>\n\n<p>These configurations cover:\n    latest_timestamp_input_col: the column containing the actrequest timestamp\n        in the dataset in latest_timestamp_data_location. Default:\n        \"actrequest_timestamp\".\n    act_request_table: the name of the SAP BW activation requests table.\n        Composed of database.table. Default: SAPPHA.RSODSACTREQ.\n    request_col_name: name of the column having the request to join\n        with the activation request table. Default: actrequest.\n    act_req_join_condition: the join condition into activation table\n        can be changed using this property.\n        Default: 'changelog_tbl.request = act_req.request_col_name'.\n    odsobject: name of BW Object, used for joining with the activation request\n        table to get the max actrequest_timestamp to consider while filtering\n        the changelog table.\n    include_changelog_tech_cols: whether to include the technical columns\n        (usually coming from the changelog) table or not. Default: True.\n    extra_cols_act_request: list of columns to be added from act request table.\n        It needs to contain the prefix \"act_req.\". E.g. \"act_req.col1\n        as column_one, act_req.col2 as column_two\".\n    get_timestamp_from_act_request: whether to get init timestamp\n        from act request table or assume current/given timestamp.\n    sap_bw_schema: sap bw schema. Default: SAPPHA.\n    max_timestamp_custom_schema: the custom schema to apply on the calculation of\n        the max timestamp to consider for the delta extractions.\n        Default: timestamp DECIMAL(23,0).\n    default_max_timestamp: the timestamp to use as default, when it is not possible\n        to derive one.</p>\n", "bases": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtraction"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils.SAPBWExtraction.__init__", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "qualname": "SAPBWExtraction.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">user</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">password</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dbtable</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">calc_upper_bound_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">changelog_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">partition_column</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_data_location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_data_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">extraction_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">driver</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;com.sap.db.jdbc.Driver&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">num_partitions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">lower_bound</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upper_bound</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">default_upper_bound</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;1&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">fetch_size</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;100000&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">compress</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">custom_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">min_timestamp</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">max_timestamp</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">generate_predicates</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">predicates</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">predicates_add_null</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">extraction_timestamp</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;20231012165159&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">max_timestamp_custom_schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;timestamp DECIMAL(15,0)&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_input_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;actrequest_timestamp&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">act_request_table</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;SAPPHA.RSODSACTREQ&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">request_col_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;actrequest&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">act_req_join_condition</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">odsobject</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">include_changelog_tech_cols</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">extra_cols_act_request</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">get_timestamp_from_act_request</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">sap_bw_schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;SAPPHA&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">default_max_timestamp</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;197000000000000&#39;</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils.SAPBWExtractionUtils", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "qualname": "SAPBWExtractionUtils", "kind": "class", "doc": "<p>Utils for managing data extraction from particularly relevant JDBC sources.</p>\n", "bases": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils.SAPBWExtractionUtils.__init__", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "qualname": "SAPBWExtractionUtils.__init__", "kind": "function", "doc": "<p>Construct SAPBWExtractionUtils.</p>\n\n<p>Args:\n    sap_bw_extraction: SAP BW Extraction configurations.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">sap_bw_extraction</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">utils</span><span class=\"o\">.</span><span class=\"n\">extraction</span><span class=\"o\">.</span><span class=\"n\">sap_bw_extraction_utils</span><span class=\"o\">.</span><span class=\"n\">SAPBWExtraction</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils.SAPBWExtractionUtils.get_changelog_table", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "qualname": "SAPBWExtractionUtils.get_changelog_table", "kind": "function", "doc": "<p>Get the changelog table, given an odsobject.</p>\n\n<p>Returns:\n     String to use as changelog_table.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils.SAPBWExtractionUtils.get_odsobject", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "qualname": "SAPBWExtractionUtils.get_odsobject", "kind": "function", "doc": "<p>Get the odsobject based on the provided options.</p>\n\n<p>With the table name we may also get the db name, so we need to split.\nMoreover, there might be the need for people to specify odsobject if\nit is different from the dbtable.</p>\n\n<p>Args:\n    input_spec_opt: options from the input_spec.</p>\n\n<p>Returns:\n    A string with the odsobject.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec_opt</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "kind": "module", "doc": "<p>Utilities module for SFTP extraction processes.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPInputFormat", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPInputFormat", "kind": "class", "doc": "<p>Formats of algorithm input.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPInputFormat.CSV", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPInputFormat.CSV", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPInputFormat.CSV: &#x27;csv&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPInputFormat.FWF", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPInputFormat.FWF", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPInputFormat.FWF: &#x27;fwf&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPInputFormat.JSON", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPInputFormat.JSON", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPInputFormat.JSON: &#x27;json&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPInputFormat.XML", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPInputFormat.XML", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPInputFormat.XML: &#x27;xml&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionFilter", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionFilter", "kind": "class", "doc": "<p>Standardize the types of filters we can have from a SFTP source.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionFilter.file_name_contains", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionFilter.file_name_contains", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPExtractionFilter.file_name_contains: &#x27;file_name_contains&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionFilter.LATEST_FILE", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionFilter.LATEST_FILE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPExtractionFilter.LATEST_FILE: &#x27;latest_file&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionFilter.EARLIEST_FILE", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionFilter.EARLIEST_FILE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPExtractionFilter.EARLIEST_FILE: &#x27;earliest_file&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionFilter.GREATER_THAN", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionFilter.GREATER_THAN", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPExtractionFilter.GREATER_THAN: &#x27;date_time_gt&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionFilter.LOWER_THAN", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionFilter.LOWER_THAN", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPExtractionFilter.LOWER_THAN: &#x27;date_time_lt&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionUtils", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionUtils", "kind": "class", "doc": "<p>Utils for managing data extraction from particularly relevant SFTP sources.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionUtils.get_files_list", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionUtils.get_files_list", "kind": "function", "doc": "<p>Get a list of files to be extracted from SFTP.</p>\n\n<p>The arguments (options_args) to list files are:\ndate_time_gt(str):\n    Filter the files greater than the string datetime\n    formatted as \"YYYY-MM-DD\" or \"YYYY-MM-DD HH:MM:SS\".\ndate_time_lt(str):\n    Filter the files lower than the string datetime\n    formatted as \"YYYY-MM-DD\" or \"YYYY-MM-DD HH:MM:SS\".\nearliest_file(bool):\n    Filter the earliest dated file in the directory.\nfile_name_contains(str):\n    Filter files when match the pattern.\nlatest_file(bool):\n    Filter the most recent dated file in the directory.\nsub_dir(bool):\n    When true, the engine will search files into subdirectories\n    of the remote_path.\n    It will consider one level below the remote_path.\n    When sub_dir is used with latest_file/earliest_file argument,\n    the engine will retrieve the latest_file/earliest_file\n    for each subdirectory.</p>\n\n<p>Args:\n    sftp: the SFTP client object.\n    remote_path: path of files to be filtered.\n    options_args: options from the acon.</p>\n\n<p>Returns:\n    A list containing the file names to be passed to Spark.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">sftp</span><span class=\"p\">:</span> <span class=\"n\">paramiko</span><span class=\"o\">.</span><span class=\"n\">sftp_client</span><span class=\"o\">.</span><span class=\"n\">SFTPClient</span>,</span><span class=\"param\">\t<span class=\"n\">remote_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">options_args</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionUtils.get_sftp_client", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionUtils.get_sftp_client", "kind": "function", "doc": "<p>Get the SFTP client.</p>\n\n<p>The SFTP client is used to open an SFTP session across an open\nSSH Transport and perform remote file operations.</p>\n\n<p>Args:\n    options_args: dictionary containing SFTP connection parameters.\n    The Paramiko arguments expected to connect are:\n        \"hostname\": the server to connect to.\n        \"port\": the server port to connect to.\n        \"username\": the username to authenticate as.\n        \"password\": used for password authentication.\n        \"pkey\": optional - an optional public key to use for authentication.\n        \"passphrase\" \u2013 optional - options used for decrypting private keys.\n        \"key_filename\" \u2013 optional - the filename, or list of filenames,\n            of optional private key(s) and/or certs to try for authentication.\n        \"timeout\" \u2013 an optional timeout (in seconds) for the TCP connect.\n        \"allow_agent\" \u2013 optional - set to False to disable\n            connecting to the SSH agent.\n        \"look_for_keys\" \u2013 optional - set to False to disable searching\n            for discoverable private key files in ~/.ssh/.\n        \"compress\" \u2013 optional - set to True to turn on compression.\n        \"sock\" - optional - an open socket or socket-like object\n            to use for communication to the target host.\n        \"gss_auth\" \u2013 optional - True if you want to use GSS-API authentication.\n        \"gss_kex\" \u2013 optional - Perform GSS-API Key Exchange and\n            user authentication.\n        \"gss_deleg_creds\" \u2013 optional - Delegate GSS-API client\n            credentials or not.\n        \"gss_host\" \u2013 optional - The targets name in the kerberos database.\n        \"gss_trust_dns\" \u2013 optional - Indicates whether or\n            not the DNS is trusted to securely canonicalize the name of the\n            host being connected to (default True).\n        \"banner_timeout\" \u2013 an optional timeout (in seconds)\n            to wait for the SSH banner to be presented.\n        \"auth_timeout\" \u2013 an optional timeout (in seconds)\n            to wait for an authentication response.\n        \"disabled_algorithms\" \u2013 an optional dict passed directly to Transport\n            and its keyword argument of the same name.\n        \"transport_factory\" \u2013 an optional callable which is handed a subset of\n            the constructor arguments (primarily those related to the socket,\n            GSS functionality, and algorithm selection) and generates a\n            Transport instance to be used by this client.\n            Defaults to Transport.__init__.</p>\n\n<pre><code>The parameter to specify the private key is expected to be in RSA format.\nAttempting a connection with a blank host key is not allowed\nunless the argument \"add_auto_policy\" is explicitly set to True.\n</code></pre>\n\n<p>Returns:\n    sftp -> a new SFTPClient session object.\n    transport -> the Transport for this connection.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">options_args</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Tuple</span><span class=\"p\">[</span><span class=\"n\">paramiko</span><span class=\"o\">.</span><span class=\"n\">sftp_client</span><span class=\"o\">.</span><span class=\"n\">SFTPClient</span><span class=\"p\">,</span> <span class=\"n\">paramiko</span><span class=\"o\">.</span><span class=\"n\">transport</span><span class=\"o\">.</span><span class=\"n\">Transport</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionUtils.validate_format", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionUtils.validate_format", "kind": "function", "doc": "<p>Validate the file extension based on the format definitions.</p>\n\n<p>Args:\n    files_format: a string containing the file extension.</p>\n\n<p>Returns:\n    The string validated and formatted.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">files_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionUtils.validate_location", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionUtils.validate_location", "kind": "function", "doc": "<p>Validate the location. Add \"/\" in the case it does not exist.</p>\n\n<p>Args:\n    location: file path.</p>\n\n<p>Returns:\n    The location validated.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">location</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.file_utils", "modulename": "lakehouse_engine.utils.file_utils", "kind": "module", "doc": "<p>Utilities for file name based operations.</p>\n"}, {"fullname": "lakehouse_engine.utils.file_utils.get_file_names_without_file_type", "modulename": "lakehouse_engine.utils.file_utils", "qualname": "get_file_names_without_file_type", "kind": "function", "doc": "<p>Function to retrieve list of file names in a folder.</p>\n\n<p>This function filters by file type and removes the extension of the file name\nit returns.</p>\n\n<p>Args:\n    path: path to the folder to list files\n    file_type: type of the file to include in list\n    exclude_regex: regex of file names to exclude</p>\n\n<p>Returns:\n    A list of file names without file type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">path</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">file_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">exclude_regex</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.logging_handler", "modulename": "lakehouse_engine.utils.logging_handler", "kind": "module", "doc": "<p>Module to configure project logging.</p>\n"}, {"fullname": "lakehouse_engine.utils.logging_handler.FilterSensitiveData", "modulename": "lakehouse_engine.utils.logging_handler", "qualname": "FilterSensitiveData", "kind": "class", "doc": "<p>Logging filter to hide sensitive data from being shown in the logs.</p>\n", "bases": "logging.Filter"}, {"fullname": "lakehouse_engine.utils.logging_handler.FilterSensitiveData.filter", "modulename": "lakehouse_engine.utils.logging_handler", "qualname": "FilterSensitiveData.filter", "kind": "function", "doc": "<p>Hide sensitive information from being shown in the logs.</p>\n\n<p>Based on the configured regex and replace strings, the content of the log\nrecords is replaced and then all the records are allowed to be logged\n(return True).</p>\n\n<p>Args:\n    record: the LogRecord event being logged.</p>\n\n<p>Returns:\n    The transformed record to be logged.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">record</span><span class=\"p\">:</span> <span class=\"n\">logging</span><span class=\"o\">.</span><span class=\"n\">LogRecord</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.logging_handler.LoggingHandler", "modulename": "lakehouse_engine.utils.logging_handler", "qualname": "LoggingHandler", "kind": "class", "doc": "<p>Handle the logging of the lakehouse engine project.</p>\n"}, {"fullname": "lakehouse_engine.utils.logging_handler.LoggingHandler.__init__", "modulename": "lakehouse_engine.utils.logging_handler", "qualname": "LoggingHandler.__init__", "kind": "function", "doc": "<p>Construct a LoggingHandler instance.</p>\n\n<p>Args:\n    class_name: name of the class to be indicated in the logs.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">class_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.logging_handler.LoggingHandler.get_logger", "modulename": "lakehouse_engine.utils.logging_handler", "qualname": "LoggingHandler.get_logger", "kind": "function", "doc": "<p>Get the _logger instance variable.</p>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>the logger object.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">logging</span><span class=\"o\">.</span><span class=\"n\">Logger</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.schema_utils", "modulename": "lakehouse_engine.utils.schema_utils", "kind": "module", "doc": "<p>Utilities to facilitate dataframe schema management.</p>\n"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils", "kind": "class", "doc": "<p>Schema utils that help retrieve and manage schemas of dataframes.</p>\n"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils.from_file", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils.from_file", "kind": "function", "doc": "<p>Get a spark schema from a file (spark StructType json file) in a file system.</p>\n\n<p>Args:\n    file_path: path of the file in a file system. Check here:\n        <a href=\"https://spark.apache.org/docs/latest/api/java/org/apache/spark/sql/types/\">https://spark.apache.org/docs/latest/api/java/org/apache/spark/sql/types/</a>\n        StructType.html</p>\n\n<p>Returns:\n    Spark schema struct type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">file_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">StructType</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils.from_file_to_dict", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils.from_file_to_dict", "kind": "function", "doc": "<p>Get a dict with the spark schema from a file in a file system.</p>\n\n<p>Args:\n    file_path: path of the file in a file system. Check here:\n        <a href=\"https://spark.apache.org/docs/latest/api/java/org/apache/spark/sql/types/\">https://spark.apache.org/docs/latest/api/java/org/apache/spark/sql/types/</a>\n        StructType.html</p>\n\n<p>Returns:\n     Spark schema in a dict.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">file_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils.from_dict", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils.from_dict", "kind": "function", "doc": "<p>Get a spark schema from a dict.</p>\n\n<p>Args:\n    struct_type: dict containing a spark schema structure. Check here:\n        <a href=\"https://spark.apache.org/docs/latest/api/java/org/apache/spark/sql/types/\">https://spark.apache.org/docs/latest/api/java/org/apache/spark/sql/types/</a>\n        StructType.html</p>\n\n<p>Returns:\n     Spark schema struct type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">struct_type</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">StructType</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils.from_table_schema", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils.from_table_schema", "kind": "function", "doc": "<p>Get a spark schema from a table.</p>\n\n<p>Args:\n    table: table name from which to inherit the schema.</p>\n\n<p>Returns:\n    Spark schema struct type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">table</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">StructType</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils.from_input_spec", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils.from_input_spec", "kind": "function", "doc": "<p>Get a spark schema from an input specification.</p>\n\n<p>This covers scenarios where the schema is provided as part of the input\nspecification of the algorithm. Schema can come from the table specified in the\ninput specification (enforce_schema_from_table) or by the dict with the spark\nschema provided there also.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n\n<p>Returns:\n    spark schema struct type.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">StructType</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils.schema_flattener", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils.schema_flattener", "kind": "function", "doc": "<p>Recursive method to flatten the schema of the dataframe.</p>\n\n<p>Args:\n    schema: schema to be flattened.\n    prefix: prefix of the struct to get the value for. Only relevant\n    for being used in the internal recursive logic.\n    level: level of the depth in the schema being flattened. Only relevant\n    for being used in the internal recursive logic.\n    max_level: level until which you want to flatten the schema. Default: None.\n    shorten_names: whether to shorten the names of the prefixes of the fields\n    being flattened or not. Default: False.\n    alias: whether to define alias for the columns being flattened or\n    not. Default: True.\n    num_chars: number of characters to consider when shortening the names of\n    the fields. Default: 7.\n    ignore_cols: columns which you don't want to flatten. Default: None.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">schema</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">StructType</span>,</span><span class=\"param\">\t<span class=\"n\">prefix</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">level</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">1</span>,</span><span class=\"param\">\t<span class=\"n\">max_level</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">shorten_names</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">alias</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">num_chars</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">7</span>,</span><span class=\"param\">\t<span class=\"n\">ignore_cols</span><span class=\"p\">:</span> <span class=\"n\">List</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">List</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage", "modulename": "lakehouse_engine.utils.storage", "kind": "module", "doc": "<p>Utilities to interact with storage systems.</p>\n"}, {"fullname": "lakehouse_engine.utils.storage.file_storage", "modulename": "lakehouse_engine.utils.storage.file_storage", "kind": "module", "doc": "<p>Module for abstract representation of a storage system holding files.</p>\n"}, {"fullname": "lakehouse_engine.utils.storage.file_storage.FileStorage", "modulename": "lakehouse_engine.utils.storage.file_storage", "qualname": "FileStorage", "kind": "class", "doc": "<p>Abstract file storage class.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.utils.storage.file_storage.FileStorage.get_file_payload", "modulename": "lakehouse_engine.utils.storage.file_storage", "qualname": "FileStorage.get_file_payload", "kind": "function", "doc": "<p>Get the payload of a file.</p>\n\n<p>Args:\n    url: url of the file.</p>\n\n<p>Returns:\n    File payload/content.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"n\">urllib</span><span class=\"o\">.</span><span class=\"n\">parse</span><span class=\"o\">.</span><span class=\"n\">ParseResult</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage.file_storage.FileStorage.write_payload_to_file", "modulename": "lakehouse_engine.utils.storage.file_storage", "qualname": "FileStorage.write_payload_to_file", "kind": "function", "doc": "<p>Write payload into a file.</p>\n\n<p>Args:\n    url: url of the file.\n    content: content to write into the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"n\">urllib</span><span class=\"o\">.</span><span class=\"n\">parse</span><span class=\"o\">.</span><span class=\"n\">ParseResult</span>, </span><span class=\"param\"><span class=\"n\">content</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage.file_storage_functions", "modulename": "lakehouse_engine.utils.storage.file_storage_functions", "kind": "module", "doc": "<p>Module for common file storage functions.</p>\n"}, {"fullname": "lakehouse_engine.utils.storage.file_storage_functions.FileStorageFunctions", "modulename": "lakehouse_engine.utils.storage.file_storage_functions", "qualname": "FileStorageFunctions", "kind": "class", "doc": "<p>Class for common file storage functions.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.utils.storage.file_storage_functions.FileStorageFunctions.read_json", "modulename": "lakehouse_engine.utils.storage.file_storage_functions", "qualname": "FileStorageFunctions.read_json", "kind": "function", "doc": "<p>Read a json file.</p>\n\n<p>The file should be in a supported file system (e.g., s3 or local filesystem -\nfor local tests only).</p>\n\n<p>Args:\n    path: path to the json file.</p>\n\n<p>Returns:\n    Dict with json file content.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage.local_fs_storage", "modulename": "lakehouse_engine.utils.storage.local_fs_storage", "kind": "module", "doc": "<p>Module to represent a local file storage system.</p>\n"}, {"fullname": "lakehouse_engine.utils.storage.local_fs_storage.LocalFSStorage", "modulename": "lakehouse_engine.utils.storage.local_fs_storage", "qualname": "LocalFSStorage", "kind": "class", "doc": "<p>Class to represent a local file storage system.</p>\n", "bases": "lakehouse_engine.utils.storage.file_storage.FileStorage"}, {"fullname": "lakehouse_engine.utils.storage.local_fs_storage.LocalFSStorage.get_file_payload", "modulename": "lakehouse_engine.utils.storage.local_fs_storage", "qualname": "LocalFSStorage.get_file_payload", "kind": "function", "doc": "<p>Get the payload of a file.</p>\n\n<p>Args:\n    url: url of the file.</p>\n\n<p>Returns:\n    file payload/content.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"n\">urllib</span><span class=\"o\">.</span><span class=\"n\">parse</span><span class=\"o\">.</span><span class=\"n\">ParseResult</span></span><span class=\"return-annotation\">) -> &lt;class &#x27;TextIO&#x27;&gt;:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage.local_fs_storage.LocalFSStorage.write_payload_to_file", "modulename": "lakehouse_engine.utils.storage.local_fs_storage", "qualname": "LocalFSStorage.write_payload_to_file", "kind": "function", "doc": "<p>Write payload into a file.</p>\n\n<p>Args:\n    url: url of the file.\n    content: content to write into the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"n\">urllib</span><span class=\"o\">.</span><span class=\"n\">parse</span><span class=\"o\">.</span><span class=\"n\">ParseResult</span>, </span><span class=\"param\"><span class=\"n\">content</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage.s3_storage", "modulename": "lakehouse_engine.utils.storage.s3_storage", "kind": "module", "doc": "<p>Module to represent a s3 file storage system.</p>\n"}, {"fullname": "lakehouse_engine.utils.storage.s3_storage.S3Storage", "modulename": "lakehouse_engine.utils.storage.s3_storage", "qualname": "S3Storage", "kind": "class", "doc": "<p>Class to represent a s3 file storage system.</p>\n", "bases": "lakehouse_engine.utils.storage.file_storage.FileStorage"}, {"fullname": "lakehouse_engine.utils.storage.s3_storage.S3Storage.get_file_payload", "modulename": "lakehouse_engine.utils.storage.s3_storage", "qualname": "S3Storage.get_file_payload", "kind": "function", "doc": "<p>Get the payload of a config file.</p>\n\n<p>Args:\n    url: url of the file.</p>\n\n<p>Returns:\n    File payload/content.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"n\">urllib</span><span class=\"o\">.</span><span class=\"n\">parse</span><span class=\"o\">.</span><span class=\"n\">ParseResult</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage.s3_storage.S3Storage.write_payload_to_file", "modulename": "lakehouse_engine.utils.storage.s3_storage", "qualname": "S3Storage.write_payload_to_file", "kind": "function", "doc": "<p>Write payload into a file.</p>\n\n<p>Args:\n    url: url of the file.\n    content: content to write into the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"n\">urllib</span><span class=\"o\">.</span><span class=\"n\">parse</span><span class=\"o\">.</span><span class=\"n\">ParseResult</span>, </span><span class=\"param\"><span class=\"n\">content</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}];
+    /** pdoc search index */const docs = [{"fullname": "lakehouse_engine", "modulename": "lakehouse_engine", "kind": "module", "doc": "<p>Lakehouse engine package containing all the system subpackages.</p>\n"}, {"fullname": "lakehouse_engine.algorithms", "modulename": "lakehouse_engine.algorithms", "kind": "module", "doc": "<p>Package containing all the lakehouse engine algorithms.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.algorithm", "modulename": "lakehouse_engine.algorithms.algorithm", "kind": "module", "doc": "<p>Module containing the Algorithm class.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.algorithm.Algorithm", "modulename": "lakehouse_engine.algorithms.algorithm", "qualname": "Algorithm", "kind": "class", "doc": "<p>Class to define the behavior of every algorithm based on ACONs.</p>\n", "bases": "lakehouse_engine.core.executable.Executable"}, {"fullname": "lakehouse_engine.algorithms.algorithm.Algorithm.__init__", "modulename": "lakehouse_engine.algorithms.algorithm", "qualname": "Algorithm.__init__", "kind": "function", "doc": "<p>Construct Algorithm instances.</p>\n\n<p>Args:\n    acon: algorithm configuration.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.algorithms.algorithm.Algorithm.get_dq_spec", "modulename": "lakehouse_engine.algorithms.algorithm", "qualname": "Algorithm.get_dq_spec", "kind": "function", "doc": "<p>Get data quality specification object from acon.</p>\n\n<p>Args:\n    spec: data quality specifications.</p>\n\n<p>Returns:\n    The DQSpec and the List of DQ Functions Specs.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Tuple</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQSpec</span><span class=\"p\">,</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQFunctionSpec</span><span class=\"p\">],</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQFunctionSpec</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.data_loader", "modulename": "lakehouse_engine.algorithms.data_loader", "kind": "module", "doc": "<p>Module to define DataLoader class.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader", "kind": "class", "doc": "<p>Load data using an algorithm configuration (ACON represented as dict).</p>\n\n<p>This algorithm focuses on the cases where users will be specifying all the algorithm\nsteps and configurations through a dict based configuration, which we name ACON\nin our framework.</p>\n\n<p>Since an ACON is a dict you can pass a custom transformer through a python function\nand, therefore, the DataLoader can also be used to load data with custom\ntransformations not provided in our transformers package.</p>\n\n<p>As the algorithm base class of the lakehouse-engine framework is based on the\nconcept of ACON, this DataLoader algorithm simply inherits from Algorithm,\nwithout overriding anything. We designed the codebase like this to avoid\ninstantiating the Algorithm class directly, which was always meant to be an\nabstraction for any specific algorithm included in the lakehouse-engine framework.</p>\n", "bases": "lakehouse_engine.algorithms.algorithm.Algorithm"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.__init__", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.__init__", "kind": "function", "doc": "<p>Construct DataLoader algorithm instances.</p>\n\n<p>A data loader needs several specifications to work properly,\nbut some of them might be optional. The available specifications are:</p>\n\n<pre><code>- input specifications (mandatory): specify how to read data.\n- transform specifications (optional): specify how to transform data.\n- data quality specifications (optional): specify how to execute the data\n    quality process.\n- output specifications (mandatory): specify how to write data to the\n    target.\n- terminate specifications (optional): specify what to do after writing into\n    the target (e.g., optimizing target table, vacuum, compute stats, etc).\n</code></pre>\n\n<p>Args:\n    acon: algorithm configuration.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.read", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.read", "kind": "function", "doc": "<p>Read data from an input location into a distributed dataframe.</p>\n\n<p>Returns:\n     An ordered dict with all the dataframes that were read.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.transform", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.transform", "kind": "function", "doc": "<p>Transform (optionally) the data that was read.</p>\n\n<p>If there isn't a transformation specification this step will be skipped, and the\noriginal dataframes that were read will be returned.\nTransformations can have dependency from another transformation result, however\nwe need to keep in mind if we are using streaming source and for some reason we\nneed to enable micro batch processing, this result cannot be used as input to\nanother transformation. Micro batch processing in pyspark streaming is only\navailable in .write(), which means this transformation with micro batch needs\nto be the end of the process.</p>\n\n<p>Args:\n    data: input dataframes in an ordered dict.</p>\n\n<p>Returns:\n    Another ordered dict with the transformed dataframes, according to the\n    transformation specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.process_dq", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.process_dq", "kind": "function", "doc": "<p>Process the data quality tasks for the data that was read and/or transformed.</p>\n\n<p>It supports multiple input dataframes. Although just one is advisable.</p>\n\n<p>It is possible to use data quality validators/expectations that will validate\nyour data and fail the process in case the expectations are not met. The DQ\nprocess also generates and keeps updating a site containing the results of the\nexpectations that were done on your data. The location of the site is\nconfigurable and can either be on file system or S3. If you define it to be\nstored on S3, you can even configure your S3 bucket to serve the site so that\npeople can easily check the quality of your data. Moreover, it is also\npossible to store the result of the DQ process into a defined result sink.</p>\n\n<p>Args:\n    data: dataframes from previous steps of the algorithm that we which to\n        run the DQ process on.</p>\n\n<p>Returns:\n    Another ordered dict with the validated dataframes.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.write", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.write", "kind": "function", "doc": "<p>Write the data that was read and transformed (if applicable).</p>\n\n<p>It supports writing multiple datasets. However, we only recommend to write one\ndataframe. This recommendation is based on easy debugging and reproducibility,\nsince if we start mixing several datasets being fueled by the same algorithm, it\nwould unleash an infinite sea of reproducibility issues plus tight coupling and\ndependencies between datasets. Having said that, there may be cases where\nwriting multiple datasets is desirable according to the use case requirements.\nUse it accordingly.</p>\n\n<p>Args:\n    data: dataframes that were read and transformed (if applicable).</p>\n\n<p>Returns:\n    Dataframes that were written.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.terminate", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.terminate", "kind": "function", "doc": "<p>Terminate the algorithm.</p>\n\n<p>Args:\n    data: dataframes that were written.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.data_loader.DataLoader.execute", "modulename": "lakehouse_engine.algorithms.data_loader", "qualname": "DataLoader.execute", "kind": "function", "doc": "<p>Define the algorithm execution behaviour.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.dq_validator", "modulename": "lakehouse_engine.algorithms.dq_validator", "kind": "module", "doc": "<p>Module to define Data Validator class.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.dq_validator.DQValidator", "modulename": "lakehouse_engine.algorithms.dq_validator", "qualname": "DQValidator", "kind": "class", "doc": "<p>Validate data using an algorithm configuration (ACON represented as dict).</p>\n\n<p>This algorithm focuses on isolate Data Quality Validations from loading,\napplying a set of data quality functions to a specific input dataset,\nwithout the need to define any output specification.\nYou can use any input specification compatible with the lakehouse engine\n(dataframe, table, files, etc).</p>\n", "bases": "lakehouse_engine.algorithms.algorithm.Algorithm"}, {"fullname": "lakehouse_engine.algorithms.dq_validator.DQValidator.__init__", "modulename": "lakehouse_engine.algorithms.dq_validator", "qualname": "DQValidator.__init__", "kind": "function", "doc": "<p>Construct DQValidator algorithm instances.</p>\n\n<p>A data quality validator needs the following specifications to work\nproperly:\n    - input specification (mandatory): specify how and what data to\n    read.\n    - data quality specification (mandatory): specify how to execute\n    the data quality process.\n    - restore_prev_version (optional): specify if, having\n    delta table/files as input, they should be restored to the\n    previous version if the data quality process fails. Note: this\n    is only considered if fail_on_error is kept as True.</p>\n\n<p>Args:\n    acon: algorithm configuration.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.algorithms.dq_validator.DQValidator.read", "modulename": "lakehouse_engine.algorithms.dq_validator", "qualname": "DQValidator.read", "kind": "function", "doc": "<p>Read data from an input location into a distributed dataframe.</p>\n\n<p>Returns:\n     Dataframe with data that was read.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.dq_validator.DQValidator.process_dq", "modulename": "lakehouse_engine.algorithms.dq_validator", "qualname": "DQValidator.process_dq", "kind": "function", "doc": "<p>Process the data quality tasks for the data that was read.</p>\n\n<p>It supports a single input dataframe.</p>\n\n<p>It is possible to use data quality validators/expectations that will validate\nyour data and fail the process in case the expectations are not met. The DQ\nprocess also generates and keeps updating a site containing the results of the\nexpectations that were done on your data. The location of the site is\nconfigurable and can either be on file system or S3. If you define it to be\nstored on S3, you can even configure your S3 bucket to serve the site so that\npeople can easily check the quality of your data. Moreover, it is also\npossible to store the result of the DQ process into a defined result sink.</p>\n\n<p>Args:\n    data: input dataframe on which to run the DQ process.</p>\n\n<p>Returns:\n    Validated dataframe.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.dq_validator.DQValidator.execute", "modulename": "lakehouse_engine.algorithms.dq_validator", "qualname": "DQValidator.execute", "kind": "function", "doc": "<p>Define the algorithm execution behaviour.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.exceptions", "modulename": "lakehouse_engine.algorithms.exceptions", "kind": "module", "doc": "<p>Package defining all the algorithm custom exceptions.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.exceptions.ReconciliationFailedException", "modulename": "lakehouse_engine.algorithms.exceptions", "qualname": "ReconciliationFailedException", "kind": "class", "doc": "<p>Exception for when the reconciliation process fails.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.algorithms.exceptions.NoNewDataException", "modulename": "lakehouse_engine.algorithms.exceptions", "qualname": "NoNewDataException", "kind": "class", "doc": "<p>Exception for when no new data is available.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.algorithms.exceptions.SensorAlreadyExistsException", "modulename": "lakehouse_engine.algorithms.exceptions", "qualname": "SensorAlreadyExistsException", "kind": "class", "doc": "<p>Exception for when a sensor with same sensor id already exists.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.algorithms.exceptions.RestoreTypeNotFoundException", "modulename": "lakehouse_engine.algorithms.exceptions", "qualname": "RestoreTypeNotFoundException", "kind": "class", "doc": "<p>Exception for when the restore type is not found.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.algorithms.reconciliator", "modulename": "lakehouse_engine.algorithms.reconciliator", "kind": "module", "doc": "<p>Module containing the Reconciliator class.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.ReconciliationType", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "ReconciliationType", "kind": "class", "doc": "<p>Type of Reconciliation.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.ReconciliationType.PCT", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "ReconciliationType.PCT", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReconciliationType.PCT: &#x27;percentage&#x27;&gt;"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.ReconciliationType.ABS", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "ReconciliationType.ABS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReconciliationType.ABS: &#x27;absolute&#x27;&gt;"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.ReconciliationTransformers", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "ReconciliationTransformers", "kind": "class", "doc": "<p>Transformers Available for the Reconciliation Algorithm.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.ReconciliationTransformers.AVAILABLE_TRANSFORMERS", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "ReconciliationTransformers.AVAILABLE_TRANSFORMERS", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict", "default_value": "&lt;ReconciliationTransformers.AVAILABLE_TRANSFORMERS: {&#x27;cache&#x27;: &lt;bound method Optimizers.cache of &lt;class &#x27;lakehouse_engine.transformers.optimizers.Optimizers&#x27;&gt;&gt;, &#x27;persist&#x27;: &lt;bound method Optimizers.persist of &lt;class &#x27;lakehouse_engine.transformers.optimizers.Optimizers&#x27;&gt;&gt;}&gt;"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.Reconciliator", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "Reconciliator", "kind": "class", "doc": "<p>Class to define the behavior of an algorithm that checks if data reconciles.</p>\n\n<p>Checking if data reconciles, using this algorithm, is a matter of reading the\n'truth' data and the 'current' data. You can use any input specification compatible\nwith the lakehouse engine to read 'truth' or 'current' data. On top of that, you\ncan pass a 'truth_preprocess_query' and a 'current_preprocess_query' so you can\npreprocess the data before it goes into the actual reconciliation process.\nMoreover, you can use the 'truth_preprocess_query_args' and\n'current_preprocess_query_args' to pass additional arguments to be used to apply\nadditional operations on top of the dataframe, resulting from the previous steps.\nWith these arguments you can apply additional operations like caching or persisting\nthe Dataframe. The way to pass the additional arguments for the operations is\nsimilar to the TransformSpec, but only a few operations are allowed. Those are\ndefined in ReconciliationTransformers.AVAILABLE_TRANSFORMERS.</p>\n\n<p>The reconciliation process is focused on joining 'truth' with 'current' by all\nprovided columns except the ones passed as 'metrics'. After that it calculates the\ndifferences in the metrics attributes (either percentage or absolute difference).\nFinally, it aggregates the differences, using the supplied aggregation function\n(e.g., sum, avg, min, max, etc).</p>\n\n<p>All of these configurations are passed via the ACON to instantiate a\nReconciliatorSpec object.</p>\n\n<p>Notes:\n    - It is crucial that both the current and truth datasets have exactly the same\n        structure.\n    - You should not use 0 as yellow or red threshold, as the algorithm will verify\n        if the difference between the truth and current values is bigger\n        or equal than those thresholds.\n    - The reconciliation does not produce any negative values or percentages, as we\n        use the absolute value of the differences. This means that the recon result\n        will not indicate if it was the current values that were bigger or smaller\n        than the truth values, or vice versa.</p>\n", "bases": "lakehouse_engine.core.executable.Executable"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.Reconciliator.__init__", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "Reconciliator.__init__", "kind": "function", "doc": "<p>Construct Algorithm instances.</p>\n\n<p>Args:\n    acon: algorithm configuration.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.Reconciliator.get_source_of_truth", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "Reconciliator.get_source_of_truth", "kind": "function", "doc": "<p>Get the source of truth (expected result) for the reconciliation process.</p>\n\n<p>Returns:\n    DataFrame containing the source of truth.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.Reconciliator.get_current_results", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "Reconciliator.get_current_results", "kind": "function", "doc": "<p>Get the current results from the table that we are checking if it reconciles.</p>\n\n<p>Returns:\n    DataFrame containing the current results.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.reconciliator.Reconciliator.execute", "modulename": "lakehouse_engine.algorithms.reconciliator", "qualname": "Reconciliator.execute", "kind": "function", "doc": "<p>Reconcile the current results against the truth dataset.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.algorithms.sensor", "modulename": "lakehouse_engine.algorithms.sensor", "kind": "module", "doc": "<p>Module to define Sensor algorithm behavior.</p>\n"}, {"fullname": "lakehouse_engine.algorithms.sensor.Sensor", "modulename": "lakehouse_engine.algorithms.sensor", "qualname": "Sensor", "kind": "class", "doc": "<p>Class representing a sensor to check if the upstream has new data.</p>\n", "bases": "lakehouse_engine.algorithms.algorithm.Algorithm"}, {"fullname": "lakehouse_engine.algorithms.sensor.Sensor.__init__", "modulename": "lakehouse_engine.algorithms.sensor", "qualname": "Sensor.__init__", "kind": "function", "doc": "<p>Construct Sensor instances.</p>\n\n<p>Args:\n    acon: algorithm configuration.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.algorithms.sensor.Sensor.execute", "modulename": "lakehouse_engine.algorithms.sensor", "qualname": "Sensor.execute", "kind": "function", "doc": "<p>Execute the sensor.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.configs", "modulename": "lakehouse_engine.configs", "kind": "module", "doc": "<p>This module receives a config file which is included in the wheel.</p>\n"}, {"fullname": "lakehouse_engine.core", "modulename": "lakehouse_engine.core", "kind": "module", "doc": "<p>Package with the core behaviour of the lakehouse engine.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions", "modulename": "lakehouse_engine.core.definitions", "kind": "module", "doc": "<p>Definitions of standard values and structures for core components.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat", "kind": "class", "doc": "<p>Formats of algorithm input.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.JDBC", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.JDBC", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.JDBC: &#x27;jdbc&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.AVRO", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.AVRO", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.AVRO: &#x27;avro&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.JSON", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.JSON", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.JSON: &#x27;json&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.CSV", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.CSV", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.CSV: &#x27;csv&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.PARQUET", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.PARQUET", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.PARQUET: &#x27;parquet&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.DELTAFILES", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.DELTAFILES", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.DELTAFILES: &#x27;delta&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.CLOUDFILES", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.CLOUDFILES", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.CLOUDFILES: &#x27;cloudfiles&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.KAFKA", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.KAFKA", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.KAFKA: &#x27;kafka&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.SQL", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.SQL", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.SQL: &#x27;sql&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.SAP_BW", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.SAP_BW", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.SAP_BW: &#x27;sap_bw&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.SAP_B4", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.SAP_B4", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.SAP_B4: &#x27;sap_b4&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.DATAFRAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.DATAFRAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.DATAFRAME: &#x27;dataframe&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.SFTP", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.SFTP", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;InputFormat.SFTP: &#x27;sftp&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.values", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.values", "kind": "function", "doc": "<p>Generates a list containing all enum values.</p>\n\n<p>Return:\n    A list with all enum values.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.definitions.InputFormat.exists", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputFormat.exists", "kind": "function", "doc": "<p>Checks if the input format exists in the enum values.</p>\n\n<p>Args:\n    input_format: format to check if exists.</p>\n\n<p>Return:\n    If the input format exists in our enum.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">input_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat", "kind": "class", "doc": "<p>Formats of algorithm output.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.JDBC", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.JDBC", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.JDBC: &#x27;jdbc&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.AVRO", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.AVRO", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.AVRO: &#x27;avro&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.JSON", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.JSON", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.JSON: &#x27;json&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.CSV", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.CSV", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.CSV: &#x27;csv&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.PARQUET", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.PARQUET", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.PARQUET: &#x27;parquet&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.DELTAFILES", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.DELTAFILES", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.DELTAFILES: &#x27;delta&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.KAFKA", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.KAFKA", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.KAFKA: &#x27;kafka&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.CONSOLE", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.CONSOLE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.CONSOLE: &#x27;console&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.NOOP", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.NOOP", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.NOOP: &#x27;noop&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.DATAFRAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.DATAFRAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.DATAFRAME: &#x27;dataframe&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.FILE", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.FILE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.FILE: &#x27;file&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.OutputFormat.TABLE", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputFormat.TABLE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;OutputFormat.TABLE: &#x27;table&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.NotifierType", "modulename": "lakehouse_engine.core.definitions", "qualname": "NotifierType", "kind": "class", "doc": "<p>Type of notifier available.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.NotifierType.EMAIL", "modulename": "lakehouse_engine.core.definitions", "qualname": "NotifierType.EMAIL", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;NotifierType.EMAIL: &#x27;email&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.NotificationEmailServers", "modulename": "lakehouse_engine.core.definitions", "qualname": "NotificationEmailServers", "kind": "class", "doc": "<p>Types of email server with special behaviour.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.NotificationRuntimeParameters", "modulename": "lakehouse_engine.core.definitions", "qualname": "NotificationRuntimeParameters", "kind": "class", "doc": "<p>Parameters to be replaced in runtime.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.NotificationRuntimeParameters.DATABRICKS_JOB_NAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "NotificationRuntimeParameters.DATABRICKS_JOB_NAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;NotificationRuntimeParameters.DATABRICKS_JOB_NAME: &#x27;databricks_job_name&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.NotificationRuntimeParameters.DATABRICKS_WORKSPACE_ID", "modulename": "lakehouse_engine.core.definitions", "qualname": "NotificationRuntimeParameters.DATABRICKS_WORKSPACE_ID", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;NotificationRuntimeParameters.DATABRICKS_WORKSPACE_ID: &#x27;databricks_workspace_id&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.ReadType", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadType", "kind": "class", "doc": "<p>Define the types of read operations.</p>\n\n<p>BATCH - read the data in batch mode (e.g., Spark batch).\nSTREAMING - read the data in streaming mode (e.g., Spark streaming).</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.ReadType.BATCH", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadType.BATCH", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReadType.BATCH: &#x27;batch&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.ReadType.STREAMING", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadType.STREAMING", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReadType.STREAMING: &#x27;streaming&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.ReadMode", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadMode", "kind": "class", "doc": "<p>Different modes that control how we handle compliance to the provided schema.</p>\n\n<p>These read modes map to Spark's read modes at the moment.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.ReadMode.PERMISSIVE", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadMode.PERMISSIVE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReadMode.PERMISSIVE: &#x27;PERMISSIVE&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.ReadMode.FAILFAST", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadMode.FAILFAST", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReadMode.FAILFAST: &#x27;FAILFAST&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.ReadMode.DROPMALFORMED", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReadMode.DROPMALFORMED", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;ReadMode.DROPMALFORMED: &#x27;DROPMALFORMED&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults", "kind": "class", "doc": "<p>Defaults used on the data quality process.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.FILE_SYSTEM_STORE", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.FILE_SYSTEM_STORE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.FILE_SYSTEM_STORE: &#x27;file_system&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.FILE_SYSTEM_S3_STORE", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.FILE_SYSTEM_S3_STORE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.FILE_SYSTEM_S3_STORE: &#x27;s3&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DQ_BATCH_IDENTIFIERS", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DQ_BATCH_IDENTIFIERS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DQ_BATCH_IDENTIFIERS: [&#x27;spec_id&#x27;, &#x27;input_id&#x27;, &#x27;timestamp&#x27;]&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATASOURCE_CLASS_NAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATASOURCE_CLASS_NAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATASOURCE_CLASS_NAME: &#x27;Datasource&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATASOURCE_EXECUTION_ENGINE", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATASOURCE_EXECUTION_ENGINE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATASOURCE_EXECUTION_ENGINE: &#x27;SparkDFExecutionEngine&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATA_CONNECTORS_CLASS_NAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATA_CONNECTORS_CLASS_NAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATA_CONNECTORS_CLASS_NAME: &#x27;RuntimeDataConnector&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATA_CONNECTORS_MODULE_NAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATA_CONNECTORS_MODULE_NAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATA_CONNECTORS_MODULE_NAME: &#x27;great_expectations.datasource.data_connector&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATA_CHECKPOINTS_CLASS_NAME", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATA_CHECKPOINTS_CLASS_NAME", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATA_CHECKPOINTS_CLASS_NAME: &#x27;SimpleCheckpoint&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATA_CHECKPOINTS_CONFIG_VERSION", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATA_CHECKPOINTS_CONFIG_VERSION", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATA_CHECKPOINTS_CONFIG_VERSION: 1.0&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.STORE_BACKEND", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.STORE_BACKEND", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.FILE_SYSTEM_S3_STORE: &#x27;s3&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.EXPECTATIONS_STORE_PREFIX", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.EXPECTATIONS_STORE_PREFIX", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.EXPECTATIONS_STORE_PREFIX: &#x27;dq/expectations/&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.VALIDATIONS_STORE_PREFIX", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.VALIDATIONS_STORE_PREFIX", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.VALIDATIONS_STORE_PREFIX: &#x27;dq/validations/&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DATA_DOCS_PREFIX", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DATA_DOCS_PREFIX", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DATA_DOCS_PREFIX: &#x27;dq/data_docs/site/&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.CHECKPOINT_STORE_PREFIX", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.CHECKPOINT_STORE_PREFIX", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.CHECKPOINT_STORE_PREFIX: &#x27;dq/checkpoints/&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.VALIDATION_COLUMN_IDENTIFIER", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.VALIDATION_COLUMN_IDENTIFIER", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.VALIDATION_COLUMN_IDENTIFIER: &#x27;validationresultidentifier&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.CUSTOM_EXPECTATION_LIST", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.CUSTOM_EXPECTATION_LIST", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.CUSTOM_EXPECTATION_LIST: [&#x27;expect_column_values_to_be_date_not_older_than&#x27;, &#x27;expect_column_pair_a_to_be_smaller_or_equal_than_b&#x27;, &#x27;expect_multicolumn_column_a_must_equal_b_or_c&#x27;, &#x27;expect_queried_column_agg_value_to_be&#x27;]&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQDefaults.DQ_VALIDATIONS_SCHEMA", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQDefaults.DQ_VALIDATIONS_SCHEMA", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQDefaults.DQ_VALIDATIONS_SCHEMA: StructType([StructField(&#x27;dq_validations&#x27;, StructType([StructField(&#x27;run_name&#x27;, StringType(), True), StructField(&#x27;run_success&#x27;, BooleanType(), True), StructField(&#x27;raised_exceptions&#x27;, BooleanType(), True), StructField(&#x27;run_row_success&#x27;, BooleanType(), True), StructField(&#x27;dq_failure_details&#x27;, ArrayType(StructType([StructField(&#x27;expectation_type&#x27;, StringType(), True), StructField(&#x27;kwargs&#x27;, StringType(), True)]), True), True)]), True)])&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType", "kind": "class", "doc": "<p>Types of write operations.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.OVERWRITE", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.OVERWRITE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.OVERWRITE: &#x27;overwrite&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.COMPLETE", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.COMPLETE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.COMPLETE: &#x27;complete&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.APPEND", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.APPEND", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.APPEND: &#x27;append&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.UPDATE", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.UPDATE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.UPDATE: &#x27;update&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.MERGE", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.MERGE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.MERGE: &#x27;merge&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.ERROR_IF_EXISTS", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.ERROR_IF_EXISTS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.ERROR_IF_EXISTS: &#x27;error&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.WriteType.IGNORE_IF_EXISTS", "modulename": "lakehouse_engine.core.definitions", "qualname": "WriteType.IGNORE_IF_EXISTS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;WriteType.IGNORE_IF_EXISTS: &#x27;ignore&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.InputSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputSpec", "kind": "class", "doc": "<p>Specification of an algorithm input.</p>\n\n<p>This is very aligned with the way the execution environment connects to the sources\n(e.g., spark sources).</p>\n\n<p>spec_id: spec_id of the input specification read_type: ReadType type of read\noperation.\ndata_format: format of the input.\nsftp_files_format: format of the files (csv, fwf, json, xml...) in a sftp\n    directory.\ndf_name: dataframe name.\ndb_table: table name in the form of <db>.<table>.\nlocation: uri that identifies from where to read data in the specified format.\nenforce_schema_from_table: if we want to enforce the table schema or not, by\n    providing a table name in the form of <db>.<table>.\nquery: sql query to execute and return the dataframe. Use it if you do not want to\n    read from a file system nor from a table, but rather from a sql query instead.\nschema: dict representation of a schema of the input (e.g., Spark struct type\n    schema).\nschema_path: path to a file with a representation of a schema of the input (e.g.,\n    Spark struct type schema).\nwith_filepath: if we want to include the path of the file that is being read. Only\n    works with the file reader (batch and streaming modes are supported).\noptions: dict with other relevant options according to the execution\n    environment (e.g., spark) possible sources.\ncalculate_upper_bound: when to calculate upper bound to extract from SAP BW or not.\ncalc_upper_bound_schema: specific schema for the calculated upper_bound.\ngenerate_predicates: when to generate predicates to extract from SAP BW or not.\npredicates_add_null: if we want to include is null on partition by predicates.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.InputSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "InputSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">spec_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">read_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">data_format</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">sftp_files_format</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">df_name</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">db_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">query</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">enforce_schema_from_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">schema_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">with_filepath</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">options</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">jdbc_args</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">calculate_upper_bound</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">calc_upper_bound_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">generate_predicates</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">predicates_add_null</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.TransformerSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "TransformerSpec", "kind": "class", "doc": "<p>Transformer Specification, i.e., a single transformation amongst many.</p>\n\n<p>function: name of the function (or callable function) to be executed.\nargs: (not applicable if using a callable function) dict with the arguments to pass\nto the function <k,v> pairs with the name of the parameter of the function and the\nrespective value.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.TransformerSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "TransformerSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">function</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.TransformSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "TransformSpec", "kind": "class", "doc": "<p>Transformation Specification.</p>\n\n<p>I.e., the specification that defines the many transformations to be done to the data\nthat was read.</p>\n\n<p>spec_id: id of the terminate specification input_id: id of the corresponding input\nspecification.\ntransformers: list of transformers to execute.\nforce_streaming_foreach_batch_processing: sometimes, when using streaming, we want\n    to force the transform to be executed in the foreachBatch function to ensure\n    non-supported streaming operations can be properly executed.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.TransformSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "TransformSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">spec_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">input_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">transformers</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TransformerSpec</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">force_streaming_foreach_batch_processing</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.DQType", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQType", "kind": "class", "doc": "<p>Available data quality tasks.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.DQType.VALIDATOR", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQType.VALIDATOR", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQType.VALIDATOR: &#x27;validator&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQType.ASSISTANT", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQType.ASSISTANT", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;DQType.ASSISTANT: &#x27;assistant&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.DQFunctionSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQFunctionSpec", "kind": "class", "doc": "<p>Defines a data quality function specification.</p>\n\n<p>function - name of the data quality function (expectation) to execute.\nIt follows the great_expectations api <a href=\"https://greatexpectations.io/expectations/\">https://greatexpectations.io/expectations/</a>.\nargs - args of the function (expectation). Follow the same api as above.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.DQFunctionSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQFunctionSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">function</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.DQSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQSpec", "kind": "class", "doc": "<p>Data quality overall specification.</p>\n\n<pre><code>spec_id - id of the specification.\ninput_id - id of the input specification.\ndq_type - type of DQ process to execute (e.g. validator).\ndq_functions - list of function specifications to execute.\nunexpected_rows_pk - the list of columns composing the primary key of the\n    source data to identify the rows failing the DQ validations. Note: only one\n    of tbl_to_derive_pk or unexpected_rows_pk arguments need to be provided. It\n    is mandatory to provide one of these arguments when using tag_source_data\n    as True. When tag_source_data is False, this is not mandatory, but still\n    recommended.\ntbl_to_derive_pk - db.table to automatically derive the unexpected_rows_pk from.\n    Note: only one of tbl_to_derive_pk or unexpected_rows_pk arguments need to\n    be provided. It is mandatory to provide one of these arguments when using\n    tag_source_data as True. hen tag_source_data is False, this is not\n    mandatory, but still recommended.\ngx_result_format - great expectations result format. Default: \"COMPLETE\".\n</code></pre>\n\n<p>\u00b4   tag_source_data - when set to true, this will ensure that the DQ process ends by\n        tagging the source data with an additional column with information about the\n        DQ results. This column makes it possible to identify if the DQ run was\n        succeeded in general and, if not, it unlocks the insights to know what\n        specific rows have made the DQ validations fail and why. Default: False.\n        Note: it only works if result_sink_explode is True, gx_result_format is\n        COMPLETE, fail_on_error is False (which is done automatically when\n        you specify tag_source_data as True) and tbl_to_derive_pk or\n        unexpected_rows_pk is configured.\n    store_backend - which store_backend to use (e.g. s3 or file_system).\n    local_fs_root_dir - path of the root directory. Note: only applicable for\n        store_backend file_system.\n    bucket - the bucket name to consider for the store_backend (store DQ artefacts).\n        Note: only applicable for store_backend s3.\n    data_docs_bucket - the bucket name for data docs only. When defined, it will\n        supersede bucket parameter.\n    expectations_store_prefix - prefix where to store expectations' data. Note: only\n        applicable for store_backend s3.\n    validations_store_prefix - prefix where to store validations' data. Note: only\n        applicable for store_backend s3.\n    data_docs_prefix - prefix where to store data_docs' data. Note: only applicable\n        for store_backend s3.\n    checkpoint_store_prefix - prefix where to store checkpoints' data. Note: only\n        applicable for store_backend s3.\n    data_asset_name - name of the data asset to consider when configuring the great\n        expectations' data source.\n    expectation_suite_name - name to consider for great expectations' suite.\n    assistant_options - additional options to pass to the DQ assistant processor.\n    result_sink_db_table - db.table_name indicating the database and table in which\n        to save the results of the DQ process.\n    result_sink_location - file system location in which to save the results of the\n        DQ process.\n    result_sink_partitions - the list of partitions to consider.\n    result_sink_format - format of the result table (e.g. delta, parquet, kafka...).\n    result_sink_options - extra spark options for configuring the result sink.\n        E.g: can be used to configure a Kafka sink if result_sink_format is kafka.\n    result_sink_explode - flag to determine if the output table/location should have\n        the columns exploded (as True) or not (as False). Default: True.\n    result_sink_extra_columns - list of extra columns to be exploded (following\n        the pattern \"<name>.*\") or columns to be selected. It is only used when\n        result_sink_explode is set to True.\n    source - name of data source, to be easier to identify in analysis. If not\n        specified, it is set as default <input_id>. This will be only used\n        when result_sink_explode is set to True.\n    fail_on_error - whether to fail the algorithm if the validations of your data in\n        the DQ process failed.\n    cache_df - whether to cache the dataframe before running the DQ process or not.\n    critical_functions - functions that should not fail. When this argument is\n        defined, fail_on_error is nullified.\n    max_percentage_failure - percentage of failure that should be allowed.\n        This argument has priority over both fail_on_error and critical_functions.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.DQSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">spec_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">input_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dq_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dq_functions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQFunctionSpec</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">unexpected_rows_pk</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">tbl_to_derive_pk</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">gx_result_format</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;COMPLETE&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">tag_source_data</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">assistant_options</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">store_backend</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;s3&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">local_fs_root_dir</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">bucket</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">data_docs_bucket</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">expectations_store_prefix</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;dq/expectations/&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">validations_store_prefix</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;dq/validations/&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">data_docs_prefix</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;dq/data_docs/site/&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">checkpoint_store_prefix</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;dq/checkpoints/&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">data_asset_name</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">expectation_suite_name</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_db_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_partitions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_options</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_explode</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">result_sink_extra_columns</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">source</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">fail_on_error</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">cache_df</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">critical_functions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQFunctionSpec</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">max_percentage_failure</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">float</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.MergeOptions", "modulename": "lakehouse_engine.core.definitions", "qualname": "MergeOptions", "kind": "class", "doc": "<p>Options for a merge operation.</p>\n\n<p>merge_predicate: predicate to apply to the merge operation so that we can check if a\n    new record corresponds to a record already included in the historical data.\ninsert_only: indicates if the merge should only insert data (e.g., deduplicate\n    scenarios).\ndelete_predicate: predicate to apply to the delete operation.\nupdate_predicate: predicate to apply to the update operation.\ninsert_predicate: predicate to apply to the insert operation.\nupdate_column_set: rules to apply to the update operation which allows to set the\n    value for each column to be updated.\n    (e.g. {\"data\": \"new.data\", \"count\": \"current.count + 1\"} )\ninsert_column_set: rules to apply to the insert operation which allows to set the\n    value for each column to be inserted.\n    (e.g. {\"date\": \"updates.date\", \"count\": \"1\"} )</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.MergeOptions.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "MergeOptions.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">merge_predicate</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">insert_only</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">delete_predicate</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">update_predicate</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">insert_predicate</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">update_column_set</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">insert_column_set</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.OutputSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputSpec", "kind": "class", "doc": "<p>Specification of an algorithm output.</p>\n\n<p>This is very aligned with the way the execution environment connects to the output\nsystems (e.g., spark outputs).</p>\n\n<p>spec_id: id of the output specification.\ninput_id: id of the corresponding input specification.\nwrite_type: type of write operation.\ndata_format: format of the output. Defaults to DELTA.\ndb_table: table name in the form of <db>.<table>.\nlocation: uri that identifies from where to write data in the specified format.\npartitions: list of partition input_col names.\nmerge_opts: options to apply to the merge operation.\nstreaming_micro_batch_transformers: transformers to invoke for each streaming micro\n    batch, before writing (i.e., in Spark's foreachBatch structured\n    streaming function). Note: the lakehouse engine manages this for you, so\n    you don't have to manually specify streaming transformations here, so we don't\n    advise you to manually specify transformations through this parameter. Supply\n    them as regular transformers in the transform_specs sections of an ACON.\nstreaming_once: if the streaming query is to be executed just once, or not,\n    generating just one micro batch.\nstreaming_processing_time: if streaming query is to be kept alive, this indicates\n    the processing time of each micro batch.\nstreaming_available_now: if set to True, set a trigger that processes all available\n    data in multiple batches then terminates the query.\n    When using streaming, this is the default trigger that the lakehouse-engine will\n    use, unless you configure a different one.\nstreaming_continuous: set a trigger that runs a continuous query with a given\n    checkpoint interval.\nstreaming_await_termination: whether to wait (True) for the termination of the\n    streaming query (e.g. timeout or exception) or not (False). Default: True.\nstreaming_await_termination_timeout: a timeout to set to the\n    streaming_await_termination. Default: None.\nwith_batch_id: whether to include the streaming batch id in the final data, or not.\n    It only takes effect in streaming mode.\noptions: dict with other relevant options according to the execution environment\n    (e.g., spark) possible outputs.  E.g.,: JDBC options, checkpoint location for\n    streaming, etc.\nstreaming_micro_batch_dq_processors: similar to streaming_micro_batch_transformers\n    but for the DQ functions to be executed. Used internally by the lakehouse\n    engine, so you don't have to supply DQ functions through this parameter. Use the\n    dq_specs of the acon instead.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.OutputSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "OutputSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">spec_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">input_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">write_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">data_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">db_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">merge_opts</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">MergeOptions</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">partitions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_micro_batch_transformers</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TransformerSpec</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_once</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_processing_time</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_available_now</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_continuous</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_await_termination</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_await_termination_timeout</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">with_batch_id</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">options</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">streaming_micro_batch_dq_processors</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQSpec</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.TerminatorSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "TerminatorSpec", "kind": "class", "doc": "<p>Terminator Specification.</p>\n\n<p>I.e., the specification that defines a terminator operation to be executed. Examples\nare compute statistics, vacuum, optimize, etc.</p>\n\n<p>spec_id: id of the terminate specification.\nfunction: terminator function to execute.\nargs: arguments of the terminator function.\ninput_id: id of the corresponding output specification (Optional).</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.TerminatorSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "TerminatorSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">function</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">input_id</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.ReconciliatorSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReconciliatorSpec", "kind": "class", "doc": "<p>Reconciliator Specification.</p>\n\n<p>metrics: list of metrics in the form of:\n    [{\n        metric: name of the column present in both truth and current datasets,\n        aggregation: sum, avg, max, min, ...,\n        type: percentage or absolute,\n        yellow: value,\n        red: value\n    }].\nrecon_type: reconciliation type (percentage or absolute). Percentage calculates\n    the difference between truth and current results as a percentage (x-y/x), and\n    absolute calculates the raw difference (x - y).\ntruth_input_spec: input specification of the truth data.\ncurrent_input_spec: input specification of the current results data\ntruth_preprocess_query: additional query on top of the truth input data to\n    preprocess the truth data before it gets fueled into the reconciliation process.\n    Important note: you need to assume that the data out of\n    the truth_input_spec is referencable by a table called 'truth'.\ntruth_preprocess_query_args: optional dict having the functions/transformations to\n    apply on top of the truth_preprocess_query and respective arguments. Note: cache\n    is being applied on the Dataframe, by default. For turning the default behavior\n    off, pass <code>\"truth_preprocess_query_args\": []</code>.\ncurrent_preprocess_query: additional query on top of the current results input data\n    to preprocess the current results data before it gets fueled into the\n    reconciliation process. Important note: you need to assume that the data out of\n    the current_results_input_spec is referencable by a table called 'current'.\ncurrent_preprocess_query_args: optional dict having the functions/transformations to\n    apply on top of the current_preprocess_query and respective arguments. Note:\n    cache is being applied on the Dataframe, by default. For turning the default\n    behavior off, pass <code>\"current_preprocess_query_args\": []</code>.\nignore_empty_df: optional boolean, to ignore the recon process if source &amp; target\n   dataframes are empty, recon will exit success code (passed)</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.ReconciliatorSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "ReconciliatorSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">metrics</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">truth_input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">current_input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">truth_preprocess_query</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">truth_preprocess_query_args</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">current_preprocess_query</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">current_preprocess_query_args</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">ignore_empty_df</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.DQValidatorSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQValidatorSpec", "kind": "class", "doc": "<p>Data Quality Validator Specification.</p>\n\n<p>input_spec: input specification of the data to be checked/validated.\ndq_spec: data quality specification.\nrestore_prev_version: specify if, having\ndelta table/files as input, they should be restored to the\nprevious version if the data quality process fails. Note: this\nis only considered if fail_on_error is kept as True.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.DQValidatorSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "DQValidatorSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">dq_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQSpec</span>,</span><span class=\"param\">\t<span class=\"n\">restore_prev_version</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions", "kind": "class", "doc": "<p>SQL definitions statements.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.compute_table_stats", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.compute_table_stats", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.compute_table_stats: &#x27;ANALYZE TABLE {} COMPUTE STATISTICS&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.drop_table_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.drop_table_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.drop_table_stmt: &#x27;DROP TABLE IF EXISTS&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.drop_view_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.drop_view_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.drop_view_stmt: &#x27;DROP VIEW IF EXISTS&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.truncate_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.truncate_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.truncate_stmt: &#x27;TRUNCATE TABLE&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.describe_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.describe_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.describe_stmt: &#x27;DESCRIBE TABLE&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.optimize_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.optimize_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.optimize_stmt: &#x27;OPTIMIZE&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.show_tbl_props_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.show_tbl_props_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.show_tbl_props_stmt: &#x27;SHOW TBLPROPERTIES&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SQLDefinitions.delete_where_stmt", "modulename": "lakehouse_engine.core.definitions", "qualname": "SQLDefinitions.delete_where_stmt", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SQLDefinitions.delete_where_stmt: &#x27;DELETE FROM {} WHERE {}&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.FileManagerAPIKeys", "modulename": "lakehouse_engine.core.definitions", "qualname": "FileManagerAPIKeys", "kind": "class", "doc": "<p>File Manager s3 api keys.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.FileManagerAPIKeys.CONTENTS", "modulename": "lakehouse_engine.core.definitions", "qualname": "FileManagerAPIKeys.CONTENTS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;FileManagerAPIKeys.CONTENTS: &#x27;Contents&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.FileManagerAPIKeys.KEY", "modulename": "lakehouse_engine.core.definitions", "qualname": "FileManagerAPIKeys.KEY", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;FileManagerAPIKeys.KEY: &#x27;Key&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.FileManagerAPIKeys.CONTINUATION", "modulename": "lakehouse_engine.core.definitions", "qualname": "FileManagerAPIKeys.CONTINUATION", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;FileManagerAPIKeys.CONTINUATION: &#x27;NextContinuationToken&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.FileManagerAPIKeys.BUCKET", "modulename": "lakehouse_engine.core.definitions", "qualname": "FileManagerAPIKeys.BUCKET", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;FileManagerAPIKeys.BUCKET: &#x27;Bucket&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.FileManagerAPIKeys.OBJECTS", "modulename": "lakehouse_engine.core.definitions", "qualname": "FileManagerAPIKeys.OBJECTS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;FileManagerAPIKeys.OBJECTS: &#x27;Objects&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SensorSpec", "modulename": "lakehouse_engine.core.definitions", "qualname": "SensorSpec", "kind": "class", "doc": "<p>Sensor Specification.</p>\n\n<p>sensor_id: sensor id.\nassets: a list of assets that are considered as available to\n    consume downstream after this sensor has status\n    PROCESSED_NEW_DATA.\ncontrol_db_table_name: db.table to store sensor metadata.\ninput_spec: input specification of the source to be checked for new data.\npreprocess_query: SQL query to transform/filter the result from the\n    upstream. Consider that we should refer to 'new_data' whenever\n    we are referring to the input of the sensor. E.g.:\n        \"SELECT dummy_col FROM new_data WHERE ...\"\ncheckpoint_location: optional location to store checkpoints to resume\n    from. These checkpoints use the same as Spark checkpoint strategy.\n    For Spark readers that do not support checkpoints, use the\n    preprocess_query parameter to form a SQL query to filter the result\n    from the upstream accordingly.\nfail_on_empty_result: if the sensor should throw an error if there is no new\n    data in the upstream. Default: True.</p>\n"}, {"fullname": "lakehouse_engine.core.definitions.SensorSpec.__init__", "modulename": "lakehouse_engine.core.definitions", "qualname": "SensorSpec.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">assets</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">preprocess_query</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">checkpoint_location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">fail_on_empty_result</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.definitions.SensorSpec.create_from_acon", "modulename": "lakehouse_engine.core.definitions", "qualname": "SensorSpec.create_from_acon", "kind": "function", "doc": "<p>Create SensorSpec from acon.</p>\n\n<p>Args:\n    acon: sensor ACON.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.definitions.SensorStatus", "modulename": "lakehouse_engine.core.definitions", "qualname": "SensorStatus", "kind": "class", "doc": "<p>Status for a sensor.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.SensorStatus.ACQUIRED_NEW_DATA", "modulename": "lakehouse_engine.core.definitions", "qualname": "SensorStatus.ACQUIRED_NEW_DATA", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SensorStatus.ACQUIRED_NEW_DATA: &#x27;ACQUIRED_NEW_DATA&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SensorStatus.PROCESSED_NEW_DATA", "modulename": "lakehouse_engine.core.definitions", "qualname": "SensorStatus.PROCESSED_NEW_DATA", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SensorStatus.PROCESSED_NEW_DATA: &#x27;PROCESSED_NEW_DATA&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SAPLogchain", "modulename": "lakehouse_engine.core.definitions", "qualname": "SAPLogchain", "kind": "class", "doc": "<p>Defaults used on consuming data from SAP Logchain.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.SAPLogchain.DBTABLE", "modulename": "lakehouse_engine.core.definitions", "qualname": "SAPLogchain.DBTABLE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SAPLogchain.DBTABLE: &#x27;SAPPHA.RSPCLOGCHAIN&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SAPLogchain.GREEN_STATUS", "modulename": "lakehouse_engine.core.definitions", "qualname": "SAPLogchain.GREEN_STATUS", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SAPLogchain.GREEN_STATUS: &#x27;G&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.SAPLogchain.ENGINE_TABLE", "modulename": "lakehouse_engine.core.definitions", "qualname": "SAPLogchain.ENGINE_TABLE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SAPLogchain.ENGINE_TABLE: &#x27;sensor_new_data&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.RestoreType", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreType", "kind": "class", "doc": "<p>Archive types.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.RestoreType.BULK", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreType.BULK", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;RestoreType.BULK: &#x27;Bulk&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.RestoreType.STANDARD", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreType.STANDARD", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;RestoreType.STANDARD: &#x27;Standard&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.RestoreType.EXPEDITED", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreType.EXPEDITED", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;RestoreType.EXPEDITED: &#x27;Expedited&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.RestoreType.values", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreType.values", "kind": "function", "doc": "<p>Generates a list containing all enum values.</p>\n\n<p>Return:\n    A list with all enum values.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.definitions.RestoreType.exists", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreType.exists", "kind": "function", "doc": "<p>Checks if the restore type exists in the enum values.</p>\n\n<p>Args:\n    restore_type: restore type to check if exists.</p>\n\n<p>Return:\n    If the restore type exists in our enum.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">restore_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.definitions.RestoreStatus", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreStatus", "kind": "class", "doc": "<p>Archive types.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.core.definitions.RestoreStatus.NOT_STARTED", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreStatus.NOT_STARTED", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;RestoreStatus.NOT_STARTED: &#x27;not_started&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.RestoreStatus.ONGOING", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreStatus.ONGOING", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;RestoreStatus.ONGOING: &#x27;ongoing&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.definitions.RestoreStatus.RESTORED", "modulename": "lakehouse_engine.core.definitions", "qualname": "RestoreStatus.RESTORED", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;RestoreStatus.RESTORED: &#x27;restored&#x27;&gt;"}, {"fullname": "lakehouse_engine.core.exec_env", "modulename": "lakehouse_engine.core.exec_env", "kind": "module", "doc": "<p>Module to take care of creating a singleton of the execution environment class.</p>\n"}, {"fullname": "lakehouse_engine.core.exec_env.ExecEnv", "modulename": "lakehouse_engine.core.exec_env", "qualname": "ExecEnv", "kind": "class", "doc": "<p>Represents the basic resources regarding the engine execution environment.</p>\n\n<p>Currently, it is solely used to encapsulate the logic to get a Spark session.</p>\n"}, {"fullname": "lakehouse_engine.core.exec_env.ExecEnv.get_or_create", "modulename": "lakehouse_engine.core.exec_env", "qualname": "ExecEnv.get_or_create", "kind": "function", "doc": "<p>Get or create an execution environment session (currently Spark).</p>\n\n<p>It instantiates a singleton session that can be accessed anywhere from the\nlakehouse engine.</p>\n\n<p>Args:\n    session: spark session.\n    enable_hive_support: whether to enable hive support or not.\n    app_name: application name.\n    config: extra spark configs to supply to the spark session.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">session</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">session</span><span class=\"o\">.</span><span class=\"n\">SparkSession</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">enable_hive_support</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">app_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">config</span><span class=\"p\">:</span> <span class=\"nb\">dict</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.executable", "modulename": "lakehouse_engine.core.executable", "kind": "module", "doc": "<p>Module representing an executable lakehouse engine component.</p>\n"}, {"fullname": "lakehouse_engine.core.executable.Executable", "modulename": "lakehouse_engine.core.executable", "qualname": "Executable", "kind": "class", "doc": "<p>Abstract class defining the behaviour of an executable component.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.core.executable.Executable.execute", "modulename": "lakehouse_engine.core.executable", "qualname": "Executable.execute", "kind": "function", "doc": "<p>Define the executable component behaviour.</p>\n\n<p>E.g., the behaviour of an algorithm inheriting from this.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager", "modulename": "lakehouse_engine.core.file_manager", "kind": "module", "doc": "<p>File manager module.</p>\n"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager", "kind": "class", "doc": "<p>Set of actions to manipulate files in several ways.</p>\n"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.__init__", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.__init__", "kind": "function", "doc": "<p>Construct FileManager algorithm instances.</p>\n\n<p>Args:\n    configs: configurations for the FileManager algorithm.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">configs</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.get_function", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.get_function", "kind": "function", "doc": "<p>Get a specific function to execute.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.delete_objects", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.delete_objects", "kind": "function", "doc": "<p>Delete objects and 'directories' in s3.</p>\n\n<p>If dry_run is set to True the function will print a dict with all the\npaths that would be deleted based on the given keys.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.copy_objects", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.copy_objects", "kind": "function", "doc": "<p>Copies objects and 'directories' in s3.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.request_restore", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.request_restore", "kind": "function", "doc": "<p>Request the restore of archived data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.check_restore_status", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.check_restore_status", "kind": "function", "doc": "<p>Check the restore status of archived data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.FileManager.request_restore_to_destination_and_wait", "modulename": "lakehouse_engine.core.file_manager", "qualname": "FileManager.request_restore_to_destination_and_wait", "kind": "function", "doc": "<p>Request and wait for the restore to complete, polling the restore status.</p>\n\n<p>After the restore is done, copy the restored files to destination</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.ArchiveFileManager", "modulename": "lakehouse_engine.core.file_manager", "qualname": "ArchiveFileManager", "kind": "class", "doc": "<p>Set of actions to restore archives.</p>\n"}, {"fullname": "lakehouse_engine.core.file_manager.ArchiveFileManager.check_restore_status", "modulename": "lakehouse_engine.core.file_manager", "qualname": "ArchiveFileManager.check_restore_status", "kind": "function", "doc": "<p>Check the restore status of archived data.</p>\n\n<p>Args:\n    source_bucket: name of bucket to check the restore status.\n    source_object: object to check the restore status.</p>\n\n<p>Returns:\n    A dict containing the amount of objects in each status.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">source_bucket</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">source_object</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.ArchiveFileManager.request_restore", "modulename": "lakehouse_engine.core.file_manager", "qualname": "ArchiveFileManager.request_restore", "kind": "function", "doc": "<p>Request the restore of archived data.</p>\n\n<p>Args:\n    source_bucket: name of bucket to perform the restore.\n    source_object: object to be restored.\n    restore_expiration: restore expiration in days.\n    retrieval_tier: type of restore, possible values are:\n        Bulk, Standard or Expedited.\n    dry_run: if dry_run is set to True the function will print a dict with\n        all the paths that would be deleted based on the given keys.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">source_bucket</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">source_object</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">restore_expiration</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">retrieval_tier</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dry_run</span><span class=\"p\">:</span> <span class=\"nb\">bool</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.file_manager.ArchiveFileManager.request_restore_and_wait", "modulename": "lakehouse_engine.core.file_manager", "qualname": "ArchiveFileManager.request_restore_and_wait", "kind": "function", "doc": "<p>Request and wait for the restore to complete, polling the restore status.</p>\n\n<p>Args:\n    source_bucket: name of bucket to perform the restore.\n    source_object: object to be restored.\n    restore_expiration: restore expiration in days.\n    retrieval_tier: type of restore, possible values are:\n        Bulk, Standard or Expedited.\n    dry_run: if dry_run is set to True the function will print a dict with\n        all the paths that would be deleted based on the given keys.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">source_bucket</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">source_object</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">restore_expiration</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">retrieval_tier</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dry_run</span><span class=\"p\">:</span> <span class=\"nb\">bool</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager", "modulename": "lakehouse_engine.core.sensor_manager", "kind": "module", "doc": "<p>Module to define Sensor Manager classes.</p>\n"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorControlTableManager", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorControlTableManager", "kind": "class", "doc": "<p>Class to control the Sensor execution.</p>\n"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorControlTableManager.check_if_sensor_has_acquired_data", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorControlTableManager.check_if_sensor_has_acquired_data", "kind": "function", "doc": "<p>Check if sensor has acquired new data.</p>\n\n<p>Args:\n    sensor_id: sensor id.\n    control_db_table_name: db.table to control sensor runs.</p>\n\n<p>Returns:\n    True if acquired new data, otherwise False</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorControlTableManager.update_sensor_status", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorControlTableManager.update_sensor_status", "kind": "function", "doc": "<p>Control sensor execution storing the execution data in a delta table.</p>\n\n<p>Args:\n    sensor_spec: sensor spec containing all sensor\n        information we need to update the control status.\n    status: status of the sensor.\n    upstream_key: upstream key (e.g., used to store an attribute\n        name from the upstream so that new data can be detected\n        automatically).\n    upstream_value: upstream value (e.g., used to store the max\n        attribute value from the upstream so that new data can be\n        detected automatically).</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">sensor_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">SensorSpec</span>,</span><span class=\"param\">\t<span class=\"n\">status</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_key</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_value</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorControlTableManager.read_sensor_table_data", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorControlTableManager.read_sensor_table_data", "kind": "function", "doc": "<p>Read data from delta table containing sensor status info.</p>\n\n<p>Args:\n    sensor_id: sensor id. If this parameter is defined search occurs\n        only considering this parameter. Otherwise, it considers sensor\n        assets and checkpoint location.\n    control_db_table_name: db.table to control sensor runs.\n    assets: list of assets that are fueled by the pipeline\n        where this sensor is.</p>\n\n<p>Return:\n    Row containing the data for the provided sensor_id.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">assets</span><span class=\"p\">:</span> <span class=\"nb\">list</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">Row</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorUpstreamManager", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorUpstreamManager", "kind": "class", "doc": "<p>Class to deal with Sensor Upstream data.</p>\n"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorUpstreamManager.generate_filter_exp_query", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorUpstreamManager.generate_filter_exp_query", "kind": "function", "doc": "<p>Generates a sensor preprocess query based on timestamp logic.</p>\n\n<p>Args:\n    sensor_id: sensor id.\n    filter_exp: expression to filter incoming new data.\n        You can use the placeholder <code>?upstream_value</code> so that\n        it can be replaced by the upstream_value in the\n        control_db_table_name for this specific sensor_id.\n    control_db_table_name: db.table to retrieve the last status change\n        timestamp. This is only relevant for the jdbc sensor.\n    upstream_key: the key of custom sensor information\n        to control how to identify new data from the\n        upstream (e.g., a time column in the upstream).\n    upstream_value: value for custom sensor\n        to identify new data from the upstream\n        (e.g., the value of a time present in the upstream)\n        If none we will set the default value.\n        Note: This parameter is used just to override the\n        default value <code>-2147483647</code>.\n    upstream_table_name: value for custom sensor\n        to query new data from the upstream.\n        If none we will set the default value,\n        our <code>sensor_new_data</code> view.</p>\n\n<p>Return:\n    The query string.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">filter_exp</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_key</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_value</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorUpstreamManager.generate_sensor_table_preprocess_query", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorUpstreamManager.generate_sensor_table_preprocess_query", "kind": "function", "doc": "<p>Generates a query to be used for a sensor having other sensor as upstream.</p>\n\n<p>Args:\n    sensor_id: sensor id.</p>\n\n<p>Return:\n    The query string.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorUpstreamManager.read_new_data", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorUpstreamManager.read_new_data", "kind": "function", "doc": "<p>Read new data from the upstream into the sensor 'new_data_df'.</p>\n\n<p>Args:\n    sensor_spec: sensor spec containing all sensor information.</p>\n\n<p>Return:\n    An empty dataframe if it doesn't have new data otherwise the new data</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">sensor_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">SensorSpec</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorUpstreamManager.get_new_data", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorUpstreamManager.get_new_data", "kind": "function", "doc": "<p>Get new data from upstream df if it's present.</p>\n\n<p>Args:\n    new_data_df: DataFrame possibly containing new data.</p>\n\n<p>Return:\n    Optional row, present if there is new data in the upstream,\n    absent otherwise.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">new_data_df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">Row</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.sensor_manager.SensorUpstreamManager.generate_sensor_sap_logchain_query", "modulename": "lakehouse_engine.core.sensor_manager", "qualname": "SensorUpstreamManager.generate_sensor_sap_logchain_query", "kind": "function", "doc": "<p>Generates a sensor query based in the SAP Logchain table.</p>\n\n<p>Args:\n    chain_id: chain id to query the status on SAP.\n    dbtable: db.table to retrieve the data to\n        check if the sap chain is already finished.\n    status: db.table to retrieve the last status change\n        timestamp.\n    engine_table_name: table name exposed with the SAP LOGCHAIN data.\n        This table will be used in the jdbc query.</p>\n\n<p>Return:\n    The query string.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">chain_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dbtable</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;SAPPHA.RSPCLOGCHAIN&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">status</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;G&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">engine_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;sensor_new_data&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager", "modulename": "lakehouse_engine.core.table_manager", "kind": "module", "doc": "<p>Table manager module.</p>\n"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager", "kind": "class", "doc": "<p>Set of actions to manipulate tables/views in several ways.</p>\n"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.__init__", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.__init__", "kind": "function", "doc": "<p>Construct TableManager algorithm instances.</p>\n\n<p>Args:\n    configs: configurations for the TableManager algorithm.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">configs</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span>)</span>"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.get_function", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.get_function", "kind": "function", "doc": "<p>Get a specific function to execute.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.create", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.create", "kind": "function", "doc": "<p>Create a new table or view on metastore.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.create_many", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.create_many", "kind": "function", "doc": "<p>Create multiple tables or views on metastore.</p>\n\n<p>In this function the path to the ddl files can be separated by comma.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.compute_table_statistics", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.compute_table_statistics", "kind": "function", "doc": "<p>Compute table statistics.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.drop_table", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.drop_table", "kind": "function", "doc": "<p>Delete table function deletes table from metastore and erases all data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.drop_view", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.drop_view", "kind": "function", "doc": "<p>Delete view function deletes view from metastore and erases all data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.truncate", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.truncate", "kind": "function", "doc": "<p>Truncate function erases all data but keeps metadata.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.vacuum", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.vacuum", "kind": "function", "doc": "<p>Vacuum function erases older versions from Delta Lake tables or locations.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.describe", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.describe", "kind": "function", "doc": "<p>Describe function describes metadata from some table or view.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.optimize", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.optimize", "kind": "function", "doc": "<p>Optimize function optimizes the layout of Delta Lake data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.execute_multiple_sql_files", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.execute_multiple_sql_files", "kind": "function", "doc": "<p>Execute multiple statements in multiple sql files.</p>\n\n<p>In this function the path to the files is separated by comma.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.execute_sql", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.execute_sql", "kind": "function", "doc": "<p>Execute sql commands separated by semicolon (;).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.show_tbl_properties", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.show_tbl_properties", "kind": "function", "doc": "<p>Show Table Properties.</p>\n\n<p>Returns: a dataframe with the table properties.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.get_tbl_pk", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.get_tbl_pk", "kind": "function", "doc": "<p>Get the primary key of a particular table.</p>\n\n<p>Returns: the list of columns that are part of the primary key.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.repair_table", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.repair_table", "kind": "function", "doc": "<p>Run the repair table command.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.core.table_manager.TableManager.delete_where", "modulename": "lakehouse_engine.core.table_manager", "qualname": "TableManager.delete_where", "kind": "function", "doc": "<p>Run the delete where command.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.dq_processors", "modulename": "lakehouse_engine.dq_processors", "kind": "module", "doc": "<p>Package to define data quality processes available in the lakehouse engine.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.assistant", "modulename": "lakehouse_engine.dq_processors.assistant", "kind": "module", "doc": "<p>Module containing the definition of a data assistant.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.assistant.Assistant", "modulename": "lakehouse_engine.dq_processors.assistant", "qualname": "Assistant", "kind": "class", "doc": "<p>Class containing the data assistant.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.assistant.Assistant.run_data_assistant", "modulename": "lakehouse_engine.dq_processors.assistant", "qualname": "Assistant.run_data_assistant", "kind": "function", "doc": "<p>Entrypoint to run the data assistant.</p>\n\n<p>Based on the data, it uses GE Onboarding Data Assistant to generate expectations\nthat can be applied to the data. Then, it returns the generated expectations\nand, depending on your configuration, it can display plots of the metrics,\nexpectations and also display or store the profiling of the data, for you to get\na better sense of it.</p>\n\n<p>Args:\n    context: the BaseDataContext containing the configurations for the data\n    source and store backend.\n    batch_request: batch request to be able to query underlying data.\n    expectation_suite_name: name of the expectation suite.\n    assistant_options: additional options to pass to the DQ assistant processor.\n    data: the input dataframe for which the DQ is running.\n    profile_file_name: file name for storing the profiling html file.</p>\n\n<p>Returns:\n    The context with the expectation suite stored.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">context</span><span class=\"p\">:</span> <span class=\"o\">&lt;</span><span class=\"n\">function</span> <span class=\"n\">BaseDataContext</span><span class=\"o\">&gt;</span>,</span><span class=\"param\">\t<span class=\"n\">batch_request</span><span class=\"p\">:</span> <span class=\"n\">great_expectations</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">batch</span><span class=\"o\">.</span><span class=\"n\">RuntimeBatchRequest</span>,</span><span class=\"param\">\t<span class=\"n\">expectation_suite_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">assistant_options</span><span class=\"p\">:</span> <span class=\"nb\">dict</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">profile_file_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations", "modulename": "lakehouse_engine.dq_processors.custom_expectations", "kind": "module", "doc": "<p>Package containing custom DQ expectations available in the lakehouse engine.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_column_pair_a_to_be_smaller_or_equal_than_b", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_column_pair_a_to_be_smaller_or_equal_than_b", "kind": "module", "doc": "<p>Expectation to check if column 'a' is lower or equal than column 'b'.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_column_pair_a_to_be_smaller_or_equal_than_b.ColumnPairCustom", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_column_pair_a_to_be_smaller_or_equal_than_b", "qualname": "ColumnPairCustom", "kind": "class", "doc": "<p>Asserts that column 'A' is lower or equal than column 'B'.</p>\n\n<p>Additionally, the 'margin' parameter can be used to add a margin to the\ncheck between column 'A' and 'B': 'A' &lt;= 'B' + 'margin'.</p>\n", "bases": "great_expectations.expectations.metrics.map_metric_provider.column_pair_map_metric_provider.ColumnPairMapMetricProvider"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_column_pair_a_to_be_smaller_or_equal_than_b.ExpectColumnPairAToBeSmallerOrEqualThanB", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_column_pair_a_to_be_smaller_or_equal_than_b", "qualname": "ExpectColumnPairAToBeSmallerOrEqualThanB", "kind": "class", "doc": "<p>Expect values in column A to be lower or equal than column B.</p>\n\n<p>Args:\n    column_A: The first column name.\n    column_B: The second column name.\n    margin: additional approximation to column B value.</p>\n\n<p>Keyword Args:\n    allow_cross_type_comparisons: If True, allow\n        comparisons between types (e.g. integer and string).\n        Otherwise, attempting such comparisons will raise an exception.\n    ignore_row_if: \"both_values_are_missing\",\n        \"either_value_is_missing\", \"neither\" (default).\n    result_format: Which output mode to use:\n        <code>BOOLEAN_ONLY</code>, <code>BASIC</code> (default), <code>COMPLETE</code>, or <code>SUMMARY</code>.\n    include_config: If True (default), then include the expectation config\n        as part of the result object.\n    catch_exceptions: If True, then catch exceptions and\n        include them as part of the result object. Default: False.\n    meta: A JSON-serializable dictionary (nesting allowed)\n        that will be included in the output without modification.</p>\n\n<p>Returns:\n    An ExpectationSuiteValidationResult.</p>\n", "bases": "great_expectations.expectations.expectation.ColumnPairMapExpectation"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_column_values_to_be_date_not_older_than", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_column_values_to_be_date_not_older_than", "kind": "module", "doc": "<p>Expectation to check if column value is a date within a timeframe.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_column_values_to_be_date_not_older_than.ColumnValuesDateNotOlderThan", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_column_values_to_be_date_not_older_than", "qualname": "ColumnValuesDateNotOlderThan", "kind": "class", "doc": "<p>Asserts that column values are a date that isn't older than a given date.</p>\n", "bases": "great_expectations.expectations.metrics.map_metric_provider.column_map_metric_provider.ColumnMapMetricProvider"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_column_values_to_be_date_not_older_than.ExpectColumnValuesToBeDateNotOlderThan", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_column_values_to_be_date_not_older_than", "qualname": "ExpectColumnValuesToBeDateNotOlderThan", "kind": "class", "doc": "<p>Expect value in column to be date that is not older than a given time.</p>\n\n<p>Since timedelta can only define an interval up to weeks, a month is defined\nas 4 weeks and a year is defined as 52 weeks.</p>\n\n<p>Args:\n    column: Name of column to validate\n    Note: Column must be of type Date, Timestamp or String (with Timestamp format).\n    Format: yyyy-MM-ddTHH:mm:ss\n    timeframe: dict with the definition of the timeframe.\n    kwargs: dict with additional parameters.</p>\n\n<p>Keyword Args:\n    allow_cross_type_comparisons: If True, allow\n        comparisons between types (e.g. integer and string).\n        Otherwise, attempting such comparisons will raise an exception.\n    ignore_row_if: \"both_values_are_missing\",\n        \"either_value_is_missing\", \"neither\" (default).\n    result_format: Which output mode to use:\n        <code>BOOLEAN_ONLY</code>, <code>BASIC</code> (default), <code>COMPLETE</code>, or <code>SUMMARY</code>.\n    include_config: If True (default), then include the expectation config\n        as part of the result object.\n    catch_exceptions: If True, then catch exceptions and\n        include them as part of the result object. Default: False.\n    meta: A JSON-serializable dictionary (nesting allowed)\n        that will be included in the output without modification.</p>\n\n<p>Returns:\n    An ExpectationSuiteValidationResult.</p>\n", "bases": "great_expectations.expectations.expectation.ColumnMapExpectation"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_multicolumn_column_a_must_equal_b_or_c", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_multicolumn_column_a_must_equal_b_or_c", "kind": "module", "doc": "<p>Expectation to check if column 'a' equals 'b', or 'c'.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_multicolumn_column_a_must_equal_b_or_c.MulticolumnCustomMetric", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_multicolumn_column_a_must_equal_b_or_c", "qualname": "MulticolumnCustomMetric", "kind": "class", "doc": "<p>Expectation metric definition.</p>\n\n<p>This expectation asserts that column 'a' must equal to column 'b' or column 'c'.\nIn addition to this it is possible to validate that column 'b' or 'c' match a regex.</p>\n", "bases": "great_expectations.expectations.metrics.map_metric_provider.multicolumn_map_metric_provider.MulticolumnMapMetricProvider"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_multicolumn_column_a_must_equal_b_or_c.ExpectMulticolumnColumnAMustEqualBOrC", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_multicolumn_column_a_must_equal_b_or_c", "qualname": "ExpectMulticolumnColumnAMustEqualBOrC", "kind": "class", "doc": "<p>MultiColumn Expectation.</p>\n\n<p>Expect that the column 'a' is equal to 'b' when this is\nnot empty; otherwise 'a' must be equal to 'c'.</p>\n\n<p>Args:\n    column_list: The column names to evaluate.</p>\n\n<p>Keyword Args:\n    ignore_row_if: default to \"never\".\n    result_format:  Which output mode to use:\n       <code>BOOLEAN_ONLY</code>, <code>BASIC</code>, <code>COMPLETE</code>, or <code>SUMMARY</code>.\n       Default set to <code>BASIC</code>.\n    include_config: If True, then include the expectation\n       config as part of the result object.\n       Default set to True.\n    catch_exceptions: If True, then catch exceptions\n       and include them as part of the result object.\n       Default set to False.</p>\n\n<p>Returns:\n    An ExpectationSuiteValidationResult.</p>\n", "bases": "great_expectations.expectations.expectation.MulticolumnMapExpectation"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_queried_column_agg_value_to_be", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_queried_column_agg_value_to_be", "kind": "module", "doc": "<p>Expectation to check if aggregated column satisfy the condition.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_queried_column_agg_value_to_be.ExpectQueriedColumnAggValueToBe", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_queried_column_agg_value_to_be", "qualname": "ExpectQueriedColumnAggValueToBe", "kind": "class", "doc": "<p>Expect agg of column to satisfy the condition specified.</p>\n\n<p>Args:\n    template_dict: dict with the following keys:\n        column (column to check sum).\n        group_column_list (group by column names to be listed).\n        condition (how to validate the aggregated value eg: between,\n        greater, lesser).\n        max_value (maximum allowed value).\n        min_value (minimum allowed value).\n        agg_type (sum/count/max/min).</p>\n", "bases": "great_expectations.expectations.expectation.QueryExpectation"}, {"fullname": "lakehouse_engine.dq_processors.custom_expectations.expect_queried_column_agg_value_to_be.ExpectQueriedColumnAggValueToBe.validate_configuration", "modulename": "lakehouse_engine.dq_processors.custom_expectations.expect_queried_column_agg_value_to_be", "qualname": "ExpectQueriedColumnAggValueToBe.validate_configuration", "kind": "function", "doc": "<p>Validates that a configuration has been set.</p>\n\n<p>Args:\n    configuration (OPTIONAL[ExpectationConfiguration]):\n    An optional Expectation Configuration entry.</p>\n\n<p>Returns:\n    None. Raises InvalidExpectationConfigurationError</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">configuration</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">great_expectations</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">expectation_configuration</span><span class=\"o\">.</span><span class=\"n\">ExpectationConfiguration</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.dq_processors.dq_factory", "modulename": "lakehouse_engine.dq_processors.dq_factory", "kind": "module", "doc": "<p>Module containing the class definition of the Data Quality Factory.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.dq_factory.DQFactory", "modulename": "lakehouse_engine.dq_processors.dq_factory", "qualname": "DQFactory", "kind": "class", "doc": "<p>Class for the Data Quality Factory.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.dq_factory.DQFactory.run_dq_process", "modulename": "lakehouse_engine.dq_processors.dq_factory", "qualname": "DQFactory.run_dq_process", "kind": "function", "doc": "<p>Run the specified data quality process on a dataframe.</p>\n\n<p>Based on the dq_specs we apply the defined expectations on top of the dataframe\nin order to apply the necessary validations and then output the result of\nthe data quality process.</p>\n\n<p>Args:\n    dq_spec: data quality specification.\n    data: input dataframe to run the dq process on.</p>\n\n<p>Returns:\n    The DataFrame containing the results of the DQ process.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">dq_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQSpec</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.dq_processors.exceptions", "modulename": "lakehouse_engine.dq_processors.exceptions", "kind": "module", "doc": "<p>Package defining all the DQ custom exceptions.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.exceptions.DQValidationsFailedException", "modulename": "lakehouse_engine.dq_processors.exceptions", "qualname": "DQValidationsFailedException", "kind": "class", "doc": "<p>Exception for when the data quality validations fail.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.dq_processors.exceptions.DQCheckpointsResultsException", "modulename": "lakehouse_engine.dq_processors.exceptions", "qualname": "DQCheckpointsResultsException", "kind": "class", "doc": "<p>Exception for when the checkpoint results parsing fail.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.dq_processors.validator", "modulename": "lakehouse_engine.dq_processors.validator", "kind": "module", "doc": "<p>Module containing the definition of a data quality validator.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.validator.Validator", "modulename": "lakehouse_engine.dq_processors.validator", "qualname": "Validator", "kind": "class", "doc": "<p>Class containing the data quality validator.</p>\n"}, {"fullname": "lakehouse_engine.dq_processors.validator.Validator.get_dq_validator", "modulename": "lakehouse_engine.dq_processors.validator", "qualname": "Validator.get_dq_validator", "kind": "function", "doc": "<p>Get a validator according to the specification.</p>\n\n<p>We use getattr to dynamically execute any expectation available.\ngetattr(validator, function) is similar to validator.function(). With this\napproach, we can execute any expectation supported.</p>\n\n<p>Args:\n    context: the BaseDataContext containing the configurations for the data\n    source and store backend.\n    batch_request: run time batch request to be able to query underlying data.\n    expectation_suite_name: name of the expectation suite.\n    dq_functions: a list of DQFunctionSpec to consider in the expectation suite.\n    critical_functions: list of critical expectations in the expectation suite.</p>\n\n<p>Returns:\n    The validator with the expectation suite stored.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">context</span><span class=\"p\">:</span> <span class=\"o\">&lt;</span><span class=\"n\">function</span> <span class=\"n\">BaseDataContext</span><span class=\"o\">&gt;</span>,</span><span class=\"param\">\t<span class=\"n\">batch_request</span><span class=\"p\">:</span> <span class=\"n\">great_expectations</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">batch</span><span class=\"o\">.</span><span class=\"n\">RuntimeBatchRequest</span>,</span><span class=\"param\">\t<span class=\"n\">expectation_suite_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dq_functions</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQFunctionSpec</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">critical_functions</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQFunctionSpec</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.dq_processors.validator.Validator.tag_source_with_dq", "modulename": "lakehouse_engine.dq_processors.validator", "qualname": "Validator.tag_source_with_dq", "kind": "function", "doc": "<p>Tags the source dataframe with a new column having the DQ results.</p>\n\n<p>Args:\n    source_pk: the primary key of the source data.\n    source_df: the source dataframe to be tagged with DQ results.\n    results_df: dq results dataframe.</p>\n\n<p>Returns: a dataframe tagged with the DQ results.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">source_pk</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">source_df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">results_df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine", "modulename": "lakehouse_engine.engine", "kind": "module", "doc": "<p>Contract of the lakehouse engine with all the available functions to be executed.</p>\n"}, {"fullname": "lakehouse_engine.engine.load_data", "modulename": "lakehouse_engine.engine", "qualname": "load_data", "kind": "function", "doc": "<p>Load data using the DataLoader algorithm.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks or other\n        apps).</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">OrderedDict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.execute_reconciliation", "modulename": "lakehouse_engine.engine", "qualname": "execute_reconciliation", "kind": "function", "doc": "<p>Execute the Reconciliator algorithm.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks or other\n        apps).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>, </span><span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.execute_dq_validation", "modulename": "lakehouse_engine.engine", "qualname": "execute_dq_validation", "kind": "function", "doc": "<p>Execute the DQValidator algorithm.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks or other\n        apps).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>, </span><span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.manage_table", "modulename": "lakehouse_engine.engine", "qualname": "manage_table", "kind": "function", "doc": "<p>Manipulate tables/views using Table Manager algorithm.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks\n        or other apps).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>, </span><span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.manage_files", "modulename": "lakehouse_engine.engine", "qualname": "manage_files", "kind": "function", "doc": "<p>Manipulate s3 files using File Manager algorithm.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks\n        or other apps).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>, </span><span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.execute_sensor", "modulename": "lakehouse_engine.engine", "qualname": "execute_sensor", "kind": "function", "doc": "<p>Execute a sensor based on a Sensor Algorithm Configuration.</p>\n\n<p>A sensor is useful to check if an upstream system has new data.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks\n        or other apps).</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>, </span><span class=\"param\"><span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.update_sensor_status", "modulename": "lakehouse_engine.engine", "qualname": "update_sensor_status", "kind": "function", "doc": "<p>Update internal sensor status.</p>\n\n<p>Update the sensor status in the control table,\nit should be used to tell the system\nthat the sensor has processed all new data that was previously identified,\nhence updating the shifted sensor status.\nUsually used to move from <code>SensorStatus.ACQUIRED_NEW_DATA</code> to\n<code>SensorStatus.PROCESSED_NEW_DATA</code>,\nbut there might be scenarios - still to identify -\nwhere we can update the sensor status from/to different statuses.</p>\n\n<p>Args:\n    sensor_id: sensor id.\n    control_db_table_name: db.table to store sensor checkpoints.\n    status: status of the sensor.\n    assets: a list of assets that are considered as available to\n        consume downstream after this sensor has status\n        PROCESSED_NEW_DATA.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">status</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;PROCESSED_NEW_DATA&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">assets</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.generate_sensor_query", "modulename": "lakehouse_engine.engine", "qualname": "generate_sensor_query", "kind": "function", "doc": "<p>Generates a preprocess query to be used in a sensor configuration.</p>\n\n<p>Args:\n    sensor_id: sensor id.\n    filter_exp: expression to filter incoming new data.\n        You can use the placeholder ?default_upstream_key and\n        ?default_upstream_value, so that it can be replaced by the\n        respective values in the control_db_table_name for this specific\n        sensor_id.\n    control_db_table_name: db.table to retrieve the last status change\n        timestamp. This is only relevant for the jdbc sensor.\n    upstream_key: the key of custom sensor information to control how to\n        identify new data from the upstream (e.g., a time column in the\n        upstream).\n    upstream_value: the upstream value\n        to identify new data from the upstream (e.g., the value of a time\n        present in the upstream).\n    upstream_table_name: value for custom sensor\n            to query new data from the upstream\n            If none we will set the default value,\n            our <code>sensor_new_data</code> view.</p>\n\n<p>Return:\n    The query string.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">filter_exp</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_key</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_value</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upstream_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.generate_sensor_sap_logchain_query", "modulename": "lakehouse_engine.engine", "qualname": "generate_sensor_sap_logchain_query", "kind": "function", "doc": "<p>Generates a sensor query based in the SAP Logchain table.</p>\n\n<p>Args:\n    chain_id: chain id to query the status on SAP.\n    dbtable: db.table to retrieve the data to\n            check if the sap chain is already finished.\n    status: db.table to retrieve the last status change\n            timestamp.\n    engine_table_name: table name exposed with the SAP LOGCHAIN data.\n            This table will be used in the jdbc query.</p>\n\n<p>Return:\n    The query string.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">chain_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dbtable</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;SAPPHA.RSPCLOGCHAIN&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">status</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;G&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">engine_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;sensor_new_data&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.engine.send_notification", "modulename": "lakehouse_engine.engine", "qualname": "send_notification", "kind": "function", "doc": "<p>Send a notification using a notifier.</p>\n\n<p>Args:\n    args: arguments for the notifier.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">args</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io", "modulename": "lakehouse_engine.io", "kind": "module", "doc": "<p>Input and Output package responsible for the behaviour of reading and writing.</p>\n"}, {"fullname": "lakehouse_engine.io.exceptions", "modulename": "lakehouse_engine.io.exceptions", "kind": "module", "doc": "<p>Package defining all the io custom exceptions.</p>\n"}, {"fullname": "lakehouse_engine.io.exceptions.IncrementalFilterInputNotFoundException", "modulename": "lakehouse_engine.io.exceptions", "qualname": "IncrementalFilterInputNotFoundException", "kind": "class", "doc": "<p>Exception for when the input of an incremental filter is not found.</p>\n\n<p>This may occur when tables are being loaded in incremental way, taking the increment\ndefinition out of a specific table, but the table still does not exist, mainly\nbecause probably it was not loaded for the first time yet.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.io.exceptions.WrongIOFormatException", "modulename": "lakehouse_engine.io.exceptions", "qualname": "WrongIOFormatException", "kind": "class", "doc": "<p>Exception for when a user provides a wrong I/O format.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.io.exceptions.NotSupportedException", "modulename": "lakehouse_engine.io.exceptions", "qualname": "NotSupportedException", "kind": "class", "doc": "<p>Exception for when a user provides a not supported operation.</p>\n", "bases": "builtins.RuntimeError"}, {"fullname": "lakehouse_engine.io.reader", "modulename": "lakehouse_engine.io.reader", "kind": "module", "doc": "<p>Defines abstract reader behaviour.</p>\n"}, {"fullname": "lakehouse_engine.io.reader.Reader", "modulename": "lakehouse_engine.io.reader", "qualname": "Reader", "kind": "class", "doc": "<p>Abstract Reader class.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.io.reader.Reader.__init__", "modulename": "lakehouse_engine.io.reader", "qualname": "Reader.__init__", "kind": "function", "doc": "<p>Construct Reader instances.</p>\n\n<p>Args:\n    input_spec: input specification for reading data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.reader.Reader.read", "modulename": "lakehouse_engine.io.reader", "qualname": "Reader.read", "kind": "function", "doc": "<p>Abstract read method.</p>\n\n<p>Returns:\n    A dataframe read according to the input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.reader_factory", "modulename": "lakehouse_engine.io.reader_factory", "kind": "module", "doc": "<p>Module for reader factory.</p>\n"}, {"fullname": "lakehouse_engine.io.reader_factory.ReaderFactory", "modulename": "lakehouse_engine.io.reader_factory", "qualname": "ReaderFactory", "kind": "class", "doc": "<p>Class for reader factory.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.io.reader_factory.ReaderFactory.get_data", "modulename": "lakehouse_engine.io.reader_factory", "qualname": "ReaderFactory.get_data", "kind": "function", "doc": "<p>Get data according to the input specification following a factory pattern.</p>\n\n<p>Args:\n    spec: input specification to get the data.</p>\n\n<p>Returns:\n    A dataframe containing the data.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers", "modulename": "lakehouse_engine.io.readers", "kind": "module", "doc": "<p>Readers package to define reading behaviour.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.dataframe_reader", "modulename": "lakehouse_engine.io.readers.dataframe_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from dataframes.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.dataframe_reader.DataFrameReader", "modulename": "lakehouse_engine.io.readers.dataframe_reader", "qualname": "DataFrameReader", "kind": "class", "doc": "<p>Class to read data from a dataframe.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.dataframe_reader.DataFrameReader.__init__", "modulename": "lakehouse_engine.io.readers.dataframe_reader", "qualname": "DataFrameReader.__init__", "kind": "function", "doc": "<p>Construct DataFrameReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.dataframe_reader.DataFrameReader.read", "modulename": "lakehouse_engine.io.readers.dataframe_reader", "qualname": "DataFrameReader.read", "kind": "function", "doc": "<p>Read data from a dataframe.</p>\n\n<p>Returns:\n    A dataframe containing the data from a dataframe previously\n    computed.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.file_reader", "modulename": "lakehouse_engine.io.readers.file_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from files.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.file_reader.FileReader", "modulename": "lakehouse_engine.io.readers.file_reader", "qualname": "FileReader", "kind": "class", "doc": "<p>Class to read from files.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.file_reader.FileReader.__init__", "modulename": "lakehouse_engine.io.readers.file_reader", "qualname": "FileReader.__init__", "kind": "function", "doc": "<p>Construct FileReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.file_reader.FileReader.read", "modulename": "lakehouse_engine.io.readers.file_reader", "qualname": "FileReader.read", "kind": "function", "doc": "<p>Read file data.</p>\n\n<p>Returns:\n    A dataframe containing the data from the files.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.jdbc_reader", "modulename": "lakehouse_engine.io.readers.jdbc_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from JDBC sources.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.jdbc_reader.JDBCReader", "modulename": "lakehouse_engine.io.readers.jdbc_reader", "qualname": "JDBCReader", "kind": "class", "doc": "<p>Class to read from JDBC source.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.jdbc_reader.JDBCReader.__init__", "modulename": "lakehouse_engine.io.readers.jdbc_reader", "qualname": "JDBCReader.__init__", "kind": "function", "doc": "<p>Construct JDBCReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.jdbc_reader.JDBCReader.read", "modulename": "lakehouse_engine.io.readers.jdbc_reader", "qualname": "JDBCReader.read", "kind": "function", "doc": "<p>Read data from JDBC source.</p>\n\n<p>Returns:\n    A dataframe containing the data from the JDBC source.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.kafka_reader", "modulename": "lakehouse_engine.io.readers.kafka_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from Kafka.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.kafka_reader.KafkaReader", "modulename": "lakehouse_engine.io.readers.kafka_reader", "qualname": "KafkaReader", "kind": "class", "doc": "<p>Class to read from Kafka.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.kafka_reader.KafkaReader.__init__", "modulename": "lakehouse_engine.io.readers.kafka_reader", "qualname": "KafkaReader.__init__", "kind": "function", "doc": "<p>Construct KafkaReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.kafka_reader.KafkaReader.read", "modulename": "lakehouse_engine.io.readers.kafka_reader", "qualname": "KafkaReader.read", "kind": "function", "doc": "<p>Read Kafka data.</p>\n\n<p>Returns:\n    A dataframe containing the data from Kafka.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.query_reader", "modulename": "lakehouse_engine.io.readers.query_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from a query.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.query_reader.QueryReader", "modulename": "lakehouse_engine.io.readers.query_reader", "qualname": "QueryReader", "kind": "class", "doc": "<p>Class to read data from a query.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.query_reader.QueryReader.__init__", "modulename": "lakehouse_engine.io.readers.query_reader", "qualname": "QueryReader.__init__", "kind": "function", "doc": "<p>Construct QueryReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.query_reader.QueryReader.read", "modulename": "lakehouse_engine.io.readers.query_reader", "qualname": "QueryReader.read", "kind": "function", "doc": "<p>Read data from a query.</p>\n\n<p>Returns:\n    A dataframe containing the data from the query.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.sap_b4_reader", "modulename": "lakehouse_engine.io.readers.sap_b4_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from SAP B4 sources.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.sap_b4_reader.SAPB4Reader", "modulename": "lakehouse_engine.io.readers.sap_b4_reader", "qualname": "SAPB4Reader", "kind": "class", "doc": "<p>Class to read from SAP B4 source.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.sap_b4_reader.SAPB4Reader.__init__", "modulename": "lakehouse_engine.io.readers.sap_b4_reader", "qualname": "SAPB4Reader.__init__", "kind": "function", "doc": "<p>Construct SAPB4Reader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.sap_b4_reader.SAPB4Reader.read", "modulename": "lakehouse_engine.io.readers.sap_b4_reader", "qualname": "SAPB4Reader.read", "kind": "function", "doc": "<p>Read data from SAP B4 source.</p>\n\n<p>Returns:\n    A dataframe containing the data from the SAP B4 source.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.sap_bw_reader", "modulename": "lakehouse_engine.io.readers.sap_bw_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from SAP BW sources.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.sap_bw_reader.SAPBWReader", "modulename": "lakehouse_engine.io.readers.sap_bw_reader", "qualname": "SAPBWReader", "kind": "class", "doc": "<p>Class to read from SAP BW source.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.sap_bw_reader.SAPBWReader.__init__", "modulename": "lakehouse_engine.io.readers.sap_bw_reader", "qualname": "SAPBWReader.__init__", "kind": "function", "doc": "<p>Construct SAPBWReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.sap_bw_reader.SAPBWReader.read", "modulename": "lakehouse_engine.io.readers.sap_bw_reader", "qualname": "SAPBWReader.read", "kind": "function", "doc": "<p>Read data from SAP BW source.</p>\n\n<p>Returns:\n    A dataframe containing the data from the SAP BW source.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.sftp_reader", "modulename": "lakehouse_engine.io.readers.sftp_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from SFTP.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.sftp_reader.SFTPReader", "modulename": "lakehouse_engine.io.readers.sftp_reader", "qualname": "SFTPReader", "kind": "class", "doc": "<p>Class to read from SFTP.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.sftp_reader.SFTPReader.__init__", "modulename": "lakehouse_engine.io.readers.sftp_reader", "qualname": "SFTPReader.__init__", "kind": "function", "doc": "<p>Construct SFTPReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.sftp_reader.SFTPReader.read", "modulename": "lakehouse_engine.io.readers.sftp_reader", "qualname": "SFTPReader.read", "kind": "function", "doc": "<p>Read SFTP data.</p>\n\n<p>Returns:\n    A dataframe containing the data from SFTP.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.readers.table_reader", "modulename": "lakehouse_engine.io.readers.table_reader", "kind": "module", "doc": "<p>Module to define behaviour to read from tables.</p>\n"}, {"fullname": "lakehouse_engine.io.readers.table_reader.TableReader", "modulename": "lakehouse_engine.io.readers.table_reader", "qualname": "TableReader", "kind": "class", "doc": "<p>Class to read data from a table.</p>\n", "bases": "lakehouse_engine.io.reader.Reader"}, {"fullname": "lakehouse_engine.io.readers.table_reader.TableReader.__init__", "modulename": "lakehouse_engine.io.readers.table_reader", "qualname": "TableReader.__init__", "kind": "function", "doc": "<p>Construct TableReader instances.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.readers.table_reader.TableReader.read", "modulename": "lakehouse_engine.io.readers.table_reader", "qualname": "TableReader.read", "kind": "function", "doc": "<p>Read data from a table.</p>\n\n<p>Returns:\n    A dataframe containing the data from the table.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writer", "modulename": "lakehouse_engine.io.writer", "kind": "module", "doc": "<p>Defines abstract writer behaviour.</p>\n"}, {"fullname": "lakehouse_engine.io.writer.Writer", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer", "kind": "class", "doc": "<p>Abstract Writer class.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.io.writer.Writer.__init__", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer.__init__", "kind": "function", "doc": "<p>Construct Writer instances.</p>\n\n<p>Args:\n    output_spec: output specification to write data.\n    df: dataframe to write.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writer.Writer.write", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer.write", "kind": "function", "doc": "<p>Abstract write method.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">OrderedDict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writer.Writer.write_transformed_micro_batch", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer.write_transformed_micro_batch", "kind": "function", "doc": "<p>Define how to write a streaming micro batch after transforming it.</p>\n\n<p>This function must define an inner function that manipulates a streaming batch,\nand then return that function. Look for concrete implementations of this\nfunction for more clarity.</p>\n\n<p>Args:\n    kwargs: any keyword arguments.</p>\n\n<p>Returns:\n    A function to be executed in the foreachBatch spark write method.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"o\">**</span><span class=\"n\">kwargs</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writer.Writer.get_transformed_micro_batch", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer.get_transformed_micro_batch", "kind": "function", "doc": "<p>Get the result of the transformations applied to a micro batch dataframe.</p>\n\n<p>Args:\n    output_spec: output specification associated with the writer.\n    batch_df: batch dataframe (given from streaming foreachBatch).\n    batch_id: if of the batch (given from streaming foreachBatch).\n    data: list of all dfs generated on previous steps before writer\n    to be available on micro batch transforms.</p>\n\n<p>Returns:\n    The transformed dataframe.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">batch_df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">batch_id</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writer.Writer.get_streaming_trigger", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer.get_streaming_trigger", "kind": "function", "doc": "<p>Define which streaming trigger will be used.</p>\n\n<p>Args:\n    output_spec: output specification.</p>\n\n<p>Returns:\n    A dict containing streaming trigger.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Dict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writer.Writer.run_micro_batch_dq_process", "modulename": "lakehouse_engine.io.writer", "qualname": "Writer.run_micro_batch_dq_process", "kind": "function", "doc": "<p>Run the data quality process in a streaming micro batch dataframe.</p>\n\n<p>Iterates over the specs and performs the checks or analysis depending on the\ndata quality specification provided in the configuration.</p>\n\n<p>Args:\n    df: the dataframe in which to run the dq process on.\n    dq_spec: data quality specification.</p>\n\n<p>Returns: the validated dataframe.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">dq_spec</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">DQSpec</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writer_factory", "modulename": "lakehouse_engine.io.writer_factory", "kind": "module", "doc": "<p>Module for writer factory.</p>\n"}, {"fullname": "lakehouse_engine.io.writer_factory.WriterFactory", "modulename": "lakehouse_engine.io.writer_factory", "qualname": "WriterFactory", "kind": "class", "doc": "<p>Class for writer factory.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.io.writer_factory.WriterFactory.get_writer", "modulename": "lakehouse_engine.io.writer_factory", "qualname": "WriterFactory.get_writer", "kind": "function", "doc": "<p>Get a writer according to the output specification using a factory pattern.</p>\n\n<p>Args:\n    OutputSpec spec: output specification to write data.\n    DataFrame df: dataframe to be written.\n    OrderedDict data: list of all dfs generated on previous steps before writer.</p>\n\n<p>Returns:\n    Writer: writer that will write the data.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">io</span><span class=\"o\">.</span><span class=\"n\">writer</span><span class=\"o\">.</span><span class=\"n\">Writer</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers", "modulename": "lakehouse_engine.io.writers", "kind": "module", "doc": "<p>Package containing the writers responsible for writing data.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.console_writer", "modulename": "lakehouse_engine.io.writers.console_writer", "kind": "module", "doc": "<p>Module to define behaviour to write to console.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.console_writer.ConsoleWriter", "modulename": "lakehouse_engine.io.writers.console_writer", "qualname": "ConsoleWriter", "kind": "class", "doc": "<p>Class to write data to console.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.console_writer.ConsoleWriter.__init__", "modulename": "lakehouse_engine.io.writers.console_writer", "qualname": "ConsoleWriter.__init__", "kind": "function", "doc": "<p>Construct ConsoleWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification\n    df: dataframe to be written.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.console_writer.ConsoleWriter.write", "modulename": "lakehouse_engine.io.writers.console_writer", "qualname": "ConsoleWriter.write", "kind": "function", "doc": "<p>Write data to console.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers.dataframe_writer", "modulename": "lakehouse_engine.io.writers.dataframe_writer", "kind": "module", "doc": "<p>Module to define behaviour to write to dataframe.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.dataframe_writer.DataFrameWriter", "modulename": "lakehouse_engine.io.writers.dataframe_writer", "qualname": "DataFrameWriter", "kind": "class", "doc": "<p>Class to write data to dataframe.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.dataframe_writer.DataFrameWriter.__init__", "modulename": "lakehouse_engine.io.writers.dataframe_writer", "qualname": "DataFrameWriter.__init__", "kind": "function", "doc": "<p>Construct DataFrameWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification.\n    df: dataframe to be written.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.dataframe_writer.DataFrameWriter.write", "modulename": "lakehouse_engine.io.writers.dataframe_writer", "qualname": "DataFrameWriter.write", "kind": "function", "doc": "<p>Write data to dataframe.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">OrderedDict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers.delta_merge_writer", "modulename": "lakehouse_engine.io.writers.delta_merge_writer", "kind": "module", "doc": "<p>Module to define the behaviour of delta merges.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.delta_merge_writer.DeltaMergeWriter", "modulename": "lakehouse_engine.io.writers.delta_merge_writer", "qualname": "DeltaMergeWriter", "kind": "class", "doc": "<p>Class to merge data using delta lake.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.delta_merge_writer.DeltaMergeWriter.__init__", "modulename": "lakehouse_engine.io.writers.delta_merge_writer", "qualname": "DeltaMergeWriter.__init__", "kind": "function", "doc": "<p>Construct DeltaMergeWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification containing merge options and\n        relevant information.\n    df: the dataframe containing the new data to be merged.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.delta_merge_writer.DeltaMergeWriter.write", "modulename": "lakehouse_engine.io.writers.delta_merge_writer", "qualname": "DeltaMergeWriter.write", "kind": "function", "doc": "<p>Merge new data with current data.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers.file_writer", "modulename": "lakehouse_engine.io.writers.file_writer", "kind": "module", "doc": "<p>Module to define behaviour to write to files.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.file_writer.FileWriter", "modulename": "lakehouse_engine.io.writers.file_writer", "qualname": "FileWriter", "kind": "class", "doc": "<p>Class to write data to files.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.file_writer.FileWriter.__init__", "modulename": "lakehouse_engine.io.writers.file_writer", "qualname": "FileWriter.__init__", "kind": "function", "doc": "<p>Construct FileWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification\n    df: dataframe to be written.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.file_writer.FileWriter.write", "modulename": "lakehouse_engine.io.writers.file_writer", "qualname": "FileWriter.write", "kind": "function", "doc": "<p>Write data to files.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers.jdbc_writer", "modulename": "lakehouse_engine.io.writers.jdbc_writer", "kind": "module", "doc": "<p>Module that defines the behaviour to write to JDBC targets.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.jdbc_writer.JDBCWriter", "modulename": "lakehouse_engine.io.writers.jdbc_writer", "qualname": "JDBCWriter", "kind": "class", "doc": "<p>Class to write to JDBC targets.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.jdbc_writer.JDBCWriter.__init__", "modulename": "lakehouse_engine.io.writers.jdbc_writer", "qualname": "JDBCWriter.__init__", "kind": "function", "doc": "<p>Construct JDBCWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification.\n    df: dataframe to be writen.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.jdbc_writer.JDBCWriter.write", "modulename": "lakehouse_engine.io.writers.jdbc_writer", "qualname": "JDBCWriter.write", "kind": "function", "doc": "<p>Write data into JDBC target.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers.kafka_writer", "modulename": "lakehouse_engine.io.writers.kafka_writer", "kind": "module", "doc": "<p>Module that defines the behaviour to write to Kafka.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.kafka_writer.KafkaWriter", "modulename": "lakehouse_engine.io.writers.kafka_writer", "qualname": "KafkaWriter", "kind": "class", "doc": "<p>Class to write to a Kafka target.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.kafka_writer.KafkaWriter.__init__", "modulename": "lakehouse_engine.io.writers.kafka_writer", "qualname": "KafkaWriter.__init__", "kind": "function", "doc": "<p>Construct KafkaWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification.\n    df: dataframe to be written.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.kafka_writer.KafkaWriter.write", "modulename": "lakehouse_engine.io.writers.kafka_writer", "qualname": "KafkaWriter.write", "kind": "function", "doc": "<p>Write data to Kafka.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.io.writers.table_writer", "modulename": "lakehouse_engine.io.writers.table_writer", "kind": "module", "doc": "<p>Module that defines the behaviour to write to tables.</p>\n"}, {"fullname": "lakehouse_engine.io.writers.table_writer.TableWriter", "modulename": "lakehouse_engine.io.writers.table_writer", "qualname": "TableWriter", "kind": "class", "doc": "<p>Class to write to a table.</p>\n", "bases": "lakehouse_engine.io.writer.Writer"}, {"fullname": "lakehouse_engine.io.writers.table_writer.TableWriter.__init__", "modulename": "lakehouse_engine.io.writers.table_writer", "qualname": "TableWriter.__init__", "kind": "function", "doc": "<p>Construct TableWriter instances.</p>\n\n<p>Args:\n    output_spec: output specification.\n    df: dataframe to be written.\n    data: list of all dfs generated on previous steps before writer.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">output_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">OutputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span></span>)</span>"}, {"fullname": "lakehouse_engine.io.writers.table_writer.TableWriter.write", "modulename": "lakehouse_engine.io.writers.table_writer", "qualname": "TableWriter.write", "kind": "function", "doc": "<p>Write data to a table.</p>\n\n<p>After the write operation we repair the table (e.g., update partitions).\nHowever, there's a caveat to this, which is the fact that this repair\noperation is not reachable if we are running long-running streaming mode.\nTherefore, we recommend not using the TableWriter with formats other than\ndelta lake for those scenarios (as delta lake does not need msck repair).\nSo, you can: 1) use delta lake format for the table; 2) use the FileWriter\nand run the repair with a certain frequency in a separate task of your\npipeline.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators", "modulename": "lakehouse_engine.terminators", "kind": "module", "doc": "<p>Package to define algorithm terminators (e.g., vacuum, optimize, compute stats).</p>\n"}, {"fullname": "lakehouse_engine.terminators.cdf_processor", "modulename": "lakehouse_engine.terminators.cdf_processor", "kind": "module", "doc": "<p>Defines change data feed processor behaviour.</p>\n"}, {"fullname": "lakehouse_engine.terminators.cdf_processor.CDFProcessor", "modulename": "lakehouse_engine.terminators.cdf_processor", "qualname": "CDFProcessor", "kind": "class", "doc": "<p>Change data feed processor class.</p>\n"}, {"fullname": "lakehouse_engine.terminators.cdf_processor.CDFProcessor.expose_cdf", "modulename": "lakehouse_engine.terminators.cdf_processor", "qualname": "CDFProcessor.expose_cdf", "kind": "function", "doc": "<p>Expose CDF to external location.</p>\n\n<p>Args:\n    spec: terminator specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.cdf_processor.CDFProcessor.delete_old_data", "modulename": "lakehouse_engine.terminators.cdf_processor", "qualname": "CDFProcessor.delete_old_data", "kind": "function", "doc": "<p>Delete old data from cdf delta table.</p>\n\n<p>Args:\n    spec: terminator specifications.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.cdf_processor.CDFProcessor.vacuum_cdf_data", "modulename": "lakehouse_engine.terminators.cdf_processor", "qualname": "CDFProcessor.vacuum_cdf_data", "kind": "function", "doc": "<p>Vacuum old data from cdf delta table.</p>\n\n<p>Args:\n    spec: terminator specifications.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.dataset_optimizer", "modulename": "lakehouse_engine.terminators.dataset_optimizer", "kind": "module", "doc": "<p>Module with dataset optimizer terminator.</p>\n"}, {"fullname": "lakehouse_engine.terminators.dataset_optimizer.DatasetOptimizer", "modulename": "lakehouse_engine.terminators.dataset_optimizer", "qualname": "DatasetOptimizer", "kind": "class", "doc": "<p>Class with dataset optimizer terminator.</p>\n"}, {"fullname": "lakehouse_engine.terminators.dataset_optimizer.DatasetOptimizer.optimize_dataset", "modulename": "lakehouse_engine.terminators.dataset_optimizer", "qualname": "DatasetOptimizer.optimize_dataset", "kind": "function", "doc": "<p>Optimize a dataset based on a set of pre-conceived optimizations.</p>\n\n<p>Most of the times the dataset is a table, but it can be a file-based one only.</p>\n\n<p>Args:\n    db_table: database_name.table_name.\n    location: dataset/table filesystem location.\n    compute_table_stats: to compute table statistics or not.\n    vacuum: (delta lake tables only) whether to vacuum the delta lake\n        table or not.\n    vacuum_hours: (delta lake tables only) number of hours to consider\n        in vacuum operation.\n    optimize: (delta lake tables only) whether to optimize the table or\n        not. Custom optimize parameters can be supplied through ExecEnv (Spark)\n        configs\n    optimize_where: expression to use in the optimize function.\n    optimize_zorder_col_list: (delta lake tables only) list of\n        columns to consider in the zorder optimization process. Custom optimize\n        parameters can be supplied through ExecEnv (Spark) configs.\n    debug: flag indicating if we are just debugging this for local\n        tests and therefore pass through all the exceptions to perform some\n        assertions in local tests.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">db_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">compute_table_stats</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">vacuum</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">vacuum_hours</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">720</span>,</span><span class=\"param\">\t<span class=\"n\">optimize</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">optimize_where</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">optimize_zorder_col_list</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">debug</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifier", "modulename": "lakehouse_engine.terminators.notifier", "kind": "module", "doc": "<p>Module with notification terminator.</p>\n"}, {"fullname": "lakehouse_engine.terminators.notifier.Notifier", "modulename": "lakehouse_engine.terminators.notifier", "qualname": "Notifier", "kind": "class", "doc": "<p>Abstract Notification class.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.terminators.notifier.Notifier.__init__", "modulename": "lakehouse_engine.terminators.notifier", "qualname": "Notifier.__init__", "kind": "function", "doc": "<p>Construct Notification instances.</p>\n\n<p>Args:\n    notification_spec: notification specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">notification_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.terminators.notifier.Notifier.create_notification", "modulename": "lakehouse_engine.terminators.notifier", "qualname": "Notifier.create_notification", "kind": "function", "doc": "<p>Abstract create notification method.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifier.Notifier.send_notification", "modulename": "lakehouse_engine.terminators.notifier", "qualname": "Notifier.send_notification", "kind": "function", "doc": "<p>Abstract send notification method.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifier.Notifier.check_if_notification_is_failure_notification", "modulename": "lakehouse_engine.terminators.notifier", "qualname": "Notifier.check_if_notification_is_failure_notification", "kind": "function", "doc": "<p>Check if given notification is a failure notification.</p>\n\n<p>Args:\n    spec: spec to validate if it is a failure notification.</p>\n\n<p>Returns:\n    A boolean telling if the notification is a failure notification</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifier_factory", "modulename": "lakehouse_engine.terminators.notifier_factory", "kind": "module", "doc": "<p>Module for notifier factory.</p>\n"}, {"fullname": "lakehouse_engine.terminators.notifier_factory.NotifierFactory", "modulename": "lakehouse_engine.terminators.notifier_factory", "qualname": "NotifierFactory", "kind": "class", "doc": "<p>Class for notification factory.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.terminators.notifier_factory.NotifierFactory.get_notifier", "modulename": "lakehouse_engine.terminators.notifier_factory", "qualname": "NotifierFactory.get_notifier", "kind": "function", "doc": "<p>Get a notifier according to the terminator specs using a factory.</p>\n\n<p>Args:\n    spec: terminator specification.</p>\n\n<p>Returns:\n    Notifier: notifier that will handle notifications.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span><span class=\"return-annotation\">) -> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">terminators</span><span class=\"o\">.</span><span class=\"n\">notifier</span><span class=\"o\">.</span><span class=\"n\">Notifier</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifier_factory.NotifierFactory.generate_failure_notification", "modulename": "lakehouse_engine.terminators.notifier_factory", "qualname": "NotifierFactory.generate_failure_notification", "kind": "function", "doc": "<p>Check if it is necessary to send a failure notification and generate it.</p>\n\n<p>Args:\n    spec: List of termination specs\n    exception: Exception that caused the failure.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"nb\">list</span>, </span><span class=\"param\"><span class=\"n\">exception</span><span class=\"p\">:</span> <span class=\"ne\">Exception</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifiers", "modulename": "lakehouse_engine.terminators.notifiers", "kind": "module", "doc": "<p>Notifications module.</p>\n"}, {"fullname": "lakehouse_engine.terminators.notifiers.email_notifier", "modulename": "lakehouse_engine.terminators.notifiers.email_notifier", "kind": "module", "doc": "<p>Module with email notifier.</p>\n"}, {"fullname": "lakehouse_engine.terminators.notifiers.email_notifier.EmailNotifier", "modulename": "lakehouse_engine.terminators.notifiers.email_notifier", "qualname": "EmailNotifier", "kind": "class", "doc": "<p>Base Notification class.</p>\n", "bases": "lakehouse_engine.terminators.notifier.Notifier"}, {"fullname": "lakehouse_engine.terminators.notifiers.email_notifier.EmailNotifier.__init__", "modulename": "lakehouse_engine.terminators.notifiers.email_notifier", "qualname": "EmailNotifier.__init__", "kind": "function", "doc": "<p>Construct Email Notification instance.</p>\n\n<p>Args:\n    notification_spec: notification specification.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">notification_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span></span>)</span>"}, {"fullname": "lakehouse_engine.terminators.notifiers.email_notifier.EmailNotifier.create_notification", "modulename": "lakehouse_engine.terminators.notifiers.email_notifier", "qualname": "EmailNotifier.create_notification", "kind": "function", "doc": "<p>Creates the notification to be sent.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifiers.email_notifier.EmailNotifier.send_notification", "modulename": "lakehouse_engine.terminators.notifiers.email_notifier", "qualname": "EmailNotifier.send_notification", "kind": "function", "doc": "<p>Sends the notification by using a series of methods.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.notifiers.notification_templates", "modulename": "lakehouse_engine.terminators.notifiers.notification_templates", "kind": "module", "doc": "<p>Email notification templates.</p>\n"}, {"fullname": "lakehouse_engine.terminators.notifiers.notification_templates.NotificationsTemplates", "modulename": "lakehouse_engine.terminators.notifiers.notification_templates", "qualname": "NotificationsTemplates", "kind": "class", "doc": "<p>Templates for notifications.</p>\n"}, {"fullname": "lakehouse_engine.terminators.sensor_terminator", "modulename": "lakehouse_engine.terminators.sensor_terminator", "kind": "module", "doc": "<p>Defines terminator behaviour.</p>\n"}, {"fullname": "lakehouse_engine.terminators.sensor_terminator.SensorTerminator", "modulename": "lakehouse_engine.terminators.sensor_terminator", "qualname": "SensorTerminator", "kind": "class", "doc": "<p>Sensor Terminator class.</p>\n"}, {"fullname": "lakehouse_engine.terminators.sensor_terminator.SensorTerminator.update_sensor_status", "modulename": "lakehouse_engine.terminators.sensor_terminator", "qualname": "SensorTerminator.update_sensor_status", "kind": "function", "doc": "<p>Update internal sensor status.</p>\n\n<p>Update the sensor status in the control table, it should be used to tell the\nsystem that the sensor has processed all new data that was previously\nidentified, hence updating the shifted sensor status.\nUsually used to move from <code>SensorStatus.ACQUIRED_NEW_DATA</code> to\n<code>SensorStatus.PROCESSED_NEW_DATA</code>, but there might be scenarios - still\nto identify - where we can update the sensor status from/to different statuses.</p>\n\n<p>Args:\n    sensor_id: sensor id.\n    control_db_table_name: db.table to store sensor checkpoints.\n    status: status of the sensor.\n    assets: a list of assets that are considered as available to\n        consume downstream after this sensor has status\n        PROCESSED_NEW_DATA.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">sensor_id</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">control_db_table_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">status</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;PROCESSED_NEW_DATA&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">assets</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.spark_terminator", "modulename": "lakehouse_engine.terminators.spark_terminator", "kind": "module", "doc": "<p>Defines terminator behaviour.</p>\n"}, {"fullname": "lakehouse_engine.terminators.spark_terminator.SparkTerminator", "modulename": "lakehouse_engine.terminators.spark_terminator", "qualname": "SparkTerminator", "kind": "class", "doc": "<p>Spark Terminator class.</p>\n"}, {"fullname": "lakehouse_engine.terminators.spark_terminator.SparkTerminator.terminate_spark", "modulename": "lakehouse_engine.terminators.spark_terminator", "qualname": "SparkTerminator.terminate_spark", "kind": "function", "doc": "<p>Terminate spark session.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.terminators.terminator_factory", "modulename": "lakehouse_engine.terminators.terminator_factory", "kind": "module", "doc": "<p>Module with the factory pattern to return terminators.</p>\n"}, {"fullname": "lakehouse_engine.terminators.terminator_factory.TerminatorFactory", "modulename": "lakehouse_engine.terminators.terminator_factory", "qualname": "TerminatorFactory", "kind": "class", "doc": "<p>TerminatorFactory class following the factory pattern.</p>\n"}, {"fullname": "lakehouse_engine.terminators.terminator_factory.TerminatorFactory.execute_terminator", "modulename": "lakehouse_engine.terminators.terminator_factory", "qualname": "TerminatorFactory.execute_terminator", "kind": "function", "doc": "<p>Execute a terminator following the factory pattern.</p>\n\n<p>Args:\n    spec: terminator specification.\n    df: dataframe to be used in the terminator. Needed when a\n        terminator requires one dataframe as input.</p>\n\n<p>Returns:\n    Transformer function to be executed in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TerminatorSpec</span>,</span><span class=\"param\">\t<span class=\"n\">df</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers", "modulename": "lakehouse_engine.transformers", "kind": "module", "doc": "<p>Package to define transformers available in the lakehouse engine.</p>\n"}, {"fullname": "lakehouse_engine.transformers.aggregators", "modulename": "lakehouse_engine.transformers.aggregators", "kind": "module", "doc": "<p>Aggregators module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.aggregators.Aggregators", "modulename": "lakehouse_engine.transformers.aggregators", "qualname": "Aggregators", "kind": "class", "doc": "<p>Class containing all aggregation functions.</p>\n"}, {"fullname": "lakehouse_engine.transformers.aggregators.Aggregators.get_max_value", "modulename": "lakehouse_engine.transformers.aggregators", "qualname": "Aggregators.get_max_value", "kind": "function", "doc": "<p>Get the maximum value of a given column of a dataframe.</p>\n\n<p>Args:\n    input_col: name of the input column.\n    output_col: name of the output column (defaults to \"latest\").</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">output_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;latest&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_creators", "modulename": "lakehouse_engine.transformers.column_creators", "kind": "module", "doc": "<p>Column creators transformers module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.column_creators.ColumnCreators", "modulename": "lakehouse_engine.transformers.column_creators", "qualname": "ColumnCreators", "kind": "class", "doc": "<p>Class containing all functions that can create columns to add value.</p>\n"}, {"fullname": "lakehouse_engine.transformers.column_creators.ColumnCreators.with_row_id", "modulename": "lakehouse_engine.transformers.column_creators", "qualname": "ColumnCreators.with_row_id", "kind": "function", "doc": "<p>Create a sequential but not consecutive id.</p>\n\n<p>Args:\n    output_col: optional name of the output column.</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">output_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;lhe_row_id&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_creators.ColumnCreators.with_auto_increment_id", "modulename": "lakehouse_engine.transformers.column_creators", "qualname": "ColumnCreators.with_auto_increment_id", "kind": "function", "doc": "<p>Create a sequential and consecutive id.</p>\n\n<p>Args:\n    output_col: optional name of the output column.</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">output_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;lhe_row_id&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_creators.ColumnCreators.with_literals", "modulename": "lakehouse_engine.transformers.column_creators", "qualname": "ColumnCreators.with_literals", "kind": "function", "doc": "<p>Create columns given a map of column names and literal values (constants).</p>\n\n<p>Args:\n    Dict[str, Any] literals: map of column names and literal values (constants).</p>\n\n<p>Returns:\n    Callable: A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">literals</span><span class=\"p\">:</span> <span class=\"n\">Dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">Any</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers", "modulename": "lakehouse_engine.transformers.column_reshapers", "kind": "module", "doc": "<p>Module with column reshaping transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers", "kind": "class", "doc": "<p>Class containing column reshaping transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.cast", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.cast", "kind": "function", "doc": "<p>Cast specific columns into the designated type.</p>\n\n<p>Args:\n    cols: dict with columns and respective target types.\n        Target types need to have the exact name of spark types:\n        <a href=\"https://spark.apache.org/docs/latest/sql-ref-datatypes.html\">https://spark.apache.org/docs/latest/sql-ref-datatypes.html</a></p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">Dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.column_selector", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.column_selector", "kind": "function", "doc": "<p>Select specific columns with specific output aliases.</p>\n\n<p>Args:\n    cols: dict with columns to select and respective aliases.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">OrderedDict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.flatten_schema", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.flatten_schema", "kind": "function", "doc": "<p>Flatten the schema of the dataframe.</p>\n\n<p>Args:\n    max_level: level until which you want to flatten the schema.\n        Default: None.\n    shorten_names: whether to shorten the names of the prefixes\n        of the fields being flattened or not. Default: False.\n    alias: whether to define alias for the columns being flattened\n        or not. Default: True.\n    num_chars: number of characters to consider when shortening\n        the names of the fields. Default: 7.\n    ignore_cols: columns which you don't want to flatten.\n        Default: None.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">max_level</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">shorten_names</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">alias</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">num_chars</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">7</span>,</span><span class=\"param\">\t<span class=\"n\">ignore_cols</span><span class=\"p\">:</span> <span class=\"n\">List</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.explode_columns", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.explode_columns", "kind": "function", "doc": "<p>Explode columns with types like ArrayType and MapType.</p>\n\n<p>After it can be applied the flatten_schema transformation,\nif we desired for example to explode the map (as we explode a StructType)\nor to explode a StructType inside the array.\nWe recommend you to specify always the columns desired to explode\nand not explode all columns.</p>\n\n<p>Args:\n    explode_arrays: whether you want to explode array columns (True)\n        or not (False). Default: False.\n    array_cols_to_explode: array columns which you want to explode.\n        If you don't specify it will get all array columns and explode them.\n        Default: None.\n    explode_maps: whether you want to explode map columns (True)\n        or not (False). Default: False.\n    map_cols_to_explode: map columns which you want to explode.\n        If you don't specify it will get all map columns and explode them.\n        Default: None.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">explode_arrays</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">array_cols_to_explode</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">explode_maps</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">map_cols_to_explode</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.with_expressions", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.with_expressions", "kind": "function", "doc": "<p>Execute Spark SQL expressions to create the specified columns.</p>\n\n<p>This function uses the Spark expr function:\n<a href=\"https://spark.apache.org/docs/latest/api/python/reference/api/\">https://spark.apache.org/docs/latest/api/python/reference/api/</a>\npyspark.sql.functions.expr.html</p>\n\n<p>Args:\n    cols_and_exprs: dict with columns and respective expressions to compute\n        (Spark SQL expressions).</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">cols_and_exprs</span><span class=\"p\">:</span> <span class=\"n\">Dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.rename", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.rename", "kind": "function", "doc": "<p>Rename specific columns into the designated name.</p>\n\n<p>Args:\n    cols: dict with columns and respective target names.\n    escape_col_names: whether to escape column names (e.g. <code>/BIC/COL1</code>) or not.\n    If True it creates a column with the new name and drop the old one.\n    If False, uses the native withColumnRenamed Spark function. Default: True.</p>\n\n<p>Returns:\n    Function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">Dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">escape_col_names</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.from_avro", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.from_avro", "kind": "function", "doc": "<p>Select all attributes from avro.</p>\n\n<p>Args:\n    schema: the schema string.\n    key_col: the name of the key column.\n    value_col: the name of the value column.\n    options: extra options (e.g., mode: \"PERMISSIVE\").\n    expand_key: whether you want to expand the content inside the key\n    column or not. Default: false.\n    expand_value: whether you want to expand the content inside the value\n    column or not. Default: true.</p>\n\n<p>Returns:\n    Function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">key_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;key&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">value_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;value&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">options</span><span class=\"p\">:</span> <span class=\"nb\">dict</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">expand_key</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">expand_value</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.from_avro_with_registry", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.from_avro_with_registry", "kind": "function", "doc": "<p>Select all attributes from avro using a schema registry.</p>\n\n<p>Args:\n    schema_registry: the url to the schema registry.\n    value_schema: the name of the value schema entry in the schema registry.\n    value_col: the name of the value column.\n    key_schema: the name of the key schema entry in the schema\n    registry. Default: None.\n    key_col: the name of the key column.\n    expand_key: whether you want to expand the content inside the key\n    column or not. Default: false.\n    expand_value: whether you want to expand the content inside the value\n    column or not. Default: true.</p>\n\n<p>Returns:\n    Function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">schema_registry</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">value_schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">value_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;value&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">key_schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">key_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;key&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">expand_key</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">expand_value</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.from_json", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.from_json", "kind": "function", "doc": "<p>Convert a json string into a json column (struct).</p>\n\n<p>The new json column can be added to the existing columns (default) or it can\nreplace all the others, being the only one to output. The new column gets the\nsame name as the original one suffixed with '_json'.</p>\n\n<p>Args:\n    input_col: dict with columns and respective target names.\n    schema_path: path to the StructType schema (spark schema).\n    schema: dict with the StructType schema (spark schema).\n    json_options: options to parse the json value.\n    drop_all_cols: whether to drop all the input columns or not.\n        Defaults to False.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">input_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">schema_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">json_options</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">drop_all_cols</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.column_reshapers.ColumnReshapers.to_json", "modulename": "lakehouse_engine.transformers.column_reshapers", "qualname": "ColumnReshapers.to_json", "kind": "function", "doc": "<p>Convert dataframe columns into a json value.</p>\n\n<p>Args:\n    in_cols: name(s) of the input column(s).\n        Example values:\n        \"*\" - all\n        columns; \"my_col\" - one column named \"my_col\";\n        \"my_col1, my_col2\" - two columns.\n    out_col: name of the output column.\n    json_options: options to parse the json value.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">in_cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">out_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">json_options</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.condensers", "modulename": "lakehouse_engine.transformers.condensers", "kind": "module", "doc": "<p>Condensers module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.condensers.Condensers", "modulename": "lakehouse_engine.transformers.condensers", "qualname": "Condensers", "kind": "class", "doc": "<p>Class containing all the functions to condensate data for later merges.</p>\n"}, {"fullname": "lakehouse_engine.transformers.condensers.Condensers.condense_record_mode_cdc", "modulename": "lakehouse_engine.transformers.condensers", "qualname": "Condensers.condense_record_mode_cdc", "kind": "function", "doc": "<p>Condense Change Data Capture (CDC) based on record_mode strategy.</p>\n\n<p>This CDC data is particularly seen in some CDC enabled systems. Other systems\nmay have different CDC strategies.</p>\n\n<p>Args:\n    business_key: The business key (logical primary key) of the data.\n    ranking_key_desc: In this type of CDC condensation the data needs to be\n        ordered descendingly in a certain way, using columns specified in this\n        parameter.\n    ranking_key_asc: In this type of CDC condensation the data needs to be\n        ordered ascendingly in a certain way, using columns specified in\n        this parameter.\n    record_mode_col: Name of the record mode input_col.\n    valid_record_modes: Depending on the context, not all record modes may be\n        considered for condensation. Use this parameter to skip those.</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">business_key</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">record_mode_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">valid_record_modes</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">ranking_key_desc</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">ranking_key_asc</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.condensers.Condensers.group_and_rank", "modulename": "lakehouse_engine.transformers.condensers", "qualname": "Condensers.group_and_rank", "kind": "function", "doc": "<p>Condense data based on a simple group by + take latest mechanism.</p>\n\n<p>Args:\n    group_key: list of column names to use in the group by.\n    ranking_key: the data needs to be ordered descendingly using columns\n        specified in this parameter.\n    descending: if the ranking considers descending order or not. Defaults to\n        True.</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">group_key</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">ranking_key</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">descending</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.custom_transformers", "modulename": "lakehouse_engine.transformers.custom_transformers", "kind": "module", "doc": "<p>Custom transformers module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.custom_transformers.CustomTransformers", "modulename": "lakehouse_engine.transformers.custom_transformers", "qualname": "CustomTransformers", "kind": "class", "doc": "<p>Class representing a CustomTransformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.custom_transformers.CustomTransformers.custom_transformation", "modulename": "lakehouse_engine.transformers.custom_transformers", "qualname": "CustomTransformers.custom_transformation", "kind": "function", "doc": "<p>Execute a custom transformation provided by the user.</p>\n\n<p>This transformer can be very useful whenever the user cannot use our provided\ntransformers, or they want to write complex logic in the transform step of the\nalgorithm.</p>\n\n<p>Attention!!! Please bare in mind that the custom_transformer function provided\nas argument needs to receive a DataFrame and return a DataFrame, because it is\nhow Spark's .transform method is able to chain the transformations.\nExample:\n    def my_custom_logic(df: DataFrame) -> DataFrame:</p>\n\n<p>Args:\n    custom_transformer: custom transformer function. A python function with all\n        required pyspark logic provided by the user.</p>\n\n<p>Returns:\n    Callable: the same function provided as parameter, in order to e called\n        later in the TransformerFactory.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">custom_transformer</span><span class=\"p\">:</span> <span class=\"n\">Callable</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.data_maskers", "modulename": "lakehouse_engine.transformers.data_maskers", "kind": "module", "doc": "<p>Module with data masking transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.data_maskers.DataMaskers", "modulename": "lakehouse_engine.transformers.data_maskers", "qualname": "DataMaskers", "kind": "class", "doc": "<p>Class containing data masking transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.data_maskers.DataMaskers.hash_masker", "modulename": "lakehouse_engine.transformers.data_maskers", "qualname": "DataMaskers.hash_masker", "kind": "function", "doc": "<p>Mask specific columns using an hashing approach.</p>\n\n<p>Args:\n    cols: list of column names to mask.\n    approach: hashing approach. Defaults to 'SHA'. There's \"MURMUR3\" as well.\n    num_bits: number of bits of the SHA approach. Only applies to SHA approach.\n    suffix: suffix to apply to new column name. Defaults to \"_hash\".\n        Note: you can pass an empty suffix to have the original column replaced.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">approach</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;SHA&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">num_bits</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">256</span>,</span><span class=\"param\">\t<span class=\"n\">suffix</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;_hash&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.data_maskers.DataMaskers.column_dropper", "modulename": "lakehouse_engine.transformers.data_maskers", "qualname": "DataMaskers.column_dropper", "kind": "function", "doc": "<p>Drop specific columns.</p>\n\n<p>Args:\n    cols: list of column names to drop.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.date_transformers", "modulename": "lakehouse_engine.transformers.date_transformers", "kind": "module", "doc": "<p>Module containing date transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.date_transformers.DateTransformers", "modulename": "lakehouse_engine.transformers.date_transformers", "qualname": "DateTransformers", "kind": "class", "doc": "<p>Class with set of transformers to transform dates in several forms.</p>\n"}, {"fullname": "lakehouse_engine.transformers.date_transformers.DateTransformers.add_current_date", "modulename": "lakehouse_engine.transformers.date_transformers", "qualname": "DateTransformers.add_current_date", "kind": "function", "doc": "<p>Add column with current date.</p>\n\n<p>The current date comes from the driver as a constant, not from every executor.</p>\n\n<p>Args:\n    output_col: name of the output column.</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">output_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.date_transformers.DateTransformers.convert_to_date", "modulename": "lakehouse_engine.transformers.date_transformers", "qualname": "DateTransformers.convert_to_date", "kind": "function", "doc": "<p>Convert multiple string columns with a source format into dates.</p>\n\n<p>Args:\n    cols: list of names of the string columns to convert.\n    source_format: dates source format (e.g., YYYY-MM-dd). Check here:\n        <a href=\"https://docs.oracle.com/javase/10/docs/api/java/time/format/\">https://docs.oracle.com/javase/10/docs/api/java/time/format/</a>\n        DateTimeFormatter.html</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">source_format</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.date_transformers.DateTransformers.convert_to_timestamp", "modulename": "lakehouse_engine.transformers.date_transformers", "qualname": "DateTransformers.convert_to_timestamp", "kind": "function", "doc": "<p>Convert multiple string columns with a source format into timestamps.</p>\n\n<p>Args:\n    cols: list of names of the string columns to convert.\n    source_format: dates source format (e.g., MM-dd-yyyy HH:mm:ss.SSS). Check\n        here: <a href=\"https://docs.oracle.com/javase/10/docs/api/java/time/format/\">https://docs.oracle.com/javase/10/docs/api/java/time/format/</a>\n        DateTimeFormatter.html</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">source_format</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.date_transformers.DateTransformers.format_date", "modulename": "lakehouse_engine.transformers.date_transformers", "qualname": "DateTransformers.format_date", "kind": "function", "doc": "<p>Convert multiple date/timestamp columns into strings with the target format.</p>\n\n<p>Args:\n    cols: list of names of the string columns to convert.\n    target_format: strings target format (e.g., YYYY-MM-dd). Check here:\n        <a href=\"https://docs.oracle.com/javase/10/docs/api/java/time/format/\">https://docs.oracle.com/javase/10/docs/api/java/time/format/</a>\n        DateTimeFormatter.html</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">target_format</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.date_transformers.DateTransformers.get_date_hierarchy", "modulename": "lakehouse_engine.transformers.date_transformers", "qualname": "DateTransformers.get_date_hierarchy", "kind": "function", "doc": "<p>Create day/month/week/quarter/year hierarchy for the provided date columns.</p>\n\n<p>Uses Spark's extract function.</p>\n\n<p>Args:\n    cols: list of names of the date columns to create the hierarchy.\n    formats: dict with the correspondence between the hierarchy and the format\n        to apply.\n        Example: {\n            \"year\": \"year\",\n            \"month\": \"month\",\n            \"day\": \"day\",\n            \"week\": \"week\",\n            \"quarter\": \"quarter\"\n        }\n        Check here: <a href=\"https://docs.oracle.com/javase/10/docs/api/java/time/format/\">https://docs.oracle.com/javase/10/docs/api/java/time/format/</a>\n        DateTimeFormatter.html</p>\n\n<p>Returns:\n    A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>, </span><span class=\"param\"><span class=\"n\">formats</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.exceptions", "modulename": "lakehouse_engine.transformers.exceptions", "kind": "module", "doc": "<p>Module for all the transformers exceptions.</p>\n"}, {"fullname": "lakehouse_engine.transformers.exceptions.WrongArgumentsException", "modulename": "lakehouse_engine.transformers.exceptions", "qualname": "WrongArgumentsException", "kind": "class", "doc": "<p>Exception for when a user provides wrong arguments to a transformer.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.transformers.exceptions.UnsupportedStreamingTransformerException", "modulename": "lakehouse_engine.transformers.exceptions", "qualname": "UnsupportedStreamingTransformerException", "kind": "class", "doc": "<p>Exception for when a user requests a transformer not supported in streaming.</p>\n", "bases": "builtins.Exception"}, {"fullname": "lakehouse_engine.transformers.filters", "modulename": "lakehouse_engine.transformers.filters", "kind": "module", "doc": "<p>Module containing the filters transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.filters.Filters", "modulename": "lakehouse_engine.transformers.filters", "qualname": "Filters", "kind": "class", "doc": "<p>Class containing the filters transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.filters.Filters.incremental_filter", "modulename": "lakehouse_engine.transformers.filters", "qualname": "Filters.incremental_filter", "kind": "function", "doc": "<p>Incrementally Filter a certain dataframe given an increment logic.</p>\n\n<p>This logic can either be an increment value or an increment dataframe from which\nthe get the latest value from. By default the operator for the filtering process\nis greater or equal to cover cases where we receive late arriving data not cover\nin a previous load. You can change greater_or_equal to false to use greater,\nwhen you trust the source will never output more data with the increment after\nyou have load the data (e.g., you will never load data until the source is still\ndumping data, which may cause you to get an incomplete picture of the last\narrived data).</p>\n\n<p>Args:\n    input_col: input column name\n    increment_value: value to which to filter the data, considering the\n        provided input_Col.\n    increment_df: a dataframe to get the increment value from.\n        you either specify this or the increment_value (this takes precedence).\n        This is a good approach to get the latest value from a given dataframe\n        that was read and apply that value as filter here. In this way you can\n        perform incremental loads based on the last value of a given dataframe\n        (e.g., table or file based). Can be used together with the\n        get_max_value transformer to accomplish these incremental based loads.\n        See our append load feature tests  to see how to provide an acon for\n        incremental loads, taking advantage of the scenario explained here.\n    increment_col: name of the column from which to get the increment\n        value from from (when using increment_df approach). This assumes there's\n        only one row in the increment_df, reason why is a good idea to use\n        together with the get_max_value transformer. Defaults to \"latest\"\n        because that's the default output column name provided by the\n        get_max_value transformer.\n    greater_or_equal: if filtering should be done by also including the\n        increment value or not (useful for scenarios where you are performing\n        increment loads but still want to include data considering the increment\n        value, and not only values greater than that increment... examples may\n        include scenarios where you already loaded data including those values,\n        but the source produced more data containing those values).\n        Defaults to false.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">input_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">increment_value</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">Any</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">increment_df</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">increment_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;latest&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">greater_or_equal</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.filters.Filters.expression_filter", "modulename": "lakehouse_engine.transformers.filters", "qualname": "Filters.expression_filter", "kind": "function", "doc": "<p>Filter a dataframe based on an expression.</p>\n\n<p>Args:\n    exp: filter expression.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">exp</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.filters.Filters.column_filter_exp", "modulename": "lakehouse_engine.transformers.filters", "qualname": "Filters.column_filter_exp", "kind": "function", "doc": "<p>Filter a dataframe's columns based on a list of SQL expressions.</p>\n\n<p>Args:\n    exp: column filter expressions.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">exp</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.filters.Filters.drop_duplicate_rows", "modulename": "lakehouse_engine.transformers.filters", "qualname": "Filters.drop_duplicate_rows", "kind": "function", "doc": "<p>Drop duplicate rows using spark function dropDuplicates().</p>\n\n<p>This transformer can be used with or without arguments.\nThe provided argument needs to be a list of columns.\nFor example: [\u201cName\u201d,\u201dVAT\u201d] will drop duplicate records within\n\"Name\" and \"VAT\" columns.\nIf the transformer is used without providing any columns list or providing\nan empty list, such as [] the result will be the same as using\nthe distinct() pyspark function. If the watermark dict is present it will\nensure that the drop operation will apply to rows within the watermark timeline\nwindow.</p>\n\n<p>Args:\n    cols: column names.\n    watermarker: properties to apply watermarker to the transformer.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>, </span><span class=\"param\"><span class=\"n\">watermarker</span><span class=\"p\">:</span> <span class=\"nb\">dict</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.joiners", "modulename": "lakehouse_engine.transformers.joiners", "kind": "module", "doc": "<p>Module with join transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.joiners.Joiners", "modulename": "lakehouse_engine.transformers.joiners", "qualname": "Joiners", "kind": "class", "doc": "<p>Class containing join transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.joiners.Joiners.join", "modulename": "lakehouse_engine.transformers.joiners", "qualname": "Joiners.join", "kind": "function", "doc": "<p>Join two dataframes based on specified type and columns.</p>\n\n<p>Some stream to stream joins are only possible if you apply Watermark, so this\nmethod also provides a parameter to enable watermarking specification.</p>\n\n<p>Args:\n    left_df_alias: alias of the first dataframe.\n    join_with: right dataframe.\n    right_df_alias: alias of the second dataframe.\n    join_condition: condition to join dataframes.\n    join_type: type of join. Defaults to inner.\n        Available values: inner, cross, outer, full, full outer,\n        left, left outer, right, right outer, semi,\n        left semi, anti, and left anti.\n    broadcast_join: whether to perform a broadcast join or not.\n    select_cols: list of columns to select at the end.\n    watermarker: properties to apply watermarking.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">join_with</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span>,</span><span class=\"param\">\t<span class=\"n\">join_condition</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">left_df_alias</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;a&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">right_df_alias</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;b&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">join_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;inner&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">broadcast_join</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">select_cols</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">watermarker</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.null_handlers", "modulename": "lakehouse_engine.transformers.null_handlers", "kind": "module", "doc": "<p>Module with null handlers transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.null_handlers.NullHandlers", "modulename": "lakehouse_engine.transformers.null_handlers", "qualname": "NullHandlers", "kind": "class", "doc": "<p>Class containing null handler transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.null_handlers.NullHandlers.replace_nulls", "modulename": "lakehouse_engine.transformers.null_handlers", "qualname": "NullHandlers.replace_nulls", "kind": "function", "doc": "<p>Replace nulls in a dataframe.</p>\n\n<p>Args:\n    replace_on_nums: if it is to replace nulls on numeric columns.\n        Applies to ints, longs and floats.\n    default_num_value: default integer value to use as replacement.\n    replace_on_strings: if it is to replace nulls on string columns.\n    default_string_value: default string value to use as replacement.\n    subset_cols: list of columns in which to replace nulls. If not\n        provided, all nulls in all columns will be replaced as specified.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">replace_on_nums</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">default_num_value</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"o\">-</span><span class=\"mi\">999</span>,</span><span class=\"param\">\t<span class=\"n\">replace_on_strings</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">default_string_value</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;UNKNOWN&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">subset_cols</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.optimizers", "modulename": "lakehouse_engine.transformers.optimizers", "kind": "module", "doc": "<p>Optimizers module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.optimizers.Optimizers", "modulename": "lakehouse_engine.transformers.optimizers", "qualname": "Optimizers", "kind": "class", "doc": "<p>Class containing all the functions that can provide optimizations.</p>\n"}, {"fullname": "lakehouse_engine.transformers.optimizers.Optimizers.cache", "modulename": "lakehouse_engine.transformers.optimizers", "qualname": "Optimizers.cache", "kind": "function", "doc": "<p>Caches the current dataframe.</p>\n\n<p>The default storage level used is MEMORY_AND_DISK.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.optimizers.Optimizers.persist", "modulename": "lakehouse_engine.transformers.optimizers", "qualname": "Optimizers.persist", "kind": "function", "doc": "<p>Caches the current dataframe with a specific StorageLevel.</p>\n\n<p>Args:\n    storage_level: the type of StorageLevel, as default MEMORY_AND_DISK_DESER.\n        More options here: <a href=\"https://spark.apache.org/docs/latest/api/python/\">https://spark.apache.org/docs/latest/api/python/</a>\n        reference/api/pyspark.StorageLevel.html</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">storage_level</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.optimizers.Optimizers.unpersist", "modulename": "lakehouse_engine.transformers.optimizers", "qualname": "Optimizers.unpersist", "kind": "function", "doc": "<p>Removes the dataframe from the disk and memory.</p>\n\n<p>Args:\n    blocking: whether to block until all the data blocks are\n        removed from disk/memory or run asynchronously.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">blocking</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.regex_transformers", "modulename": "lakehouse_engine.transformers.regex_transformers", "kind": "module", "doc": "<p>Regex transformers module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.regex_transformers.RegexTransformers", "modulename": "lakehouse_engine.transformers.regex_transformers", "qualname": "RegexTransformers", "kind": "class", "doc": "<p>Class containing all regex functions.</p>\n"}, {"fullname": "lakehouse_engine.transformers.regex_transformers.RegexTransformers.with_regex_value", "modulename": "lakehouse_engine.transformers.regex_transformers", "qualname": "RegexTransformers.with_regex_value", "kind": "function", "doc": "<p>Get the result of applying a regex to an input column (via regexp_extract).</p>\n\n<p>Args:\n    input_col: name of the input column.\n    output_col: name of the output column.\n    regex: regular expression.\n    drop_input_col: whether to drop input_col or not.\n    idx: index to return.</p>\n\n<p>Returns:\n     A function to be executed in the .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">output_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">regex</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">drop_input_col</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">idx</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">1</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.repartitioners", "modulename": "lakehouse_engine.transformers.repartitioners", "kind": "module", "doc": "<p>Module with repartitioners transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.repartitioners.Repartitioners", "modulename": "lakehouse_engine.transformers.repartitioners", "qualname": "Repartitioners", "kind": "class", "doc": "<p>Class containing repartitioners transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.repartitioners.Repartitioners.coalesce", "modulename": "lakehouse_engine.transformers.repartitioners", "qualname": "Repartitioners.coalesce", "kind": "function", "doc": "<p>Coalesce a dataframe into n partitions.</p>\n\n<p>Args:\n    num_partitions: num of partitions to coalesce.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">num_partitions</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.repartitioners.Repartitioners.repartition", "modulename": "lakehouse_engine.transformers.repartitioners", "qualname": "Repartitioners.repartition", "kind": "function", "doc": "<p>Repartition a dataframe into n partitions.</p>\n\n<p>If num_partitions is provided repartitioning happens based on the provided\nnumber, otherwise it happens based on the values of the provided cols (columns).</p>\n\n<p>Args:\n    num_partitions: num of partitions to repartition.\n    cols: list of columns to use for repartitioning.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">num_partitions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">cols</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.transformer_factory", "modulename": "lakehouse_engine.transformers.transformer_factory", "kind": "module", "doc": "<p>Module with the factory pattern to return transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.transformer_factory.TransformerFactory", "modulename": "lakehouse_engine.transformers.transformer_factory", "qualname": "TransformerFactory", "kind": "class", "doc": "<p>TransformerFactory class following the factory pattern.</p>\n"}, {"fullname": "lakehouse_engine.transformers.transformer_factory.TransformerFactory.get_transformer", "modulename": "lakehouse_engine.transformers.transformer_factory", "qualname": "TransformerFactory.get_transformer", "kind": "function", "doc": "<p>Get a transformer following the factory pattern.</p>\n\n<p>Args:\n    spec: transformer specification (individual transformation... not to be\n        confused with list of all transformations).\n    data: ordered dict of dataframes to be transformed. Needed when a\n        transformer requires more than one dataframe as input.</p>\n\n<p>Returns:\n    Transformer function to be executed in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">TransformerSpec</span>,</span><span class=\"param\">\t<span class=\"n\">data</span><span class=\"p\">:</span> <span class=\"n\">OrderedDict</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.unions", "modulename": "lakehouse_engine.transformers.unions", "kind": "module", "doc": "<p>Module with union transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.unions.Unions", "modulename": "lakehouse_engine.transformers.unions", "qualname": "Unions", "kind": "class", "doc": "<p>Class containing union transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.unions.Unions.union", "modulename": "lakehouse_engine.transformers.unions", "qualname": "Unions.union", "kind": "function", "doc": "<p>Union dataframes, resolving columns by position (not by name).</p>\n\n<p>Args:\n    union_with: list of dataframes to union.\n    deduplication: whether to perform deduplication of elements or not.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">union_with</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">deduplication</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.unions.Unions.union_by_name", "modulename": "lakehouse_engine.transformers.unions", "qualname": "Unions.union_by_name", "kind": "function", "doc": "<p>Union dataframes, resolving columns by name (not by position).</p>\n\n<p>Args:\n    union_with: list of dataframes to union.\n    deduplication: whether to perform deduplication of elements or not.\n    allow_missing_columns: allow the union of DataFrames with different\n        schemas.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">union_with</span><span class=\"p\">:</span> <span class=\"n\">List</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">dataframe</span><span class=\"o\">.</span><span class=\"n\">DataFrame</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">deduplication</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">allow_missing_columns</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.transformers.watermarker", "modulename": "lakehouse_engine.transformers.watermarker", "kind": "module", "doc": "<p>Watermarker module.</p>\n"}, {"fullname": "lakehouse_engine.transformers.watermarker.Watermarker", "modulename": "lakehouse_engine.transformers.watermarker", "qualname": "Watermarker", "kind": "class", "doc": "<p>Class containing all watermarker transformers.</p>\n"}, {"fullname": "lakehouse_engine.transformers.watermarker.Watermarker.with_watermark", "modulename": "lakehouse_engine.transformers.watermarker", "qualname": "Watermarker.with_watermark", "kind": "function", "doc": "<p>Get the dataframe with watermarker defined.</p>\n\n<p>Args:\n    watermarker_column: name of the input column to be considered for\n     the watermarking. Note: it must be a timestamp.\n    watermarker_time: time window to define the watermark value.</p>\n\n<p>Returns:\n    A function to be executed on other transformers.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">watermarker_column</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">watermarker_time</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Callable</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils", "modulename": "lakehouse_engine.utils", "kind": "module", "doc": "<p>Utilities package.</p>\n"}, {"fullname": "lakehouse_engine.utils.configs", "modulename": "lakehouse_engine.utils.configs", "kind": "module", "doc": "<p>Config utilities package.</p>\n"}, {"fullname": "lakehouse_engine.utils.configs.config_utils", "modulename": "lakehouse_engine.utils.configs.config_utils", "kind": "module", "doc": "<p>Module to read configurations.</p>\n"}, {"fullname": "lakehouse_engine.utils.configs.config_utils.ConfigUtils", "modulename": "lakehouse_engine.utils.configs.config_utils", "qualname": "ConfigUtils", "kind": "class", "doc": "<p>Config utilities class.</p>\n"}, {"fullname": "lakehouse_engine.utils.configs.config_utils.ConfigUtils.get_acon", "modulename": "lakehouse_engine.utils.configs.config_utils", "qualname": "ConfigUtils.get_acon", "kind": "function", "doc": "<p>Get acon based on a filesystem path or on a dict.</p>\n\n<p>Args:\n    acon_path: path of the acon (algorithm configuration) file.\n    acon: acon provided directly through python code (e.g., notebooks\n        or other apps).</p>\n\n<p>Returns:\n    Dict representation of an acon.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">acon_path</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">acon</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.configs.config_utils.ConfigUtils.get_config", "modulename": "lakehouse_engine.utils.configs.config_utils", "qualname": "ConfigUtils.get_config", "kind": "function", "doc": "<p>Get Lakehouse Engine configurations.</p>\n\n<p>Returns:\n     A dictionary with the engine configurations.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">) -> <span class=\"nb\">dict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.configs.config_utils.ConfigUtils.read_json_acon", "modulename": "lakehouse_engine.utils.configs.config_utils", "qualname": "ConfigUtils.read_json_acon", "kind": "function", "doc": "<p>Read an acon (algorithm configuration) file.</p>\n\n<p>Args:\n    path: path to the acon file.</p>\n\n<p>Returns:\n    The acon file content as a dict.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.configs.config_utils.ConfigUtils.read_sql", "modulename": "lakehouse_engine.utils.configs.config_utils", "qualname": "ConfigUtils.read_sql", "kind": "function", "doc": "<p>Read a DDL file in Spark SQL format from a cloud object storage system.</p>\n\n<p>Args:\n    path: path to the acon (algorithm configuration) file.</p>\n\n<p>Returns:\n    Content of the SQL file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.databricks_utils", "modulename": "lakehouse_engine.utils.databricks_utils", "kind": "module", "doc": "<p>Utilities for databricks operations.</p>\n"}, {"fullname": "lakehouse_engine.utils.databricks_utils.DatabricksUtils", "modulename": "lakehouse_engine.utils.databricks_utils", "qualname": "DatabricksUtils", "kind": "class", "doc": "<p>Databricks utilities class.</p>\n"}, {"fullname": "lakehouse_engine.utils.databricks_utils.DatabricksUtils.get_db_utils", "modulename": "lakehouse_engine.utils.databricks_utils", "qualname": "DatabricksUtils.get_db_utils", "kind": "function", "doc": "<p>Get db utils on databricks.</p>\n\n<p>Args:\n    spark: spark session.</p>\n\n<p>Returns:\n    Dbutils from databricks.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">spark</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">session</span><span class=\"o\">.</span><span class=\"n\">SparkSession</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.databricks_utils.DatabricksUtils.get_databricks_job_information", "modulename": "lakehouse_engine.utils.databricks_utils", "qualname": "DatabricksUtils.get_databricks_job_information", "kind": "function", "doc": "<p>Get notebook context from running acon.</p>\n\n<p>Returns:\n    Dict containing databricks notebook context.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"return-annotation\">) -> <span class=\"n\">Tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.expectations_utils", "modulename": "lakehouse_engine.utils.expectations_utils", "kind": "module", "doc": "<p>Utilities to be used by custom expectations.</p>\n"}, {"fullname": "lakehouse_engine.utils.expectations_utils.validate_result", "modulename": "lakehouse_engine.utils.expectations_utils", "qualname": "validate_result", "kind": "function", "doc": "<p>Validates the test results of the custom expectations.</p>\n\n<p>If you need to make additional validations on your custom expectation\nand/or require additional fields to be returned you can add them before\ncalling this function. The partial_success and partial_result\noptional parameters can be used to pass the result of additional\nvalidations and add more information to the result key of the\nreturned dict respectively.</p>\n\n<p>Args:\n    expectation: Expectation to validate.\n    configuration: Configuration used in the test.\n    metrics: Test result metrics.\n    partial_success: Result of validations done before calling this method.\n    partial_result: Extra fields to be returned to the user.</p>\n\n<p>Returns:\n     The result of the validation.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">expectation</span><span class=\"p\">:</span> <span class=\"n\">great_expectations</span><span class=\"o\">.</span><span class=\"n\">expectations</span><span class=\"o\">.</span><span class=\"n\">expectation</span><span class=\"o\">.</span><span class=\"n\">Expectation</span>,</span><span class=\"param\">\t<span class=\"n\">configuration</span><span class=\"p\">:</span> <span class=\"n\">great_expectations</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">expectation_configuration</span><span class=\"o\">.</span><span class=\"n\">ExpectationConfiguration</span>,</span><span class=\"param\">\t<span class=\"n\">metrics</span><span class=\"p\">:</span> <span class=\"n\">Dict</span>,</span><span class=\"param\">\t<span class=\"n\">partial_success</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">partial_result</span><span class=\"p\">:</span> <span class=\"nb\">dict</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction", "modulename": "lakehouse_engine.utils.extraction", "kind": "module", "doc": "<p>Extraction utilities package.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "kind": "module", "doc": "<p>Utilities module for JDBC extraction processes.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionType", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionType", "kind": "class", "doc": "<p>Standardize the types of extractions we can have from a JDBC source.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionType.INIT", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionType.INIT", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;JDBCExtractionType.INIT: &#x27;init&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionType.DELTA", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionType.DELTA", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;JDBCExtractionType.DELTA: &#x27;delta&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtraction", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtraction", "kind": "class", "doc": "<p>Configurations available for an Extraction from a JDBC source.</p>\n\n<p>These configurations cover:\n    user: username to connect to JDBC source.\n    password: password to connect to JDBC source (always use secrets,\n        don't use text passwords in your code).\n    url: url to connect to JDBC source.\n    dbtable: database.table to extract data from.\n    calc_upper_bound_schema: custom schema used for the upper bound calculation.\n    changelog_table: table of type changelog from which to extract data,\n        when the extraction type is delta.\n    partition_column: column used to split the extraction.\n    latest_timestamp_data_location: data location (e.g., s3) containing the data\n        to get the latest timestamp already loaded into bronze.\n    latest_timestamp_data_format: the format of the dataset in\n        latest_timestamp_data_location. Default: delta.\n    extraction_type: type of extraction (delta or init). Default: \"delta\".\n    driver: JDBC driver name. Default: \"com.sap.db.jdbc.Driver\".\n    num_partitions: number of Spark partitions to split the extraction.\n    lower_bound: lower bound to decide the partition stride.\n    upper_bound: upper bound to decide the partition stride. If\n        calculate_upper_bound is True, then upperBound will be\n        derived by our upper bound optimizer, using the partition column.\n    default_upper_bound: the value to use as default upper bound in case\n        the result of the upper bound calculation is None. Default: \"1\".\n    fetch_size: how many rows to fetch per round trip. Default: \"100000\".\n    compress: enable network compression. Default: True.\n    custom_schema: specify custom_schema for particular columns of the\n        returned dataframe in the init/delta extraction of the source table.\n    min_timestamp: min timestamp to consider to filter the changelog data.\n        Default: None and automatically derived from the location provided.\n        In case this one is provided it has precedence and the calculation\n        is not done.\n    max_timestamp: max timestamp to consider to filter the changelog data.\n        Default: None and automatically derived from the table having information\n        about the extraction requests, their timestamps and their status.\n        In case this one is provided it has precedence and the calculation\n        is not done.\n    generate_predicates: whether to generate predicates automatically or not.\n        Default: False.\n    predicates: list containing all values to partition (if generate_predicates\n        is used, the manual values provided are ignored). Default: None.\n    predicates_add_null: whether to consider null on predicates list.\n        Default: True.\n    extraction_timestamp: the timestamp of the extraction. Default: current time\n        following the format \"%Y%m%d%H%M%S\".\n    max_timestamp_custom_schema: custom schema used on the max_timestamp derivation\n        from the table holding the extraction requests information.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtraction.__init__", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtraction.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">user</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">password</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dbtable</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">calc_upper_bound_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">changelog_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">partition_column</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_data_location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_data_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">extraction_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">driver</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;com.sap.db.jdbc.Driver&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">num_partitions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">lower_bound</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upper_bound</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">default_upper_bound</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;1&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">fetch_size</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;100000&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">compress</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">custom_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">min_timestamp</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">max_timestamp</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">generate_predicates</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">predicates</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">predicates_add_null</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">extraction_timestamp</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;20231018182628&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">max_timestamp_custom_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionUtils", "kind": "class", "doc": "<p>Utils for managing data extraction from particularly relevant JDBC sources.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils.__init__", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionUtils.__init__", "kind": "function", "doc": "<p>Construct JDBCExtractionUtils.</p>\n\n<p>Args:\n    jdbc_extraction: JDBC Extraction configurations. Can be of type:\n        JDBCExtraction, SAPB4Extraction or SAPBWExtraction.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">jdbc_extraction</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils.get_additional_spark_options", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionUtils.get_additional_spark_options", "kind": "function", "doc": "<p>Helper to get additional Spark Options initially passed.</p>\n\n<p>If people provide additional Spark options, not covered by the util function\narguments (get_spark_jdbc_options), we need to consider them.\nThus, we update the options retrieved by the utils, by checking if there is\nany Spark option initially provided that is not yet considered in the retrieved\noptions or function arguments and if the value for the key is not None.\nIf these conditions are filled, we add the options and return the complete dict.</p>\n\n<p>Args:\n    input_spec: the input specification.\n    options: dict with Spark options.\n    ignore_options: list of options to be ignored by the process.\n        Spark read has two different approaches to parallelize\n        reading process, one of them is using upper/lower bound,\n        another one is using predicates, those process can't be\n        executed at the same time, you must choose one of them.\n        By choosing predicates you can't pass lower and upper bound,\n        also can't pass number of partitions and partition column\n        otherwise spark will interpret the execution partitioned by\n        upper and lower bound and will expect to fill all variables.\n        To avoid fill all predicates hardcoded at the acon, there is\n        a feature that automatically generates all predicates for init\n        or delta load based on input partition column, but at the end\n        of the process, partition column can't be passed to the options,\n        because we are choosing predicates execution, that is why to\n        generate predicates we need to pass some options to ignore.</p>\n\n<p>Returns:\n     a dict with all the options passed as argument, plus the options that\n     were initially provided, but were not used in the util\n     (get_spark_jdbc_options).</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span>,</span><span class=\"param\">\t<span class=\"n\">options</span><span class=\"p\">:</span> <span class=\"nb\">dict</span>,</span><span class=\"param\">\t<span class=\"n\">ignore_options</span><span class=\"p\">:</span> <span class=\"n\">List</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils.get_predicates", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionUtils.get_predicates", "kind": "function", "doc": "<p>Get the predicates list, based on a predicates query.</p>\n\n<p>Args:\n    predicates_query: query to use as the basis to get the distinct values for\n        a specified column, based on which predicates are generated.</p>\n\n<p>Returns:\n    List containing the predicates to use to split the extraction from\n    JDBC sources.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">predicates_query</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">List</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils.get_spark_jdbc_options", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionUtils.get_spark_jdbc_options", "kind": "function", "doc": "<p>Get the Spark options to extract data from a JDBC source.</p>\n\n<p>Returns:\n    The Spark jdbc args dictionary, including the query to submit\n    and also options args dictionary.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Tuple</span><span class=\"p\">[</span><span class=\"nb\">dict</span><span class=\"p\">,</span> <span class=\"nb\">dict</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils.get_spark_jdbc_optimal_upper_bound", "modulename": "lakehouse_engine.utils.extraction.jdbc_extraction_utils", "qualname": "JDBCExtractionUtils.get_spark_jdbc_optimal_upper_bound", "kind": "function", "doc": "<p>Get an optimal upperBound to properly split a Spark JDBC extraction.</p>\n\n<p>Returns:\n     Either an int, date or timestamp to serve as upperBound Spark JDBC option.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "kind": "module", "doc": "<p>Utilities module for SAP B4 extraction processes.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.ADSOTypes", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "ADSOTypes", "kind": "class", "doc": "<p>Standardise the types of ADSOs we can have for Extractions from SAP B4.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.ADSOTypes.AQ", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "ADSOTypes.AQ", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str", "default_value": "&lt;ADSOTypes.AQ: &#x27;AQ&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.ADSOTypes.CL", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "ADSOTypes.CL", "kind": "variable", "doc": "<p></p>\n", "annotation": ": str", "default_value": "&lt;ADSOTypes.CL: &#x27;CL&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.ADSOTypes.SUPPORTED_TYPES", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "ADSOTypes.SUPPORTED_TYPES", "kind": "variable", "doc": "<p></p>\n", "annotation": ": list", "default_value": "&lt;ADSOTypes.SUPPORTED_TYPES: [&#x27;AQ&#x27;, &#x27;CL&#x27;]&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.SAPB4Extraction", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "SAPB4Extraction", "kind": "class", "doc": "<p>Configurations available for an Extraction from SAP B4.</p>\n\n<p>It inherits from JDBCExtraction configurations, so it can use\nand/or overwrite those configurations.</p>\n\n<p>These configurations cover:\n    latest_timestamp_input_col: the column containing the request timestamps\n        in the dataset in latest_timestamp_data_location. Default: REQTSN.\n    request_status_tbl: the name of the SAP B4 table having information\n        about the extraction requests. Composed of database.table.\n        Default: SAPHANADB.RSPMREQUEST.\n    request_col_name: name of the column having the request timestamp to join\n        with the request status table. Default: REQUEST_TSN.\n    data_target: the data target to extract from. User in the join operation with\n        the request status table.\n    act_req_join_condition: the join condition into activation table\n        can be changed using this property.\n        Default: 'tbl.reqtsn = req.request_col_name'.\n    include_changelog_tech_cols: whether to include the technical columns\n        (usually coming from the changelog) table or not.\n    extra_cols_req_status_tbl: columns to be added from request status table.\n        It needs to contain the prefix \"req.\". E.g. \"req.col1 as column_one,\n        req.col2 as column_two\".\n    request_status_tbl_filter: filter to use for filtering the request status table,\n        influencing the calculation of the max timestamps and the delta extractions.\n    adso_type: the type of ADSO that you are extracting from. Can be \"AQ\" or \"CL\".\n    max_timestamp_custom_schema: the custom schema to apply on the calculation of\n        the max timestamp to consider for the delta extractions.\n        Default: timestamp DECIMAL(23,0).\n    default_max_timestamp: the timestamp to use as default, when it is not possible\n        to derive one.\n    custom_schema: specify custom_schema for particular columns of the\n        returned dataframe in the init/delta extraction of the source table.</p>\n", "bases": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtraction"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.SAPB4Extraction.__init__", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "SAPB4Extraction.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">user</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">password</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dbtable</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">calc_upper_bound_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">changelog_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">partition_column</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_data_location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_data_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">extraction_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">driver</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;com.sap.db.jdbc.Driver&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">num_partitions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">lower_bound</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upper_bound</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">default_upper_bound</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;1&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">fetch_size</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;100000&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">compress</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">custom_schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;REQTSN DECIMAL(23,0)&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">min_timestamp</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">max_timestamp</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">generate_predicates</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">predicates</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">predicates_add_null</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">extraction_timestamp</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;20231018182628&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">max_timestamp_custom_schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;timestamp DECIMAL(23,0)&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_input_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;REQTSN&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">request_status_tbl</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;SAPHANADB.RSPMREQUEST&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">request_col_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;REQUEST_TSN&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">data_target</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">act_req_join_condition</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">include_changelog_tech_cols</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">bool</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">extra_cols_req_status_tbl</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">request_status_tbl_filter</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">adso_type</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">default_max_timestamp</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;1970000000000000000000&#39;</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.SAPB4ExtractionUtils", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "SAPB4ExtractionUtils", "kind": "class", "doc": "<p>Utils for managing data extraction from SAP B4.</p>\n", "bases": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.SAPB4ExtractionUtils.__init__", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "SAPB4ExtractionUtils.__init__", "kind": "function", "doc": "<p>Construct SAPB4ExtractionUtils.</p>\n\n<p>Args:\n    sap_b4_extraction: SAP B4 Extraction configurations.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">sap_b4_extraction</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">utils</span><span class=\"o\">.</span><span class=\"n\">extraction</span><span class=\"o\">.</span><span class=\"n\">sap_b4_extraction_utils</span><span class=\"o\">.</span><span class=\"n\">SAPB4Extraction</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils.SAPB4ExtractionUtils.get_data_target", "modulename": "lakehouse_engine.utils.extraction.sap_b4_extraction_utils", "qualname": "SAPB4ExtractionUtils.get_data_target", "kind": "function", "doc": "<p>Get the data_target from the data_target option or derive it.</p>\n\n<p>By definition data_target is the same for the table and changelog table and\nis the same string ignoring everything before / and the first and last\ncharacter after /. E.g. for a dbtable /BIC/abtable12, the data_target\nwould be btable1.</p>\n\n<p>Args:\n    input_spec_opt: options from the input_spec.</p>\n\n<p>Returns:\n    A string with the data_target.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec_opt</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "kind": "module", "doc": "<p>Utilities module for SAP BW extraction processes.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils.SAPBWExtraction", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "qualname": "SAPBWExtraction", "kind": "class", "doc": "<p>Configurations available for an Extraction from SAP BW.</p>\n\n<p>It inherits from SAPBWExtraction configurations, so it can use\nand/or overwrite those configurations.</p>\n\n<p>These configurations cover:\n    latest_timestamp_input_col: the column containing the actrequest timestamp\n        in the dataset in latest_timestamp_data_location. Default:\n        \"actrequest_timestamp\".\n    act_request_table: the name of the SAP BW activation requests table.\n        Composed of database.table. Default: SAPPHA.RSODSACTREQ.\n    request_col_name: name of the column having the request to join\n        with the activation request table. Default: actrequest.\n    act_req_join_condition: the join condition into activation table\n        can be changed using this property.\n        Default: 'changelog_tbl.request = act_req.request_col_name'.\n    odsobject: name of BW Object, used for joining with the activation request\n        table to get the max actrequest_timestamp to consider while filtering\n        the changelog table.\n    include_changelog_tech_cols: whether to include the technical columns\n        (usually coming from the changelog) table or not. Default: True.\n    extra_cols_act_request: list of columns to be added from act request table.\n        It needs to contain the prefix \"act_req.\". E.g. \"act_req.col1\n        as column_one, act_req.col2 as column_two\".\n    get_timestamp_from_act_request: whether to get init timestamp\n        from act request table or assume current/given timestamp.\n    sap_bw_schema: sap bw schema. Default: SAPPHA.\n    max_timestamp_custom_schema: the custom schema to apply on the calculation of\n        the max timestamp to consider for the delta extractions.\n        Default: timestamp DECIMAL(23,0).\n    default_max_timestamp: the timestamp to use as default, when it is not possible\n        to derive one.</p>\n", "bases": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtraction"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils.SAPBWExtraction.__init__", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "qualname": "SAPBWExtraction.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">user</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">password</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">dbtable</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">calc_upper_bound_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">changelog_table</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">partition_column</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_data_location</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_data_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">extraction_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;delta&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">driver</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;com.sap.db.jdbc.Driver&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">num_partitions</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">lower_bound</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">upper_bound</span><span class=\"p\">:</span> <span class=\"n\">Union</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"nb\">float</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">NoneType</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">default_upper_bound</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;1&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">fetch_size</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;100000&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">compress</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">custom_schema</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">min_timestamp</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">max_timestamp</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">generate_predicates</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">predicates</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">List</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">predicates_add_null</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">extraction_timestamp</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;20231018182628&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">max_timestamp_custom_schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;timestamp DECIMAL(15,0)&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">latest_timestamp_input_col</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;actrequest_timestamp&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">act_request_table</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;SAPPHA.RSODSACTREQ&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">request_col_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;actrequest&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">act_req_join_condition</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">odsobject</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">include_changelog_tech_cols</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">extra_cols_act_request</span><span class=\"p\">:</span> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">get_timestamp_from_act_request</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">sap_bw_schema</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;SAPPHA&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">default_max_timestamp</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;197000000000000&#39;</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils.SAPBWExtractionUtils", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "qualname": "SAPBWExtractionUtils", "kind": "class", "doc": "<p>Utils for managing data extraction from particularly relevant JDBC sources.</p>\n", "bases": "lakehouse_engine.utils.extraction.jdbc_extraction_utils.JDBCExtractionUtils"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils.SAPBWExtractionUtils.__init__", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "qualname": "SAPBWExtractionUtils.__init__", "kind": "function", "doc": "<p>Construct SAPBWExtractionUtils.</p>\n\n<p>Args:\n    sap_bw_extraction: SAP BW Extraction configurations.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">sap_bw_extraction</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">utils</span><span class=\"o\">.</span><span class=\"n\">extraction</span><span class=\"o\">.</span><span class=\"n\">sap_bw_extraction_utils</span><span class=\"o\">.</span><span class=\"n\">SAPBWExtraction</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils.SAPBWExtractionUtils.get_changelog_table", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "qualname": "SAPBWExtractionUtils.get_changelog_table", "kind": "function", "doc": "<p>Get the changelog table, given an odsobject.</p>\n\n<p>Returns:\n     String to use as changelog_table.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils.SAPBWExtractionUtils.get_odsobject", "modulename": "lakehouse_engine.utils.extraction.sap_bw_extraction_utils", "qualname": "SAPBWExtractionUtils.get_odsobject", "kind": "function", "doc": "<p>Get the odsobject based on the provided options.</p>\n\n<p>With the table name we may also get the db name, so we need to split.\nMoreover, there might be the need for people to specify odsobject if\nit is different from the dbtable.</p>\n\n<p>Args:\n    input_spec_opt: options from the input_spec.</p>\n\n<p>Returns:\n    A string with the odsobject.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">input_spec_opt</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "kind": "module", "doc": "<p>Utilities module for SFTP extraction processes.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPInputFormat", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPInputFormat", "kind": "class", "doc": "<p>Formats of algorithm input.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPInputFormat.CSV", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPInputFormat.CSV", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPInputFormat.CSV: &#x27;csv&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPInputFormat.FWF", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPInputFormat.FWF", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPInputFormat.FWF: &#x27;fwf&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPInputFormat.JSON", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPInputFormat.JSON", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPInputFormat.JSON: &#x27;json&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPInputFormat.XML", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPInputFormat.XML", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPInputFormat.XML: &#x27;xml&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionFilter", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionFilter", "kind": "class", "doc": "<p>Standardize the types of filters we can have from a SFTP source.</p>\n", "bases": "enum.Enum"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionFilter.file_name_contains", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionFilter.file_name_contains", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPExtractionFilter.file_name_contains: &#x27;file_name_contains&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionFilter.LATEST_FILE", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionFilter.LATEST_FILE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPExtractionFilter.LATEST_FILE: &#x27;latest_file&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionFilter.EARLIEST_FILE", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionFilter.EARLIEST_FILE", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPExtractionFilter.EARLIEST_FILE: &#x27;earliest_file&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionFilter.GREATER_THAN", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionFilter.GREATER_THAN", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPExtractionFilter.GREATER_THAN: &#x27;date_time_gt&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionFilter.LOWER_THAN", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionFilter.LOWER_THAN", "kind": "variable", "doc": "<p></p>\n", "default_value": "&lt;SFTPExtractionFilter.LOWER_THAN: &#x27;date_time_lt&#x27;&gt;"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionUtils", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionUtils", "kind": "class", "doc": "<p>Utils for managing data extraction from particularly relevant SFTP sources.</p>\n"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionUtils.get_files_list", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionUtils.get_files_list", "kind": "function", "doc": "<p>Get a list of files to be extracted from SFTP.</p>\n\n<p>The arguments (options_args) to list files are:\ndate_time_gt(str):\n    Filter the files greater than the string datetime\n    formatted as \"YYYY-MM-DD\" or \"YYYY-MM-DD HH:MM:SS\".\ndate_time_lt(str):\n    Filter the files lower than the string datetime\n    formatted as \"YYYY-MM-DD\" or \"YYYY-MM-DD HH:MM:SS\".\nearliest_file(bool):\n    Filter the earliest dated file in the directory.\nfile_name_contains(str):\n    Filter files when match the pattern.\nlatest_file(bool):\n    Filter the most recent dated file in the directory.\nsub_dir(bool):\n    When true, the engine will search files into subdirectories\n    of the remote_path.\n    It will consider one level below the remote_path.\n    When sub_dir is used with latest_file/earliest_file argument,\n    the engine will retrieve the latest_file/earliest_file\n    for each subdirectory.</p>\n\n<p>Args:\n    sftp: the SFTP client object.\n    remote_path: path of files to be filtered.\n    options_args: options from the acon.</p>\n\n<p>Returns:\n    A list containing the file names to be passed to Spark.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">sftp</span><span class=\"p\">:</span> <span class=\"n\">paramiko</span><span class=\"o\">.</span><span class=\"n\">sftp_client</span><span class=\"o\">.</span><span class=\"n\">SFTPClient</span>,</span><span class=\"param\">\t<span class=\"n\">remote_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span>,</span><span class=\"param\">\t<span class=\"n\">options_args</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Set</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionUtils.get_sftp_client", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionUtils.get_sftp_client", "kind": "function", "doc": "<p>Get the SFTP client.</p>\n\n<p>The SFTP client is used to open an SFTP session across an open\nSSH Transport and perform remote file operations.</p>\n\n<p>Args:\n    options_args: dictionary containing SFTP connection parameters.\n    The Paramiko arguments expected to connect are:\n        \"hostname\": the server to connect to.\n        \"port\": the server port to connect to.\n        \"username\": the username to authenticate as.\n        \"password\": used for password authentication.\n        \"pkey\": optional - an optional public key to use for authentication.\n        \"passphrase\" \u2013 optional - options used for decrypting private keys.\n        \"key_filename\" \u2013 optional - the filename, or list of filenames,\n            of optional private key(s) and/or certs to try for authentication.\n        \"timeout\" \u2013 an optional timeout (in seconds) for the TCP connect.\n        \"allow_agent\" \u2013 optional - set to False to disable\n            connecting to the SSH agent.\n        \"look_for_keys\" \u2013 optional - set to False to disable searching\n            for discoverable private key files in ~/.ssh/.\n        \"compress\" \u2013 optional - set to True to turn on compression.\n        \"sock\" - optional - an open socket or socket-like object\n            to use for communication to the target host.\n        \"gss_auth\" \u2013 optional - True if you want to use GSS-API authentication.\n        \"gss_kex\" \u2013 optional - Perform GSS-API Key Exchange and\n            user authentication.\n        \"gss_deleg_creds\" \u2013 optional - Delegate GSS-API client\n            credentials or not.\n        \"gss_host\" \u2013 optional - The targets name in the kerberos database.\n        \"gss_trust_dns\" \u2013 optional - Indicates whether or\n            not the DNS is trusted to securely canonicalize the name of the\n            host being connected to (default True).\n        \"banner_timeout\" \u2013 an optional timeout (in seconds)\n            to wait for the SSH banner to be presented.\n        \"auth_timeout\" \u2013 an optional timeout (in seconds)\n            to wait for an authentication response.\n        \"disabled_algorithms\" \u2013 an optional dict passed directly to Transport\n            and its keyword argument of the same name.\n        \"transport_factory\" \u2013 an optional callable which is handed a subset of\n            the constructor arguments (primarily those related to the socket,\n            GSS functionality, and algorithm selection) and generates a\n            Transport instance to be used by this client.\n            Defaults to Transport.__init__.</p>\n\n<pre><code>The parameter to specify the private key is expected to be in RSA format.\nAttempting a connection with a blank host key is not allowed\nunless the argument \"add_auto_policy\" is explicitly set to True.\n</code></pre>\n\n<p>Returns:\n    sftp -> a new SFTPClient session object.\n    transport -> the Transport for this connection.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">options_args</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Tuple</span><span class=\"p\">[</span><span class=\"n\">paramiko</span><span class=\"o\">.</span><span class=\"n\">sftp_client</span><span class=\"o\">.</span><span class=\"n\">SFTPClient</span><span class=\"p\">,</span> <span class=\"n\">paramiko</span><span class=\"o\">.</span><span class=\"n\">transport</span><span class=\"o\">.</span><span class=\"n\">Transport</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionUtils.validate_format", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionUtils.validate_format", "kind": "function", "doc": "<p>Validate the file extension based on the format definitions.</p>\n\n<p>Args:\n    files_format: a string containing the file extension.</p>\n\n<p>Returns:\n    The string validated and formatted.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">files_format</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.extraction.sftp_extraction_utils.SFTPExtractionUtils.validate_location", "modulename": "lakehouse_engine.utils.extraction.sftp_extraction_utils", "qualname": "SFTPExtractionUtils.validate_location", "kind": "function", "doc": "<p>Validate the location. Add \"/\" in the case it does not exist.</p>\n\n<p>Args:\n    location: file path.</p>\n\n<p>Returns:\n    The location validated.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">location</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">str</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.file_utils", "modulename": "lakehouse_engine.utils.file_utils", "kind": "module", "doc": "<p>Utilities for file name based operations.</p>\n"}, {"fullname": "lakehouse_engine.utils.file_utils.get_file_names_without_file_type", "modulename": "lakehouse_engine.utils.file_utils", "qualname": "get_file_names_without_file_type", "kind": "function", "doc": "<p>Function to retrieve list of file names in a folder.</p>\n\n<p>This function filters by file type and removes the extension of the file name\nit returns.</p>\n\n<p>Args:\n    path: path to the folder to list files\n    file_type: type of the file to include in list\n    exclude_regex: regex of file names to exclude</p>\n\n<p>Returns:\n    A list of file names without file type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">path</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">file_type</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">exclude_regex</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.logging_handler", "modulename": "lakehouse_engine.utils.logging_handler", "kind": "module", "doc": "<p>Module to configure project logging.</p>\n"}, {"fullname": "lakehouse_engine.utils.logging_handler.FilterSensitiveData", "modulename": "lakehouse_engine.utils.logging_handler", "qualname": "FilterSensitiveData", "kind": "class", "doc": "<p>Logging filter to hide sensitive data from being shown in the logs.</p>\n", "bases": "logging.Filter"}, {"fullname": "lakehouse_engine.utils.logging_handler.FilterSensitiveData.filter", "modulename": "lakehouse_engine.utils.logging_handler", "qualname": "FilterSensitiveData.filter", "kind": "function", "doc": "<p>Hide sensitive information from being shown in the logs.</p>\n\n<p>Based on the configured regex and replace strings, the content of the log\nrecords is replaced and then all the records are allowed to be logged\n(return True).</p>\n\n<p>Args:\n    record: the LogRecord event being logged.</p>\n\n<p>Returns:\n    The transformed record to be logged.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">record</span><span class=\"p\">:</span> <span class=\"n\">logging</span><span class=\"o\">.</span><span class=\"n\">LogRecord</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">bool</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.logging_handler.LoggingHandler", "modulename": "lakehouse_engine.utils.logging_handler", "qualname": "LoggingHandler", "kind": "class", "doc": "<p>Handle the logging of the lakehouse engine project.</p>\n"}, {"fullname": "lakehouse_engine.utils.logging_handler.LoggingHandler.__init__", "modulename": "lakehouse_engine.utils.logging_handler", "qualname": "LoggingHandler.__init__", "kind": "function", "doc": "<p>Construct a LoggingHandler instance.</p>\n\n<p>Args:\n    class_name: name of the class to be indicated in the logs.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">class_name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span>)</span>"}, {"fullname": "lakehouse_engine.utils.logging_handler.LoggingHandler.get_logger", "modulename": "lakehouse_engine.utils.logging_handler", "qualname": "LoggingHandler.get_logger", "kind": "function", "doc": "<p>Get the _logger instance variable.</p>\n\n<h6 id=\"returns\">Returns</h6>\n\n<blockquote>\n  <p>the logger object.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span></span><span class=\"return-annotation\">) -> <span class=\"n\">logging</span><span class=\"o\">.</span><span class=\"n\">Logger</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.schema_utils", "modulename": "lakehouse_engine.utils.schema_utils", "kind": "module", "doc": "<p>Utilities to facilitate dataframe schema management.</p>\n"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils", "kind": "class", "doc": "<p>Schema utils that help retrieve and manage schemas of dataframes.</p>\n"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils.from_file", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils.from_file", "kind": "function", "doc": "<p>Get a spark schema from a file (spark StructType json file) in a file system.</p>\n\n<p>Args:\n    file_path: path of the file in a file system. Check here:\n        <a href=\"https://spark.apache.org/docs/latest/api/java/org/apache/spark/sql/types/\">https://spark.apache.org/docs/latest/api/java/org/apache/spark/sql/types/</a>\n        StructType.html</p>\n\n<p>Returns:\n    Spark schema struct type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">file_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">StructType</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils.from_file_to_dict", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils.from_file_to_dict", "kind": "function", "doc": "<p>Get a dict with the spark schema from a file in a file system.</p>\n\n<p>Args:\n    file_path: path of the file in a file system. Check here:\n        <a href=\"https://spark.apache.org/docs/latest/api/java/org/apache/spark/sql/types/\">https://spark.apache.org/docs/latest/api/java/org/apache/spark/sql/types/</a>\n        StructType.html</p>\n\n<p>Returns:\n     Spark schema in a dict.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">file_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils.from_dict", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils.from_dict", "kind": "function", "doc": "<p>Get a spark schema from a dict.</p>\n\n<p>Args:\n    struct_type: dict containing a spark schema structure. Check here:\n        <a href=\"https://spark.apache.org/docs/latest/api/java/org/apache/spark/sql/types/\">https://spark.apache.org/docs/latest/api/java/org/apache/spark/sql/types/</a>\n        StructType.html</p>\n\n<p>Returns:\n     Spark schema struct type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">struct_type</span><span class=\"p\">:</span> <span class=\"nb\">dict</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">StructType</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils.from_table_schema", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils.from_table_schema", "kind": "function", "doc": "<p>Get a spark schema from a table.</p>\n\n<p>Args:\n    table: table name from which to inherit the schema.</p>\n\n<p>Returns:\n    Spark schema struct type.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">table</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">StructType</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils.from_input_spec", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils.from_input_spec", "kind": "function", "doc": "<p>Get a spark schema from an input specification.</p>\n\n<p>This covers scenarios where the schema is provided as part of the input\nspecification of the algorithm. Schema can come from the table specified in the\ninput specification (enforce_schema_from_table) or by the dict with the spark\nschema provided there also.</p>\n\n<p>Args:\n    input_spec: input specification.</p>\n\n<p>Returns:\n    spark schema struct type.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">cls</span>,</span><span class=\"param\">\t<span class=\"n\">input_spec</span><span class=\"p\">:</span> <span class=\"n\">lakehouse_engine</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">definitions</span><span class=\"o\">.</span><span class=\"n\">InputSpec</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Optional</span><span class=\"p\">[</span><span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">StructType</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.schema_utils.SchemaUtils.schema_flattener", "modulename": "lakehouse_engine.utils.schema_utils", "qualname": "SchemaUtils.schema_flattener", "kind": "function", "doc": "<p>Recursive method to flatten the schema of the dataframe.</p>\n\n<p>Args:\n    schema: schema to be flattened.\n    prefix: prefix of the struct to get the value for. Only relevant\n    for being used in the internal recursive logic.\n    level: level of the depth in the schema being flattened. Only relevant\n    for being used in the internal recursive logic.\n    max_level: level until which you want to flatten the schema. Default: None.\n    shorten_names: whether to shorten the names of the prefixes of the fields\n    being flattened or not. Default: False.\n    alias: whether to define alias for the columns being flattened or\n    not. Default: True.\n    num_chars: number of characters to consider when shortening the names of\n    the fields. Default: 7.\n    ignore_cols: columns which you don't want to flatten. Default: None.</p>\n\n<p>Returns:\n    A function to be called in .transform() spark function.</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">schema</span><span class=\"p\">:</span> <span class=\"n\">pyspark</span><span class=\"o\">.</span><span class=\"n\">sql</span><span class=\"o\">.</span><span class=\"n\">types</span><span class=\"o\">.</span><span class=\"n\">StructType</span>,</span><span class=\"param\">\t<span class=\"n\">prefix</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">level</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">1</span>,</span><span class=\"param\">\t<span class=\"n\">max_level</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">shorten_names</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">alias</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">num_chars</span><span class=\"p\">:</span> <span class=\"nb\">int</span> <span class=\"o\">=</span> <span class=\"mi\">7</span>,</span><span class=\"param\">\t<span class=\"n\">ignore_cols</span><span class=\"p\">:</span> <span class=\"n\">List</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"n\">List</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage", "modulename": "lakehouse_engine.utils.storage", "kind": "module", "doc": "<p>Utilities to interact with storage systems.</p>\n"}, {"fullname": "lakehouse_engine.utils.storage.file_storage", "modulename": "lakehouse_engine.utils.storage.file_storage", "kind": "module", "doc": "<p>Module for abstract representation of a storage system holding files.</p>\n"}, {"fullname": "lakehouse_engine.utils.storage.file_storage.FileStorage", "modulename": "lakehouse_engine.utils.storage.file_storage", "qualname": "FileStorage", "kind": "class", "doc": "<p>Abstract file storage class.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.utils.storage.file_storage.FileStorage.get_file_payload", "modulename": "lakehouse_engine.utils.storage.file_storage", "qualname": "FileStorage.get_file_payload", "kind": "function", "doc": "<p>Get the payload of a file.</p>\n\n<p>Args:\n    url: url of the file.</p>\n\n<p>Returns:\n    File payload/content.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"n\">urllib</span><span class=\"o\">.</span><span class=\"n\">parse</span><span class=\"o\">.</span><span class=\"n\">ParseResult</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage.file_storage.FileStorage.write_payload_to_file", "modulename": "lakehouse_engine.utils.storage.file_storage", "qualname": "FileStorage.write_payload_to_file", "kind": "function", "doc": "<p>Write payload into a file.</p>\n\n<p>Args:\n    url: url of the file.\n    content: content to write into the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"n\">urllib</span><span class=\"o\">.</span><span class=\"n\">parse</span><span class=\"o\">.</span><span class=\"n\">ParseResult</span>, </span><span class=\"param\"><span class=\"n\">content</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage.file_storage_functions", "modulename": "lakehouse_engine.utils.storage.file_storage_functions", "kind": "module", "doc": "<p>Module for common file storage functions.</p>\n"}, {"fullname": "lakehouse_engine.utils.storage.file_storage_functions.FileStorageFunctions", "modulename": "lakehouse_engine.utils.storage.file_storage_functions", "qualname": "FileStorageFunctions", "kind": "class", "doc": "<p>Class for common file storage functions.</p>\n", "bases": "abc.ABC"}, {"fullname": "lakehouse_engine.utils.storage.file_storage_functions.FileStorageFunctions.read_json", "modulename": "lakehouse_engine.utils.storage.file_storage_functions", "qualname": "FileStorageFunctions.read_json", "kind": "function", "doc": "<p>Read a json file.</p>\n\n<p>The file should be in a supported file system (e.g., s3 or local filesystem -\nfor local tests only).</p>\n\n<p>Args:\n    path: path to the json file.</p>\n\n<p>Returns:\n    Dict with json file content.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">path</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage.local_fs_storage", "modulename": "lakehouse_engine.utils.storage.local_fs_storage", "kind": "module", "doc": "<p>Module to represent a local file storage system.</p>\n"}, {"fullname": "lakehouse_engine.utils.storage.local_fs_storage.LocalFSStorage", "modulename": "lakehouse_engine.utils.storage.local_fs_storage", "qualname": "LocalFSStorage", "kind": "class", "doc": "<p>Class to represent a local file storage system.</p>\n", "bases": "lakehouse_engine.utils.storage.file_storage.FileStorage"}, {"fullname": "lakehouse_engine.utils.storage.local_fs_storage.LocalFSStorage.get_file_payload", "modulename": "lakehouse_engine.utils.storage.local_fs_storage", "qualname": "LocalFSStorage.get_file_payload", "kind": "function", "doc": "<p>Get the payload of a file.</p>\n\n<p>Args:\n    url: url of the file.</p>\n\n<p>Returns:\n    file payload/content.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"n\">urllib</span><span class=\"o\">.</span><span class=\"n\">parse</span><span class=\"o\">.</span><span class=\"n\">ParseResult</span></span><span class=\"return-annotation\">) -> &lt;class &#x27;TextIO&#x27;&gt;:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage.local_fs_storage.LocalFSStorage.write_payload_to_file", "modulename": "lakehouse_engine.utils.storage.local_fs_storage", "qualname": "LocalFSStorage.write_payload_to_file", "kind": "function", "doc": "<p>Write payload into a file.</p>\n\n<p>Args:\n    url: url of the file.\n    content: content to write into the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"n\">urllib</span><span class=\"o\">.</span><span class=\"n\">parse</span><span class=\"o\">.</span><span class=\"n\">ParseResult</span>, </span><span class=\"param\"><span class=\"n\">content</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage.s3_storage", "modulename": "lakehouse_engine.utils.storage.s3_storage", "kind": "module", "doc": "<p>Module to represent a s3 file storage system.</p>\n"}, {"fullname": "lakehouse_engine.utils.storage.s3_storage.S3Storage", "modulename": "lakehouse_engine.utils.storage.s3_storage", "qualname": "S3Storage", "kind": "class", "doc": "<p>Class to represent a s3 file storage system.</p>\n", "bases": "lakehouse_engine.utils.storage.file_storage.FileStorage"}, {"fullname": "lakehouse_engine.utils.storage.s3_storage.S3Storage.get_file_payload", "modulename": "lakehouse_engine.utils.storage.s3_storage", "qualname": "S3Storage.get_file_payload", "kind": "function", "doc": "<p>Get the payload of a config file.</p>\n\n<p>Args:\n    url: url of the file.</p>\n\n<p>Returns:\n    File payload/content.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"n\">urllib</span><span class=\"o\">.</span><span class=\"n\">parse</span><span class=\"o\">.</span><span class=\"n\">ParseResult</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, {"fullname": "lakehouse_engine.utils.storage.s3_storage.S3Storage.write_payload_to_file", "modulename": "lakehouse_engine.utils.storage.s3_storage", "qualname": "S3Storage.write_payload_to_file", "kind": "function", "doc": "<p>Write payload into a file.</p>\n\n<p>Args:\n    url: url of the file.\n    content: content to write into the file.</p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">cls</span>, </span><span class=\"param\"><span class=\"n\">url</span><span class=\"p\">:</span> <span class=\"n\">urllib</span><span class=\"o\">.</span><span class=\"n\">parse</span><span class=\"o\">.</span><span class=\"n\">ParseResult</span>, </span><span class=\"param\"><span class=\"n\">content</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}];
 
     // mirrored in build-search-index.js (part 1)
     // Also split on html tags. this is a cheap heuristic, but good enough.