danielgafni · edgBR · Dec 18, 2023 · Dec 18, 2023 · Dec 18, 2023 · Dec 18, 2023
diff --git a/.github/workflows/ci.yml b/.github/workflows/ci.yml
@@ -37,6 +37,7 @@ jobs:
           - "0.17.0"
           - "0.18.0"
           - "0.19.0"
+          - "0.20.1"
     steps:
       - name: Setup python for test ${{ matrix.py }}
         uses: actions/setup-python@v2
@@ -81,6 +82,7 @@ jobs:
           - "0.17.0"
           - "0.18.0"
           - "0.19.0"
+          - "0.20.0" #minimal version for delta merge
     steps:
       - name: Setup python for test ${{ matrix.py }}
         uses: actions/setup-python@v2

diff --git a/.pre-commit-config.yaml b/.pre-commit-config.yaml
@@ -43,3 +43,5 @@ repos:
         entry: pyright .
         language: system
         pass_filenames: false
+        language: system
+        pass_filenames: false
diff --git a/dagster_polars/io_managers/delta.py b/dagster_polars/io_managers/delta.py
@@ -24,6 +24,7 @@ class DeltaWriteMode(str, Enum):
     append = "append"
     overwrite = "overwrite"
     ignore = "ignore"
+    merge = "merge"
 
 
 class PolarsDeltaIOManager(BasePolarsUPathIOManager):
@@ -49,7 +50,10 @@ def dump_df_to_path(
     ):
         assert context.metadata is not None
 
-        delta_write_options = context.metadata.get("delta_write_options")
+        if context.metadata.get("mode") or self.mode != "merge":
+            delta_write_options = context.metadata.get("delta_write_options")
+        else:
+            delta_merge_options = context.metadata.get("delta_merge_options")
 
         if context.has_asset_partitions:
             delta_write_options = delta_write_options or {}
@@ -63,13 +67,26 @@ def dump_df_to_path(
 
         storage_options = self.get_storage_options(path)
 
-        df.write_delta(
-            str(path),
-            mode=context.metadata.get("mode") or self.mode,  # type: ignore
-            overwrite_schema=context.metadata.get("overwrite_schema") or self.overwrite_schema,
-            storage_options=storage_options,
-            delta_write_options=delta_write_options,
-        )
+        if context.metadata.get("mode") or self.mode != "merge":
+            df.write_delta(
+                str(path),
+                mode=context.metadata.get("mode") or self.mode,  # type: ignore
+                overwrite_schema=context.metadata.get("overwrite_schema") or self.overwrite_schema,
+                storage_options=storage_options,
+                delta_write_options=delta_write_options,
+            )
+        else:
+            ( 
+                df.write_delta(
+                    str(path),
+                    mode=context.metadata.get("mode") or self.mode,  # type: ignore
+                    storage_options=storage_options,
+                    delta_merge_options=delta_merge_options,
+                )
+                .when_matched_update_all()
+                .when_not_matched_insert_all()
+                .execute()
+            )
         current_version = DeltaTable(str(path), storage_options=storage_options).version()
         context.add_output_metadata({"version": current_version})
 

diff --git a/pyproject.toml b/pyproject.toml
@@ -3,7 +3,8 @@ name = "dagster-polars"
 version = "0.0.0"
 description = "Dagster integration library for Polars"
 authors = [
-    "Daniel Gafni <[email protected]>"
+    "Daniel Gafni <[email protected]>",
+    "Edgar Bahilo <[email protected]>"
 ]
 readme = "README.md"
 packages = [{include = "dagster_polars"}]
@@ -28,11 +29,11 @@ license = "Apache-2.0"
 [tool.poetry.dependencies]
 python = "^3.8"
 dagster = "^1.4.0"
-polars = ">=0.17.0"
+polars = ">=0.20.1"
 pyarrow = ">=8.0.0"
 typing-extensions = "^4.7.1"
 
-deltalake = { version = ">=0.10.0", optional = true }
+deltalake = { version = ">=0.14.0", optional = true }
 dagster-gcp = { version = ">=0.19.5", optional = true }
 universal-pathlib = "^0.1.4"
 

diff --git a/tests/test_polars_delta.py b/tests/test_polars_delta.py
@@ -101,7 +101,16 @@ def append_asset() -> pl.DataFrame:
 
     pl_testing.assert_frame_equal(pl.concat([df, df]), pl.read_delta(saved_path))
 
-
+def test_polars_delta_io_manager_merge(polars_delta_io_manager: PolarsDeltaIOManager):
+    df = pl.DataFrame(
+        {
+            "a": [1, 2, 3],
+        }
+    )
+    x = "hello"
+    assert "hello" == x
+    ####
+
 def test_polars_delta_io_manager_overwrite_schema(
     polars_delta_io_manager: PolarsDeltaIOManager, dagster_instance: DagsterInstance
 ):