Backport PRs #3201, #3523, #3547, #3580 to the 2.8.x branch. #3536

rwgk · 2025-01-27T18:26:03Z

Description

To resolve CI issues.
To not have to deal with very different pyproject.toml/setup.py between main and 2.8.x.

This PR is a pure accumulation of git cherry-picks:

@shwina

* Add cccl/python/cuda_cccl directory and use from cuda_parallel, cuda_cooperative * Run `copy_cccl_headers_to_aude_include()` before `setup()` * Create python/cuda_cccl/cuda/_include/__init__.py, then simply import cuda._include to find the include path. * Add cuda.cccl._version exactly as for cuda.cooperative and cuda.parallel * Bug fix: cuda/_include only exists after shutil.copytree() ran. * Use `f"cuda-cccl @ file://{cccl_path}/python/cuda_cccl"` in setup.py * Remove CustomBuildCommand, CustomWheelBuild in cuda_parallel/setup.py (they are equivalent to the default functions) * Replace := operator (needs Python 3.8+) * Fix oversights: remove `pip3 install ./cuda_cccl` lines from README.md * Restore original README.md: `pip3 install -e` now works on first pass. * cuda_cccl/README.md: FOR INTERNAL USE ONLY * Remove `$pymajor.$pyminor.` prefix in cuda_cccl _version.py (as suggested under NVIDIA#3201 (comment)) Command used: ci/update_version.sh 2 8 0 * Modernize pyproject.toml, setup.py Trigger for this change: * NVIDIA#3201 (comment) * NVIDIA#3201 (comment) * Install CCCL headers under cuda.cccl.include Trigger for this change: * NVIDIA#3201 (comment) Unexpected accidental discovery: cuda.cooperative unit tests pass without CCCL headers entirely. * Factor out cuda_cccl/cuda/cccl/include_paths.py * Reuse cuda_cccl/cuda/cccl/include_paths.py from cuda_cooperative * Add missing Copyright notice. * Add missing __init__.py (cuda.cccl) * Add `"cuda.cccl"` to `autodoc.mock_imports` * Move cuda.cccl.include_paths into function where it is used. (Attempt to resolve Build and Verify Docs failure.) * Add # TODO: move this to a module-level import * Modernize cuda_cooperative/pyproject.toml, setup.py * Convert cuda_cooperative to use hatchling as build backend. * Revert "Convert cuda_cooperative to use hatchling as build backend." This reverts commit 61637d6. * Move numpy from [build-system] requires -> [project] dependencies * Move pyproject.toml [project] dependencies -> setup.py install_requires, to be able to use CCCL_PATH * Remove copy_license() and use license_files=["../../LICENSE"] instead. * Further modernize cuda_cccl/setup.py to use pathlib * Trivial simplifications in cuda_cccl/pyproject.toml * Further simplify cuda_cccl/pyproject.toml, setup.py: remove inconsequential code * Make cuda_cooperative/pyproject.toml more similar to cuda_cccl/pyproject.toml * Add taplo-pre-commit to .pre-commit-config.yaml * taplo-pre-commit auto-fixes * Use pathlib in cuda_cooperative/setup.py * CCCL_PYTHON_PATH in cuda_cooperative/setup.py * Modernize cuda_parallel/pyproject.toml, setup.py * Use pathlib in cuda_parallel/setup.py * Add `# TOML lint & format` comment. * Replace MANIFEST.in with `[tool.setuptools.package-data]` section in pyproject.toml * Use pathlib in cuda/cccl/include_paths.py * pre-commit autoupdate (EXCEPT clang-format, which was manually restored) * Fixes after git merge main * Resolve warning: AttributeError: '_Reduce' object has no attribute 'build_result' ``` =========================================================================== warnings summary =========================================================================== tests/test_reduce.py::test_reduce_non_contiguous /home/coder/cccl/python/devenv/lib/python3.12/site-packages/_pytest/unraisableexception.py:85: PytestUnraisableExceptionWarning: Exception ignored in: <function _Reduce.__del__ at 0x7bf123139080> Traceback (most recent call last): File "/home/coder/cccl/python/cuda_parallel/cuda/parallel/experimental/algorithms/reduce.py", line 132, in __del__ bindings.cccl_device_reduce_cleanup(ctypes.byref(self.build_result)) ^^^^^^^^^^^^^^^^^ AttributeError: '_Reduce' object has no attribute 'build_result' warnings.warn(pytest.PytestUnraisableExceptionWarning(msg)) -- Docs: https://docs.pytest.org/en/stable/how-to/capture-warnings.html ============================================================= 1 passed, 93 deselected, 1 warning in 0.44s ============================================================== ``` * Move `copy_cccl_headers_to_cuda_cccl_include()` functionality to `class CustomBuildPy` * Introduce cuda_cooperative/constraints.txt * Also add cuda_parallel/constraints.txt * Add `--constraint constraints.txt` in ci/test_python.sh * Update Copyright dates * Switch to https://github.com/ComPWA/taplo-pre-commit (the other repo has been archived by the owner on Jul 1, 2024) For completeness: The other repo took a long time to install into the pre-commit cache; so long it lead to timeouts in the CCCL CI. * Remove unused cuda_parallel jinja2 dependency (noticed by chance). * Remove constraints.txt files, advertise running `pip install cuda-cccl` first instead. * Make cuda_cooperative, cuda_parallel testing completely independent. * Run only test_python.sh [skip-rapids][skip-matx][skip-docs][skip-vdc] * Try using another runner (because V100 runners seem to be stuck) [skip-rapids][skip-matx][skip-docs][skip-vdc] * Fix sign-compare warning (NVIDIA#3408) [skip-rapids][skip-matx][skip-docs][skip-vdc] * Revert "Try using another runner (because V100 runners seem to be stuck) [skip-rapids][skip-matx][skip-docs][skip-vdc]" This reverts commit ea33a21. Error message: NVIDIA#3201 (comment) * Try using A100 runner (because V100 runners still seem to be stuck) [skip-rapids][skip-matx][skip-docs][skip-vdc] * Also show cuda-cooperative site-packages, cuda-parallel site-packages (after pip install) [skip-rapids][skip-matx][skip-docs][skip-vdc] * Try using l4 runner (because V100 runners still seem to be stuck) [skip-rapids][skip-matx][skip-docs][skip-vdc] * Restore original ci/matrix.yaml [skip-rapids] * Use for loop in test_python.sh to avoid code duplication. * Run only test_python.sh [skip-rapids][skip-matx][skip-docs][skip-vdc][skip pre-commit.ci] * Comment out taplo-lint in pre-commit config [skip-rapids][skip-matx][skip-docs][skip-vdc] * Revert "Run only test_python.sh [skip-rapids][skip-matx][skip-docs][skip-vdc][skip pre-commit.ci]" This reverts commit ec206fd. * Implement suggestion by @shwina (NVIDIA#3201 (review)) * Address feedback by @leofang --------- Co-authored-by: Bernhard Manfred Gruber <[email protected]>

…st` (NVIDIA#3523) Co-authored-by: Ashwin Srinath <[email protected]>

rwgk · 2025-01-27T21:46:10Z

Hi @shwina, the "cuda (python)" test passed:

https://github.com/NVIDIA/cccl/actions/runs/12995717180/job/36243058253?pr=3536

Some jobs are still running, but it looks like there will be only the unrelated MSVC failures.

@wmaxey what's the best way to deal with that?

@bernhardmgruber for vis.

github-actions · 2025-01-27T22:40:22Z

🟨 CI finished in 4h 12m: Pass: 97%/176 | Total: 1d 07h | Avg: 10m 37s | Max: 56m 05s | Hits: 439%/10852

🟨 libcudacxx: Pass: 91%/48 | Total: 11h 56m | Avg: 14m 55s | Max: 26m 56s

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  91%/46  | Total: 11h 15m | Avg: 14m 41s | Max: 26m 56s
  🟩 arm64              Pass: 100%/2   | Total: 40m 28s | Avg: 20m 14s | Max: 20m 26s
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/4   | Total:  1h 08m | Avg: 17m 00s | Max: 22m 29s
  🔍 nvcc               Pass:  90%/44  | Total: 10h 48m | Avg: 14m 43s | Max: 26m 56s
🚨 cxx_family: MSVC 🚨
  🟩 Clang              Pass: 100%/20  | Total:  4h 28m | Avg: 13m 24s | Max: 22m 29s
  🟩 GCC                Pass: 100%/21  | Total:  5h 29m | Avg: 15m 40s | Max: 24m 54s
  🟩 Intel              Pass: 100%/1   | Total: 24m 20s | Avg: 24m 20s | Max: 24m 20s
  🔥 MSVC               Pass:   0%/4   | Total: 59m 46s | Avg: 14m 56s | Max: 20m 35s
  🟩 NVHPC              Pass: 100%/2   | Total: 34m 55s | Avg: 17m 27s | Max: 26m 56s
🔍 jobs: Build 🔍
  🔍 Build              Pass:  90%/41  | Total:  9h 47m | Avg: 14m 19s | Max: 26m 56s
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 31m | Avg: 22m 58s | Max: 24m 54s
  🟩 Test               Pass: 100%/2   | Total: 34m 45s | Avg: 17m 22s | Max: 17m 36s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  1m 59s | Avg:  1m 59s | Max:  1m 59s
🟨 ctk
  🟨 11.1               Pass:  85%/7   | Total:  1h 38m | Avg: 14m 04s | Max: 21m 48s
  🟩 12.5               Pass: 100%/2   | Total: 34m 55s | Avg: 17m 27s | Max: 26m 56s
  🟨 12.6               Pass:  92%/39  | Total:  9h 42m | Avg: 14m 56s | Max: 24m 54s
🟨 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  1h 08m | Avg: 17m 00s | Max: 22m 29s
  🟨 nvcc11.1           Pass:  85%/7   | Total:  1h 38m | Avg: 14m 04s | Max: 21m 48s
  🟩 nvcc12.5           Pass: 100%/2   | Total: 34m 55s | Avg: 17m 27s | Max: 26m 56s
  🟨 nvcc12.6           Pass:  91%/35  | Total:  8h 34m | Avg: 14m 42s | Max: 24m 54s
🟨 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 43m 55s | Avg: 10m 58s | Max: 19m 41s
  🟩 Clang10            Pass: 100%/1   | Total:  4m 51s | Avg:  4m 51s | Max:  4m 51s
  🟩 Clang11            Pass: 100%/1   | Total: 19m 04s | Avg: 19m 04s | Max: 19m 04s
  🟩 Clang12            Pass: 100%/1   | Total:  4m 30s | Avg:  4m 30s | Max:  4m 30s
  🟩 Clang13            Pass: 100%/1   | Total: 18m 04s | Avg: 18m 04s | Max: 18m 04s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 29s | Avg:  4m 29s | Max:  4m 29s
  🟩 Clang15            Pass: 100%/1   | Total: 19m 27s | Avg: 19m 27s | Max: 19m 27s
  🟩 Clang16            Pass: 100%/1   | Total:  4m 28s | Avg:  4m 28s | Max:  4m 28s
  🟩 Clang17            Pass: 100%/1   | Total:  4m 16s | Avg:  4m 16s | Max:  4m 16s
  🟩 Clang18            Pass: 100%/8   | Total:  2h 24m | Avg: 18m 07s | Max: 22m 29s
  🟩 GCC6               Pass: 100%/2   | Total:  5m 18s | Avg:  2m 39s | Max:  2m 40s
  🟩 GCC7               Pass: 100%/2   | Total: 32m 03s | Avg: 16m 01s | Max: 17m 25s
  🟩 GCC8               Pass: 100%/1   | Total: 16m 59s | Avg: 16m 59s | Max: 16m 59s
  🟩 GCC9               Pass: 100%/3   | Total: 56m 48s | Avg: 18m 56s | Max: 21m 48s
  🟩 GCC10              Pass: 100%/1   | Total:  4m 04s | Avg:  4m 04s | Max:  4m 04s
  🟩 GCC11              Pass: 100%/1   | Total: 22m 49s | Avg: 22m 49s | Max: 22m 49s
  🟩 GCC12              Pass: 100%/1   | Total: 20m 58s | Avg: 20m 58s | Max: 20m 58s
  🟩 GCC13              Pass: 100%/10  | Total:  2h 50m | Avg: 17m 00s | Max: 24m 54s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total: 24m 20s | Avg: 24m 20s | Max: 24m 20s
  🟥 MSVC14.16          Pass:   0%/1   | Total: 20m 35s | Avg: 20m 35s | Max: 20m 35s
  🟥 MSVC14.29          Pass:   0%/1   | Total: 12m 57s | Avg: 12m 57s | Max: 12m 57s
  🟥 MSVC14.39          Pass:   0%/2   | Total: 26m 14s | Avg: 13m 07s | Max: 13m 11s
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 34m 55s | Avg: 17m 27s | Max: 26m 56s
🟨 std
  🟩 11                 Pass: 100%/6   | Total:  1h 23m | Avg: 13m 58s | Max: 21m 48s
  🟨 14                 Pass:  80%/5   | Total:  1h 08m | Avg: 13m 43s | Max: 23m 21s
  🟨 17                 Pass:  84%/13  | Total:  3h 47m | Avg: 17m 31s | Max: 26m 56s
  🟨 20                 Pass:  95%/23  | Total:  5h 33m | Avg: 14m 30s | Max: 24m 54s
🟨 gpu
  🟨 v100               Pass:  91%/48  | Total: 11h 56m | Avg: 14m 55s | Max: 26m 56s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total: 13m 17s | Avg: 13m 17s | Max: 13m 17s
  🟩 90a                Pass: 100%/2   | Total: 16m 20s | Avg:  8m 10s | Max: 12m 26s

🟨 thrust: Pass: 97%/46 | Total: 7h 00m | Avg: 9m 08s | Max: 33m 52s | Hits: 366%/7408

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  97%/44  | Total:  6h 51m | Avg:  9m 20s | Max: 33m 52s | Hits: 366%/7408  
  🟩 arm64              Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  4m 52s
🔍 ctk: 12.6 🔍
  🟩 11.1               Pass: 100%/7   | Total: 50m 36s | Avg:  7m 13s | Max: 25m 18s | Hits: 368%/1852  
  🟩 12.5               Pass: 100%/2   | Total: 29m 23s | Avg: 14m 41s | Max: 15m 33s
  🔍 12.6               Pass:  97%/37  | Total:  5h 40m | Avg:  9m 12s | Max: 33m 52s | Hits: 365%/5556  
🔍 cudacxx: nvcc12.6 🔍
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 10m 12s | Avg:  5m 06s | Max:  5m 12s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 50m 36s | Avg:  7m 13s | Max: 25m 18s | Hits: 368%/1852  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 29m 23s | Avg: 14m 41s | Max: 15m 33s
  🔍 nvcc12.6           Pass:  97%/35  | Total:  5h 30m | Avg:  9m 26s | Max: 33m 52s | Hits: 365%/5556  
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total: 10m 12s | Avg:  5m 06s | Max:  5m 12s
  🔍 nvcc               Pass:  97%/44  | Total:  6h 50m | Avg:  9m 19s | Max: 33m 52s | Hits: 366%/7408  
🔍 cxx: MSVC14.39 🔍
  🟩 Clang9             Pass: 100%/4   | Total: 20m 45s | Avg:  5m 11s | Max:  6m 30s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 21s | Avg:  6m 21s | Max:  6m 21s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 07s | Avg:  5m 07s | Max:  5m 07s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 31s | Avg:  5m 31s | Max:  5m 31s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 35s | Avg:  5m 35s | Max:  5m 35s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 20s | Avg:  5m 20s | Max:  5m 20s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 10s | Avg:  5m 10s | Max:  5m 10s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 25s | Avg:  5m 25s | Max:  5m 25s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 06s | Avg:  5m 06s | Max:  5m 06s
  🟩 Clang18            Pass: 100%/7   | Total: 51m 32s | Avg:  7m 21s | Max: 18m 46s
  🟩 GCC6               Pass: 100%/2   | Total:  7m 56s | Avg:  3m 58s | Max:  4m 09s
  🟩 GCC7               Pass: 100%/2   | Total: 10m 02s | Avg:  5m 01s | Max:  5m 19s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 10s | Avg:  5m 10s | Max:  5m 10s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 20s | Avg:  4m 46s | Max:  5m 50s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 48s | Avg:  5m 48s | Max:  5m 48s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 25s | Avg:  5m 25s | Max:  5m 25s
  🟩 GCC12              Pass: 100%/1   | Total:  6m 00s | Avg:  6m 00s | Max:  6m 00s
  🟩 GCC13              Pass: 100%/8   | Total:  1h 05m | Avg:  8m 09s | Max: 18m 27s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  7m 15s | Avg:  7m 15s | Max:  7m 15s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 25m 18s | Avg: 25m 18s | Max: 25m 18s | Hits: 368%/1852  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 27m 18s | Avg: 27m 18s | Max: 27m 18s | Hits: 365%/1852  
  🔍 MSVC14.39          Pass:  66%/3   | Total:  1h 35m | Avg: 31m 55s | Max: 33m 52s | Hits: 365%/3704  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 29m 23s | Avg: 14m 41s | Max: 15m 33s
🔍 cxx_family: MSVC 🔍
  🟩 Clang              Pass: 100%/19  | Total:  1h 55m | Avg:  6m 05s | Max: 18m 46s
  🟩 GCC                Pass: 100%/19  | Total:  1h 59m | Avg:  6m 18s | Max: 18m 27s
  🟩 Intel              Pass: 100%/1   | Total:  7m 15s | Avg:  7m 15s | Max:  7m 15s
  🔍 MSVC               Pass:  80%/5   | Total:  2h 28m | Avg: 29m 40s | Max: 33m 52s | Hits: 366%/7408  
  🟩 NVHPC              Pass: 100%/2   | Total: 29m 23s | Avg: 14m 41s | Max: 15m 33s
🔍 jobs: TestCPU 🔍
  🟩 Build              Pass: 100%/40  | Total:  5h 22m | Avg:  8m 03s | Max: 31m 31s | Hits: 366%/7408  
  🔍 TestCPU            Pass:  66%/3   | Total: 49m 19s | Avg: 16m 26s | Max: 33m 52s
  🟩 TestGPU            Pass: 100%/3   | Total: 48m 57s | Avg: 16m 19s | Max: 18m 46s
🔍 std: 20 🔍
  🟩 11                 Pass: 100%/5   | Total: 21m 58s | Avg:  4m 23s | Max:  5m 23s
  🟩 14                 Pass: 100%/4   | Total: 41m 16s | Avg: 10m 19s | Max: 25m 18s | Hits: 368%/1852  
  🟩 17                 Pass: 100%/12  | Total:  2h 01m | Avg: 10m 07s | Max: 30m 22s | Hits: 365%/3704  
  🔍 20                 Pass:  95%/23  | Total:  3h 31m | Avg:  9m 12s | Max: 33m 52s | Hits: 365%/1852  
🟨 gpu
  🟨 v100               Pass:  97%/46  | Total:  7h 00m | Avg:  9m 08s | Max: 33m 52s | Hits: 366%/7408  
🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 24m 20s | Avg: 12m 10s | Max: 18m 27s
🟩 sm
  🟩 90a                Pass: 100%/1   | Total:  4m 45s | Avg:  4m 45s | Max:  4m 45s

🟩 cub: Pass: 100%/47 | Total: 8h 44m | Avg: 11m 09s | Max: 56m 05s | Hits: 599%/3132

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  8h 34m | Avg: 11m 26s | Max: 56m 05s | Hits: 599%/3132  
  🟩 arm64              Pass: 100%/2   | Total:  9m 51s | Avg:  4m 55s | Max:  5m 07s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total:  1h 06m | Avg:  9m 29s | Max: 39m 16s | Hits: 599%/783   
  🟩 12.5               Pass: 100%/2   | Total: 19m 22s | Avg:  9m 41s | Max:  9m 47s
  🟩 12.6               Pass: 100%/38  | Total:  7h 19m | Avg: 11m 33s | Max: 56m 05s | Hits: 599%/2349  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  8m 50s | Avg:  4m 25s | Max:  4m 37s
  🟩 nvcc11.1           Pass: 100%/7   | Total:  1h 06m | Avg:  9m 29s | Max: 39m 16s | Hits: 599%/783   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 19m 22s | Avg:  9m 41s | Max:  9m 47s
  🟩 nvcc12.6           Pass: 100%/36  | Total:  7h 10m | Avg: 11m 56s | Max: 56m 05s | Hits: 599%/2349  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  8m 50s | Avg:  4m 25s | Max:  4m 37s
  🟩 nvcc               Pass: 100%/45  | Total:  8h 35m | Avg: 11m 27s | Max: 56m 05s | Hits: 599%/3132  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 19s | Avg:  5m 19s | Max:  6m 08s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 15s | Avg:  6m 15s | Max:  6m 15s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 29s | Avg:  5m 29s | Max:  5m 29s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 19s | Avg:  5m 19s | Max:  5m 19s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 17s | Avg:  5m 17s | Max:  5m 17s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 37s | Avg:  5m 37s | Max:  5m 37s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 45s | Avg:  5m 45s | Max:  5m 45s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 20s | Avg:  5m 20s | Max:  5m 20s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 33s | Avg:  5m 33s | Max:  5m 33s
  🟩 Clang18            Pass: 100%/7   | Total:  1h 22m | Avg: 11m 45s | Max: 36m 28s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 50s | Avg:  4m 25s | Max:  4m 35s
  🟩 GCC7               Pass: 100%/2   | Total: 10m 18s | Avg:  5m 09s | Max:  5m 13s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 33s | Avg:  5m 33s | Max:  5m 33s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 40s | Avg:  4m 53s | Max:  5m 46s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 30s | Avg:  5m 30s | Max:  5m 30s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 23s | Avg:  5m 23s | Max:  5m 23s
  🟩 GCC12              Pass: 100%/3   | Total: 26m 40s | Avg:  8m 53s | Max: 16m 22s
  🟩 GCC13              Pass: 100%/8   | Total:  1h 39m | Avg: 12m 27s | Max: 24m 32s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total: 56m 05s | Avg: 56m 05s | Max: 56m 05s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 39m 16s | Avg: 39m 16s | Max: 39m 16s | Hits: 599%/783   
  🟩 MSVC14.29          Pass: 100%/1   | Total: 27m 22s | Avg: 27m 22s | Max: 27m 22s | Hits: 599%/783   
  🟩 MSVC14.39          Pass: 100%/2   | Total: 58m 01s | Avg: 29m 00s | Max: 30m 41s | Hits: 599%/1566  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 19m 22s | Avg:  9m 41s | Max:  9m 47s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 28m | Avg:  7m 47s | Max: 36m 28s
  🟩 GCC                Pass: 100%/21  | Total:  2h 56m | Avg:  8m 24s | Max: 24m 32s
  🟩 Intel              Pass: 100%/1   | Total: 56m 05s | Avg: 56m 05s | Max: 56m 05s
  🟩 MSVC               Pass: 100%/4   | Total:  2h 04m | Avg: 31m 09s | Max: 39m 16s | Hits: 599%/3132  
  🟩 NVHPC              Pass: 100%/2   | Total: 19m 22s | Avg:  9m 41s | Max:  9m 47s
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 20m 52s | Avg: 10m 26s | Max: 16m 22s
  🟩 v100               Pass: 100%/45  | Total:  8h 23m | Avg: 11m 11s | Max: 56m 05s | Hits: 599%/3132  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  6h 12m | Avg:  9m 19s | Max: 56m 05s | Hits: 599%/3132  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 19m 01s | Avg: 19m 01s | Max: 19m 01s
  🟩 GraphCapture       Pass: 100%/1   | Total: 16m 53s | Avg: 16m 53s | Max: 16m 53s
  🟩 HostLaunch         Pass: 100%/3   | Total: 55m 08s | Avg: 18m 22s | Max: 20m 51s
  🟩 TestGPU            Pass: 100%/2   | Total:  1h 01m | Avg: 30m 30s | Max: 36m 28s
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 20m 52s | Avg: 10m 26s | Max: 16m 22s
  🟩 90a                Pass: 100%/1   | Total:  4m 20s | Avg:  4m 20s | Max:  4m 20s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 23m 42s | Avg:  4m 44s | Max:  5m 46s
  🟩 14                 Pass: 100%/4   | Total: 55m 12s | Avg: 13m 48s | Max: 39m 16s | Hits: 599%/783   
  🟩 17                 Pass: 100%/12  | Total:  2h 43m | Avg: 13m 35s | Max: 56m 05s | Hits: 599%/1566  
  🟩 20                 Pass: 100%/26  | Total:  4h 42m | Avg: 10m 52s | Max: 36m 28s | Hits: 599%/783

🟩 cudax: Pass: 100%/26 | Total: 2h 07m | Avg: 4m 53s | Max: 17m 24s | Hits: 582%/312

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  1h 56m | Avg:  5m 19s | Max: 17m 24s | Hits: 582%/312   
  🟩 arm64              Pass: 100%/4   | Total: 10m 21s | Avg:  2m 35s | Max:  2m 40s
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 17m 35s | Avg:  5m 51s | Max: 11m 16s | Hits: 582%/156   
  🟩 12.5               Pass: 100%/2   | Total:  9m 58s | Avg:  4m 59s | Max:  5m 06s
  🟩 12.6               Pass: 100%/21  | Total:  1h 39m | Avg:  4m 45s | Max: 17m 24s | Hits: 582%/156   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 17m 35s | Avg:  5m 51s | Max: 11m 16s | Hits: 582%/156   
  🟩 nvcc12.5           Pass: 100%/2   | Total:  9m 58s | Avg:  4m 59s | Max:  5m 06s
  🟩 nvcc12.6           Pass: 100%/21  | Total:  1h 39m | Avg:  4m 45s | Max: 17m 24s | Hits: 582%/156   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 07m | Avg:  4m 53s | Max: 17m 24s | Hits: 582%/312   
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  3m 19s | Avg:  3m 19s | Max:  3m 19s
  🟩 Clang10            Pass: 100%/1   | Total:  3m 52s | Avg:  3m 52s | Max:  3m 52s
  🟩 Clang11            Pass: 100%/1   | Total:  3m 09s | Avg:  3m 09s | Max:  3m 09s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 04s | Avg:  3m 04s | Max:  3m 04s
  🟩 Clang13            Pass: 100%/1   | Total:  3m 23s | Avg:  3m 23s | Max:  3m 23s
  🟩 Clang14            Pass: 100%/1   | Total:  3m 22s | Avg:  3m 22s | Max:  3m 22s
  🟩 Clang15            Pass: 100%/1   | Total:  3m 12s | Avg:  3m 12s | Max:  3m 12s
  🟩 Clang16            Pass: 100%/1   | Total:  3m 29s | Avg:  3m 29s | Max:  3m 29s
  🟩 Clang17            Pass: 100%/1   | Total:  3m 04s | Avg:  3m 04s | Max:  3m 04s
  🟩 Clang18            Pass: 100%/4   | Total: 26m 00s | Avg:  6m 30s | Max: 17m 24s
  🟩 GCC9               Pass: 100%/1   | Total:  3m 00s | Avg:  3m 00s | Max:  3m 00s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 13s | Avg:  3m 13s | Max:  3m 13s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 02s | Avg:  3m 02s | Max:  3m 02s
  🟩 GCC12              Pass: 100%/2   | Total: 18m 41s | Avg:  9m 20s | Max: 15m 18s
  🟩 GCC13              Pass: 100%/4   | Total: 10m 30s | Avg:  2m 37s | Max:  2m 44s
  🟩 MSVC14.36          Pass: 100%/1   | Total: 11m 16s | Avg: 11m 16s | Max: 11m 16s | Hits: 582%/156   
  🟩 MSVC14.39          Pass: 100%/1   | Total: 11m 46s | Avg: 11m 46s | Max: 11m 46s | Hits: 582%/156   
  🟩 NVHPC24.7          Pass: 100%/2   | Total:  9m 58s | Avg:  4m 59s | Max:  5m 06s
🟩 cxx_family
  🟩 Clang              Pass: 100%/13  | Total: 55m 54s | Avg:  4m 18s | Max: 17m 24s
  🟩 GCC                Pass: 100%/9   | Total: 38m 26s | Avg:  4m 16s | Max: 15m 18s
  🟩 MSVC               Pass: 100%/2   | Total: 23m 02s | Avg: 11m 31s | Max: 11m 46s | Hits: 582%/312   
  🟩 NVHPC              Pass: 100%/2   | Total:  9m 58s | Avg:  4m 59s | Max:  5m 06s
🟩 gpu
  🟩 v100               Pass: 100%/26  | Total:  2h 07m | Avg:  4m 53s | Max: 17m 24s | Hits: 582%/312   
🟩 jobs
  🟩 Build              Pass: 100%/24  | Total:  1h 34m | Avg:  3m 56s | Max: 11m 46s | Hits: 582%/312   
  🟩 Test               Pass: 100%/2   | Total: 32m 42s | Avg: 16m 21s | Max: 17m 24s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 44s | Avg:  2m 44s | Max:  2m 44s
  🟩 90a                Pass: 100%/1   | Total:  2m 44s | Avg:  2m 44s | Max:  2m 44s
🟩 std
  🟩 17                 Pass: 100%/6   | Total: 19m 08s | Avg:  3m 11s | Max:  4m 52s
  🟩 20                 Pass: 100%/20  | Total:  1h 48m | Avg:  5m 24s | Max: 17m 24s | Hits: 582%/312

🟩 cccl: Pass: 100%/6 | Total: 25m 39s | Avg: 4m 16s | Max: 5m 14s

🟩 cpu
  🟩 amd64              Pass: 100%/6   | Total: 25m 39s | Avg:  4m 16s | Max:  5m 14s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  7m 22s | Avg:  3m 41s | Max:  3m 42s
  🟩 12.0               Pass: 100%/2   | Total:  8m 48s | Avg:  4m 24s | Max:  4m 38s
  🟩 12.6               Pass: 100%/2   | Total:  9m 29s | Avg:  4m 44s | Max:  5m 14s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  7m 22s | Avg:  3m 41s | Max:  3m 42s
  🟩 nvcc12.0           Pass: 100%/2   | Total:  8m 48s | Avg:  4m 24s | Max:  4m 38s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 29s | Avg:  4m 44s | Max:  5m 14s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/6   | Total: 25m 39s | Avg:  4m 16s | Max:  5m 14s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  3m 42s | Avg:  3m 42s | Max:  3m 42s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 38s | Avg:  4m 38s | Max:  4m 38s
  🟩 Clang18            Pass: 100%/1   | Total:  5m 14s | Avg:  5m 14s | Max:  5m 14s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 40s | Avg:  3m 40s | Max:  3m 40s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 10s | Avg:  4m 10s | Max:  4m 10s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 15s | Avg:  4m 15s | Max:  4m 15s
🟩 cxx_family
  🟩 Clang              Pass: 100%/3   | Total: 13m 34s | Avg:  4m 31s | Max:  5m 14s
  🟩 GCC                Pass: 100%/3   | Total: 12m 05s | Avg:  4m 01s | Max:  4m 15s
🟩 gpu
  🟩 v100               Pass: 100%/6   | Total: 25m 39s | Avg:  4m 16s | Max:  5m 14s
🟩 jobs
  🟩 Infra              Pass: 100%/6   | Total: 25m 39s | Avg:  4m 16s | Max:  5m 14s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 9m 22s | Avg: 4m 41s | Max: 7m 23s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  7m 23s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  7m 23s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  7m 23s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  7m 23s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  7m 23s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  7m 23s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total:  9m 22s | Avg:  4m 41s | Max:  7m 23s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  1m 59s | Avg:  1m 59s | Max:  1m 59s
  🟩 Test               Pass: 100%/1   | Total:  7m 23s | Avg:  7m 23s | Max:  7m 23s

🟩 python: Pass: 100%/1 | Total: 46m 14s | Avg: 46m 14s | Max: 46m 14s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 46m 14s | Avg: 46m 14s | Max: 46m 14s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 46m 14s | Avg: 46m 14s | Max: 46m 14s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 46m 14s | Avg: 46m 14s | Max: 46m 14s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 46m 14s | Avg: 46m 14s | Max: 46m 14s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 46m 14s | Avg: 46m 14s | Max: 46m 14s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 46m 14s | Avg: 46m 14s | Max: 46m 14s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 46m 14s | Avg: 46m 14s | Max: 46m 14s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 46m 14s | Avg: 46m 14s | Max: 46m 14s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
	libcu++
	CUB
	Thrust
	CUDA Experimental
+/-	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 176)

#	Runner
125	`linux-amd64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
1	`linux-amd64-gpu-h100-latest-1-testing`

github-actions · 2025-01-28T10:19:04Z

🟨 CI finished in 2h 48m: Pass: 98%/176 | Total: 1d 19h | Avg: 14m 41s | Max: 1h 04m | Hits: 527%/20732

🟨 thrust: Pass: 95%/46 | Total: 10h 32m | Avg: 13m 44s | Max: 58m 20s | Hits: 366%/7408

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  95%/44  | Total:  9h 43m | Avg: 13m 16s | Max: 58m 20s | Hits: 366%/7408  
  🟩 arm64              Pass: 100%/2   | Total: 48m 36s | Avg: 24m 18s | Max: 44m 01s
🔍 ctk: 12.6 🔍
  🟩 11.1               Pass: 100%/7   | Total: 49m 54s | Avg:  7m 07s | Max: 24m 38s | Hits: 368%/1852  
  🟩 12.5               Pass: 100%/2   | Total: 28m 50s | Avg: 14m 25s | Max: 14m 47s
  🔍 12.6               Pass:  94%/37  | Total:  9h 13m | Avg: 14m 57s | Max: 58m 20s | Hits: 365%/5556  
🔍 cudacxx: nvcc12.6 🔍
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 11m 02s | Avg:  5m 31s | Max:  5m 48s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 49m 54s | Avg:  7m 07s | Max: 24m 38s | Hits: 368%/1852  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 28m 50s | Avg: 14m 25s | Max: 14m 47s
  🔍 nvcc12.6           Pass:  94%/35  | Total:  9h 02m | Avg: 15m 30s | Max: 58m 20s | Hits: 365%/5556  
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total: 11m 02s | Avg:  5m 31s | Max:  5m 48s
  🔍 nvcc               Pass:  95%/44  | Total: 10h 21m | Avg: 14m 07s | Max: 58m 20s | Hits: 366%/7408  
🔍 std: 20 🔍
  🟩 11                 Pass: 100%/5   | Total: 22m 58s | Avg:  4m 35s | Max:  6m 08s
  🟩 14                 Pass: 100%/4   | Total: 41m 25s | Avg: 10m 21s | Max: 24m 38s | Hits: 368%/1852  
  🟩 17                 Pass: 100%/12  | Total:  3h 31m | Avg: 17m 37s | Max: 58m 20s | Hits: 365%/3704  
  🔍 20                 Pass:  91%/23  | Total:  5h 07m | Avg: 13m 22s | Max: 44m 01s | Hits: 365%/1852  
🟨 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 22s | Avg:  5m 20s | Max:  6m 42s
  🟩 Clang10            Pass: 100%/1   | Total:  7m 16s | Avg:  7m 16s | Max:  7m 16s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 12s | Avg:  5m 12s | Max:  5m 12s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 31s | Avg:  5m 31s | Max:  5m 31s
  🟩 Clang13            Pass: 100%/1   | Total:  6m 04s | Avg:  6m 04s | Max:  6m 04s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 15s | Avg:  5m 15s | Max:  5m 15s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 23s | Avg:  5m 23s | Max:  5m 23s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 53s | Avg:  5m 53s | Max:  5m 53s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 17s | Avg:  5m 17s | Max:  5m 17s
  🟨 Clang18            Pass:  85%/7   | Total: 50m 29s | Avg:  7m 12s | Max: 15m 32s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 23s | Avg:  4m 11s | Max:  4m 22s
  🟩 GCC7               Pass: 100%/2   | Total: 10m 42s | Avg:  5m 21s | Max:  5m 43s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 45s | Avg:  5m 45s | Max:  5m 45s
  🟩 GCC9               Pass: 100%/3   | Total: 13m 37s | Avg:  4m 32s | Max:  5m 16s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 35s | Avg:  5m 35s | Max:  5m 35s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 39s | Avg:  5m 39s | Max:  5m 39s
  🟩 GCC12              Pass: 100%/1   | Total:  6m 11s | Avg:  6m 11s | Max:  6m 11s
  🟩 GCC13              Pass: 100%/8   | Total:  3h 47m | Avg: 28m 25s | Max: 44m 01s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total: 58m 20s | Avg: 58m 20s | Max: 58m 20s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 24m 38s | Avg: 24m 38s | Max: 24m 38s | Hits: 368%/1852  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 26m 01s | Avg: 26m 01s | Max: 26m 01s | Hits: 365%/1852  
  🟨 MSVC14.39          Pass:  66%/3   | Total:  1h 33m | Avg: 31m 10s | Max: 32m 28s | Hits: 365%/3704  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 28m 50s | Avg: 14m 25s | Max: 14m 47s
🟨 cxx_family
  🟨 Clang              Pass:  94%/19  | Total:  1h 57m | Avg:  6m 11s | Max: 15m 32s
  🟩 GCC                Pass: 100%/19  | Total:  4h 43m | Avg: 14m 54s | Max: 44m 01s
  🟩 Intel              Pass: 100%/1   | Total: 58m 20s | Avg: 58m 20s | Max: 58m 20s
  🟨 MSVC               Pass:  80%/5   | Total:  2h 24m | Avg: 28m 50s | Max: 32m 28s | Hits: 366%/7408  
  🟩 NVHPC              Pass: 100%/2   | Total: 28m 50s | Avg: 14m 25s | Max: 14m 47s
🟨 jobs
  🟩 Build              Pass: 100%/40  | Total:  9h 03m | Avg: 13m 35s | Max: 58m 20s | Hits: 366%/7408  
  🟨 TestCPU            Pass:  66%/3   | Total: 48m 28s | Avg: 16m 09s | Max: 32m 28s
  🟨 TestGPU            Pass:  66%/3   | Total: 40m 01s | Avg: 13m 20s | Max: 15m 32s
🟨 gpu
  🟨 v100               Pass:  95%/46  | Total: 10h 32m | Avg: 13m 44s | Max: 58m 20s | Hits: 366%/7408  
🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 48m 56s | Avg: 24m 28s | Max: 36m 33s
🟩 sm
  🟩 90a                Pass: 100%/1   | Total: 29m 16s | Avg: 29m 16s | Max: 29m 16s

🟩 libcudacxx: Pass: 100%/48 | Total: 16h 26m | Avg: 20m 32s | Max: 57m 11s | Hits: 624%/9880

🟩 cpu
  🟩 amd64              Pass: 100%/46  | Total: 15h 47m | Avg: 20m 36s | Max: 57m 11s | Hits: 624%/9880  
  🟩 arm64              Pass: 100%/2   | Total: 38m 11s | Avg: 19m 05s | Max: 19m 37s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total:  1h 53m | Avg: 16m 15s | Max: 28m 31s | Hits: 618%/2287  
  🟩 12.5               Pass: 100%/2   | Total: 59m 16s | Avg: 29m 38s | Max: 31m 38s
  🟩 12.6               Pass: 100%/39  | Total: 13h 33m | Avg: 20m 50s | Max: 57m 11s | Hits: 626%/7593  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  1h 05m | Avg: 16m 23s | Max: 20m 25s
  🟩 nvcc11.1           Pass: 100%/7   | Total:  1h 53m | Avg: 16m 15s | Max: 28m 31s | Hits: 618%/2287  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 59m 16s | Avg: 29m 38s | Max: 31m 38s
  🟩 nvcc12.6           Pass: 100%/35  | Total: 12h 27m | Avg: 21m 21s | Max: 57m 11s | Hits: 626%/7593  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  1h 05m | Avg: 16m 23s | Max: 20m 25s
  🟩 nvcc               Pass: 100%/44  | Total: 15h 20m | Avg: 20m 55s | Max: 57m 11s | Hits: 624%/9880  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total:  1h 01m | Avg: 15m 26s | Max: 22m 35s
  🟩 Clang10            Pass: 100%/1   | Total: 21m 15s | Avg: 21m 15s | Max: 21m 15s
  🟩 Clang11            Pass: 100%/1   | Total: 22m 53s | Avg: 22m 53s | Max: 22m 53s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 56s | Avg:  3m 56s | Max:  3m 56s
  🟩 Clang13            Pass: 100%/1   | Total: 19m 42s | Avg: 19m 42s | Max: 19m 42s
  🟩 Clang14            Pass: 100%/1   | Total: 17m 57s | Avg: 17m 57s | Max: 17m 57s
  🟩 Clang15            Pass: 100%/1   | Total: 20m 33s | Avg: 20m 33s | Max: 20m 33s
  🟩 Clang16            Pass: 100%/1   | Total: 21m 31s | Avg: 21m 31s | Max: 21m 31s
  🟩 Clang17            Pass: 100%/1   | Total: 26m 25s | Avg: 26m 25s | Max: 26m 25s
  🟩 Clang18            Pass: 100%/8   | Total:  2h 45m | Avg: 20m 42s | Max: 56m 42s
  🟩 GCC6               Pass: 100%/2   | Total: 29m 55s | Avg: 14m 57s | Max: 26m 54s
  🟩 GCC7               Pass: 100%/2   | Total: 31m 51s | Avg: 15m 55s | Max: 16m 28s
  🟩 GCC8               Pass: 100%/1   | Total: 20m 04s | Avg: 20m 04s | Max: 20m 04s
  🟩 GCC9               Pass: 100%/3   | Total: 36m 10s | Avg: 12m 03s | Max: 18m 54s
  🟩 GCC10              Pass: 100%/1   | Total: 21m 03s | Avg: 21m 03s | Max: 21m 03s
  🟩 GCC11              Pass: 100%/1   | Total: 19m 32s | Avg: 19m 32s | Max: 19m 32s
  🟩 GCC12              Pass: 100%/1   | Total: 20m 46s | Avg: 20m 46s | Max: 20m 46s
  🟩 GCC13              Pass: 100%/10  | Total:  3h 45m | Avg: 22m 31s | Max: 57m 11s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total: 26m 57s | Avg: 26m 57s | Max: 26m 57s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 28m 31s | Avg: 28m 31s | Max: 28m 31s | Hits: 618%/2287  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 28m 26s | Avg: 28m 26s | Max: 28m 26s | Hits: 615%/2482  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 56m 50s | Avg: 28m 25s | Max: 28m 55s | Hits: 631%/5111  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 59m 16s | Avg: 29m 38s | Max: 31m 38s
🟩 cxx_family
  🟩 Clang              Pass: 100%/20  | Total:  6h 21m | Avg: 19m 04s | Max: 56m 42s
  🟩 GCC                Pass: 100%/21  | Total:  6h 44m | Avg: 19m 16s | Max: 57m 11s
  🟩 Intel              Pass: 100%/1   | Total: 26m 57s | Avg: 26m 57s | Max: 26m 57s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 53m | Avg: 28m 26s | Max: 28m 55s | Hits: 624%/9880  
  🟩 NVHPC              Pass: 100%/2   | Total: 59m 16s | Avg: 29m 38s | Max: 31m 38s
🟩 gpu
  🟩 v100               Pass: 100%/48  | Total: 16h 26m | Avg: 20m 32s | Max: 57m 11s | Hits: 624%/9880  
🟩 jobs
  🟩 Build              Pass: 100%/41  | Total: 13h 03m | Avg: 19m 05s | Max: 31m 38s | Hits: 624%/9880  
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 27m | Avg: 21m 45s | Max: 23m 28s
  🟩 Test               Pass: 100%/2   | Total:  1h 53m | Avg: 56m 56s | Max: 57m 11s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 12s | Avg:  2m 12s | Max:  2m 12s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total: 12m 58s | Avg: 12m 58s | Max: 12m 58s
  🟩 90a                Pass: 100%/2   | Total: 28m 43s | Avg: 14m 21s | Max: 15m 46s
🟩 std
  🟩 11                 Pass: 100%/6   | Total:  1h 29m | Avg: 14m 58s | Max: 26m 54s
  🟩 14                 Pass: 100%/5   | Total:  1h 30m | Avg: 18m 10s | Max: 28m 31s | Hits: 618%/2287  
  🟩 17                 Pass: 100%/13  | Total:  4h 51m | Avg: 22m 24s | Max: 31m 38s | Hits: 623%/4964  
  🟩 20                 Pass: 100%/23  | Total:  8h 31m | Avg: 22m 15s | Max: 57m 11s | Hits: 630%/2629

🟩 cub: Pass: 100%/47 | Total: 11h 48m | Avg: 15m 04s | Max: 1h 04m | Hits: 599%/3132

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total: 10h 44m | Avg: 14m 18s | Max:  1h 04m | Hits: 599%/3132  
  🟩 arm64              Pass: 100%/2   | Total:  1h 04m | Avg: 32m 08s | Max: 59m 28s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total:  1h 03m | Avg:  9m 08s | Max: 38m 32s | Hits: 599%/783   
  🟩 12.5               Pass: 100%/2   | Total: 19m 49s | Avg:  9m 54s | Max: 10m 04s
  🟩 12.6               Pass: 100%/38  | Total: 10h 24m | Avg: 16m 26s | Max:  1h 04m | Hits: 599%/2349  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  9m 00s | Avg:  4m 30s | Max:  4m 37s
  🟩 nvcc11.1           Pass: 100%/7   | Total:  1h 03m | Avg:  9m 08s | Max: 38m 32s | Hits: 599%/783   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 19m 49s | Avg:  9m 54s | Max: 10m 04s
  🟩 nvcc12.6           Pass: 100%/36  | Total: 10h 15m | Avg: 17m 05s | Max:  1h 04m | Hits: 599%/2349  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  9m 00s | Avg:  4m 30s | Max:  4m 37s
  🟩 nvcc               Pass: 100%/45  | Total: 11h 39m | Avg: 15m 32s | Max:  1h 04m | Hits: 599%/3132  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 50s | Avg:  5m 27s | Max:  6m 43s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 52s | Avg:  6m 52s | Max:  6m 52s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 24s | Avg:  5m 24s | Max:  5m 24s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 19s | Avg:  5m 19s | Max:  5m 19s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 43s | Avg:  5m 43s | Max:  5m 43s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 25s | Avg:  5m 25s | Max:  5m 25s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 44s | Avg:  5m 44s | Max:  5m 44s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 47s | Avg:  5m 47s | Max:  5m 47s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 54s | Avg:  5m 54s | Max:  5m 54s
  🟩 Clang18            Pass: 100%/7   | Total:  1h 08m | Avg:  9m 46s | Max: 24m 20s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 12s | Avg:  4m 06s | Max:  4m 11s
  🟩 GCC7               Pass: 100%/2   | Total: 11m 05s | Avg:  5m 32s | Max:  5m 37s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 09s | Avg:  5m 09s | Max:  5m 09s
  🟩 GCC9               Pass: 100%/3   | Total: 14m 04s | Avg:  4m 41s | Max:  5m 46s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 52s | Avg:  5m 52s | Max:  5m 52s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 58s | Avg:  5m 58s | Max:  5m 58s
  🟩 GCC12              Pass: 100%/3   | Total: 26m 44s | Avg:  8m 54s | Max: 16m 16s
  🟩 GCC13              Pass: 100%/8   | Total:  4h 48m | Avg: 36m 06s | Max:  1h 03m
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  1h 04m | Avg:  1h 04m | Max:  1h 04m
  🟩 MSVC14.16          Pass: 100%/1   | Total: 38m 32s | Avg: 38m 32s | Max: 38m 32s | Hits: 599%/783   
  🟩 MSVC14.29          Pass: 100%/1   | Total: 26m 12s | Avg: 26m 12s | Max: 26m 12s | Hits: 599%/783   
  🟩 MSVC14.39          Pass: 100%/2   | Total: 56m 50s | Avg: 28m 25s | Max: 29m 36s | Hits: 599%/1566  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 19m 49s | Avg:  9m 54s | Max: 10m 04s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  2h 16m | Avg:  7m 10s | Max: 24m 20s
  🟩 GCC                Pass: 100%/21  | Total:  6h 05m | Avg: 17m 25s | Max:  1h 03m
  🟩 Intel              Pass: 100%/1   | Total:  1h 04m | Avg:  1h 04m | Max:  1h 04m
  🟩 MSVC               Pass: 100%/4   | Total:  2h 01m | Avg: 30m 23s | Max: 38m 32s | Hits: 599%/3132  
  🟩 NVHPC              Pass: 100%/2   | Total: 19m 49s | Avg:  9m 54s | Max: 10m 04s
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 20m 56s | Avg: 10m 28s | Max: 16m 16s
  🟩 v100               Pass: 100%/45  | Total: 11h 27m | Avg: 15m 16s | Max:  1h 04m | Hits: 599%/3132  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  9h 31m | Avg: 14m 16s | Max:  1h 04m | Hits: 599%/3132  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 19m 52s | Avg: 19m 52s | Max: 19m 52s
  🟩 GraphCapture       Pass: 100%/1   | Total: 15m 48s | Avg: 15m 48s | Max: 15m 48s
  🟩 HostLaunch         Pass: 100%/3   | Total: 54m 07s | Avg: 18m 02s | Max: 19m 10s
  🟩 TestGPU            Pass: 100%/2   | Total: 47m 30s | Avg: 23m 45s | Max: 24m 20s
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 20m 56s | Avg: 10m 28s | Max: 16m 16s
  🟩 90a                Pass: 100%/1   | Total: 27m 50s | Avg: 27m 50s | Max: 27m 50s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 24m 02s | Avg:  4m 48s | Max:  6m 11s
  🟩 14                 Pass: 100%/4   | Total: 54m 54s | Avg: 13m 43s | Max: 38m 32s | Hits: 599%/783   
  🟩 17                 Pass: 100%/12  | Total:  3h 46m | Avg: 18m 50s | Max:  1h 04m | Hits: 599%/1566  
  🟩 20                 Pass: 100%/26  | Total:  6h 43m | Avg: 15m 30s | Max:  1h 03m | Hits: 599%/783

🟩 cudax: Pass: 100%/26 | Total: 2h 55m | Avg: 6m 44s | Max: 21m 11s | Hits: 582%/312

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 22m | Avg:  6m 27s | Max: 21m 11s | Hits: 582%/312   
  🟩 arm64              Pass: 100%/4   | Total: 33m 10s | Avg:  8m 17s | Max: 14m 45s
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 15m 23s | Avg:  5m 07s | Max:  9m 04s | Hits: 582%/156   
  🟩 12.5               Pass: 100%/2   | Total: 11m 25s | Avg:  5m 42s | Max:  5m 45s
  🟩 12.6               Pass: 100%/21  | Total:  2h 28m | Avg:  7m 04s | Max: 21m 11s | Hits: 582%/156   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 15m 23s | Avg:  5m 07s | Max:  9m 04s | Hits: 582%/156   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 11m 25s | Avg:  5m 42s | Max:  5m 45s
  🟩 nvcc12.6           Pass: 100%/21  | Total:  2h 28m | Avg:  7m 04s | Max: 21m 11s | Hits: 582%/156   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 55m | Avg:  6m 44s | Max: 21m 11s | Hits: 582%/312   
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  3m 14s | Avg:  3m 14s | Max:  3m 14s
  🟩 Clang10            Pass: 100%/1   | Total:  3m 30s | Avg:  3m 30s | Max:  3m 30s
  🟩 Clang11            Pass: 100%/1   | Total:  3m 13s | Avg:  3m 13s | Max:  3m 13s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 07s | Avg:  3m 07s | Max:  3m 07s
  🟩 Clang13            Pass: 100%/1   | Total:  3m 17s | Avg:  3m 17s | Max:  3m 17s
  🟩 Clang14            Pass: 100%/1   | Total:  3m 35s | Avg:  3m 35s | Max:  3m 35s
  🟩 Clang15            Pass: 100%/1   | Total:  3m 24s | Avg:  3m 24s | Max:  3m 24s
  🟩 Clang16            Pass: 100%/1   | Total:  3m 34s | Avg:  3m 34s | Max:  3m 34s
  🟩 Clang17            Pass: 100%/1   | Total:  3m 32s | Avg:  3m 32s | Max:  3m 32s
  🟩 Clang18            Pass: 100%/4   | Total: 30m 06s | Avg:  7m 31s | Max: 21m 11s
  🟩 GCC9               Pass: 100%/1   | Total:  3m 05s | Avg:  3m 05s | Max:  3m 05s
  🟩 GCC10              Pass: 100%/1   | Total:  3m 38s | Avg:  3m 38s | Max:  3m 38s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 19s | Avg:  3m 19s | Max:  3m 19s
  🟩 GCC12              Pass: 100%/2   | Total: 22m 35s | Avg: 11m 17s | Max: 19m 23s
  🟩 GCC13              Pass: 100%/4   | Total: 49m 56s | Avg: 12m 29s | Max: 14m 45s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  9m 04s | Avg:  9m 04s | Max:  9m 04s | Hits: 582%/156   
  🟩 MSVC14.39          Pass: 100%/1   | Total: 11m 43s | Avg: 11m 43s | Max: 11m 43s | Hits: 582%/156   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 11m 25s | Avg:  5m 42s | Max:  5m 45s
🟩 cxx_family
  🟩 Clang              Pass: 100%/13  | Total:  1h 00m | Avg:  4m 39s | Max: 21m 11s
  🟩 GCC                Pass: 100%/9   | Total:  1h 22m | Avg:  9m 10s | Max: 19m 23s
  🟩 MSVC               Pass: 100%/2   | Total: 20m 47s | Avg: 10m 23s | Max: 11m 43s | Hits: 582%/312   
  🟩 NVHPC              Pass: 100%/2   | Total: 11m 25s | Avg:  5m 42s | Max:  5m 45s
🟩 gpu
  🟩 v100               Pass: 100%/26  | Total:  2h 55m | Avg:  6m 44s | Max: 21m 11s | Hits: 582%/312   
🟩 jobs
  🟩 Build              Pass: 100%/24  | Total:  2h 14m | Avg:  5m 36s | Max: 14m 45s | Hits: 582%/312   
  🟩 Test               Pass: 100%/2   | Total: 40m 34s | Avg: 20m 17s | Max: 21m 11s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total: 10m 20s | Avg: 10m 20s | Max: 10m 20s
  🟩 90a                Pass: 100%/1   | Total: 11m 53s | Avg: 11m 53s | Max: 11m 53s
🟩 std
  🟩 17                 Pass: 100%/6   | Total: 38m 07s | Avg:  6m 21s | Max: 12m 58s
  🟩 20                 Pass: 100%/20  | Total:  2h 17m | Avg:  6m 51s | Max: 21m 11s | Hits: 582%/312

🟩 cccl: Pass: 100%/6 | Total: 28m 48s | Avg: 4m 48s | Max: 5m 20s

🟩 cpu
  🟩 amd64              Pass: 100%/6   | Total: 28m 48s | Avg:  4m 48s | Max:  5m 20s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  7m 50s | Avg:  3m 55s | Max:  4m 26s
  🟩 12.0               Pass: 100%/2   | Total: 10m 33s | Avg:  5m 16s | Max:  5m 20s
  🟩 12.6               Pass: 100%/2   | Total: 10m 25s | Avg:  5m 12s | Max:  5m 17s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  7m 50s | Avg:  3m 55s | Max:  4m 26s
  🟩 nvcc12.0           Pass: 100%/2   | Total: 10m 33s | Avg:  5m 16s | Max:  5m 20s
  🟩 nvcc12.6           Pass: 100%/2   | Total: 10m 25s | Avg:  5m 12s | Max:  5m 17s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/6   | Total: 28m 48s | Avg:  4m 48s | Max:  5m 20s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 26s | Avg:  4m 26s | Max:  4m 26s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 20s | Avg:  5m 20s | Max:  5m 20s
  🟩 Clang18            Pass: 100%/1   | Total:  5m 17s | Avg:  5m 17s | Max:  5m 17s
  🟩 GCC6               Pass: 100%/1   | Total:  3m 24s | Avg:  3m 24s | Max:  3m 24s
  🟩 GCC12              Pass: 100%/1   | Total:  5m 13s | Avg:  5m 13s | Max:  5m 13s
  🟩 GCC13              Pass: 100%/1   | Total:  5m 08s | Avg:  5m 08s | Max:  5m 08s
🟩 cxx_family
  🟩 Clang              Pass: 100%/3   | Total: 15m 03s | Avg:  5m 01s | Max:  5m 20s
  🟩 GCC                Pass: 100%/3   | Total: 13m 45s | Avg:  4m 35s | Max:  5m 13s
🟩 gpu
  🟩 v100               Pass: 100%/6   | Total: 28m 48s | Avg:  4m 48s | Max:  5m 20s
🟩 jobs
  🟩 Infra              Pass: 100%/6   | Total: 28m 48s | Avg:  4m 48s | Max:  5m 20s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 9m 46s | Avg: 4m 53s | Max: 7m 25s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total:  9m 46s | Avg:  4m 53s | Max:  7m 25s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total:  9m 46s | Avg:  4m 53s | Max:  7m 25s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 46s | Avg:  4m 53s | Max:  7m 25s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total:  9m 46s | Avg:  4m 53s | Max:  7m 25s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total:  9m 46s | Avg:  4m 53s | Max:  7m 25s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total:  9m 46s | Avg:  4m 53s | Max:  7m 25s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total:  9m 46s | Avg:  4m 53s | Max:  7m 25s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 21s | Avg:  2m 21s | Max:  2m 21s
  🟩 Test               Pass: 100%/1   | Total:  7m 25s | Avg:  7m 25s | Max:  7m 25s

🟩 python: Pass: 100%/1 | Total: 44m 58s | Avg: 44m 58s | Max: 44m 58s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 44m 58s | Avg: 44m 58s | Max: 44m 58s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 44m 58s | Avg: 44m 58s | Max: 44m 58s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 44m 58s | Avg: 44m 58s | Max: 44m 58s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 44m 58s | Avg: 44m 58s | Max: 44m 58s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 44m 58s | Avg: 44m 58s | Max: 44m 58s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 44m 58s | Avg: 44m 58s | Max: 44m 58s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 44m 58s | Avg: 44m 58s | Max: 44m 58s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 44m 58s | Avg: 44m 58s | Max: 44m 58s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
+/-	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 176)

#	Runner
125	`linux-amd64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
1	`linux-amd64-gpu-h100-latest-1-testing`

rwgk · 2025-01-28T16:11:27Z

There were two failures that look like flakes:

https://github.com/NVIDIA/cccl/actions/runs/13005590267/attempts/1?pr=3536

I triggered a rerun of those.

bernhardmgruber · 2025-01-28T17:36:55Z

There were two failures that look like flakes:

https://github.com/NVIDIA/cccl/actions/runs/13005590267/attempts/1?pr=3536

I triggered a rerun of those.

I have seen the failures of TBB tests all over the place this morning, so we went ahead and disabled the CI runs in #3547. Can you please include those changes in your PR here?

… -m pytest` (NVIDIA#3523)" This reverts commit a2e21cb.

* Replace pipes.quote with shlex.quote * Drop TBB run on windows to unblock CI * Update ci/matrix.yaml Co-authored-by: Michael Schellenberger Costa <[email protected]> Co-authored-by: Bernhard Manfred Gruber <[email protected]>

rwgk · 2025-01-28T17:50:35Z

I have seen the failures of TBB tests all over the place this morning, so we went ahead and disabled the CI runs in #3547. Can you please include those changes in your PR here?

Done. I updated the PR description to explain that this PR is now a pure accumulation of cherry-picks, including #3547.

wmaxey · 2025-01-28T19:25:42Z

Enabling auto-merge as this is blocking an nvbug.

rwgk · 2025-01-28T21:37:00Z

FWIW — The GPU runners are severely in short supply. It's only now, almost 4 hours after pushing my commits, that I see "26 queued" going down to "24 queued" (I saw that by luck; I keep looking here every once in a while).

github-actions · 2025-01-29T20:41:53Z

🟨 CI finished in 2h 50m: Pass: 99%/175 | Total: 1d 05h | Avg: 10m 12s | Max: 56m 27s | Hits: 549%/20732

🟨 cub: Pass: 97%/47 | Total: 8h 50m | Avg: 11m 17s | Max: 56m 27s | Hits: 599%/3132

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  97%/45  | Total:  8h 41m | Avg: 11m 35s | Max: 56m 27s | Hits: 599%/3132  
  🟩 arm64              Pass: 100%/2   | Total:  9m 31s | Avg:  4m 45s | Max:  4m 50s
🔍 ctk: 12.6 🔍
  🟩 11.1               Pass: 100%/7   | Total:  1h 06m | Avg:  9m 28s | Max: 40m 42s | Hits: 599%/783   
  🟩 12.5               Pass: 100%/2   | Total: 18m 50s | Avg:  9m 25s | Max:  9m 39s
  🔍 12.6               Pass:  97%/38  | Total:  7h 25m | Avg: 11m 43s | Max: 56m 27s | Hits: 599%/2349  
🔍 cudacxx: nvcc12.6 🔍
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  9m 01s | Avg:  4m 30s | Max:  4m 35s
  🟩 nvcc11.1           Pass: 100%/7   | Total:  1h 06m | Avg:  9m 28s | Max: 40m 42s | Hits: 599%/783   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 18m 50s | Avg:  9m 25s | Max:  9m 39s
  🔍 nvcc12.6           Pass:  97%/36  | Total:  7h 16m | Avg: 12m 07s | Max: 56m 27s | Hits: 599%/2349  
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total:  9m 01s | Avg:  4m 30s | Max:  4m 35s
  🔍 nvcc               Pass:  97%/45  | Total:  8h 41m | Avg: 11m 35s | Max: 56m 27s | Hits: 599%/3132  
🔍 cxx: GCC13 🔍
  🟩 Clang9             Pass: 100%/4   | Total: 21m 36s | Avg:  5m 24s | Max:  6m 55s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 50s | Avg:  6m 50s | Max:  6m 50s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 33s | Avg:  5m 33s | Max:  5m 33s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 28s | Avg:  5m 28s | Max:  5m 28s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 22s | Avg:  5m 22s | Max:  5m 22s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 19s | Avg:  5m 19s | Max:  5m 19s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 55s | Avg:  5m 55s | Max:  5m 55s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 32s | Avg:  5m 32s | Max:  5m 32s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 27s | Avg:  5m 27s | Max:  5m 27s
  🟩 Clang18            Pass: 100%/7   | Total:  2h 05m | Avg: 17m 53s | Max: 56m 27s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 23s | Avg:  4m 11s | Max:  4m 16s
  🟩 GCC7               Pass: 100%/2   | Total: 10m 15s | Avg:  5m 07s | Max:  5m 17s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 24s | Avg:  5m 24s | Max:  5m 24s
  🟩 GCC9               Pass: 100%/3   | Total: 13m 59s | Avg:  4m 39s | Max:  5m 27s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 35s | Avg:  5m 35s | Max:  5m 35s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 35s | Avg:  5m 35s | Max:  5m 35s
  🟩 GCC12              Pass: 100%/3   | Total: 26m 51s | Avg:  8m 57s | Max: 16m 09s
  🔍 GCC13              Pass:  87%/8   | Total:  1h 49m | Avg: 13m 41s | Max: 39m 45s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  6m 30s | Avg:  6m 30s | Max:  6m 30s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 40m 42s | Avg: 40m 42s | Max: 40m 42s | Hits: 599%/783   
  🟩 MSVC14.29          Pass: 100%/1   | Total: 28m 32s | Avg: 28m 32s | Max: 28m 32s | Hits: 599%/783   
  🟩 MSVC14.39          Pass: 100%/2   | Total: 58m 28s | Avg: 29m 14s | Max: 29m 15s | Hits: 599%/1566  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 18m 50s | Avg:  9m 25s | Max:  9m 39s
🔍 cxx_family: GCC 🔍
  🟩 Clang              Pass: 100%/19  | Total:  3h 12m | Avg: 10m 07s | Max: 56m 27s
  🔍 GCC                Pass:  95%/21  | Total:  3h 05m | Avg:  8m 50s | Max: 39m 45s
  🟩 Intel              Pass: 100%/1   | Total:  6m 30s | Avg:  6m 30s | Max:  6m 30s
  🟩 MSVC               Pass: 100%/4   | Total:  2h 07m | Avg: 31m 55s | Max: 40m 42s | Hits: 599%/3132  
  🟩 NVHPC              Pass: 100%/2   | Total: 18m 50s | Avg:  9m 25s | Max:  9m 39s
🔍 gpu: v100 🔍
  🟩 h100               Pass: 100%/2   | Total: 20m 37s | Avg: 10m 18s | Max: 16m 09s
  🔍 v100               Pass:  97%/45  | Total:  8h 30m | Avg: 11m 20s | Max: 56m 27s | Hits: 599%/3132  
🚨 jobs: GraphCapture 🚨
  🟩 Build              Pass: 100%/40  | Total:  5h 26m | Avg:  8m 09s | Max: 40m 42s | Hits: 599%/3132  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 22m 57s | Avg: 22m 57s | Max: 22m 57s
  🔥 GraphCapture       Pass:   0%/1   | Total:  3m 45s | Avg:  3m 45s | Max:  3m 45s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 21m | Avg: 27m 16s | Max: 43m 50s
  🟩 TestGPU            Pass: 100%/2   | Total:  1h 36m | Avg: 48m 06s | Max: 56m 27s
🔍 std: 20 🔍
  🟩 11                 Pass: 100%/5   | Total: 23m 51s | Avg:  4m 46s | Max:  5m 59s
  🟩 14                 Pass: 100%/4   | Total: 56m 42s | Avg: 14m 10s | Max: 40m 42s | Hits: 599%/783   
  🟩 17                 Pass: 100%/12  | Total:  1h 56m | Avg:  9m 40s | Max: 29m 15s | Hits: 599%/1566  
  🔍 20                 Pass:  96%/26  | Total:  5h 34m | Avg: 12m 51s | Max: 56m 27s | Hits: 599%/783   
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 20m 37s | Avg: 10m 18s | Max: 16m 09s
  🟩 90a                Pass: 100%/1   | Total:  4m 25s | Avg:  4m 25s | Max:  4m 25s

🟩 libcudacxx: Pass: 100%/48 | Total: 10h 10m | Avg: 12m 43s | Max: 34m 12s | Hits: 668%/9880

🟩 cpu
  🟩 amd64              Pass: 100%/46  | Total: 10h 03m | Avg: 13m 07s | Max: 34m 12s | Hits: 668%/9880  
  🟩 arm64              Pass: 100%/2   | Total:  7m 03s | Avg:  3m 31s | Max:  3m 49s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total:  1h 02m | Avg:  8m 51s | Max: 24m 52s | Hits: 681%/2287  
  🟩 12.5               Pass: 100%/2   | Total: 42m 14s | Avg: 21m 07s | Max: 32m 38s
  🟩 12.6               Pass: 100%/39  | Total:  8h 26m | Avg: 12m 59s | Max: 34m 12s | Hits: 664%/7593  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  1h 13m | Avg: 18m 15s | Max: 22m 41s
  🟩 nvcc11.1           Pass: 100%/7   | Total:  1h 02m | Avg:  8m 51s | Max: 24m 52s | Hits: 681%/2287  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 42m 14s | Avg: 21m 07s | Max: 32m 38s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  7h 13m | Avg: 12m 23s | Max: 34m 12s | Hits: 664%/7593  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  1h 13m | Avg: 18m 15s | Max: 22m 41s
  🟩 nvcc               Pass: 100%/44  | Total:  8h 57m | Avg: 12m 13s | Max: 34m 12s | Hits: 668%/9880  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 31m 19s | Avg:  7m 49s | Max: 20m 09s
  🟩 Clang10            Pass: 100%/1   | Total:  5m 12s | Avg:  5m 12s | Max:  5m 12s
  🟩 Clang11            Pass: 100%/1   | Total:  4m 00s | Avg:  4m 00s | Max:  4m 00s
  🟩 Clang12            Pass: 100%/1   | Total:  4m 22s | Avg:  4m 22s | Max:  4m 22s
  🟩 Clang13            Pass: 100%/1   | Total:  4m 18s | Avg:  4m 18s | Max:  4m 18s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 14s | Avg:  4m 14s | Max:  4m 14s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 00s | Avg:  5m 00s | Max:  5m 00s
  🟩 Clang16            Pass: 100%/1   | Total:  4m 29s | Avg:  4m 29s | Max:  4m 29s
  🟩 Clang17            Pass: 100%/1   | Total:  4m 31s | Avg:  4m 31s | Max:  4m 31s
  🟩 Clang18            Pass: 100%/8   | Total:  1h 45m | Avg: 13m 08s | Max: 22m 41s
  🟩 GCC6               Pass: 100%/2   | Total:  4m 50s | Avg:  2m 25s | Max:  2m 36s
  🟩 GCC7               Pass: 100%/2   | Total:  6m 29s | Avg:  3m 14s | Max:  3m 32s
  🟩 GCC8               Pass: 100%/1   | Total: 20m 01s | Avg: 20m 01s | Max: 20m 01s
  🟩 GCC9               Pass: 100%/3   | Total: 29m 22s | Avg:  9m 47s | Max: 22m 34s
  🟩 GCC10              Pass: 100%/1   | Total: 18m 29s | Avg: 18m 29s | Max: 18m 29s
  🟩 GCC11              Pass: 100%/1   | Total: 19m 26s | Avg: 19m 26s | Max: 19m 26s
  🟩 GCC12              Pass: 100%/1   | Total:  3m 45s | Avg:  3m 45s | Max:  3m 45s
  🟩 GCC13              Pass: 100%/10  | Total:  2h 59m | Avg: 17m 56s | Max: 34m 12s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  5m 19s | Avg:  5m 19s | Max:  5m 19s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 24m 52s | Avg: 24m 52s | Max: 24m 52s | Hits: 681%/2287  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 25m 09s | Avg: 25m 09s | Max: 25m 09s | Hits: 683%/2482  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 58m 57s | Avg: 29m 28s | Max: 33m 48s | Hits: 656%/5111  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 42m 14s | Avg: 21m 07s | Max: 32m 38s
🟩 cxx_family
  🟩 Clang              Pass: 100%/20  | Total:  2h 52m | Avg:  8m 37s | Max: 22m 41s
  🟩 GCC                Pass: 100%/21  | Total:  4h 41m | Avg: 13m 25s | Max: 34m 12s
  🟩 Intel              Pass: 100%/1   | Total:  5m 19s | Avg:  5m 19s | Max:  5m 19s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 48m | Avg: 27m 14s | Max: 33m 48s | Hits: 668%/9880  
  🟩 NVHPC              Pass: 100%/2   | Total: 42m 14s | Avg: 21m 07s | Max: 32m 38s
🟩 gpu
  🟩 v100               Pass: 100%/48  | Total: 10h 10m | Avg: 12m 43s | Max: 34m 12s | Hits: 668%/9880  
🟩 jobs
  🟩 Build              Pass: 100%/41  | Total:  7h 22m | Avg: 10m 48s | Max: 33m 48s | Hits: 668%/9880  
  🟩 NVRTC              Pass: 100%/4   | Total:  2h 02m | Avg: 30m 38s | Max: 34m 12s
  🟩 Test               Pass: 100%/2   | Total: 43m 27s | Avg: 21m 43s | Max: 23m 19s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  1m 58s | Avg:  1m 58s | Max:  1m 58s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total: 15m 21s | Avg: 15m 21s | Max: 15m 21s
  🟩 90a                Pass: 100%/2   | Total: 16m 43s | Avg:  8m 21s | Max: 12m 45s
🟩 std
  🟩 11                 Pass: 100%/6   | Total:  1h 01m | Avg: 10m 10s | Max: 25m 45s
  🟩 14                 Pass: 100%/5   | Total:  1h 25m | Avg: 17m 04s | Max: 34m 12s | Hits: 681%/2287  
  🟩 17                 Pass: 100%/13  | Total:  2h 58m | Avg: 13m 45s | Max: 31m 09s | Hits: 683%/4964  
  🟩 20                 Pass: 100%/23  | Total:  4h 43m | Avg: 12m 20s | Max: 33m 48s | Hits: 630%/2629

🟩 thrust: Pass: 100%/45 | Total: 6h 55m | Avg: 9m 14s | Max: 37m 04s | Hits: 366%/7408

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 35m 18s | Avg: 17m 39s | Max: 29m 48s
🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total:  6h 46m | Avg:  9m 27s | Max: 37m 04s | Hits: 366%/7408  
  🟩 arm64              Pass: 100%/2   | Total:  9m 20s | Avg:  4m 40s | Max:  4m 54s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 50m 46s | Avg:  7m 15s | Max: 25m 36s | Hits: 368%/1852  
  🟩 12.5               Pass: 100%/2   | Total: 28m 30s | Avg: 14m 15s | Max: 14m 25s
  🟩 12.6               Pass: 100%/36  | Total:  5h 36m | Avg:  9m 21s | Max: 37m 04s | Hits: 365%/5556  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 10m 31s | Avg:  5m 15s | Max:  5m 23s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 50m 46s | Avg:  7m 15s | Max: 25m 36s | Hits: 368%/1852  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 28m 30s | Avg: 14m 15s | Max: 14m 25s
  🟩 nvcc12.6           Pass: 100%/34  | Total:  5h 26m | Avg:  9m 35s | Max: 37m 04s | Hits: 365%/5556  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 10m 31s | Avg:  5m 15s | Max:  5m 23s
  🟩 nvcc               Pass: 100%/43  | Total:  6h 45m | Avg:  9m 25s | Max: 37m 04s | Hits: 366%/7408  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 18s | Avg:  5m 19s | Max:  6m 41s
  🟩 Clang10            Pass: 100%/1   | Total:  7m 40s | Avg:  7m 40s | Max:  7m 40s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 01s | Avg:  5m 01s | Max:  5m 01s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 05s | Avg:  5m 05s | Max:  5m 05s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 13s | Avg:  5m 13s | Max:  5m 13s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 09s | Avg:  5m 09s | Max:  5m 09s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 49s | Avg:  5m 49s | Max:  5m 49s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 51s | Avg:  5m 51s | Max:  5m 51s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 45s | Avg:  5m 45s | Max:  5m 45s
  🟩 Clang18            Pass: 100%/7   | Total: 45m 24s | Avg:  6m 29s | Max: 11m 16s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 15s | Avg:  4m 07s | Max:  4m 29s
  🟩 GCC7               Pass: 100%/2   | Total:  9m 52s | Avg:  4m 56s | Max:  5m 19s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 14s | Avg:  5m 14s | Max:  5m 14s
  🟩 GCC9               Pass: 100%/3   | Total: 13m 41s | Avg:  4m 33s | Max:  5m 23s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 52s | Avg:  5m 52s | Max:  5m 52s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 59s | Avg:  5m 59s | Max:  5m 59s
  🟩 GCC12              Pass: 100%/1   | Total:  5m 44s | Avg:  5m 44s | Max:  5m 44s
  🟩 GCC13              Pass: 100%/8   | Total:  1h 42m | Avg: 12m 46s | Max: 37m 04s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  7m 31s | Avg:  7m 31s | Max:  7m 31s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 25m 36s | Avg: 25m 36s | Max: 25m 36s | Hits: 368%/1852  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 27m 35s | Avg: 27m 35s | Max: 27m 35s | Hits: 365%/1852  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 57m 40s | Avg: 28m 50s | Max: 29m 30s | Hits: 365%/3704  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 28m 30s | Avg: 14m 15s | Max: 14m 25s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  1h 52m | Avg:  5m 54s | Max: 11m 16s
  🟩 GCC                Pass: 100%/19  | Total:  2h 36m | Avg:  8m 15s | Max: 37m 04s
  🟩 Intel              Pass: 100%/1   | Total:  7m 31s | Avg:  7m 31s | Max:  7m 31s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 50m | Avg: 27m 42s | Max: 29m 30s | Hits: 366%/7408  
  🟩 NVHPC              Pass: 100%/2   | Total: 28m 30s | Avg: 14m 15s | Max: 14m 25s
🟩 gpu
  🟩 v100               Pass: 100%/45  | Total:  6h 55m | Avg:  9m 14s | Max: 37m 04s | Hits: 366%/7408  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  5h 21m | Avg:  8m 02s | Max: 29m 30s | Hits: 366%/7408  
  🟩 TestCPU            Pass: 100%/2   | Total: 16m 29s | Avg:  8m 14s | Max:  8m 18s
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 18m | Avg: 26m 02s | Max: 37m 04s
🟩 sm
  🟩 90a                Pass: 100%/1   | Total:  4m 35s | Avg:  4m 35s | Max:  4m 35s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 22m 11s | Avg:  4m 26s | Max:  6m 00s
  🟩 14                 Pass: 100%/4   | Total: 42m 05s | Avg: 10m 31s | Max: 25m 36s | Hits: 368%/1852  
  🟩 17                 Pass: 100%/12  | Total:  2h 03m | Avg: 10m 15s | Max: 29m 30s | Hits: 365%/3704  
  🟩 20                 Pass: 100%/22  | Total:  3h 13m | Avg:  8m 47s | Max: 37m 04s | Hits: 365%/1852

🟩 cudax: Pass: 100%/26 | Total: 2h 20m | Avg: 5m 24s | Max: 24m 10s | Hits: 582%/312

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 10m | Avg:  5m 56s | Max: 24m 10s | Hits: 582%/312   
  🟩 arm64              Pass: 100%/4   | Total: 10m 05s | Avg:  2m 31s | Max:  2m 36s
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 14m 48s | Avg:  4m 56s | Max:  8m 44s | Hits: 582%/156   
  🟩 12.5               Pass: 100%/2   | Total: 10m 47s | Avg:  5m 23s | Max:  5m 29s
  🟩 12.6               Pass: 100%/21  | Total:  1h 55m | Avg:  5m 28s | Max: 24m 10s | Hits: 582%/156   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 14m 48s | Avg:  4m 56s | Max:  8m 44s | Hits: 582%/156   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 10m 47s | Avg:  5m 23s | Max:  5m 29s
  🟩 nvcc12.6           Pass: 100%/21  | Total:  1h 55m | Avg:  5m 28s | Max: 24m 10s | Hits: 582%/156   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 20m | Avg:  5m 24s | Max: 24m 10s | Hits: 582%/312   
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  3m 15s | Avg:  3m 15s | Max:  3m 15s
  🟩 Clang10            Pass: 100%/1   | Total:  3m 50s | Avg:  3m 50s | Max:  3m 50s
  🟩 Clang11            Pass: 100%/1   | Total:  3m 18s | Avg:  3m 18s | Max:  3m 18s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 15s | Avg:  3m 15s | Max:  3m 15s
  🟩 Clang13            Pass: 100%/1   | Total:  3m 07s | Avg:  3m 07s | Max:  3m 07s
  🟩 Clang14            Pass: 100%/1   | Total:  3m 14s | Avg:  3m 14s | Max:  3m 14s
  🟩 Clang15            Pass: 100%/1   | Total:  3m 36s | Avg:  3m 36s | Max:  3m 36s
  🟩 Clang16            Pass: 100%/1   | Total:  3m 13s | Avg:  3m 13s | Max:  3m 13s
  🟩 Clang17            Pass: 100%/1   | Total:  3m 16s | Avg:  3m 16s | Max:  3m 16s
  🟩 Clang18            Pass: 100%/4   | Total: 32m 27s | Avg:  8m 06s | Max: 24m 10s
  🟩 GCC9               Pass: 100%/1   | Total:  2m 49s | Avg:  2m 49s | Max:  2m 49s
  🟩 GCC10              Pass: 100%/1   | Total:  2m 59s | Avg:  2m 59s | Max:  2m 59s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 12s | Avg:  3m 12s | Max:  3m 12s
  🟩 GCC12              Pass: 100%/2   | Total: 26m 58s | Avg: 13m 29s | Max: 23m 49s
  🟩 GCC13              Pass: 100%/4   | Total: 10m 06s | Avg:  2m 31s | Max:  2m 39s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  8m 44s | Avg:  8m 44s | Max:  8m 44s | Hits: 582%/156   
  🟩 MSVC14.39          Pass: 100%/1   | Total: 12m 31s | Avg: 12m 31s | Max: 12m 31s | Hits: 582%/156   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 10m 47s | Avg:  5m 23s | Max:  5m 29s
🟩 cxx_family
  🟩 Clang              Pass: 100%/13  | Total:  1h 02m | Avg:  4m 48s | Max: 24m 10s
  🟩 GCC                Pass: 100%/9   | Total: 46m 04s | Avg:  5m 07s | Max: 23m 49s
  🟩 MSVC               Pass: 100%/2   | Total: 21m 15s | Avg: 10m 37s | Max: 12m 31s | Hits: 582%/312   
  🟩 NVHPC              Pass: 100%/2   | Total: 10m 47s | Avg:  5m 23s | Max:  5m 29s
🟩 gpu
  🟩 v100               Pass: 100%/26  | Total:  2h 20m | Avg:  5m 24s | Max: 24m 10s | Hits: 582%/312   
🟩 jobs
  🟩 Build              Pass: 100%/24  | Total:  1h 32m | Avg:  3m 51s | Max: 12m 31s | Hits: 582%/312   
  🟩 Test               Pass: 100%/2   | Total: 47m 59s | Avg: 23m 59s | Max: 24m 10s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 39s | Avg:  2m 39s | Max:  2m 39s
  🟩 90a                Pass: 100%/1   | Total:  2m 30s | Avg:  2m 30s | Max:  2m 30s
🟩 std
  🟩 17                 Pass: 100%/6   | Total: 18m 58s | Avg:  3m 09s | Max:  5m 18s
  🟩 20                 Pass: 100%/20  | Total:  2h 01m | Avg:  6m 04s | Max: 24m 10s | Hits: 582%/312

🟩 cccl: Pass: 100%/6 | Total: 28m 50s | Avg: 4m 48s | Max: 5m 27s

🟩 cpu
  🟩 amd64              Pass: 100%/6   | Total: 28m 50s | Avg:  4m 48s | Max:  5m 27s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  9m 00s | Avg:  4m 30s | Max:  4m 37s
  🟩 12.0               Pass: 100%/2   | Total:  9m 51s | Avg:  4m 55s | Max:  5m 27s
  🟩 12.6               Pass: 100%/2   | Total:  9m 59s | Avg:  4m 59s | Max:  5m 27s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  9m 00s | Avg:  4m 30s | Max:  4m 37s
  🟩 nvcc12.0           Pass: 100%/2   | Total:  9m 51s | Avg:  4m 55s | Max:  5m 27s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 59s | Avg:  4m 59s | Max:  5m 27s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/6   | Total: 28m 50s | Avg:  4m 48s | Max:  5m 27s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 37s | Avg:  4m 37s | Max:  4m 37s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 27s | Avg:  5m 27s | Max:  5m 27s
  🟩 Clang18            Pass: 100%/1   | Total:  5m 27s | Avg:  5m 27s | Max:  5m 27s
  🟩 GCC6               Pass: 100%/1   | Total:  4m 23s | Avg:  4m 23s | Max:  4m 23s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 24s | Avg:  4m 24s | Max:  4m 24s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 32s | Avg:  4m 32s | Max:  4m 32s
🟩 cxx_family
  🟩 Clang              Pass: 100%/3   | Total: 15m 31s | Avg:  5m 10s | Max:  5m 27s
  🟩 GCC                Pass: 100%/3   | Total: 13m 19s | Avg:  4m 26s | Max:  4m 32s
🟩 gpu
  🟩 v100               Pass: 100%/6   | Total: 28m 50s | Avg:  4m 48s | Max:  5m 27s
🟩 jobs
  🟩 Infra              Pass: 100%/6   | Total: 28m 50s | Avg:  4m 48s | Max:  5m 27s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 13m 21s | Avg: 6m 40s | Max: 11m 22s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  1m 59s | Avg:  1m 59s | Max:  1m 59s
  🟩 Test               Pass: 100%/1   | Total: 11m 22s | Avg: 11m 22s | Max: 11m 22s

🟩 python: Pass: 100%/1 | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
+/-	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 175)

#	Runner
125	`linux-amd64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
14	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
1	`linux-amd64-gpu-h100-latest-1`

github-actions · 2025-01-29T23:41:43Z

🟩 CI finished in 5h 48m: Pass: 100%/175 | Total: 1d 06h | Avg: 10m 17s | Max: 56m 27s | Hits: 549%/20732

🟩 libcudacxx: Pass: 100%/48 | Total: 10h 10m | Avg: 12m 43s | Max: 34m 12s | Hits: 668%/9880

🟩 cpu
  🟩 amd64              Pass: 100%/46  | Total: 10h 03m | Avg: 13m 07s | Max: 34m 12s | Hits: 668%/9880  
  🟩 arm64              Pass: 100%/2   | Total:  7m 03s | Avg:  3m 31s | Max:  3m 49s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total:  1h 02m | Avg:  8m 51s | Max: 24m 52s | Hits: 681%/2287  
  🟩 12.5               Pass: 100%/2   | Total: 42m 14s | Avg: 21m 07s | Max: 32m 38s
  🟩 12.6               Pass: 100%/39  | Total:  8h 26m | Avg: 12m 59s | Max: 34m 12s | Hits: 664%/7593  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  1h 13m | Avg: 18m 15s | Max: 22m 41s
  🟩 nvcc11.1           Pass: 100%/7   | Total:  1h 02m | Avg:  8m 51s | Max: 24m 52s | Hits: 681%/2287  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 42m 14s | Avg: 21m 07s | Max: 32m 38s
  🟩 nvcc12.6           Pass: 100%/35  | Total:  7h 13m | Avg: 12m 23s | Max: 34m 12s | Hits: 664%/7593  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  1h 13m | Avg: 18m 15s | Max: 22m 41s
  🟩 nvcc               Pass: 100%/44  | Total:  8h 57m | Avg: 12m 13s | Max: 34m 12s | Hits: 668%/9880  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 31m 19s | Avg:  7m 49s | Max: 20m 09s
  🟩 Clang10            Pass: 100%/1   | Total:  5m 12s | Avg:  5m 12s | Max:  5m 12s
  🟩 Clang11            Pass: 100%/1   | Total:  4m 00s | Avg:  4m 00s | Max:  4m 00s
  🟩 Clang12            Pass: 100%/1   | Total:  4m 22s | Avg:  4m 22s | Max:  4m 22s
  🟩 Clang13            Pass: 100%/1   | Total:  4m 18s | Avg:  4m 18s | Max:  4m 18s
  🟩 Clang14            Pass: 100%/1   | Total:  4m 14s | Avg:  4m 14s | Max:  4m 14s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 00s | Avg:  5m 00s | Max:  5m 00s
  🟩 Clang16            Pass: 100%/1   | Total:  4m 29s | Avg:  4m 29s | Max:  4m 29s
  🟩 Clang17            Pass: 100%/1   | Total:  4m 31s | Avg:  4m 31s | Max:  4m 31s
  🟩 Clang18            Pass: 100%/8   | Total:  1h 45m | Avg: 13m 08s | Max: 22m 41s
  🟩 GCC6               Pass: 100%/2   | Total:  4m 50s | Avg:  2m 25s | Max:  2m 36s
  🟩 GCC7               Pass: 100%/2   | Total:  6m 29s | Avg:  3m 14s | Max:  3m 32s
  🟩 GCC8               Pass: 100%/1   | Total: 20m 01s | Avg: 20m 01s | Max: 20m 01s
  🟩 GCC9               Pass: 100%/3   | Total: 29m 22s | Avg:  9m 47s | Max: 22m 34s
  🟩 GCC10              Pass: 100%/1   | Total: 18m 29s | Avg: 18m 29s | Max: 18m 29s
  🟩 GCC11              Pass: 100%/1   | Total: 19m 26s | Avg: 19m 26s | Max: 19m 26s
  🟩 GCC12              Pass: 100%/1   | Total:  3m 45s | Avg:  3m 45s | Max:  3m 45s
  🟩 GCC13              Pass: 100%/10  | Total:  2h 59m | Avg: 17m 56s | Max: 34m 12s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  5m 19s | Avg:  5m 19s | Max:  5m 19s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 24m 52s | Avg: 24m 52s | Max: 24m 52s | Hits: 681%/2287  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 25m 09s | Avg: 25m 09s | Max: 25m 09s | Hits: 683%/2482  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 58m 57s | Avg: 29m 28s | Max: 33m 48s | Hits: 656%/5111  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 42m 14s | Avg: 21m 07s | Max: 32m 38s
🟩 cxx_family
  🟩 Clang              Pass: 100%/20  | Total:  2h 52m | Avg:  8m 37s | Max: 22m 41s
  🟩 GCC                Pass: 100%/21  | Total:  4h 41m | Avg: 13m 25s | Max: 34m 12s
  🟩 Intel              Pass: 100%/1   | Total:  5m 19s | Avg:  5m 19s | Max:  5m 19s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 48m | Avg: 27m 14s | Max: 33m 48s | Hits: 668%/9880  
  🟩 NVHPC              Pass: 100%/2   | Total: 42m 14s | Avg: 21m 07s | Max: 32m 38s
🟩 gpu
  🟩 v100               Pass: 100%/48  | Total: 10h 10m | Avg: 12m 43s | Max: 34m 12s | Hits: 668%/9880  
🟩 jobs
  🟩 Build              Pass: 100%/41  | Total:  7h 22m | Avg: 10m 48s | Max: 33m 48s | Hits: 668%/9880  
  🟩 NVRTC              Pass: 100%/4   | Total:  2h 02m | Avg: 30m 38s | Max: 34m 12s
  🟩 Test               Pass: 100%/2   | Total: 43m 27s | Avg: 21m 43s | Max: 23m 19s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  1m 58s | Avg:  1m 58s | Max:  1m 58s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total: 15m 21s | Avg: 15m 21s | Max: 15m 21s
  🟩 90a                Pass: 100%/2   | Total: 16m 43s | Avg:  8m 21s | Max: 12m 45s
🟩 std
  🟩 11                 Pass: 100%/6   | Total:  1h 01m | Avg: 10m 10s | Max: 25m 45s
  🟩 14                 Pass: 100%/5   | Total:  1h 25m | Avg: 17m 04s | Max: 34m 12s | Hits: 681%/2287  
  🟩 17                 Pass: 100%/13  | Total:  2h 58m | Avg: 13m 45s | Max: 31m 09s | Hits: 683%/4964  
  🟩 20                 Pass: 100%/23  | Total:  4h 43m | Avg: 12m 20s | Max: 33m 48s | Hits: 630%/2629

🟩 cub: Pass: 100%/47 | Total: 9h 06m | Avg: 11m 37s | Max: 56m 27s | Hits: 599%/3132

🟩 cpu
  🟩 amd64              Pass: 100%/45  | Total:  8h 56m | Avg: 11m 55s | Max: 56m 27s | Hits: 599%/3132  
  🟩 arm64              Pass: 100%/2   | Total:  9m 31s | Avg:  4m 45s | Max:  4m 50s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total:  1h 06m | Avg:  9m 28s | Max: 40m 42s | Hits: 599%/783   
  🟩 12.5               Pass: 100%/2   | Total: 18m 50s | Avg:  9m 25s | Max:  9m 39s
  🟩 12.6               Pass: 100%/38  | Total:  7h 41m | Avg: 12m 08s | Max: 56m 27s | Hits: 599%/2349  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  9m 01s | Avg:  4m 30s | Max:  4m 35s
  🟩 nvcc11.1           Pass: 100%/7   | Total:  1h 06m | Avg:  9m 28s | Max: 40m 42s | Hits: 599%/783   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 18m 50s | Avg:  9m 25s | Max:  9m 39s
  🟩 nvcc12.6           Pass: 100%/36  | Total:  7h 32m | Avg: 12m 33s | Max: 56m 27s | Hits: 599%/2349  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  9m 01s | Avg:  4m 30s | Max:  4m 35s
  🟩 nvcc               Pass: 100%/45  | Total:  8h 57m | Avg: 11m 56s | Max: 56m 27s | Hits: 599%/3132  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 36s | Avg:  5m 24s | Max:  6m 55s
  🟩 Clang10            Pass: 100%/1   | Total:  6m 50s | Avg:  6m 50s | Max:  6m 50s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 33s | Avg:  5m 33s | Max:  5m 33s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 28s | Avg:  5m 28s | Max:  5m 28s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 22s | Avg:  5m 22s | Max:  5m 22s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 19s | Avg:  5m 19s | Max:  5m 19s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 55s | Avg:  5m 55s | Max:  5m 55s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 32s | Avg:  5m 32s | Max:  5m 32s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 27s | Avg:  5m 27s | Max:  5m 27s
  🟩 Clang18            Pass: 100%/7   | Total:  2h 05m | Avg: 17m 53s | Max: 56m 27s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 23s | Avg:  4m 11s | Max:  4m 16s
  🟩 GCC7               Pass: 100%/2   | Total: 10m 15s | Avg:  5m 07s | Max:  5m 17s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 24s | Avg:  5m 24s | Max:  5m 24s
  🟩 GCC9               Pass: 100%/3   | Total: 13m 59s | Avg:  4m 39s | Max:  5m 27s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 35s | Avg:  5m 35s | Max:  5m 35s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 35s | Avg:  5m 35s | Max:  5m 35s
  🟩 GCC12              Pass: 100%/3   | Total: 26m 51s | Avg:  8m 57s | Max: 16m 09s
  🟩 GCC13              Pass: 100%/8   | Total:  2h 05m | Avg: 15m 38s | Max: 39m 45s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  6m 30s | Avg:  6m 30s | Max:  6m 30s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 40m 42s | Avg: 40m 42s | Max: 40m 42s | Hits: 599%/783   
  🟩 MSVC14.29          Pass: 100%/1   | Total: 28m 32s | Avg: 28m 32s | Max: 28m 32s | Hits: 599%/783   
  🟩 MSVC14.39          Pass: 100%/2   | Total: 58m 28s | Avg: 29m 14s | Max: 29m 15s | Hits: 599%/1566  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 18m 50s | Avg:  9m 25s | Max:  9m 39s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  3h 12m | Avg: 10m 07s | Max: 56m 27s
  🟩 GCC                Pass: 100%/21  | Total:  3h 21m | Avg:  9m 34s | Max: 39m 45s
  🟩 Intel              Pass: 100%/1   | Total:  6m 30s | Avg:  6m 30s | Max:  6m 30s
  🟩 MSVC               Pass: 100%/4   | Total:  2h 07m | Avg: 31m 55s | Max: 40m 42s | Hits: 599%/3132  
  🟩 NVHPC              Pass: 100%/2   | Total: 18m 50s | Avg:  9m 25s | Max:  9m 39s
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 20m 37s | Avg: 10m 18s | Max: 16m 09s
  🟩 v100               Pass: 100%/45  | Total:  8h 45m | Avg: 11m 41s | Max: 56m 27s | Hits: 599%/3132  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  5h 26m | Avg:  8m 09s | Max: 40m 42s | Hits: 599%/3132  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 22m 57s | Avg: 22m 57s | Max: 22m 57s
  🟩 GraphCapture       Pass: 100%/1   | Total: 19m 22s | Avg: 19m 22s | Max: 19m 22s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 21m | Avg: 27m 16s | Max: 43m 50s
  🟩 TestGPU            Pass: 100%/2   | Total:  1h 36m | Avg: 48m 06s | Max: 56m 27s
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 20m 37s | Avg: 10m 18s | Max: 16m 09s
  🟩 90a                Pass: 100%/1   | Total:  4m 25s | Avg:  4m 25s | Max:  4m 25s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 23m 51s | Avg:  4m 46s | Max:  5m 59s
  🟩 14                 Pass: 100%/4   | Total: 56m 42s | Avg: 14m 10s | Max: 40m 42s | Hits: 599%/783   
  🟩 17                 Pass: 100%/12  | Total:  1h 56m | Avg:  9m 40s | Max: 29m 15s | Hits: 599%/1566  
  🟩 20                 Pass: 100%/26  | Total:  5h 49m | Avg: 13m 27s | Max: 56m 27s | Hits: 599%/783

🟩 thrust: Pass: 100%/45 | Total: 6h 55m | Avg: 9m 14s | Max: 37m 04s | Hits: 366%/7408

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 35m 18s | Avg: 17m 39s | Max: 29m 48s
🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total:  6h 46m | Avg:  9m 27s | Max: 37m 04s | Hits: 366%/7408  
  🟩 arm64              Pass: 100%/2   | Total:  9m 20s | Avg:  4m 40s | Max:  4m 54s
🟩 ctk
  🟩 11.1               Pass: 100%/7   | Total: 50m 46s | Avg:  7m 15s | Max: 25m 36s | Hits: 368%/1852  
  🟩 12.5               Pass: 100%/2   | Total: 28m 30s | Avg: 14m 15s | Max: 14m 25s
  🟩 12.6               Pass: 100%/36  | Total:  5h 36m | Avg:  9m 21s | Max: 37m 04s | Hits: 365%/5556  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 10m 31s | Avg:  5m 15s | Max:  5m 23s
  🟩 nvcc11.1           Pass: 100%/7   | Total: 50m 46s | Avg:  7m 15s | Max: 25m 36s | Hits: 368%/1852  
  🟩 nvcc12.5           Pass: 100%/2   | Total: 28m 30s | Avg: 14m 15s | Max: 14m 25s
  🟩 nvcc12.6           Pass: 100%/34  | Total:  5h 26m | Avg:  9m 35s | Max: 37m 04s | Hits: 365%/5556  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 10m 31s | Avg:  5m 15s | Max:  5m 23s
  🟩 nvcc               Pass: 100%/43  | Total:  6h 45m | Avg:  9m 25s | Max: 37m 04s | Hits: 366%/7408  
🟩 cxx
  🟩 Clang9             Pass: 100%/4   | Total: 21m 18s | Avg:  5m 19s | Max:  6m 41s
  🟩 Clang10            Pass: 100%/1   | Total:  7m 40s | Avg:  7m 40s | Max:  7m 40s
  🟩 Clang11            Pass: 100%/1   | Total:  5m 01s | Avg:  5m 01s | Max:  5m 01s
  🟩 Clang12            Pass: 100%/1   | Total:  5m 05s | Avg:  5m 05s | Max:  5m 05s
  🟩 Clang13            Pass: 100%/1   | Total:  5m 13s | Avg:  5m 13s | Max:  5m 13s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 09s | Avg:  5m 09s | Max:  5m 09s
  🟩 Clang15            Pass: 100%/1   | Total:  5m 49s | Avg:  5m 49s | Max:  5m 49s
  🟩 Clang16            Pass: 100%/1   | Total:  5m 51s | Avg:  5m 51s | Max:  5m 51s
  🟩 Clang17            Pass: 100%/1   | Total:  5m 45s | Avg:  5m 45s | Max:  5m 45s
  🟩 Clang18            Pass: 100%/7   | Total: 45m 24s | Avg:  6m 29s | Max: 11m 16s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 15s | Avg:  4m 07s | Max:  4m 29s
  🟩 GCC7               Pass: 100%/2   | Total:  9m 52s | Avg:  4m 56s | Max:  5m 19s
  🟩 GCC8               Pass: 100%/1   | Total:  5m 14s | Avg:  5m 14s | Max:  5m 14s
  🟩 GCC9               Pass: 100%/3   | Total: 13m 41s | Avg:  4m 33s | Max:  5m 23s
  🟩 GCC10              Pass: 100%/1   | Total:  5m 52s | Avg:  5m 52s | Max:  5m 52s
  🟩 GCC11              Pass: 100%/1   | Total:  5m 59s | Avg:  5m 59s | Max:  5m 59s
  🟩 GCC12              Pass: 100%/1   | Total:  5m 44s | Avg:  5m 44s | Max:  5m 44s
  🟩 GCC13              Pass: 100%/8   | Total:  1h 42m | Avg: 12m 46s | Max: 37m 04s
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  7m 31s | Avg:  7m 31s | Max:  7m 31s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 25m 36s | Avg: 25m 36s | Max: 25m 36s | Hits: 368%/1852  
  🟩 MSVC14.29          Pass: 100%/1   | Total: 27m 35s | Avg: 27m 35s | Max: 27m 35s | Hits: 365%/1852  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 57m 40s | Avg: 28m 50s | Max: 29m 30s | Hits: 365%/3704  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 28m 30s | Avg: 14m 15s | Max: 14m 25s
🟩 cxx_family
  🟩 Clang              Pass: 100%/19  | Total:  1h 52m | Avg:  5m 54s | Max: 11m 16s
  🟩 GCC                Pass: 100%/19  | Total:  2h 36m | Avg:  8m 15s | Max: 37m 04s
  🟩 Intel              Pass: 100%/1   | Total:  7m 31s | Avg:  7m 31s | Max:  7m 31s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 50m | Avg: 27m 42s | Max: 29m 30s | Hits: 366%/7408  
  🟩 NVHPC              Pass: 100%/2   | Total: 28m 30s | Avg: 14m 15s | Max: 14m 25s
🟩 gpu
  🟩 v100               Pass: 100%/45  | Total:  6h 55m | Avg:  9m 14s | Max: 37m 04s | Hits: 366%/7408  
🟩 jobs
  🟩 Build              Pass: 100%/40  | Total:  5h 21m | Avg:  8m 02s | Max: 29m 30s | Hits: 366%/7408  
  🟩 TestCPU            Pass: 100%/2   | Total: 16m 29s | Avg:  8m 14s | Max:  8m 18s
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 18m | Avg: 26m 02s | Max: 37m 04s
🟩 sm
  🟩 90a                Pass: 100%/1   | Total:  4m 35s | Avg:  4m 35s | Max:  4m 35s
🟩 std
  🟩 11                 Pass: 100%/5   | Total: 22m 11s | Avg:  4m 26s | Max:  6m 00s
  🟩 14                 Pass: 100%/4   | Total: 42m 05s | Avg: 10m 31s | Max: 25m 36s | Hits: 368%/1852  
  🟩 17                 Pass: 100%/12  | Total:  2h 03m | Avg: 10m 15s | Max: 29m 30s | Hits: 365%/3704  
  🟩 20                 Pass: 100%/22  | Total:  3h 13m | Avg:  8m 47s | Max: 37m 04s | Hits: 365%/1852

🟩 cudax: Pass: 100%/26 | Total: 2h 20m | Avg: 5m 24s | Max: 24m 10s | Hits: 582%/312

🟩 cpu
  🟩 amd64              Pass: 100%/22  | Total:  2h 10m | Avg:  5m 56s | Max: 24m 10s | Hits: 582%/312   
  🟩 arm64              Pass: 100%/4   | Total: 10m 05s | Avg:  2m 31s | Max:  2m 36s
🟩 ctk
  🟩 12.0               Pass: 100%/3   | Total: 14m 48s | Avg:  4m 56s | Max:  8m 44s | Hits: 582%/156   
  🟩 12.5               Pass: 100%/2   | Total: 10m 47s | Avg:  5m 23s | Max:  5m 29s
  🟩 12.6               Pass: 100%/21  | Total:  1h 55m | Avg:  5m 28s | Max: 24m 10s | Hits: 582%/156   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/3   | Total: 14m 48s | Avg:  4m 56s | Max:  8m 44s | Hits: 582%/156   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 10m 47s | Avg:  5m 23s | Max:  5m 29s
  🟩 nvcc12.6           Pass: 100%/21  | Total:  1h 55m | Avg:  5m 28s | Max: 24m 10s | Hits: 582%/156   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/26  | Total:  2h 20m | Avg:  5m 24s | Max: 24m 10s | Hits: 582%/312   
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  3m 15s | Avg:  3m 15s | Max:  3m 15s
  🟩 Clang10            Pass: 100%/1   | Total:  3m 50s | Avg:  3m 50s | Max:  3m 50s
  🟩 Clang11            Pass: 100%/1   | Total:  3m 18s | Avg:  3m 18s | Max:  3m 18s
  🟩 Clang12            Pass: 100%/1   | Total:  3m 15s | Avg:  3m 15s | Max:  3m 15s
  🟩 Clang13            Pass: 100%/1   | Total:  3m 07s | Avg:  3m 07s | Max:  3m 07s
  🟩 Clang14            Pass: 100%/1   | Total:  3m 14s | Avg:  3m 14s | Max:  3m 14s
  🟩 Clang15            Pass: 100%/1   | Total:  3m 36s | Avg:  3m 36s | Max:  3m 36s
  🟩 Clang16            Pass: 100%/1   | Total:  3m 13s | Avg:  3m 13s | Max:  3m 13s
  🟩 Clang17            Pass: 100%/1   | Total:  3m 16s | Avg:  3m 16s | Max:  3m 16s
  🟩 Clang18            Pass: 100%/4   | Total: 32m 27s | Avg:  8m 06s | Max: 24m 10s
  🟩 GCC9               Pass: 100%/1   | Total:  2m 49s | Avg:  2m 49s | Max:  2m 49s
  🟩 GCC10              Pass: 100%/1   | Total:  2m 59s | Avg:  2m 59s | Max:  2m 59s
  🟩 GCC11              Pass: 100%/1   | Total:  3m 12s | Avg:  3m 12s | Max:  3m 12s
  🟩 GCC12              Pass: 100%/2   | Total: 26m 58s | Avg: 13m 29s | Max: 23m 49s
  🟩 GCC13              Pass: 100%/4   | Total: 10m 06s | Avg:  2m 31s | Max:  2m 39s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  8m 44s | Avg:  8m 44s | Max:  8m 44s | Hits: 582%/156   
  🟩 MSVC14.39          Pass: 100%/1   | Total: 12m 31s | Avg: 12m 31s | Max: 12m 31s | Hits: 582%/156   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 10m 47s | Avg:  5m 23s | Max:  5m 29s
🟩 cxx_family
  🟩 Clang              Pass: 100%/13  | Total:  1h 02m | Avg:  4m 48s | Max: 24m 10s
  🟩 GCC                Pass: 100%/9   | Total: 46m 04s | Avg:  5m 07s | Max: 23m 49s
  🟩 MSVC               Pass: 100%/2   | Total: 21m 15s | Avg: 10m 37s | Max: 12m 31s | Hits: 582%/312   
  🟩 NVHPC              Pass: 100%/2   | Total: 10m 47s | Avg:  5m 23s | Max:  5m 29s
🟩 gpu
  🟩 v100               Pass: 100%/26  | Total:  2h 20m | Avg:  5m 24s | Max: 24m 10s | Hits: 582%/312   
🟩 jobs
  🟩 Build              Pass: 100%/24  | Total:  1h 32m | Avg:  3m 51s | Max: 12m 31s | Hits: 582%/312   
  🟩 Test               Pass: 100%/2   | Total: 47m 59s | Avg: 23m 59s | Max: 24m 10s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 39s | Avg:  2m 39s | Max:  2m 39s
  🟩 90a                Pass: 100%/1   | Total:  2m 30s | Avg:  2m 30s | Max:  2m 30s
🟩 std
  🟩 17                 Pass: 100%/6   | Total: 18m 58s | Avg:  3m 09s | Max:  5m 18s
  🟩 20                 Pass: 100%/20  | Total:  2h 01m | Avg:  6m 04s | Max: 24m 10s | Hits: 582%/312

🟩 cccl: Pass: 100%/6 | Total: 28m 50s | Avg: 4m 48s | Max: 5m 27s

🟩 cpu
  🟩 amd64              Pass: 100%/6   | Total: 28m 50s | Avg:  4m 48s | Max:  5m 27s
🟩 ctk
  🟩 11.1               Pass: 100%/2   | Total:  9m 00s | Avg:  4m 30s | Max:  4m 37s
  🟩 12.0               Pass: 100%/2   | Total:  9m 51s | Avg:  4m 55s | Max:  5m 27s
  🟩 12.6               Pass: 100%/2   | Total:  9m 59s | Avg:  4m 59s | Max:  5m 27s
🟩 cudacxx
  🟩 nvcc11.1           Pass: 100%/2   | Total:  9m 00s | Avg:  4m 30s | Max:  4m 37s
  🟩 nvcc12.0           Pass: 100%/2   | Total:  9m 51s | Avg:  4m 55s | Max:  5m 27s
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 59s | Avg:  4m 59s | Max:  5m 27s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/6   | Total: 28m 50s | Avg:  4m 48s | Max:  5m 27s
🟩 cxx
  🟩 Clang9             Pass: 100%/1   | Total:  4m 37s | Avg:  4m 37s | Max:  4m 37s
  🟩 Clang14            Pass: 100%/1   | Total:  5m 27s | Avg:  5m 27s | Max:  5m 27s
  🟩 Clang18            Pass: 100%/1   | Total:  5m 27s | Avg:  5m 27s | Max:  5m 27s
  🟩 GCC6               Pass: 100%/1   | Total:  4m 23s | Avg:  4m 23s | Max:  4m 23s
  🟩 GCC12              Pass: 100%/1   | Total:  4m 24s | Avg:  4m 24s | Max:  4m 24s
  🟩 GCC13              Pass: 100%/1   | Total:  4m 32s | Avg:  4m 32s | Max:  4m 32s
🟩 cxx_family
  🟩 Clang              Pass: 100%/3   | Total: 15m 31s | Avg:  5m 10s | Max:  5m 27s
  🟩 GCC                Pass: 100%/3   | Total: 13m 19s | Avg:  4m 26s | Max:  4m 32s
🟩 gpu
  🟩 v100               Pass: 100%/6   | Total: 28m 50s | Avg:  4m 48s | Max:  5m 27s
🟩 jobs
  🟩 Infra              Pass: 100%/6   | Total: 28m 50s | Avg:  4m 48s | Max:  5m 27s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 13m 21s | Avg: 6m 40s | Max: 11m 22s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max: 11m 22s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  1m 59s | Avg:  1m 59s | Max:  1m 59s
  🟩 Test               Pass: 100%/1   | Total: 11m 22s | Avg: 11m 22s | Max: 11m 22s

🟩 python: Pass: 100%/1 | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s

👃 Inspect Changes

Modifications in project?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
+/-	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
+/-	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 175)

#	Runner
125	`linux-amd64-cpu16`
25	`linux-amd64-gpu-v100-latest-1`
14	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
1	`linux-amd64-gpu-h100-latest-1`

@shwina

…e 2.8.x branch. (NVIDIA#3536) * [FEA]: Introduce Python module with CCCL headers (NVIDIA#3201) * Add cccl/python/cuda_cccl directory and use from cuda_parallel, cuda_cooperative * Run `copy_cccl_headers_to_aude_include()` before `setup()` * Create python/cuda_cccl/cuda/_include/__init__.py, then simply import cuda._include to find the include path. * Add cuda.cccl._version exactly as for cuda.cooperative and cuda.parallel * Bug fix: cuda/_include only exists after shutil.copytree() ran. * Use `f"cuda-cccl @ file://{cccl_path}/python/cuda_cccl"` in setup.py * Remove CustomBuildCommand, CustomWheelBuild in cuda_parallel/setup.py (they are equivalent to the default functions) * Replace := operator (needs Python 3.8+) * Fix oversights: remove `pip3 install ./cuda_cccl` lines from README.md * Restore original README.md: `pip3 install -e` now works on first pass. * cuda_cccl/README.md: FOR INTERNAL USE ONLY * Remove `$pymajor.$pyminor.` prefix in cuda_cccl _version.py (as suggested under NVIDIA#3201 (comment)) Command used: ci/update_version.sh 2 8 0 * Modernize pyproject.toml, setup.py Trigger for this change: * NVIDIA#3201 (comment) * NVIDIA#3201 (comment) * Install CCCL headers under cuda.cccl.include Trigger for this change: * NVIDIA#3201 (comment) Unexpected accidental discovery: cuda.cooperative unit tests pass without CCCL headers entirely. * Factor out cuda_cccl/cuda/cccl/include_paths.py * Reuse cuda_cccl/cuda/cccl/include_paths.py from cuda_cooperative * Add missing Copyright notice. * Add missing __init__.py (cuda.cccl) * Add `"cuda.cccl"` to `autodoc.mock_imports` * Move cuda.cccl.include_paths into function where it is used. (Attempt to resolve Build and Verify Docs failure.) * Add # TODO: move this to a module-level import * Modernize cuda_cooperative/pyproject.toml, setup.py * Convert cuda_cooperative to use hatchling as build backend. * Revert "Convert cuda_cooperative to use hatchling as build backend." This reverts commit 61637d6. * Move numpy from [build-system] requires -> [project] dependencies * Move pyproject.toml [project] dependencies -> setup.py install_requires, to be able to use CCCL_PATH * Remove copy_license() and use license_files=["../../LICENSE"] instead. * Further modernize cuda_cccl/setup.py to use pathlib * Trivial simplifications in cuda_cccl/pyproject.toml * Further simplify cuda_cccl/pyproject.toml, setup.py: remove inconsequential code * Make cuda_cooperative/pyproject.toml more similar to cuda_cccl/pyproject.toml * Add taplo-pre-commit to .pre-commit-config.yaml * taplo-pre-commit auto-fixes * Use pathlib in cuda_cooperative/setup.py * CCCL_PYTHON_PATH in cuda_cooperative/setup.py * Modernize cuda_parallel/pyproject.toml, setup.py * Use pathlib in cuda_parallel/setup.py * Add `# TOML lint & format` comment. * Replace MANIFEST.in with `[tool.setuptools.package-data]` section in pyproject.toml * Use pathlib in cuda/cccl/include_paths.py * pre-commit autoupdate (EXCEPT clang-format, which was manually restored) * Fixes after git merge main * Resolve warning: AttributeError: '_Reduce' object has no attribute 'build_result' ``` =========================================================================== warnings summary =========================================================================== tests/test_reduce.py::test_reduce_non_contiguous /home/coder/cccl/python/devenv/lib/python3.12/site-packages/_pytest/unraisableexception.py:85: PytestUnraisableExceptionWarning: Exception ignored in: <function _Reduce.__del__ at 0x7bf123139080> Traceback (most recent call last): File "/home/coder/cccl/python/cuda_parallel/cuda/parallel/experimental/algorithms/reduce.py", line 132, in __del__ bindings.cccl_device_reduce_cleanup(ctypes.byref(self.build_result)) ^^^^^^^^^^^^^^^^^ AttributeError: '_Reduce' object has no attribute 'build_result' warnings.warn(pytest.PytestUnraisableExceptionWarning(msg)) -- Docs: https://docs.pytest.org/en/stable/how-to/capture-warnings.html ============================================================= 1 passed, 93 deselected, 1 warning in 0.44s ============================================================== ``` * Move `copy_cccl_headers_to_cuda_cccl_include()` functionality to `class CustomBuildPy` * Introduce cuda_cooperative/constraints.txt * Also add cuda_parallel/constraints.txt * Add `--constraint constraints.txt` in ci/test_python.sh * Update Copyright dates * Switch to https://github.com/ComPWA/taplo-pre-commit (the other repo has been archived by the owner on Jul 1, 2024) For completeness: The other repo took a long time to install into the pre-commit cache; so long it lead to timeouts in the CCCL CI. * Remove unused cuda_parallel jinja2 dependency (noticed by chance). * Remove constraints.txt files, advertise running `pip install cuda-cccl` first instead. * Make cuda_cooperative, cuda_parallel testing completely independent. * Run only test_python.sh [skip-rapids][skip-matx][skip-docs][skip-vdc] * Try using another runner (because V100 runners seem to be stuck) [skip-rapids][skip-matx][skip-docs][skip-vdc] * Fix sign-compare warning (NVIDIA#3408) [skip-rapids][skip-matx][skip-docs][skip-vdc] * Revert "Try using another runner (because V100 runners seem to be stuck) [skip-rapids][skip-matx][skip-docs][skip-vdc]" This reverts commit ea33a21. Error message: NVIDIA#3201 (comment) * Try using A100 runner (because V100 runners still seem to be stuck) [skip-rapids][skip-matx][skip-docs][skip-vdc] * Also show cuda-cooperative site-packages, cuda-parallel site-packages (after pip install) [skip-rapids][skip-matx][skip-docs][skip-vdc] * Try using l4 runner (because V100 runners still seem to be stuck) [skip-rapids][skip-matx][skip-docs][skip-vdc] * Restore original ci/matrix.yaml [skip-rapids] * Use for loop in test_python.sh to avoid code duplication. * Run only test_python.sh [skip-rapids][skip-matx][skip-docs][skip-vdc][skip pre-commit.ci] * Comment out taplo-lint in pre-commit config [skip-rapids][skip-matx][skip-docs][skip-vdc] * Revert "Run only test_python.sh [skip-rapids][skip-matx][skip-docs][skip-vdc][skip pre-commit.ci]" This reverts commit ec206fd. * Implement suggestion by @shwina (NVIDIA#3201 (review)) * Address feedback by @leofang --------- Co-authored-by: Bernhard Manfred Gruber <[email protected]> * cuda.parallel: invoke pytest directly rather than via `python -m pytest` (NVIDIA#3523) Co-authored-by: Ashwin Srinath <[email protected]> * Copy file from PR NVIDIA#3547 (bugfix/drop_pipe_in_lit by @wmaxey) * Revert "cuda.parallel: invoke pytest directly rather than via `python -m pytest` (NVIDIA#3523)" This reverts commit a2e21cb. * Replace pipes.quote with shlex.quote in lit config (NVIDIA#3547) * Replace pipes.quote with shlex.quote * Drop TBB run on windows to unblock CI * Update ci/matrix.yaml Co-authored-by: Michael Schellenberger Costa <[email protected]> Co-authored-by: Bernhard Manfred Gruber <[email protected]> * Remove nvks runners from testing pool. (NVIDIA#3580) --------- Co-authored-by: Bernhard Manfred Gruber <[email protected]> Co-authored-by: Ashwin Srinath <[email protected]> Co-authored-by: Ashwin Srinath <[email protected]> Co-authored-by: Wesley Maxey <[email protected]> Co-authored-by: Michael Schellenberger Costa <[email protected]> Co-authored-by: Allison Piper <[email protected]>

rwgk and others added 2 commits January 27, 2025 10:13

cuda.parallel: invoke pytest directly rather than via `python -m pyte…

a2e21cb

…st` (NVIDIA#3523) Co-authored-by: Ashwin Srinath <[email protected]>

rwgk requested review from a team as code owners January 27, 2025 18:26

rwgk requested review from jrhemstad and ericniebler January 27, 2025 18:26

rwgk requested a review from shwina January 27, 2025 21:46

rwgk added 2 commits January 27, 2025 23:26

Copy file from PR NVIDIA#3547 (bugfix/drop_pipe_in_lit by @wmaxey)

36b3fb6

Merge branch 'branch/2.8.x' into backport_pr3201_to_2.8.x

d9b796c

rwgk requested a review from a team as a code owner January 28, 2025 07:27

rwgk mentioned this pull request Jan 28, 2025

Replace pipes.quote with shlex.quote in lit config #3547

Merged

2 tasks

miscco approved these changes Jan 28, 2025

View reviewed changes

rwgk and others added 2 commits January 28, 2025 09:43

Revert "cuda.parallel: invoke pytest directly rather than via `python…

10660b4

… -m pytest` (NVIDIA#3523)" This reverts commit a2e21cb.

rwgk changed the title ~~Backport PRs #3201 and #3523 to the 2.8.x branch.~~ Backport PRs #3201, #3523, #3547 to the 2.8.x branch. Jan 28, 2025

bernhardmgruber approved these changes Jan 28, 2025

View reviewed changes

NaderAlAwar approved these changes Jan 28, 2025

View reviewed changes

wmaxey enabled auto-merge (squash) January 28, 2025 19:26

miscco approved these changes Jan 28, 2025

View reviewed changes

Remove nvks runners from testing pool. (NVIDIA#3580)

1ff4b51

miscco mentioned this pull request Jan 29, 2025

[BACKPORT]: Remove nvks runners from testing pool. (#3580) #3581

Closed

rwgk changed the title ~~Backport PRs #3201, #3523, #3547 to the 2.8.x branch.~~ Backport PRs #3201, #3523, #3547, #3580 to the 2.8.x branch. Jan 29, 2025

miscco approved these changes Jan 29, 2025

View reviewed changes

jrhemstad disabled auto-merge January 29, 2025 21:50

rwgk merged commit 450b6a8 into NVIDIA:branch/2.8.x Jan 29, 2025
229 checks passed

rwgk deleted the backport_pr3201_to_2.8.x branch January 29, 2025 23:50

bernhardmgruber mentioned this pull request Jan 31, 2025

Backport to 2.8: cuda.parallel: invoke pytest directly rather than via python -m pytest (#3523) #3532

Closed

Backport PRs #3201, #3523, #3547, #3580 to the 2.8.x branch. #3536

Backport PRs #3201, #3523, #3547, #3580 to the 2.8.x branch. #3536

Conversation

rwgk commented Jan 27, 2025 • edited Loading

Description

rwgk commented Jan 27, 2025

github-actions bot commented Jan 27, 2025

🟨 libcudacxx: Pass: 91%/48 | Total: 11h 56m | Avg: 14m 55s | Max: 26m 56s

🟨 thrust: Pass: 97%/46 | Total: 7h 00m | Avg: 9m 08s | Max: 33m 52s | Hits: 366%/7408

🟩 cub: Pass: 100%/47 | Total: 8h 44m | Avg: 11m 09s | Max: 56m 05s | Hits: 599%/3132

🟩 cudax: Pass: 100%/26 | Total: 2h 07m | Avg: 4m 53s | Max: 17m 24s | Hits: 582%/312

🟩 cccl: Pass: 100%/6 | Total: 25m 39s | Avg: 4m 16s | Max: 5m 14s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 9m 22s | Avg: 4m 41s | Max: 7m 23s

🟩 python: Pass: 100%/1 | Total: 46m 14s | Avg: 46m 14s | Max: 46m 14s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 176)

github-actions bot commented Jan 28, 2025

🟨 thrust: Pass: 95%/46 | Total: 10h 32m | Avg: 13m 44s | Max: 58m 20s | Hits: 366%/7408

🟩 libcudacxx: Pass: 100%/48 | Total: 16h 26m | Avg: 20m 32s | Max: 57m 11s | Hits: 624%/9880

🟩 cub: Pass: 100%/47 | Total: 11h 48m | Avg: 15m 04s | Max: 1h 04m | Hits: 599%/3132

🟩 cudax: Pass: 100%/26 | Total: 2h 55m | Avg: 6m 44s | Max: 21m 11s | Hits: 582%/312

🟩 cccl: Pass: 100%/6 | Total: 28m 48s | Avg: 4m 48s | Max: 5m 20s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 9m 46s | Avg: 4m 53s | Max: 7m 25s

🟩 python: Pass: 100%/1 | Total: 44m 58s | Avg: 44m 58s | Max: 44m 58s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 176)

rwgk commented Jan 28, 2025

bernhardmgruber commented Jan 28, 2025

rwgk commented Jan 28, 2025

wmaxey commented Jan 28, 2025 • edited Loading

rwgk commented Jan 28, 2025

github-actions bot commented Jan 29, 2025

🟨 cub: Pass: 97%/47 | Total: 8h 50m | Avg: 11m 17s | Max: 56m 27s | Hits: 599%/3132

🟩 libcudacxx: Pass: 100%/48 | Total: 10h 10m | Avg: 12m 43s | Max: 34m 12s | Hits: 668%/9880

🟩 thrust: Pass: 100%/45 | Total: 6h 55m | Avg: 9m 14s | Max: 37m 04s | Hits: 366%/7408

🟩 cudax: Pass: 100%/26 | Total: 2h 20m | Avg: 5m 24s | Max: 24m 10s | Hits: 582%/312

🟩 cccl: Pass: 100%/6 | Total: 28m 50s | Avg: 4m 48s | Max: 5m 27s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 13m 21s | Avg: 6m 40s | Max: 11m 22s

🟩 python: Pass: 100%/1 | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 175)

github-actions bot commented Jan 29, 2025

🟩 libcudacxx: Pass: 100%/48 | Total: 10h 10m | Avg: 12m 43s | Max: 34m 12s | Hits: 668%/9880

🟩 cub: Pass: 100%/47 | Total: 9h 06m | Avg: 11m 37s | Max: 56m 27s | Hits: 599%/3132

🟩 thrust: Pass: 100%/45 | Total: 6h 55m | Avg: 9m 14s | Max: 37m 04s | Hits: 366%/7408

🟩 cudax: Pass: 100%/26 | Total: 2h 20m | Avg: 5m 24s | Max: 24m 10s | Hits: 582%/312

🟩 cccl: Pass: 100%/6 | Total: 28m 50s | Avg: 4m 48s | Max: 5m 27s

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 13m 21s | Avg: 6m 40s | Max: 11m 22s

🟩 python: Pass: 100%/1 | Total: 44m 46s | Avg: 44m 46s | Max: 44m 46s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 175)

rwgk commented Jan 27, 2025 •

edited

Loading

wmaxey commented Jan 28, 2025 •

edited

Loading