Optimize `bit_floor`, `bit_ceil`, `bit_width` #3296

fbusato · 2025-01-09T00:12:06Z

Fixes #2239

Description

Optimize bit_floor, bit_ceil, bit_width

Features:

Added nodiscard, noexcept
Add concept-like macro
Check for overflow in bit_ceil
Add assumptions on the return values
Optimize all functions with bfind and relying on the shift behavior when the amount is larger than the number of bits (CUDA)
Document performance considerations

Requires: #3414

libcudacxx/include/cuda/std/__bit/integral.h

libcudacxx/include/cuda/std/__type_traits/is_unsigned_integer.h

libcudacxx/include/cuda/std/__bit/integral.h

Co-authored-by: Michael Schellenberger Costa <[email protected]>

libcudacxx/include/cuda/std/__bit/integral.h

Co-authored-by: Wesley Maxey <[email protected]>

github-actions · 2025-02-21T21:44:57Z

🟨 CI finished in 1h 14m: Pass: 43%/158 | Total: 2d 04h | Avg: 20m 03s | Max: 1h 11m | Hits: 61%/87192

🟨 cub: Pass: 6%/45 | Total: 20h 12m | Avg: 26m 56s | Max: 1h 11m | Hits: 12%/3120

🟨 cxx
  🟥 Clang14            Pass:   0%/4   | Total:  2h 08m | Avg: 32m 10s | Max: 33m 41s
  🟥 Clang15            Pass:   0%/2   | Total:  1h 00m | Avg: 30m 05s | Max: 30m 18s
  🟥 Clang16            Pass:   0%/2   | Total:  1h 01m | Avg: 30m 43s | Max: 31m 03s
  🟥 Clang17            Pass:   0%/2   | Total:  1h 03m | Avg: 31m 32s | Max: 32m 46s
  🟥 Clang18            Pass:   0%/7   | Total:  1h 49m | Avg: 15m 36s | Max: 40m 46s
  🟥 GCC7               Pass:   0%/2   | Total:  1h 01m | Avg: 30m 51s | Max: 31m 51s
  🟥 GCC8               Pass:   0%/1   | Total: 31m 43s | Avg: 31m 43s | Max: 31m 43s
  🟥 GCC9               Pass:   0%/2   | Total:  1h 04m | Avg: 32m 14s | Max: 32m 57s
  🟥 GCC10              Pass:   0%/2   | Total: 59m 53s | Avg: 29m 56s | Max: 30m 06s
  🟥 GCC11              Pass:   0%/2   | Total:  1h 00m | Avg: 30m 12s | Max: 30m 16s
  🟥 GCC12              Pass:   0%/2   | Total:  1h 00m | Avg: 30m 11s | Max: 30m 37s
  🟥 GCC13              Pass:   0%/11  | Total:  2h 39m | Avg: 14m 27s | Max: 44m 49s
  🟩 MSVC14.29          Pass: 100%/2   | Total:  2h 14m | Avg:  1h 07m | Max:  1h 11m | Hits:  12%/2080  
  🟨 MSVC14.42          Pass:  50%/2   | Total:  1h 31m | Avg: 45m 44s | Max:  1h 09m | Hits:  12%/1040  
  🟥 NVHPC24.7          Pass:   0%/2   | Total:  1h 06m | Avg: 33m 23s | Max: 34m 22s
🟨 cpu
  🟨 amd64              Pass:   6%/43  | Total: 18h 51m | Avg: 26m 18s | Max:  1h 11m | Hits:  12%/3120  
  🟥 arm64              Pass:   0%/2   | Total:  1h 21m | Avg: 40m 32s | Max: 40m 46s
🟨 ctk
  🟨 12.0               Pass:  20%/5   | Total:  3h 13m | Avg: 38m 40s | Max:  1h 02m | Hits:  12%/1040  
  🟥 12.5               Pass:   0%/2   | Total:  1h 06m | Avg: 33m 23s | Max: 34m 22s
  🟨 12.8               Pass:   5%/38  | Total: 15h 52m | Avg: 25m 03s | Max:  1h 11m | Hits:  12%/2080  
🟨 cudacxx
  🟥 ClangCUDA18        Pass:   0%/2   | Total:  4m 46s | Avg:  2m 23s | Max:  2m 26s
  🟨 nvcc12.0           Pass:  20%/5   | Total:  3h 13m | Avg: 38m 40s | Max:  1h 02m | Hits:  12%/1040  
  🟥 nvcc12.5           Pass:   0%/2   | Total:  1h 06m | Avg: 33m 23s | Max: 34m 22s
  🟨 nvcc12.8           Pass:   5%/36  | Total: 15h 47m | Avg: 26m 19s | Max:  1h 11m | Hits:  12%/2080  
🟨 cudacxx_family
  🟥 ClangCUDA          Pass:   0%/2   | Total:  4m 46s | Avg:  2m 23s | Max:  2m 26s
  🟨 nvcc               Pass:   6%/43  | Total: 20h 07m | Avg: 28m 05s | Max:  1h 11m | Hits:  12%/3120  
🟨 cxx_family
  🟥 Clang              Pass:   0%/17  | Total:  7h 02m | Avg: 24m 51s | Max: 40m 46s
  🟥 GCC                Pass:   0%/22  | Total:  8h 17m | Avg: 22m 37s | Max: 44m 49s
  🟨 MSVC               Pass:  75%/4   | Total:  3h 45m | Avg: 56m 22s | Max:  1h 11m | Hits:  12%/3120  
  🟥 NVHPC              Pass:   0%/2   | Total:  1h 06m | Avg: 33m 23s | Max: 34m 22s
🟨 gpu
  🟥 h100               Pass:   0%/3   | Total: 12m 21s | Avg:  4m 07s | Max: 12m 21s
  🟨 rtx2080            Pass:   8%/34  | Total: 18h 58m | Avg: 33m 29s | Max:  1h 11m | Hits:  12%/3120  
  🟥 rtxa6000           Pass:   0%/8   | Total:  1h 01m | Avg:  7m 40s | Max: 31m 15s
🟨 jobs
  🟨 Build              Pass:   8%/37  | Total: 20h 12m | Avg: 32m 46s | Max:  1h 11m | Hits:  12%/3120  
  🟥 DeviceLaunch       Pass:   0%/1  
  🟥 GraphCapture       Pass:   0%/1  
  🟥 HostLaunch         Pass:   0%/3  
  🟥 TestGPU            Pass:   0%/3  
🟥 sm
  🟥 90                 Pass:   0%/3   | Total: 12m 21s | Avg:  4m 07s | Max: 12m 21s
  🟥 90;90a;100         Pass:   0%/1   | Total: 44m 49s | Avg: 44m 49s | Max: 44m 49s
🟨 std
  🟨 17                 Pass:  15%/20  | Total: 11h 50m | Avg: 35m 31s | Max:  1h 11m | Hits:  12%/3120  
  🟥 20                 Pass:   0%/25  | Total:  8h 22m | Avg: 20m 05s | Max: 44m 49s

🟨 libcudacxx: Pass: 2%/43 | Total: 7h 41m | Avg: 10m 43s | Max: 28m 30s

🟨 jobs
  🟥 Build              Pass:   0%/37  | Total:  7h 01m | Avg: 11m 23s | Max: 28m 30s
  🟥 NVRTC              Pass:   0%/2   | Total: 37m 25s | Avg: 18m 42s | Max: 21m 16s
  🟥 Test               Pass:   0%/3  
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 14s | Avg:  2m 14s | Max:  2m 14s
🟨 cpu
  🟨 amd64              Pass:   2%/41  | Total:  7h 13m | Avg: 10m 33s | Max: 28m 30s
  🟥 arm64              Pass:   0%/2   | Total: 28m 05s | Avg: 14m 02s | Max: 21m 53s
🟨 ctk
  🟥 12.0               Pass:   0%/5   | Total: 59m 10s | Avg: 11m 50s | Max: 23m 08s
  🟥 12.5               Pass:   0%/2   | Total: 25m 43s | Avg: 12m 51s | Max: 13m 40s
  🟨 12.8               Pass:   2%/36  | Total:  6h 16m | Avg: 10m 27s | Max: 28m 30s
🟨 cudacxx
  🟥 ClangCUDA18        Pass:   0%/2   | Total:  4m 45s | Avg:  2m 22s | Max:  2m 27s
  🟥 nvcc12.0           Pass:   0%/5   | Total: 59m 10s | Avg: 11m 50s | Max: 23m 08s
  🟥 nvcc12.5           Pass:   0%/2   | Total: 25m 43s | Avg: 12m 51s | Max: 13m 40s
  🟨 nvcc12.8           Pass:   2%/34  | Total:  6h 11m | Avg: 10m 55s | Max: 28m 30s
🟨 cudacxx_family
  🟥 ClangCUDA          Pass:   0%/2   | Total:  4m 45s | Avg:  2m 22s | Max:  2m 27s
  🟨 nvcc               Pass:   2%/41  | Total:  7h 36m | Avg: 11m 08s | Max: 28m 30s
🟨 cxx
  🟥 Clang14            Pass:   0%/4   | Total: 39m 13s | Avg:  9m 48s | Max: 18m 24s
  🟥 Clang15            Pass:   0%/2   | Total: 29m 04s | Avg: 14m 32s | Max: 22m 05s
  🟥 Clang16            Pass:   0%/2   | Total: 33m 05s | Avg: 16m 32s | Max: 26m 07s
  🟥 Clang17            Pass:   0%/2   | Total: 14m 31s | Avg:  7m 15s | Max:  7m 40s
  🟥 Clang18            Pass:   0%/6   | Total: 41m 36s | Avg:  6m 56s | Max: 21m 53s
  🟥 GCC7               Pass:   0%/2   | Total: 11m 43s | Avg:  5m 51s | Max:  6m 24s
  🟥 GCC8               Pass:   0%/1   | Total:  6m 06s | Avg:  6m 06s | Max:  6m 06s
  🟥 GCC9               Pass:   0%/2   | Total: 27m 11s | Avg: 13m 35s | Max: 21m 03s
  🟥 GCC10              Pass:   0%/2   | Total: 26m 56s | Avg: 13m 28s | Max: 20m 10s
  🟥 GCC11              Pass:   0%/2   | Total: 13m 20s | Avg:  6m 40s | Max:  6m 51s
  🟥 GCC12              Pass:   0%/2   | Total: 14m 10s | Avg:  7m 05s | Max:  7m 43s
  🟨 GCC13              Pass:  10%/10  | Total:  1h 28m | Avg:  8m 50s | Max: 21m 16s
  🟥 MSVC14.29          Pass:   0%/2   | Total: 49m 37s | Avg: 24m 48s | Max: 26m 29s
  🟥 MSVC14.42          Pass:   0%/2   | Total: 40m 32s | Avg: 20m 16s | Max: 28m 30s
  🟥 NVHPC24.7          Pass:   0%/2   | Total: 25m 43s | Avg: 12m 51s | Max: 13m 40s
🟨 cxx_family
  🟥 Clang              Pass:   0%/16  | Total:  2h 37m | Avg:  9m 50s | Max: 26m 07s
  🟨 GCC                Pass:   4%/21  | Total:  3h 07m | Avg:  8m 56s | Max: 21m 16s
  🟥 MSVC               Pass:   0%/4   | Total:  1h 30m | Avg: 22m 32s | Max: 28m 30s
  🟥 NVHPC              Pass:   0%/2   | Total: 25m 43s | Avg: 12m 51s | Max: 13m 40s
🟨 gpu
  🟥 h100               Pass:   0%/2   | Total:  5m 44s | Avg:  2m 52s | Max:  5m 44s
  🟨 rtx2080            Pass:   2%/41  | Total:  7h 35m | Avg: 11m 06s | Max: 28m 30s
🟥 sm
  🟥 75                 Pass:   0%/2   | Total: 37m 25s | Avg: 18m 42s | Max: 21m 16s
  🟥 90                 Pass:   0%/2   | Total:  5m 44s | Avg:  2m 52s | Max:  5m 44s
  🟥 90;90a;100         Pass:   0%/1   | Total:  8m 18s | Avg:  8m 18s | Max:  8m 18s
🟥 std
  🟥 17                 Pass:   0%/21  | Total:  4h 42m | Avg: 13m 27s | Max: 28m 30s
  🟥 20                 Pass:   0%/21  | Total:  2h 56m | Avg:  8m 24s | Max: 26m 07s

🟨 thrust: Pass: 91%/45 | Total: 21h 48m | Avg: 29m 04s | Max: 1h 04m | Hits: 57%/73024

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  90%/43  | Total: 20h 49m | Avg: 29m 03s | Max:  1h 04m | Hits:  58%/69461 
  🟩 arm64              Pass: 100%/2   | Total: 59m 24s | Avg: 29m 42s | Max: 31m 26s | Hits:  49%/3563  
🔍 ctk: 12.8 🔍
  🟩 12.0               Pass: 100%/5   | Total:  2h 55m | Avg: 35m 06s | Max: 56m 45s | Hits:  50%/8901  
  🟩 12.5               Pass: 100%/2   | Total:  2h 03m | Avg:  1h 01m | Max:  1h 04m | Hits:  31%/3562  
  🔍 12.8               Pass:  89%/38  | Total: 16h 50m | Avg: 26m 34s | Max: 58m 02s | Hits:  60%/60561 
🟨 cudacxx
  🟥 ClangCUDA18        Pass:   0%/2   | Total:  4m 43s | Avg:  2m 21s | Max:  2m 23s
  🟩 nvcc12.0           Pass: 100%/5   | Total:  2h 55m | Avg: 35m 06s | Max: 56m 45s | Hits:  50%/8901  
  🟩 nvcc12.5           Pass: 100%/2   | Total:  2h 03m | Avg:  1h 01m | Max:  1h 04m | Hits:  31%/3562  
  🟨 nvcc12.8           Pass:  94%/36  | Total: 16h 45m | Avg: 27m 55s | Max: 58m 02s | Hits:  60%/60561 
🟨 cxx
  🟩 Clang14            Pass: 100%/4   | Total:  1h 58m | Avg: 29m 32s | Max: 29m 46s | Hits:  59%/7124  
  🟩 Clang15            Pass: 100%/2   | Total:  1h 06m | Avg: 33m 13s | Max: 34m 31s | Hits:  49%/3562  
  🟩 Clang16            Pass: 100%/2   | Total:  1h 09m | Avg: 34m 37s | Max: 34m 51s | Hits:  49%/3562  
  🟩 Clang17            Pass: 100%/2   | Total:  1h 02m | Avg: 31m 24s | Max: 33m 01s | Hits:  49%/3562  
  🟨 Clang18            Pass:  71%/7   | Total:  1h 51m | Avg: 15m 58s | Max: 31m 57s | Hits:  69%/8905  
  🟩 GCC7               Pass: 100%/2   | Total: 59m 27s | Avg: 29m 43s | Max: 30m 07s | Hits:  61%/3564  
  🟩 GCC8               Pass: 100%/1   | Total: 29m 15s | Avg: 29m 15s | Max: 29m 15s | Hits:  49%/1782  
  🟩 GCC9               Pass: 100%/2   | Total:  1h 01m | Avg: 30m 36s | Max: 30m 41s | Hits:  56%/3564  
  🟩 GCC10              Pass: 100%/2   | Total:  1h 03m | Avg: 31m 32s | Max: 33m 10s | Hits:  49%/3564  
  🟩 GCC11              Pass: 100%/2   | Total:  1h 03m | Avg: 31m 47s | Max: 32m 31s | Hits:  49%/3564  
  🟩 GCC12              Pass: 100%/2   | Total:  1h 05m | Avg: 32m 30s | Max: 32m 35s | Hits:  49%/3564  
  🟩 GCC13              Pass: 100%/10  | Total:  3h 30m | Avg: 21m 04s | Max: 31m 48s | Hits:  74%/17820 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 53m | Avg: 56m 31s | Max: 56m 45s | Hits:  35%/3550  
  🟨 MSVC14.42          Pass:  33%/3   | Total:  1h 31m | Avg: 30m 37s | Max: 58m 02s | Hits:  22%/1775  
  🟩 NVHPC24.7          Pass: 100%/2   | Total:  2h 03m | Avg:  1h 01m | Max:  1h 04m | Hits:  31%/3562  
🟨 cxx_family
  🟨 Clang              Pass:  88%/17  | Total:  7h 08m | Avg: 25m 12s | Max: 34m 51s | Hits:  58%/26715 
  🟩 GCC                Pass: 100%/21  | Total:  9h 12m | Avg: 26m 17s | Max: 33m 10s | Hits:  63%/37422 
  🟨 MSVC               Pass:  60%/5   | Total:  3h 24m | Avg: 40m 59s | Max: 58m 02s | Hits:  30%/5325  
  🟩 NVHPC              Pass: 100%/2   | Total:  2h 03m | Avg:  1h 01m | Max:  1h 04m | Hits:  31%/3562  
🟨 gpu
  🟩 h100               Pass: 100%/2   | Total: 32m 08s | Avg: 16m 04s | Max: 20m 14s | Hits:  74%/3564  
  🟨 rtx2080            Pass:  93%/33  | Total: 18h 27m | Avg: 33m 33s | Max:  1h 04m | Hits:  49%/55207 
  🟨 rtx4090            Pass:  80%/10  | Total:  2h 49m | Avg: 16m 55s | Max: 33m 51s | Hits:  84%/14253 
🟨 jobs
  🟨 Build              Pass:  92%/38  | Total: 20h 49m | Avg: 32m 52s | Max:  1h 04m | Hits:  50%/62334 
  🟨 TestCPU            Pass:  66%/3   | Total: 14m 47s | Avg:  4m 55s | Max:  7m 40s | Hits:  99%/3563  
  🟩 TestGPU            Pass: 100%/4   | Total: 44m 46s | Avg: 11m 11s | Max: 11m 54s | Hits:  99%/7127  
🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 37m 35s | Avg: 18m 47s | Max: 26m 24s | Hits:  74%/3564  
🟨 cudacxx_family
  🟥 ClangCUDA          Pass:   0%/2   | Total:  4m 43s | Avg:  2m 21s | Max:  2m 23s
  🟨 nvcc               Pass:  95%/43  | Total: 21h 43m | Avg: 30m 19s | Max:  1h 04m | Hits:  57%/73024 
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 32m 08s | Avg: 16m 04s | Max: 20m 14s | Hits:  74%/3564  
  🟩 90;90a;100         Pass: 100%/1   | Total: 29m 12s | Avg: 29m 12s | Max: 29m 12s | Hits:  76%/1782  
🟨 std
  🟨 17                 Pass:  95%/20  | Total: 11h 35m | Avg: 34m 45s | Max: 58m 15s | Hits:  48%/33830 
  🟨 20                 Pass:  86%/23  | Total:  9h 35m | Avg: 25m 02s | Max:  1h 04m | Hits:  64%/35630

🟨 cudax: Pass: 90%/22 | Total: 2h 10m | Avg: 5m 55s | Max: 13m 43s | Hits: 98%/10740

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  88%/18  | Total:  1h 55m | Avg:  6m 24s | Max: 13m 43s | Hits:  98%/8512  
  🟩 arm64              Pass: 100%/4   | Total: 15m 02s | Avg:  3m 45s | Max:  3m 58s | Hits:  98%/2228  
🚨 cxx_family: MSVC 🚨
  🟩 Clang              Pass: 100%/8   | Total: 40m 39s | Avg:  5m 04s | Max: 12m 51s | Hits:  98%/4458  
  🟩 GCC                Pass: 100%/10  | Total: 56m 48s | Avg:  5m 40s | Max: 13m 43s | Hits:  98%/5572  
  🔥 MSVC               Pass:   0%/2   | Total: 20m 11s | Avg: 10m 05s | Max: 10m 08s
  🟩 NVHPC              Pass: 100%/2   | Total: 12m 46s | Avg:  6m 23s | Max:  6m 27s | Hits:  95%/710   
🔍 gpu: rtx2080 🔍
  🟩 h100               Pass: 100%/2   | Total: 17m 33s | Avg:  8m 46s | Max: 13m 43s | Hits:  98%/1114  
  🔍 rtx2080            Pass:  90%/20  | Total:  1h 52m | Avg:  5m 38s | Max: 12m 51s | Hits:  98%/9626  
🔍 jobs: Build 🔍
  🔍 Build              Pass:  89%/19  | Total:  1h 31m | Avg:  4m 48s | Max: 10m 08s | Hits:  98%/9069  
  🟩 Test               Pass: 100%/3   | Total: 38m 54s | Avg: 12m 58s | Max: 13m 43s | Hits:  99%/1671  
🔍 std: 20 🔍
  🟩 17                 Pass: 100%/4   | Total: 17m 03s | Avg:  4m 15s | Max:  6m 19s | Hits:  97%/2026  
  🔍 20                 Pass:  88%/18  | Total:  1h 53m | Avg:  6m 17s | Max: 13m 43s | Hits:  98%/8714  
🟨 ctk
  🟥 12.0               Pass:   0%/1   | Total: 10m 03s | Avg: 10m 03s | Max: 10m 03s
  🟩 12.5               Pass: 100%/2   | Total: 12m 46s | Avg:  6m 23s | Max:  6m 27s | Hits:  95%/710   
  🟨 12.8               Pass:  94%/19  | Total:  1h 47m | Avg:  5m 39s | Max: 13m 43s | Hits:  98%/10030 
🟨 cudacxx
  🟥 nvcc12.0           Pass:   0%/1   | Total: 10m 03s | Avg: 10m 03s | Max: 10m 03s
  🟩 nvcc12.5           Pass: 100%/2   | Total: 12m 46s | Avg:  6m 23s | Max:  6m 27s | Hits:  95%/710   
  🟨 nvcc12.8           Pass:  94%/19  | Total:  1h 47m | Avg:  5m 39s | Max: 13m 43s | Hits:  98%/10030 
🟨 cxx
  🟩 Clang14            Pass: 100%/1   | Total:  3m 58s | Avg:  3m 58s | Max:  3m 58s | Hits:  98%/559   
  🟩 Clang15            Pass: 100%/1   | Total:  3m 58s | Avg:  3m 58s | Max:  3m 58s | Hits:  98%/557   
  🟩 Clang16            Pass: 100%/1   | Total:  4m 15s | Avg:  4m 15s | Max:  4m 15s | Hits:  98%/557   
  🟩 Clang17            Pass: 100%/1   | Total:  4m 16s | Avg:  4m 16s | Max:  4m 16s | Hits:  98%/557   
  🟩 Clang18            Pass: 100%/4   | Total: 24m 12s | Avg:  6m 03s | Max: 12m 51s | Hits:  98%/2228  
  🟩 GCC10              Pass: 100%/1   | Total:  4m 05s | Avg:  4m 05s | Max:  4m 05s | Hits:  98%/559   
  🟩 GCC11              Pass: 100%/1   | Total:  4m 01s | Avg:  4m 01s | Max:  4m 01s | Hits:  98%/557   
  🟩 GCC12              Pass: 100%/2   | Total: 16m 42s | Avg:  8m 21s | Max: 12m 20s | Hits:  98%/1114  
  🟩 GCC13              Pass: 100%/6   | Total: 32m 00s | Avg:  5m 20s | Max: 13m 43s | Hits:  98%/3342  
  🟥 MSVC14.39          Pass:   0%/1   | Total: 10m 03s | Avg: 10m 03s | Max: 10m 03s
  🟥 MSVC14.42          Pass:   0%/1   | Total: 10m 08s | Avg: 10m 08s | Max: 10m 08s
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 12m 46s | Avg:  6m 23s | Max:  6m 27s | Hits:  95%/710   
🟨 cudacxx_family
  🟨 nvcc               Pass:  90%/22  | Total:  2h 10m | Avg:  5m 55s | Max: 13m 43s | Hits:  98%/10740 
🟩 sm
  🟩 90                 Pass: 100%/3   | Total: 20m 49s | Avg:  6m 56s | Max: 13m 43s | Hits:  98%/1671  
  🟩 90a                Pass: 100%/1   | Total:  3m 27s | Avg:  3m 27s | Max:  3m 27s | Hits:  98%/557

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 15m 24s | Avg: 7m 42s | Max: 12m 48s | Hits: 97%/308

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 48s | Hits:  97%/308   
🟩 ctk
  🟩 12.8               Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 48s | Hits:  97%/308   
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 48s | Hits:  97%/308   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 48s | Hits:  97%/308   
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 48s | Hits:  97%/308   
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 48s | Hits:  97%/308   
🟩 gpu
  🟩 rtx2080            Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 48s | Hits:  97%/308   
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 36s | Avg:  2m 36s | Max:  2m 36s | Hits:  96%/154   
  🟩 Test               Pass: 100%/1   | Total: 12m 48s | Avg: 12m 48s | Max: 12m 48s | Hits:  98%/154

🟩 python: Pass: 100%/1 | Total: 39m 59s | Avg: 39m 59s | Max: 39m 59s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 39m 59s | Avg: 39m 59s | Max: 39m 59s
🟩 ctk
  🟩 12.8               Pass: 100%/1   | Total: 39m 59s | Avg: 39m 59s | Max: 39m 59s
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/1   | Total: 39m 59s | Avg: 39m 59s | Max: 39m 59s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 39m 59s | Avg: 39m 59s | Max: 39m 59s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 39m 59s | Avg: 39m 59s | Max: 39m 59s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 39m 59s | Avg: 39m 59s | Max: 39m 59s
🟩 gpu
  🟩 rtx2080            Pass: 100%/1   | Total: 39m 59s | Avg: 39m 59s | Max: 39m 59s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 39m 59s | Avg: 39m 59s | Max: 39m 59s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 158)

#	Runner
111	`linux-amd64-cpu16`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
8	`linux-amd64-gpu-rtx2080-latest-1`
6	`linux-amd64-gpu-rtxa6000-latest-1`
5	`linux-amd64-gpu-h100-latest-1`
3	`linux-amd64-gpu-rtx4090-latest-1`

github-actions · 2025-02-22T00:38:33Z

🟨 CI finished in 1h 36m: Pass: 97%/158 | Total: 3d 03h | Avg: 28m 31s | Max: 1h 26m | Hits: 70%/237980

🟨 libcudacxx: Pass: 90%/43 | Total: 9h 33m | Avg: 13m 19s | Max: 34m 06s | Hits: 75%/92787

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  90%/41  | Total:  9h 21m | Avg: 13m 41s | Max: 34m 06s | Hits:  74%/87130 
  🟩 arm64              Pass: 100%/2   | Total: 12m 07s | Avg:  6m 03s | Max:  6m 08s | Hits:  92%/5657  
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total: 43m 33s | Avg: 21m 46s | Max: 22m 58s | Hits:  26%/5620  
  🔍 nvcc               Pass:  90%/41  | Total:  8h 49m | Avg: 12m 55s | Max: 34m 06s | Hits:  78%/87167 
🚨 cxx_family: MSVC 🚨
  🟩 Clang              Pass: 100%/16  | Total:  2h 58m | Avg: 11m 07s | Max: 22m 58s | Hits:  75%/42110 
  🟩 GCC                Pass: 100%/21  | Total:  3h 36m | Avg: 10m 18s | Max: 23m 04s | Hits:  81%/45075 
  🔥 MSVC               Pass:   0%/4   | Total:  1h 53m | Avg: 28m 17s | Max: 30m 51s
  🟩 NVHPC              Pass: 100%/2   | Total:  1h 05m | Avg: 32m 52s | Max: 34m 06s | Hits:  32%/5602  
🔍 gpu: rtx2080 🔍
  🟩 h100               Pass: 100%/2   | Total: 18m 45s | Avg:  9m 22s | Max: 13m 22s | Hits:  92%/2918  
  🔍 rtx2080            Pass:  90%/41  | Total:  9h 14m | Avg: 13m 31s | Max: 34m 06s | Hits:  74%/89869 
🔍 jobs: Build 🔍
  🔍 Build              Pass:  89%/37  | Total:  8h 21m | Avg: 13m 33s | Max: 34m 06s | Hits:  75%/92747 
  🟩 NVRTC              Pass: 100%/2   | Total: 31m 59s | Avg: 15m 59s | Max: 16m 24s | Hits:  90%/40    
  🟩 Test               Pass: 100%/3   | Total: 37m 38s | Avg: 12m 32s | Max: 15m 24s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 04s | Avg:  2m 04s | Max:  2m 04s
🟨 ctk
  🟨 12.0               Pass:  80%/5   | Total:  1h 05m | Avg: 13m 02s | Max: 25m 24s | Hits:  76%/11141 
  🟩 12.5               Pass: 100%/2   | Total:  1h 05m | Avg: 32m 52s | Max: 34m 06s | Hits:  32%/5602  
  🟨 12.8               Pass:  91%/36  | Total:  7h 22m | Avg: 12m 17s | Max: 30m 51s | Hits:  78%/76044 
🟨 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 43m 33s | Avg: 21m 46s | Max: 22m 58s | Hits:  26%/5620  
  🟨 nvcc12.0           Pass:  80%/5   | Total:  1h 05m | Avg: 13m 02s | Max: 25m 24s | Hits:  76%/11141 
  🟩 nvcc12.5           Pass: 100%/2   | Total:  1h 05m | Avg: 32m 52s | Max: 34m 06s | Hits:  32%/5602  
  🟨 nvcc12.8           Pass:  91%/34  | Total:  6h 38m | Avg: 11m 43s | Max: 30m 51s | Hits:  82%/70424 
🟨 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 43m 39s | Avg: 10m 54s | Max: 22m 39s | Hits:  77%/11206 
  🟩 Clang15            Pass: 100%/2   | Total: 15m 02s | Avg:  7m 31s | Max:  7m 46s | Hits:  91%/5614  
  🟩 Clang16            Pass: 100%/2   | Total: 14m 45s | Avg:  7m 22s | Max:  7m 54s | Hits:  91%/5614  
  🟩 Clang17            Pass: 100%/2   | Total: 30m 59s | Avg: 15m 29s | Max: 22m 50s | Hits:  63%/5614  
  🟩 Clang18            Pass: 100%/6   | Total:  1h 13m | Avg: 12m 16s | Max: 22m 58s | Hits:  66%/14062 
  🟩 GCC7               Pass: 100%/2   | Total: 40m 20s | Avg: 20m 10s | Max: 20m 46s | Hits:  34%/5552  
  🟩 GCC8               Pass: 100%/1   | Total: 23m 04s | Avg: 23m 04s | Max: 23m 04s | Hits:  34%/2786  
  🟩 GCC9               Pass: 100%/2   | Total: 13m 33s | Avg:  6m 46s | Max:  6m 57s | Hits:  91%/5564  
  🟩 GCC10              Pass: 100%/2   | Total: 13m 58s | Avg:  6m 59s | Max:  7m 31s | Hits:  91%/5620  
  🟩 GCC11              Pass: 100%/2   | Total: 14m 23s | Avg:  7m 11s | Max:  7m 19s | Hits:  90%/5616  
  🟩 GCC12              Pass: 100%/2   | Total: 14m 56s | Avg:  7m 28s | Max:  7m 54s | Hits:  92%/5616  
  🟩 GCC13              Pass: 100%/10  | Total:  1h 36m | Avg:  9m 37s | Max: 16m 24s | Hits:  91%/14321 
  🟥 MSVC14.29          Pass:   0%/2   | Total: 53m 38s | Avg: 26m 49s | Max: 28m 14s
  🟥 MSVC14.42          Pass:   0%/2   | Total: 59m 30s | Avg: 29m 45s | Max: 30m 51s
  🟩 NVHPC24.7          Pass: 100%/2   | Total:  1h 05m | Avg: 32m 52s | Max: 34m 06s | Hits:  32%/5602  
🟩 sm
  🟩 75                 Pass: 100%/2   | Total: 31m 59s | Avg: 15m 59s | Max: 16m 24s | Hits:  90%/40    
  🟩 90                 Pass: 100%/2   | Total: 18m 45s | Avg:  9m 22s | Max: 13m 22s | Hits:  92%/2918  
  🟩 90;90a;100         Pass: 100%/1   | Total:  7m 35s | Avg:  7m 35s | Max:  7m 35s | Hits:  89%/2918  
🟨 std
  🟨 17                 Pass:  85%/21  | Total:  5h 13m | Avg: 14m 56s | Max: 31m 38s | Hits:  71%/47347 
  🟨 20                 Pass:  95%/21  | Total:  4h 17m | Avg: 12m 15s | Max: 34m 06s | Hits:  80%/45440

🟩 cub: Pass: 100%/45 | Total: 1d 17h | Avg: 54m 46s | Max: 1h 26m | Hits: 46%/53485

🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total:  1d 15h | Avg: 54m 26s | Max:  1h 26m | Hits:  47%/51055 
  🟩 arm64              Pass: 100%/2   | Total:  2h 03m | Avg:  1h 01m | Max:  1h 02m | Hits:  37%/2430  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total:  5h 08m | Avg:  1h 01m | Max:  1h 07m | Hits:  32%/5908  
  🟩 12.5               Pass: 100%/2   | Total:  2h 19m | Avg:  1h 09m | Max:  1h 10m | Hits:  34%/2248  
  🟩 12.8               Pass: 100%/38  | Total:  1d 09h | Avg: 53m 03s | Max:  1h 26m | Hits:  48%/45329 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  2h 08m | Avg:  1h 04m | Max:  1h 06m | Hits:  38%/2100  
  🟩 nvcc12.0           Pass: 100%/5   | Total:  5h 08m | Avg:  1h 01m | Max:  1h 07m | Hits:  32%/5908  
  🟩 nvcc12.5           Pass: 100%/2   | Total:  2h 19m | Avg:  1h 09m | Max:  1h 10m | Hits:  34%/2248  
  🟩 nvcc12.8           Pass: 100%/36  | Total:  1d 07h | Avg: 52m 26s | Max:  1h 26m | Hits:  49%/43229 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  2h 08m | Avg:  1h 04m | Max:  1h 06m | Hits:  38%/2100  
  🟩 nvcc               Pass: 100%/43  | Total:  1d 14h | Avg: 54m 20s | Max:  1h 26m | Hits:  46%/51385 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total:  4h 05m | Avg:  1h 01m | Max:  1h 04m | Hits:  37%/4868  
  🟩 Clang15            Pass: 100%/2   | Total:  2h 03m | Avg:  1h 01m | Max:  1h 05m | Hits:  37%/2430  
  🟩 Clang16            Pass: 100%/2   | Total:  2h 01m | Avg:  1h 00m | Max:  1h 01m | Hits:  37%/2430  
  🟩 Clang17            Pass: 100%/2   | Total:  1h 57m | Avg: 58m 53s | Max:  1h 00m | Hits:  37%/2430  
  🟩 Clang18            Pass: 100%/7   | Total:  5h 47m | Avg: 49m 34s | Max:  1h 06m | Hits:  56%/8175  
  🟩 GCC7               Pass: 100%/2   | Total:  1h 57m | Avg: 58m 30s | Max: 58m 56s | Hits:  37%/2434  
  🟩 GCC8               Pass: 100%/1   | Total:  1h 02m | Avg:  1h 02m | Max:  1h 02m | Hits:  37%/1217  
  🟩 GCC9               Pass: 100%/2   | Total:  2h 00m | Avg:  1h 00m | Max:  1h 00m | Hits:  37%/2434  
  🟩 GCC10              Pass: 100%/2   | Total:  2h 02m | Avg:  1h 01m | Max:  1h 04m | Hits:  37%/2434  
  🟩 GCC11              Pass: 100%/2   | Total:  2h 03m | Avg:  1h 01m | Max:  1h 04m | Hits:  37%/2430  
  🟩 GCC12              Pass: 100%/2   | Total:  2h 01m | Avg:  1h 00m | Max:  1h 01m | Hits:  37%/2430  
  🟩 GCC13              Pass: 100%/11  | Total:  6h 45m | Avg: 36m 49s | Max:  1h 07m | Hits:  71%/13365 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  2h 20m | Avg:  1h 10m | Max:  1h 12m | Hits:  12%/2080  
  🟩 MSVC14.42          Pass: 100%/2   | Total:  2h 36m | Avg:  1h 18m | Max:  1h 26m | Hits:  12%/2080  
  🟩 NVHPC24.7          Pass: 100%/2   | Total:  2h 19m | Avg:  1h 09m | Max:  1h 10m | Hits:  34%/2248  
🟩 cxx_family
  🟩 Clang              Pass: 100%/17  | Total: 15h 54m | Avg: 56m 09s | Max:  1h 06m | Hits:  44%/20333 
  🟩 GCC                Pass: 100%/22  | Total: 17h 53m | Avg: 48m 47s | Max:  1h 07m | Hits:  54%/26744 
  🟩 MSVC               Pass: 100%/4   | Total:  4h 56m | Avg:  1h 14m | Max:  1h 26m | Hits:  12%/4160  
  🟩 NVHPC              Pass: 100%/2   | Total:  2h 19m | Avg:  1h 09m | Max:  1h 10m | Hits:  34%/2248  
🟩 gpu
  🟩 h100               Pass: 100%/3   | Total:  1h 14m | Avg: 24m 43s | Max: 27m 15s | Hits:  78%/3645  
  🟩 rtx2080            Pass: 100%/34  | Total:  1d 11h | Avg:  1h 03m | Max:  1h 26m | Hits:  34%/40120 
  🟩 rtxa6000           Pass: 100%/8   | Total:  4h 04m | Avg: 30m 34s | Max: 59m 20s | Hits:  84%/9720  
🟩 jobs
  🟩 Build              Pass: 100%/37  | Total:  1d 14h | Avg:  1h 01m | Max:  1h 26m | Hits:  34%/43765 
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 21m 59s | Avg: 21m 59s | Max: 21m 59s | Hits:  99%/1215  
  🟩 GraphCapture       Pass: 100%/1   | Total: 17m 32s | Avg: 17m 32s | Max: 17m 32s | Hits:  99%/1215  
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 10m | Avg: 23m 38s | Max: 24m 14s | Hits:  99%/3645  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 02m | Avg: 20m 59s | Max: 22m 54s | Hits:  99%/3645  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total:  1h 14m | Avg: 24m 43s | Max: 27m 15s | Hits:  78%/3645  
  🟩 90;90a;100         Pass: 100%/1   | Total:  1h 07m | Avg:  1h 07m | Max:  1h 07m | Hits:  37%/1215  
🟩 std
  🟩 17                 Pass: 100%/20  | Total: 20h 41m | Avg:  1h 02m | Max:  1h 12m | Hits:  33%/23535 
  🟩 20                 Pass: 100%/25  | Total: 20h 23m | Avg: 48m 56s | Max:  1h 26m | Hits:  56%/29950

🟩 thrust: Pass: 100%/45 | Total: 21h 20m | Avg: 28m 27s | Max: 59m 50s | Hits: 76%/80136

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 33m 46s | Avg: 16m 53s | Max: 22m 43s | Hits:  88%/3564  
🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total: 20h 28m | Avg: 28m 34s | Max: 59m 50s | Hits:  76%/76573 
  🟩 arm64              Pass: 100%/2   | Total: 52m 09s | Avg: 26m 04s | Max: 27m 26s | Hits:  76%/3563  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total:  2h 39m | Avg: 31m 53s | Max: 47m 38s | Hits:  72%/8901  
  🟩 12.5               Pass: 100%/2   | Total:  1h 36m | Avg: 48m 07s | Max: 51m 17s | Hits:  64%/3562  
  🟩 12.8               Pass: 100%/38  | Total: 17h 04m | Avg: 26m 58s | Max: 59m 50s | Hits:  77%/67673 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 52m 44s | Avg: 26m 22s | Max: 27m 26s | Hits:  53%/3562  
  🟩 nvcc12.0           Pass: 100%/5   | Total:  2h 39m | Avg: 31m 53s | Max: 47m 38s | Hits:  72%/8901  
  🟩 nvcc12.5           Pass: 100%/2   | Total:  1h 36m | Avg: 48m 07s | Max: 51m 17s | Hits:  64%/3562  
  🟩 nvcc12.8           Pass: 100%/36  | Total: 16h 12m | Avg: 27m 00s | Max: 59m 50s | Hits:  78%/64111 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 52m 44s | Avg: 26m 22s | Max: 27m 26s | Hits:  53%/3562  
  🟩 nvcc               Pass: 100%/43  | Total: 20h 27m | Avg: 28m 33s | Max: 59m 50s | Hits:  77%/76574 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total:  1h 51m | Avg: 27m 46s | Max: 29m 50s | Hits:  77%/7124  
  🟩 Clang15            Pass: 100%/2   | Total: 54m 45s | Avg: 27m 22s | Max: 28m 08s | Hits:  77%/3562  
  🟩 Clang16            Pass: 100%/2   | Total: 52m 57s | Avg: 26m 28s | Max: 26m 35s | Hits:  77%/3562  
  🟩 Clang17            Pass: 100%/2   | Total: 56m 06s | Avg: 28m 03s | Max: 28m 49s | Hits:  77%/3562  
  🟩 Clang18            Pass: 100%/7   | Total:  2h 33m | Avg: 21m 57s | Max: 29m 38s | Hits:  76%/12467 
  🟩 GCC7               Pass: 100%/2   | Total: 54m 02s | Avg: 27m 01s | Max: 27m 07s | Hits:  76%/3564  
  🟩 GCC8               Pass: 100%/1   | Total: 28m 27s | Avg: 28m 27s | Max: 28m 27s | Hits:  76%/1782  
  🟩 GCC9               Pass: 100%/2   | Total: 58m 50s | Avg: 29m 25s | Max: 30m 30s | Hits:  76%/3564  
  🟩 GCC10              Pass: 100%/2   | Total: 56m 28s | Avg: 28m 14s | Max: 29m 58s | Hits:  76%/3564  
  🟩 GCC11              Pass: 100%/2   | Total: 57m 39s | Avg: 28m 49s | Max: 30m 13s | Hits:  76%/3564  
  🟩 GCC12              Pass: 100%/2   | Total: 57m 49s | Avg: 28m 54s | Max: 29m 06s | Hits:  76%/3564  
  🟩 GCC13              Pass: 100%/10  | Total:  3h 17m | Avg: 19m 44s | Max: 32m 41s | Hits:  86%/17820 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 39m | Avg: 49m 49s | Max: 52m 00s | Hits:  54%/3550  
  🟩 MSVC14.42          Pass: 100%/3   | Total:  2h 25m | Avg: 48m 25s | Max: 59m 50s | Hits:  60%/5325  
  🟩 NVHPC24.7          Pass: 100%/2   | Total:  1h 36m | Avg: 48m 07s | Max: 51m 17s | Hits:  64%/3562  
🟩 cxx_family
  🟩 Clang              Pass: 100%/17  | Total:  7h 08m | Avg: 25m 12s | Max: 29m 50s | Hits:  77%/30277 
  🟩 GCC                Pass: 100%/21  | Total:  8h 30m | Avg: 24m 19s | Max: 32m 41s | Hits:  81%/37422 
  🟩 MSVC               Pass: 100%/5   | Total:  4h 04m | Avg: 48m 59s | Max: 59m 50s | Hits:  58%/8875  
  🟩 NVHPC              Pass: 100%/2   | Total:  1h 36m | Avg: 48m 07s | Max: 51m 17s | Hits:  64%/3562  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 27m 39s | Avg: 13m 49s | Max: 16m 23s | Hits:  88%/3564  
  🟩 rtx2080            Pass: 100%/33  | Total: 17h 09m | Avg: 31m 11s | Max: 53m 43s | Hits:  72%/58769 
  🟩 rtx4090            Pass: 100%/10  | Total:  3h 43m | Avg: 22m 23s | Max: 59m 50s | Hits:  85%/17803 
🟩 jobs
  🟩 Build              Pass: 100%/38  | Total: 19h 50m | Avg: 31m 19s | Max: 59m 50s | Hits:  72%/67671 
  🟩 TestCPU            Pass: 100%/3   | Total: 47m 20s | Avg: 15m 46s | Max: 31m 44s | Hits:  90%/5338  
  🟩 TestGPU            Pass: 100%/4   | Total: 42m 54s | Avg: 10m 43s | Max: 11m 16s | Hits:  99%/7127  
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 27m 39s | Avg: 13m 49s | Max: 16m 23s | Hits:  88%/3564  
  🟩 90;90a;100         Pass: 100%/1   | Total: 30m 02s | Avg: 30m 02s | Max: 30m 02s | Hits:  76%/1782  
🟩 std
  🟩 17                 Pass: 100%/20  | Total: 10h 51m | Avg: 32m 33s | Max: 53m 43s | Hits:  71%/35611 
  🟩 20                 Pass: 100%/23  | Total:  9h 55m | Avg: 25m 54s | Max: 59m 50s | Hits:  79%/40961

🟩 cudax: Pass: 100%/22 | Total: 2h 13m | Avg: 6m 03s | Max: 17m 58s | Hits: 96%/11264

🟩 cpu
  🟩 amd64              Pass: 100%/18  | Total:  1h 58m | Avg:  6m 34s | Max: 17m 58s | Hits:  96%/9036  
  🟩 arm64              Pass: 100%/4   | Total: 14m 57s | Avg:  3m 44s | Max:  3m 53s | Hits:  98%/2228  
🟩 ctk
  🟩 12.0               Pass: 100%/1   | Total: 10m 09s | Avg: 10m 09s | Max: 10m 09s | Hits:  60%/262   
  🟩 12.5               Pass: 100%/2   | Total: 12m 32s | Avg:  6m 16s | Max:  6m 19s | Hits:  95%/710   
  🟩 12.8               Pass: 100%/19  | Total:  1h 50m | Avg:  5m 49s | Max: 17m 58s | Hits:  97%/10292 
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/1   | Total: 10m 09s | Avg: 10m 09s | Max: 10m 09s | Hits:  60%/262   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 12m 32s | Avg:  6m 16s | Max:  6m 19s | Hits:  95%/710   
  🟩 nvcc12.8           Pass: 100%/19  | Total:  1h 50m | Avg:  5m 49s | Max: 17m 58s | Hits:  97%/10292 
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/22  | Total:  2h 13m | Avg:  6m 03s | Max: 17m 58s | Hits:  96%/11264 
🟩 cxx
  🟩 Clang14            Pass: 100%/1   | Total:  3m 55s | Avg:  3m 55s | Max:  3m 55s | Hits:  98%/559   
  🟩 Clang15            Pass: 100%/1   | Total:  4m 06s | Avg:  4m 06s | Max:  4m 06s | Hits:  98%/557   
  🟩 Clang16            Pass: 100%/1   | Total:  4m 02s | Avg:  4m 02s | Max:  4m 02s | Hits:  98%/557   
  🟩 Clang17            Pass: 100%/1   | Total:  4m 14s | Avg:  4m 14s | Max:  4m 14s | Hits:  98%/557   
  🟩 Clang18            Pass: 100%/4   | Total: 29m 26s | Avg:  7m 21s | Max: 17m 58s | Hits:  98%/2228  
  🟩 GCC10              Pass: 100%/1   | Total:  4m 12s | Avg:  4m 12s | Max:  4m 12s | Hits:  98%/559   
  🟩 GCC11              Pass: 100%/1   | Total:  3m 56s | Avg:  3m 56s | Max:  3m 56s | Hits:  98%/557   
  🟩 GCC12              Pass: 100%/2   | Total: 17m 22s | Avg:  8m 41s | Max: 12m 57s | Hits:  98%/1114  
  🟩 GCC13              Pass: 100%/6   | Total: 29m 31s | Avg:  4m 55s | Max: 11m 23s | Hits:  98%/3342  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 10m 09s | Avg: 10m 09s | Max: 10m 09s | Hits:  60%/262   
  🟩 MSVC14.42          Pass: 100%/1   | Total:  9m 53s | Avg:  9m 53s | Max:  9m 53s | Hits:  60%/262   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 12m 32s | Avg:  6m 16s | Max:  6m 19s | Hits:  95%/710   
🟩 cxx_family
  🟩 Clang              Pass: 100%/8   | Total: 45m 43s | Avg:  5m 42s | Max: 17m 58s | Hits:  98%/4458  
  🟩 GCC                Pass: 100%/10  | Total: 55m 01s | Avg:  5m 30s | Max: 12m 57s | Hits:  98%/5572  
  🟩 MSVC               Pass: 100%/2   | Total: 20m 02s | Avg: 10m 01s | Max: 10m 09s | Hits:  60%/524   
  🟩 NVHPC              Pass: 100%/2   | Total: 12m 32s | Avg:  6m 16s | Max:  6m 19s | Hits:  95%/710   
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 15m 00s | Avg:  7m 30s | Max: 11m 23s | Hits:  98%/1114  
  🟩 rtx2080            Pass: 100%/20  | Total:  1h 58m | Avg:  5m 54s | Max: 17m 58s | Hits:  96%/10150 
🟩 jobs
  🟩 Build              Pass: 100%/19  | Total:  1h 31m | Avg:  4m 47s | Max: 10m 09s | Hits:  96%/9593  
  🟩 Test               Pass: 100%/3   | Total: 42m 18s | Avg: 14m 06s | Max: 17m 58s | Hits:  99%/1671  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total: 18m 27s | Avg:  6m 09s | Max: 11m 23s | Hits:  98%/1671  
  🟩 90a                Pass: 100%/1   | Total:  3m 24s | Avg:  3m 24s | Max:  3m 24s | Hits:  98%/557   
🟩 std
  🟩 17                 Pass: 100%/4   | Total: 17m 06s | Avg:  4m 16s | Max:  6m 13s | Hits:  97%/2026  
  🟩 20                 Pass: 100%/18  | Total:  1h 56m | Avg:  6m 27s | Max: 17m 58s | Hits:  96%/9238

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 14m 44s | Avg: 7m 22s | Max: 12m 17s | Hits: 97%/308

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 14m 44s | Avg:  7m 22s | Max: 12m 17s | Hits:  97%/308   
🟩 ctk
  🟩 12.8               Pass: 100%/2   | Total: 14m 44s | Avg:  7m 22s | Max: 12m 17s | Hits:  97%/308   
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/2   | Total: 14m 44s | Avg:  7m 22s | Max: 12m 17s | Hits:  97%/308   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 14m 44s | Avg:  7m 22s | Max: 12m 17s | Hits:  97%/308   
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 14m 44s | Avg:  7m 22s | Max: 12m 17s | Hits:  97%/308   
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 14m 44s | Avg:  7m 22s | Max: 12m 17s | Hits:  97%/308   
🟩 gpu
  🟩 rtx2080            Pass: 100%/2   | Total: 14m 44s | Avg:  7m 22s | Max: 12m 17s | Hits:  97%/308   
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 27s | Avg:  2m 27s | Max:  2m 27s | Hits:  96%/154   
  🟩 Test               Pass: 100%/1   | Total: 12m 17s | Avg: 12m 17s | Max: 12m 17s | Hits:  98%/154

🟩 python: Pass: 100%/1 | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 ctk
  🟩 12.8               Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 gpu
  🟩 rtx2080            Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 158)

#	Runner
111	`linux-amd64-cpu16`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
8	`linux-amd64-gpu-rtx2080-latest-1`
6	`linux-amd64-gpu-rtxa6000-latest-1`
5	`linux-amd64-gpu-h100-latest-1`
3	`linux-amd64-gpu-rtx4090-latest-1`

github-actions · 2025-02-22T02:46:38Z

🟩 CI finished in 1h 35m: Pass: 100%/158 | Total: 3d 01h | Avg: 27m 56s | Max: 1h 17m | Hits: 73%/248320

🟩 cub: Pass: 100%/45 | Total: 1d 16h | Avg: 54m 08s | Max: 1h 17m | Hits: 46%/53485

🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total:  1d 14h | Avg: 53m 48s | Max:  1h 17m | Hits:  47%/51055 
  🟩 arm64              Pass: 100%/2   | Total:  2h 02m | Avg:  1h 01m | Max:  1h 01m | Hits:  37%/2430  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total:  5h 00m | Avg:  1h 00m | Max:  1h 04m | Hits:  32%/5908  
  🟩 12.5               Pass: 100%/2   | Total:  2h 22m | Avg:  1h 11m | Max:  1h 15m | Hits:  34%/2248  
  🟩 12.8               Pass: 100%/38  | Total:  1d 09h | Avg: 52m 26s | Max:  1h 17m | Hits:  48%/45329 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  2h 05m | Avg:  1h 02m | Max:  1h 05m | Hits:  38%/2100  
  🟩 nvcc12.0           Pass: 100%/5   | Total:  5h 00m | Avg:  1h 00m | Max:  1h 04m | Hits:  32%/5908  
  🟩 nvcc12.5           Pass: 100%/2   | Total:  2h 22m | Avg:  1h 11m | Max:  1h 15m | Hits:  34%/2248  
  🟩 nvcc12.8           Pass: 100%/36  | Total:  1d 07h | Avg: 51m 52s | Max:  1h 17m | Hits:  49%/43229 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  2h 05m | Avg:  1h 02m | Max:  1h 05m | Hits:  38%/2100  
  🟩 nvcc               Pass: 100%/43  | Total:  1d 14h | Avg: 53m 44s | Max:  1h 17m | Hits:  46%/51385 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total:  3h 58m | Avg: 59m 33s | Max:  1h 03m | Hits:  37%/4868  
  🟩 Clang15            Pass: 100%/2   | Total:  1h 55m | Avg: 57m 30s | Max: 57m 39s | Hits:  37%/2430  
  🟩 Clang16            Pass: 100%/2   | Total:  2h 07m | Avg:  1h 03m | Max:  1h 05m | Hits:  37%/2430  
  🟩 Clang17            Pass: 100%/2   | Total:  1h 54m | Avg: 57m 25s | Max: 57m 38s | Hits:  37%/2430  
  🟩 Clang18            Pass: 100%/7   | Total:  5h 48m | Avg: 49m 47s | Max:  1h 05m | Hits:  56%/8175  
  🟩 GCC7               Pass: 100%/2   | Total:  1h 57m | Avg: 58m 53s | Max:  1h 00m | Hits:  37%/2434  
  🟩 GCC8               Pass: 100%/1   | Total: 57m 25s | Avg: 57m 25s | Max: 57m 25s | Hits:  37%/1217  
  🟩 GCC9               Pass: 100%/2   | Total:  1h 56m | Avg: 58m 04s | Max: 58m 23s | Hits:  37%/2434  
  🟩 GCC10              Pass: 100%/2   | Total:  1h 55m | Avg: 57m 55s | Max: 58m 48s | Hits:  37%/2434  
  🟩 GCC11              Pass: 100%/2   | Total:  2h 02m | Avg:  1h 01m | Max:  1h 03m | Hits:  37%/2430  
  🟩 GCC12              Pass: 100%/2   | Total:  2h 04m | Avg:  1h 02m | Max:  1h 05m | Hits:  37%/2430  
  🟩 GCC13              Pass: 100%/11  | Total:  6h 45m | Avg: 36m 49s | Max:  1h 04m | Hits:  71%/13365 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  2h 18m | Avg:  1h 09m | Max:  1h 13m | Hits:  12%/2080  
  🟩 MSVC14.42          Pass: 100%/2   | Total:  2h 31m | Avg:  1h 15m | Max:  1h 17m | Hits:  12%/2080  
  🟩 NVHPC24.7          Pass: 100%/2   | Total:  2h 22m | Avg:  1h 11m | Max:  1h 15m | Hits:  34%/2248  
🟩 cxx_family
  🟩 Clang              Pass: 100%/17  | Total: 15h 44m | Avg: 55m 32s | Max:  1h 05m | Hits:  44%/20333 
  🟩 GCC                Pass: 100%/22  | Total: 17h 39m | Avg: 48m 09s | Max:  1h 05m | Hits:  54%/26744 
  🟩 MSVC               Pass: 100%/4   | Total:  4h 49m | Avg:  1h 12m | Max:  1h 17m | Hits:  12%/4160  
  🟩 NVHPC              Pass: 100%/2   | Total:  2h 22m | Avg:  1h 11m | Max:  1h 15m | Hits:  34%/2248  
🟩 gpu
  🟩 h100               Pass: 100%/3   | Total:  1h 16m | Avg: 25m 28s | Max: 31m 12s | Hits:  78%/3645  
  🟩 rtx2080            Pass: 100%/34  | Total:  1d 11h | Avg:  1h 02m | Max:  1h 17m | Hits:  34%/40120 
  🟩 rtxa6000           Pass: 100%/8   | Total:  4h 08m | Avg: 31m 07s | Max:  1h 02m | Hits:  84%/9720  
🟩 jobs
  🟩 Build              Pass: 100%/37  | Total:  1d 13h | Avg:  1h 01m | Max:  1h 17m | Hits:  34%/43765 
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 20m 54s | Avg: 20m 54s | Max: 20m 54s | Hits:  99%/1215  
  🟩 GraphCapture       Pass: 100%/1   | Total: 16m 49s | Avg: 16m 49s | Max: 16m 49s | Hits:  99%/1215  
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 09m | Avg: 23m 05s | Max: 24m 31s | Hits:  99%/3645  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 03m | Avg: 21m 18s | Max: 22m 17s | Hits:  99%/3645  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total:  1h 16m | Avg: 25m 28s | Max: 31m 12s | Hits:  78%/3645  
  🟩 90;90a;100         Pass: 100%/1   | Total:  1h 04m | Avg:  1h 04m | Max:  1h 04m | Hits:  37%/1215  
🟩 std
  🟩 17                 Pass: 100%/20  | Total: 20h 31m | Avg:  1h 01m | Max:  1h 17m | Hits:  33%/23535 
  🟩 20                 Pass: 100%/25  | Total: 20h 04m | Avg: 48m 11s | Max:  1h 13m | Hits:  56%/29950

🟩 thrust: Pass: 100%/45 | Total: 21h 11m | Avg: 28m 15s | Max: 52m 20s | Hits: 77%/80136

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 36m 39s | Avg: 18m 19s | Max: 25m 34s | Hits:  88%/3564  
🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total: 20h 19m | Avg: 28m 21s | Max: 52m 20s | Hits:  77%/76573 
  🟩 arm64              Pass: 100%/2   | Total: 51m 45s | Avg: 25m 52s | Max: 27m 26s | Hits:  76%/3563  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total:  2h 44m | Avg: 32m 49s | Max: 51m 46s | Hits:  72%/8901  
  🟩 12.5               Pass: 100%/2   | Total:  1h 32m | Avg: 46m 11s | Max: 47m 00s | Hits:  64%/3562  
  🟩 12.8               Pass: 100%/38  | Total: 16h 54m | Avg: 26m 42s | Max: 52m 20s | Hits:  78%/67673 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 45m 33s | Avg: 22m 46s | Max: 23m 11s | Hits:  77%/3562  
  🟩 nvcc12.0           Pass: 100%/5   | Total:  2h 44m | Avg: 32m 49s | Max: 51m 46s | Hits:  72%/8901  
  🟩 nvcc12.5           Pass: 100%/2   | Total:  1h 32m | Avg: 46m 11s | Max: 47m 00s | Hits:  64%/3562  
  🟩 nvcc12.8           Pass: 100%/36  | Total: 16h 09m | Avg: 26m 55s | Max: 52m 20s | Hits:  78%/64111 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 45m 33s | Avg: 22m 46s | Max: 23m 11s | Hits:  77%/3562  
  🟩 nvcc               Pass: 100%/43  | Total: 20h 25m | Avg: 28m 30s | Max: 52m 20s | Hits:  77%/76574 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total:  1h 48m | Avg: 27m 06s | Max: 29m 08s | Hits:  77%/7124  
  🟩 Clang15            Pass: 100%/2   | Total: 54m 25s | Avg: 27m 12s | Max: 27m 33s | Hits:  77%/3562  
  🟩 Clang16            Pass: 100%/2   | Total: 59m 29s | Avg: 29m 44s | Max: 30m 26s | Hits:  77%/3562  
  🟩 Clang17            Pass: 100%/2   | Total: 52m 51s | Avg: 26m 25s | Max: 26m 38s | Hits:  77%/3562  
  🟩 Clang18            Pass: 100%/7   | Total:  2h 21m | Avg: 20m 14s | Max: 28m 07s | Hits:  83%/12467 
  🟩 GCC7               Pass: 100%/2   | Total: 57m 54s | Avg: 28m 57s | Max: 30m 33s | Hits:  76%/3564  
  🟩 GCC8               Pass: 100%/1   | Total: 28m 42s | Avg: 28m 42s | Max: 28m 42s | Hits:  76%/1782  
  🟩 GCC9               Pass: 100%/2   | Total: 56m 12s | Avg: 28m 06s | Max: 29m 33s | Hits:  76%/3564  
  🟩 GCC10              Pass: 100%/2   | Total: 55m 38s | Avg: 27m 49s | Max: 28m 00s | Hits:  76%/3564  
  🟩 GCC11              Pass: 100%/2   | Total: 58m 02s | Avg: 29m 01s | Max: 29m 16s | Hits:  76%/3564  
  🟩 GCC12              Pass: 100%/2   | Total:  1h 04m | Avg: 32m 07s | Max: 34m 52s | Hits:  76%/3564  
  🟩 GCC13              Pass: 100%/10  | Total:  3h 22m | Avg: 20m 12s | Max: 31m 27s | Hits:  86%/17820 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 43m | Avg: 51m 59s | Max: 52m 12s | Hits:  54%/3550  
  🟩 MSVC14.42          Pass: 100%/3   | Total:  2h 15m | Avg: 45m 10s | Max: 52m 20s | Hits:  60%/5325  
  🟩 NVHPC24.7          Pass: 100%/2   | Total:  1h 32m | Avg: 46m 11s | Max: 47m 00s | Hits:  64%/3562  
🟩 cxx_family
  🟩 Clang              Pass: 100%/17  | Total:  6h 56m | Avg: 24m 31s | Max: 30m 26s | Hits:  79%/30277 
  🟩 GCC                Pass: 100%/21  | Total:  8h 42m | Avg: 24m 53s | Max: 34m 52s | Hits:  81%/37422 
  🟩 MSVC               Pass: 100%/5   | Total:  3h 59m | Avg: 47m 54s | Max: 52m 20s | Hits:  58%/8875  
  🟩 NVHPC              Pass: 100%/2   | Total:  1h 32m | Avg: 46m 11s | Max: 47m 00s | Hits:  64%/3562  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 29m 26s | Avg: 14m 43s | Max: 17m 46s | Hits:  88%/3564  
  🟩 rtx2080            Pass: 100%/33  | Total: 17h 06m | Avg: 31m 06s | Max: 52m 12s | Hits:  74%/58769 
  🟩 rtx4090            Pass: 100%/10  | Total:  3h 35m | Avg: 21m 31s | Max: 52m 20s | Hits:  85%/17803 
🟩 jobs
  🟩 Build              Pass: 100%/38  | Total: 19h 38m | Avg: 31m 00s | Max: 52m 20s | Hits:  74%/67671 
  🟩 TestCPU            Pass: 100%/3   | Total: 48m 33s | Avg: 16m 11s | Max: 33m 14s | Hits:  90%/5338  
  🟩 TestGPU            Pass: 100%/4   | Total: 44m 19s | Avg: 11m 04s | Max: 11m 40s | Hits:  99%/7127  
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 29m 26s | Avg: 14m 43s | Max: 17m 46s | Hits:  88%/3564  
  🟩 90;90a;100         Pass: 100%/1   | Total: 31m 27s | Avg: 31m 27s | Max: 31m 27s | Hits:  76%/1782  
🟩 std
  🟩 17                 Pass: 100%/20  | Total: 10h 46m | Avg: 32m 19s | Max: 52m 12s | Hits:  73%/35611 
  🟩 20                 Pass: 100%/23  | Total:  9h 48m | Avg: 25m 34s | Max: 52m 20s | Hits:  80%/40961

🟩 libcudacxx: Pass: 100%/43 | Total: 8h 33m | Avg: 11m 56s | Max: 32m 43s | Hits: 81%/103127

🟩 cpu
  🟩 amd64              Pass: 100%/41  | Total:  8h 20m | Avg: 12m 11s | Max: 32m 43s | Hits:  81%/97470 
  🟩 arm64              Pass: 100%/2   | Total: 13m 25s | Avg:  6m 42s | Max:  6m 53s | Hits:  89%/5657  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total:  1h 03m | Avg: 12m 40s | Max: 24m 38s | Hits:  80%/13681 
  🟩 12.5               Pass: 100%/2   | Total: 23m 30s | Avg: 11m 45s | Max: 12m 01s | Hits:  91%/5602  
  🟩 12.8               Pass: 100%/36  | Total:  7h 06m | Avg: 11m 51s | Max: 32m 43s | Hits:  81%/83844 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 43m 05s | Avg: 21m 32s | Max: 22m 05s | Hits:  26%/5620  
  🟩 nvcc12.0           Pass: 100%/5   | Total:  1h 03m | Avg: 12m 40s | Max: 24m 38s | Hits:  80%/13681 
  🟩 nvcc12.5           Pass: 100%/2   | Total: 23m 30s | Avg: 11m 45s | Max: 12m 01s | Hits:  91%/5602  
  🟩 nvcc12.8           Pass: 100%/34  | Total:  6h 23m | Avg: 11m 16s | Max: 32m 43s | Hits:  85%/78224 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 43m 05s | Avg: 21m 32s | Max: 22m 05s | Hits:  26%/5620  
  🟩 nvcc               Pass: 100%/41  | Total:  7h 50m | Avg: 11m 28s | Max: 32m 43s | Hits:  85%/97507 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 43m 58s | Avg: 10m 59s | Max: 23m 01s | Hits:  77%/11206 
  🟩 Clang15            Pass: 100%/2   | Total: 14m 35s | Avg:  7m 17s | Max:  7m 23s | Hits:  92%/5614  
  🟩 Clang16            Pass: 100%/2   | Total: 15m 01s | Avg:  7m 30s | Max:  7m 52s | Hits:  91%/5614  
  🟩 Clang17            Pass: 100%/2   | Total: 15m 22s | Avg:  7m 41s | Max:  8m 01s | Hits:  91%/5614  
  🟩 Clang18            Pass: 100%/6   | Total:  1h 14m | Avg: 12m 20s | Max: 22m 05s | Hits:  65%/14062 
  🟩 GCC7               Pass: 100%/2   | Total: 25m 09s | Avg: 12m 34s | Max: 18m 40s | Hits:  62%/5552  
  🟩 GCC8               Pass: 100%/1   | Total:  5m 53s | Avg:  5m 53s | Max:  5m 53s | Hits:  92%/2786  
  🟩 GCC9               Pass: 100%/2   | Total: 13m 20s | Avg:  6m 40s | Max:  7m 11s | Hits:  92%/5564  
  🟩 GCC10              Pass: 100%/2   | Total: 28m 05s | Avg: 14m 02s | Max: 20m 26s | Hits:  63%/5620  
  🟩 GCC11              Pass: 100%/2   | Total: 14m 39s | Avg:  7m 19s | Max:  7m 22s | Hits:  92%/5616  
  🟩 GCC12              Pass: 100%/2   | Total: 14m 42s | Avg:  7m 21s | Max:  7m 42s | Hits:  90%/5616  
  🟩 GCC13              Pass: 100%/10  | Total:  2h 01m | Avg: 12m 08s | Max: 32m 43s | Hits:  79%/14321 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 49m 31s | Avg: 24m 45s | Max: 24m 53s | Hits:  92%/5090  
  🟩 MSVC14.42          Pass: 100%/2   | Total: 54m 24s | Avg: 27m 12s | Max: 27m 31s | Hits:  91%/5250  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 23m 30s | Avg: 11m 45s | Max: 12m 01s | Hits:  91%/5602  
🟩 cxx_family
  🟩 Clang              Pass: 100%/16  | Total:  2h 42m | Avg: 10m 11s | Max: 23m 01s | Hits:  79%/42110 
  🟩 GCC                Pass: 100%/21  | Total:  3h 43m | Avg: 10m 37s | Max: 32m 43s | Hits:  80%/45075 
  🟩 MSVC               Pass: 100%/4   | Total:  1h 43m | Avg: 25m 58s | Max: 27m 31s | Hits:  91%/10340 
  🟩 NVHPC              Pass: 100%/2   | Total: 23m 30s | Avg: 11m 45s | Max: 12m 01s | Hits:  91%/5602  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 19m 11s | Avg:  9m 35s | Max: 13m 19s | Hits:  92%/2918  
  🟩 rtx2080            Pass: 100%/41  | Total:  8h 14m | Avg: 12m 03s | Max: 32m 43s | Hits:  81%/100209
🟩 jobs
  🟩 Build              Pass: 100%/37  | Total:  7h 22m | Avg: 11m 57s | Max: 32m 43s | Hits:  81%/103087
  🟩 NVRTC              Pass: 100%/2   | Total: 31m 57s | Avg: 15m 58s | Max: 16m 28s | Hits:  90%/40    
  🟩 Test               Pass: 100%/3   | Total: 37m 05s | Avg: 12m 21s | Max: 14m 27s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 15s | Avg:  2m 15s | Max:  2m 15s
🟩 sm
  🟩 75                 Pass: 100%/2   | Total: 31m 57s | Avg: 15m 58s | Max: 16m 28s | Hits:  90%/40    
  🟩 90                 Pass: 100%/2   | Total: 19m 11s | Avg:  9m 35s | Max: 13m 19s | Hits:  92%/2918  
  🟩 90;90a;100         Pass: 100%/1   | Total: 32m 43s | Avg: 32m 43s | Max: 32m 43s | Hits:  33%/2918  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  4h 33m | Avg: 13m 01s | Max: 27m 31s | Hits:  79%/54987 
  🟩 20                 Pass: 100%/21  | Total:  3h 57m | Avg: 11m 19s | Max: 32m 43s | Hits:  84%/48140

🟩 cudax: Pass: 100%/22 | Total: 2h 10m | Avg: 5m 55s | Max: 13m 52s | Hits: 96%/11264

🟩 cpu
  🟩 amd64              Pass: 100%/18  | Total:  1h 55m | Avg:  6m 26s | Max: 13m 52s | Hits:  96%/9036  
  🟩 arm64              Pass: 100%/4   | Total: 14m 28s | Avg:  3m 37s | Max:  3m 52s | Hits:  98%/2228  
🟩 ctk
  🟩 12.0               Pass: 100%/1   | Total: 10m 21s | Avg: 10m 21s | Max: 10m 21s | Hits:  60%/262   
  🟩 12.5               Pass: 100%/2   | Total: 12m 13s | Avg:  6m 06s | Max:  6m 13s | Hits:  95%/710   
  🟩 12.8               Pass: 100%/19  | Total:  1h 47m | Avg:  5m 40s | Max: 13m 52s | Hits:  97%/10292 
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/1   | Total: 10m 21s | Avg: 10m 21s | Max: 10m 21s | Hits:  60%/262   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 12m 13s | Avg:  6m 06s | Max:  6m 13s | Hits:  95%/710   
  🟩 nvcc12.8           Pass: 100%/19  | Total:  1h 47m | Avg:  5m 40s | Max: 13m 52s | Hits:  97%/10292 
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/22  | Total:  2h 10m | Avg:  5m 55s | Max: 13m 52s | Hits:  96%/11264 
🟩 cxx
  🟩 Clang14            Pass: 100%/1   | Total:  4m 02s | Avg:  4m 02s | Max:  4m 02s | Hits:  98%/559   
  🟩 Clang15            Pass: 100%/1   | Total:  4m 08s | Avg:  4m 08s | Max:  4m 08s | Hits:  98%/557   
  🟩 Clang16            Pass: 100%/1   | Total:  4m 09s | Avg:  4m 09s | Max:  4m 09s | Hits:  98%/557   
  🟩 Clang17            Pass: 100%/1   | Total:  4m 02s | Avg:  4m 02s | Max:  4m 02s | Hits:  98%/557   
  🟩 Clang18            Pass: 100%/4   | Total: 23m 51s | Avg:  5m 57s | Max: 12m 45s | Hits:  98%/2228  
  🟩 GCC10              Pass: 100%/1   | Total:  4m 02s | Avg:  4m 02s | Max:  4m 02s | Hits:  98%/559   
  🟩 GCC11              Pass: 100%/1   | Total:  4m 14s | Avg:  4m 14s | Max:  4m 14s | Hits:  98%/557   
  🟩 GCC12              Pass: 100%/2   | Total: 16m 47s | Avg:  8m 23s | Max: 12m 39s | Hits:  98%/1114  
  🟩 GCC13              Pass: 100%/6   | Total: 31m 47s | Avg:  5m 17s | Max: 13m 52s | Hits:  98%/3342  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 10m 21s | Avg: 10m 21s | Max: 10m 21s | Hits:  60%/262   
  🟩 MSVC14.42          Pass: 100%/1   | Total: 10m 51s | Avg: 10m 51s | Max: 10m 51s | Hits:  60%/262   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 12m 13s | Avg:  6m 06s | Max:  6m 13s | Hits:  95%/710   
🟩 cxx_family
  🟩 Clang              Pass: 100%/8   | Total: 40m 12s | Avg:  5m 01s | Max: 12m 45s | Hits:  98%/4458  
  🟩 GCC                Pass: 100%/10  | Total: 56m 50s | Avg:  5m 41s | Max: 13m 52s | Hits:  98%/5572  
  🟩 MSVC               Pass: 100%/2   | Total: 21m 12s | Avg: 10m 36s | Max: 10m 51s | Hits:  60%/524   
  🟩 NVHPC              Pass: 100%/2   | Total: 12m 13s | Avg:  6m 06s | Max:  6m 13s | Hits:  95%/710   
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 17m 20s | Avg:  8m 40s | Max: 13m 52s | Hits:  98%/1114  
  🟩 rtx2080            Pass: 100%/20  | Total:  1h 53m | Avg:  5m 39s | Max: 12m 45s | Hits:  96%/10150 
🟩 jobs
  🟩 Build              Pass: 100%/19  | Total:  1h 31m | Avg:  4m 47s | Max: 10m 51s | Hits:  96%/9593  
  🟩 Test               Pass: 100%/3   | Total: 39m 16s | Avg: 13m 05s | Max: 13m 52s | Hits:  99%/1671  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total: 20m 37s | Avg:  6m 52s | Max: 13m 52s | Hits:  98%/1671  
  🟩 90a                Pass: 100%/1   | Total:  3m 38s | Avg:  3m 38s | Max:  3m 38s | Hits:  98%/557   
🟩 std
  🟩 17                 Pass: 100%/4   | Total: 16m 38s | Avg:  4m 09s | Max:  6m 13s | Hits:  97%/2026  
  🟩 20                 Pass: 100%/18  | Total:  1h 53m | Avg:  6m 19s | Max: 13m 52s | Hits:  96%/9238

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 20m 35s | Avg: 10m 17s | Max: 18m 09s | Hits: 97%/308

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 20m 35s | Avg: 10m 17s | Max: 18m 09s | Hits:  97%/308   
🟩 ctk
  🟩 12.8               Pass: 100%/2   | Total: 20m 35s | Avg: 10m 17s | Max: 18m 09s | Hits:  97%/308   
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/2   | Total: 20m 35s | Avg: 10m 17s | Max: 18m 09s | Hits:  97%/308   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 20m 35s | Avg: 10m 17s | Max: 18m 09s | Hits:  97%/308   
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 20m 35s | Avg: 10m 17s | Max: 18m 09s | Hits:  97%/308   
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 20m 35s | Avg: 10m 17s | Max: 18m 09s | Hits:  97%/308   
🟩 gpu
  🟩 rtx2080            Pass: 100%/2   | Total: 20m 35s | Avg: 10m 17s | Max: 18m 09s | Hits:  97%/308   
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 26s | Avg:  2m 26s | Max:  2m 26s | Hits:  96%/154   
  🟩 Test               Pass: 100%/1   | Total: 18m 09s | Avg: 18m 09s | Max: 18m 09s | Hits:  98%/154

🟩 python: Pass: 100%/1 | Total: 41m 22s | Avg: 41m 22s | Max: 41m 22s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 41m 22s | Avg: 41m 22s | Max: 41m 22s
🟩 ctk
  🟩 12.8               Pass: 100%/1   | Total: 41m 22s | Avg: 41m 22s | Max: 41m 22s
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/1   | Total: 41m 22s | Avg: 41m 22s | Max: 41m 22s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 41m 22s | Avg: 41m 22s | Max: 41m 22s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 41m 22s | Avg: 41m 22s | Max: 41m 22s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 41m 22s | Avg: 41m 22s | Max: 41m 22s
🟩 gpu
  🟩 rtx2080            Pass: 100%/1   | Total: 41m 22s | Avg: 41m 22s | Max: 41m 22s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 41m 22s | Avg: 41m 22s | Max: 41m 22s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 158)

#	Runner
111	`linux-amd64-cpu16`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
8	`linux-amd64-gpu-rtx2080-latest-1`
6	`linux-amd64-gpu-rtxa6000-latest-1`
5	`linux-amd64-gpu-h100-latest-1`
3	`linux-amd64-gpu-rtx4090-latest-1`

miscco · 2025-02-24T09:41:23Z

libcudacxx/include/cuda/std/__bit/integral.h

+// #include <cuda/__ptx/instructions/shl.h>
+// #include <cuda/__ptx/instructions/shr.h>


Please remove commented out includes

this PR is marked blocked because it depends on these two instructions

miscco · 2025-02-24T09:43:25Z

libcudacxx/include/cuda/std/__bit/integral.h

-                        + (numeric_limits<unsigned>::digits - numeric_limits<_Tp>::digits)))
-                >> (numeric_limits<unsigned>::digits - numeric_limits<_Tp>::digits));
+  // if __t == 0, __bit_log2(0) returns 0xFFFFFFFF. Since unsigned overflow is well-defined, the result is -1 + 1 = 0
+  auto __ret = _CUDA_VSTD::__bit_log2(__t) + 1;


The comment and the code do not agree. __bit_log2 is returning an int so this would be signed overflow aka UB.

Please add the appropriate casts if you want to intermittently cast to unsigned

miscco · 2025-02-24T09:44:43Z

libcudacxx/include/cuda/std/__bit/integral.h

+  if (!_CUDA_VSTD::__cccl_default_is_constant_evaluated() && sizeof(_Tp) <= 8 && false)
+  {
+    // CUDA right shift (ptx::shr) returns 0 if the right operand is larger than the number of bits of the type
+    // The result is computed as max(1, bit_width(__t - 1)) because it is more efficient than ternary operator


Please file a backend bug for that

I don't think it is a bug. Recent GPU archs provide MNMX instructions to compute minimum and maximum efficiently. The ternary operator has a different semantic. I don't think the compiler is able to understand the program logic enough to exploit this optimization.

fbusato · 2025-02-25T23:10:53Z

shl/shr have been added. The PR is not more blocked

github-actions · 2025-02-26T00:43:27Z

🟩 CI finished in 1h 30m: Pass: 100%/158 | Total: 3d 01h | Avg: 27m 54s | Max: 1h 18m | Hits: 76%/248762

🟩 cub: Pass: 100%/45 | Total: 1d 17h | Avg: 54m 50s | Max: 1h 18m | Hits: 46%/53485

🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total:  1d 15h | Avg: 54m 33s | Max:  1h 18m | Hits:  46%/51055 
  🟩 arm64              Pass: 100%/2   | Total:  2h 01m | Avg:  1h 00m | Max:  1h 01m | Hits:  37%/2430  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total:  5h 14m | Avg:  1h 02m | Max:  1h 06m | Hits:  32%/5908  
  🟩 12.5               Pass: 100%/2   | Total:  2h 13m | Avg:  1h 06m | Max:  1h 07m | Hits:  34%/2248  
  🟩 12.8               Pass: 100%/38  | Total:  1d 09h | Avg: 53m 09s | Max:  1h 18m | Hits:  48%/45329 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  1h 59m | Avg: 59m 50s | Max: 59m 58s | Hits:  38%/2100  
  🟩 nvcc12.0           Pass: 100%/5   | Total:  5h 14m | Avg:  1h 02m | Max:  1h 06m | Hits:  32%/5908  
  🟩 nvcc12.5           Pass: 100%/2   | Total:  2h 13m | Avg:  1h 06m | Max:  1h 07m | Hits:  34%/2248  
  🟩 nvcc12.8           Pass: 100%/36  | Total:  1d 07h | Avg: 52m 47s | Max:  1h 18m | Hits:  49%/43229 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  1h 59m | Avg: 59m 50s | Max: 59m 58s | Hits:  38%/2100  
  🟩 nvcc               Pass: 100%/43  | Total:  1d 15h | Avg: 54m 36s | Max:  1h 18m | Hits:  46%/51385 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total:  4h 07m | Avg:  1h 01m | Max:  1h 06m | Hits:  37%/4868  
  🟩 Clang15            Pass: 100%/2   | Total:  2h 02m | Avg:  1h 01m | Max:  1h 02m | Hits:  37%/2430  
  🟩 Clang16            Pass: 100%/2   | Total:  2h 00m | Avg:  1h 00m | Max:  1h 01m | Hits:  37%/2430  
  🟩 Clang17            Pass: 100%/2   | Total:  1h 58m | Avg: 59m 14s | Max: 59m 28s | Hits:  37%/2430  
  🟩 Clang18            Pass: 100%/7   | Total:  5h 48m | Avg: 49m 49s | Max:  1h 04m | Hits:  56%/8175  
  🟩 GCC7               Pass: 100%/2   | Total:  2h 00m | Avg:  1h 00m | Max:  1h 02m | Hits:  36%/2434  
  🟩 GCC8               Pass: 100%/1   | Total: 57m 04s | Avg: 57m 04s | Max: 57m 04s | Hits:  37%/1217  
  🟩 GCC9               Pass: 100%/2   | Total:  1h 59m | Avg: 59m 43s | Max: 59m 56s | Hits:  37%/2434  
  🟩 GCC10              Pass: 100%/2   | Total:  2h 07m | Avg:  1h 03m | Max:  1h 06m | Hits:  37%/2434  
  🟩 GCC11              Pass: 100%/2   | Total:  2h 00m | Avg:  1h 00m | Max:  1h 02m | Hits:  36%/2430  
  🟩 GCC12              Pass: 100%/2   | Total:  2h 02m | Avg:  1h 01m | Max:  1h 04m | Hits:  36%/2430  
  🟩 GCC13              Pass: 100%/11  | Total:  6h 55m | Avg: 37m 48s | Max:  1h 06m | Hits:  71%/13365 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  2h 25m | Avg:  1h 12m | Max:  1h 18m | Hits:  12%/2080  
  🟩 MSVC14.42          Pass: 100%/2   | Total:  2h 27m | Avg:  1h 13m | Max:  1h 16m | Hits:  12%/2080  
  🟩 NVHPC24.7          Pass: 100%/2   | Total:  2h 13m | Avg:  1h 06m | Max:  1h 07m | Hits:  34%/2248  
🟩 cxx_family
  🟩 Clang              Pass: 100%/17  | Total: 15h 58m | Avg: 56m 21s | Max:  1h 06m | Hits:  44%/20333 
  🟩 GCC                Pass: 100%/22  | Total: 18h 03m | Avg: 49m 15s | Max:  1h 06m | Hits:  54%/26744 
  🟩 MSVC               Pass: 100%/4   | Total:  4h 53m | Avg:  1h 13m | Max:  1h 18m | Hits:  12%/4160  
  🟩 NVHPC              Pass: 100%/2   | Total:  2h 13m | Avg:  1h 06m | Max:  1h 07m | Hits:  34%/2248  
🟩 gpu
  🟩 h100               Pass: 100%/3   | Total:  1h 12m | Avg: 24m 17s | Max: 28m 41s | Hits:  78%/3645  
  🟩 rtx2080            Pass: 100%/34  | Total:  1d 11h | Avg:  1h 02m | Max:  1h 18m | Hits:  34%/40120 
  🟩 rtxa6000           Pass: 100%/8   | Total:  4h 17m | Avg: 32m 11s | Max:  1h 01m | Hits:  84%/9720  
🟩 jobs
  🟩 Build              Pass: 100%/37  | Total:  1d 14h | Avg:  1h 01m | Max:  1h 18m | Hits:  34%/43765 
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 24m 37s | Avg: 24m 37s | Max: 24m 37s | Hits:  99%/1215  
  🟩 GraphCapture       Pass: 100%/1   | Total: 18m 49s | Avg: 18m 49s | Max: 18m 49s | Hits:  99%/1215  
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 12m | Avg: 24m 17s | Max: 25m 55s | Hits:  99%/3645  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 03m | Avg: 21m 15s | Max: 22m 45s | Hits:  99%/3645  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total:  1h 12m | Avg: 24m 17s | Max: 28m 41s | Hits:  78%/3645  
  🟩 90;90a;100         Pass: 100%/1   | Total:  1h 06m | Avg:  1h 06m | Max:  1h 06m | Hits:  36%/1215  
🟩 std
  🟩 17                 Pass: 100%/20  | Total: 21h 02m | Avg:  1h 03m | Max:  1h 18m | Hits:  33%/23535 
  🟩 20                 Pass: 100%/25  | Total: 20h 06m | Avg: 48m 14s | Max:  1h 16m | Hits:  56%/29950

🟩 thrust: Pass: 100%/45 | Total: 21h 23m | Avg: 28m 31s | Max: 55m 00s | Hits: 77%/80136

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 34m 46s | Avg: 17m 23s | Max: 23m 42s | Hits:  88%/3564  
🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total: 20h 31m | Avg: 28m 38s | Max: 55m 00s | Hits:  77%/76573 
  🟩 arm64              Pass: 100%/2   | Total: 51m 55s | Avg: 25m 57s | Max: 27m 16s | Hits:  76%/3563  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total:  2h 41m | Avg: 32m 15s | Max: 52m 00s | Hits:  72%/8901  
  🟩 12.5               Pass: 100%/2   | Total:  1h 35m | Avg: 47m 50s | Max: 48m 35s | Hits:  64%/3562  
  🟩 12.8               Pass: 100%/38  | Total: 17h 06m | Avg: 27m 01s | Max: 55m 00s | Hits:  78%/67673 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 49m 31s | Avg: 24m 45s | Max: 24m 50s | Hits:  77%/3562  
  🟩 nvcc12.0           Pass: 100%/5   | Total:  2h 41m | Avg: 32m 15s | Max: 52m 00s | Hits:  72%/8901  
  🟩 nvcc12.5           Pass: 100%/2   | Total:  1h 35m | Avg: 47m 50s | Max: 48m 35s | Hits:  64%/3562  
  🟩 nvcc12.8           Pass: 100%/36  | Total: 16h 17m | Avg: 27m 08s | Max: 55m 00s | Hits:  78%/64111 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 49m 31s | Avg: 24m 45s | Max: 24m 50s | Hits:  77%/3562  
  🟩 nvcc               Pass: 100%/43  | Total: 20h 34m | Avg: 28m 42s | Max: 55m 00s | Hits:  77%/76574 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total:  1h 51m | Avg: 27m 57s | Max: 29m 02s | Hits:  77%/7124  
  🟩 Clang15            Pass: 100%/2   | Total: 54m 50s | Avg: 27m 25s | Max: 27m 54s | Hits:  77%/3562  
  🟩 Clang16            Pass: 100%/2   | Total: 56m 08s | Avg: 28m 04s | Max: 29m 21s | Hits:  77%/3562  
  🟩 Clang17            Pass: 100%/2   | Total: 55m 30s | Avg: 27m 45s | Max: 27m 51s | Hits:  77%/3562  
  🟩 Clang18            Pass: 100%/7   | Total:  2h 26m | Avg: 20m 54s | Max: 28m 03s | Hits:  83%/12467 
  🟩 GCC7               Pass: 100%/2   | Total: 52m 58s | Avg: 26m 29s | Max: 26m 33s | Hits:  76%/3564  
  🟩 GCC8               Pass: 100%/1   | Total: 29m 52s | Avg: 29m 52s | Max: 29m 52s | Hits:  76%/1782  
  🟩 GCC9               Pass: 100%/2   | Total: 56m 07s | Avg: 28m 03s | Max: 28m 19s | Hits:  76%/3564  
  🟩 GCC10              Pass: 100%/2   | Total: 57m 40s | Avg: 28m 50s | Max: 30m 36s | Hits:  76%/3564  
  🟩 GCC11              Pass: 100%/2   | Total: 58m 24s | Avg: 29m 12s | Max: 29m 28s | Hits:  76%/3564  
  🟩 GCC12              Pass: 100%/2   | Total:  1h 03m | Avg: 31m 40s | Max: 32m 38s | Hits:  76%/3564  
  🟩 GCC13              Pass: 100%/10  | Total:  3h 22m | Avg: 20m 15s | Max: 32m 33s | Hits:  86%/17820 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 43m | Avg: 51m 45s | Max: 52m 00s | Hits:  54%/3550  
  🟩 MSVC14.42          Pass: 100%/3   | Total:  2h 18m | Avg: 46m 19s | Max: 55m 00s | Hits:  60%/5325  
  🟩 NVHPC24.7          Pass: 100%/2   | Total:  1h 35m | Avg: 47m 50s | Max: 48m 35s | Hits:  64%/3562  
🟩 cxx_family
  🟩 Clang              Pass: 100%/17  | Total:  7h 04m | Avg: 24m 58s | Max: 29m 21s | Hits:  79%/30277 
  🟩 GCC                Pass: 100%/21  | Total:  8h 40m | Avg: 24m 48s | Max: 32m 38s | Hits:  81%/37422 
  🟩 MSVC               Pass: 100%/5   | Total:  4h 02m | Avg: 48m 30s | Max: 55m 00s | Hits:  58%/8875  
  🟩 NVHPC              Pass: 100%/2   | Total:  1h 35m | Avg: 47m 50s | Max: 48m 35s | Hits:  64%/3562  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 27m 47s | Avg: 13m 53s | Max: 16m 40s | Hits:  88%/3564  
  🟩 rtx2080            Pass: 100%/33  | Total: 17h 23m | Avg: 31m 36s | Max: 54m 21s | Hits:  74%/58769 
  🟩 rtx4090            Pass: 100%/10  | Total:  3h 32m | Avg: 21m 17s | Max: 55m 00s | Hits:  85%/17803 
🟩 jobs
  🟩 Build              Pass: 100%/38  | Total: 19h 54m | Avg: 31m 26s | Max: 55m 00s | Hits:  74%/67671 
  🟩 TestCPU            Pass: 100%/3   | Total: 45m 05s | Avg: 15m 01s | Max: 29m 38s | Hits:  90%/5338  
  🟩 TestGPU            Pass: 100%/4   | Total: 43m 54s | Avg: 10m 58s | Max: 11m 33s | Hits:  99%/7127  
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 27m 47s | Avg: 13m 53s | Max: 16m 40s | Hits:  88%/3564  
  🟩 90;90a;100         Pass: 100%/1   | Total: 32m 33s | Avg: 32m 33s | Max: 32m 33s | Hits:  76%/1782  
🟩 std
  🟩 17                 Pass: 100%/20  | Total: 10h 56m | Avg: 32m 48s | Max: 54m 21s | Hits:  73%/35611 
  🟩 20                 Pass: 100%/23  | Total:  9h 52m | Avg: 25m 46s | Max: 55m 00s | Hits:  80%/40961

🟩 libcudacxx: Pass: 100%/43 | Total: 7h 43m | Avg: 10m 46s | Max: 30m 12s | Hits: 88%/103495

🟩 cpu
  🟩 amd64              Pass: 100%/41  | Total:  7h 30m | Avg: 10m 59s | Max: 30m 12s | Hits:  88%/97818 
  🟩 arm64              Pass: 100%/2   | Total: 12m 43s | Avg:  6m 21s | Max:  6m 30s | Hits:  91%/5677  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 49m 29s | Avg:  9m 53s | Max: 24m 12s | Hits:  92%/13731 
  🟩 12.5               Pass: 100%/2   | Total: 23m 43s | Avg: 11m 51s | Max: 12m 06s | Hits:  91%/5622  
  🟩 12.8               Pass: 100%/36  | Total:  6h 30m | Avg: 10m 50s | Max: 30m 12s | Hits:  87%/84142 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 43m 26s | Avg: 21m 43s | Max: 24m 07s | Hits:  26%/5638  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 49m 29s | Avg:  9m 53s | Max: 24m 12s | Hits:  92%/13731 
  🟩 nvcc12.5           Pass: 100%/2   | Total: 23m 43s | Avg: 11m 51s | Max: 12m 06s | Hits:  91%/5622  
  🟩 nvcc12.8           Pass: 100%/34  | Total:  5h 46m | Avg: 10m 11s | Max: 30m 12s | Hits:  91%/78504 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 43m 26s | Avg: 21m 43s | Max: 24m 07s | Hits:  26%/5638  
  🟩 nvcc               Pass: 100%/41  | Total:  6h 59m | Avg: 10m 14s | Max: 30m 12s | Hits:  91%/97857 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 27m 37s | Avg:  6m 54s | Max:  7m 36s | Hits:  92%/11246 
  🟩 Clang15            Pass: 100%/2   | Total: 15m 28s | Avg:  7m 44s | Max:  8m 20s | Hits:  91%/5634  
  🟩 Clang16            Pass: 100%/2   | Total: 15m 34s | Avg:  7m 47s | Max:  7m 54s | Hits:  92%/5634  
  🟩 Clang17            Pass: 100%/2   | Total: 15m 13s | Avg:  7m 36s | Max:  7m 40s | Hits:  91%/5634  
  🟩 Clang18            Pass: 100%/6   | Total:  1h 18m | Avg: 13m 04s | Max: 24m 07s | Hits:  66%/14110 
  🟩 GCC7               Pass: 100%/2   | Total: 12m 09s | Avg:  6m 04s | Max:  6m 25s | Hits:  91%/5572  
  🟩 GCC8               Pass: 100%/1   | Total:  6m 28s | Avg:  6m 28s | Max:  6m 28s | Hits:  91%/2796  
  🟩 GCC9               Pass: 100%/2   | Total: 13m 30s | Avg:  6m 45s | Max:  6m 58s | Hits:  92%/5584  
  🟩 GCC10              Pass: 100%/2   | Total: 14m 32s | Avg:  7m 16s | Max:  7m 24s | Hits:  92%/5640  
  🟩 GCC11              Pass: 100%/2   | Total: 14m 47s | Avg:  7m 23s | Max:  7m 24s | Hits:  92%/5636  
  🟩 GCC12              Pass: 100%/2   | Total: 15m 12s | Avg:  7m 36s | Max:  7m 38s | Hits:  90%/5636  
  🟩 GCC13              Pass: 100%/10  | Total:  1h 40m | Avg: 10m 04s | Max: 18m 44s | Hits:  91%/14371 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 52m 35s | Avg: 26m 17s | Max: 28m 23s | Hits:  92%/5110  
  🟩 MSVC14.42          Pass: 100%/2   | Total: 57m 08s | Avg: 28m 34s | Max: 30m 12s | Hits:  91%/5270  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 23m 43s | Avg: 11m 51s | Max: 12m 06s | Hits:  91%/5622  
🟩 cxx_family
  🟩 Clang              Pass: 100%/16  | Total:  2h 32m | Avg:  9m 31s | Max: 24m 07s | Hits:  83%/42258 
  🟩 GCC                Pass: 100%/21  | Total:  2h 57m | Avg:  8m 26s | Max: 18m 44s | Hits:  91%/45235 
  🟩 MSVC               Pass: 100%/4   | Total:  1h 49m | Avg: 27m 25s | Max: 30m 12s | Hits:  91%/10380 
  🟩 NVHPC              Pass: 100%/2   | Total: 23m 43s | Avg: 11m 51s | Max: 12m 06s | Hits:  91%/5622  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 18m 26s | Avg:  9m 13s | Max: 13m 03s | Hits:  92%/2928  
  🟩 rtx2080            Pass: 100%/41  | Total:  7h 24m | Avg: 10m 50s | Max: 30m 12s | Hits:  88%/100567
🟩 jobs
  🟩 Build              Pass: 100%/37  | Total:  6h 30m | Avg: 10m 33s | Max: 30m 12s | Hits:  88%/103455
  🟩 NVRTC              Pass: 100%/2   | Total: 34m 14s | Avg: 17m 07s | Max: 18m 44s | Hits:  90%/40    
  🟩 Test               Pass: 100%/3   | Total: 36m 17s | Avg: 12m 05s | Max: 13m 59s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 13s | Avg:  2m 13s | Max:  2m 13s
🟩 sm
  🟩 75                 Pass: 100%/2   | Total: 34m 14s | Avg: 17m 07s | Max: 18m 44s | Hits:  90%/40    
  🟩 90                 Pass: 100%/2   | Total: 18m 26s | Avg:  9m 13s | Max: 13m 03s | Hits:  92%/2928  
  🟩 90;90a;100         Pass: 100%/1   | Total: 16m 11s | Avg: 16m 11s | Max: 16m 11s | Hits:  89%/2928  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  3h 53m | Avg: 11m 07s | Max: 28m 23s | Hits:  88%/55186 
  🟩 20                 Pass: 100%/21  | Total:  3h 47m | Avg: 10m 50s | Max: 30m 12s | Hits:  88%/48309

🟩 cudax: Pass: 100%/22 | Total: 2h 08m | Avg: 5m 49s | Max: 13m 54s | Hits: 96%/11338

🟩 cpu
  🟩 amd64              Pass: 100%/18  | Total:  1h 53m | Avg:  6m 17s | Max: 13m 54s | Hits:  96%/9094  
  🟩 arm64              Pass: 100%/4   | Total: 14m 49s | Avg:  3m 42s | Max:  3m 54s | Hits:  98%/2244  
🟩 ctk
  🟩 12.0               Pass: 100%/1   | Total:  9m 41s | Avg:  9m 41s | Max:  9m 41s | Hits:  60%/262   
  🟩 12.5               Pass: 100%/2   | Total: 12m 47s | Avg:  6m 23s | Max:  6m 37s | Hits:  95%/712   
  🟩 12.8               Pass: 100%/19  | Total:  1h 45m | Avg:  5m 33s | Max: 13m 54s | Hits:  97%/10364 
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/1   | Total:  9m 41s | Avg:  9m 41s | Max:  9m 41s | Hits:  60%/262   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 12m 47s | Avg:  6m 23s | Max:  6m 37s | Hits:  95%/712   
  🟩 nvcc12.8           Pass: 100%/19  | Total:  1h 45m | Avg:  5m 33s | Max: 13m 54s | Hits:  97%/10364 
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/22  | Total:  2h 08m | Avg:  5m 49s | Max: 13m 54s | Hits:  96%/11338 
🟩 cxx
  🟩 Clang14            Pass: 100%/1   | Total:  4m 04s | Avg:  4m 04s | Max:  4m 04s | Hits:  98%/563   
  🟩 Clang15            Pass: 100%/1   | Total:  4m 04s | Avg:  4m 04s | Max:  4m 04s | Hits:  98%/561   
  🟩 Clang16            Pass: 100%/1   | Total:  3m 58s | Avg:  3m 58s | Max:  3m 58s | Hits:  98%/561   
  🟩 Clang17            Pass: 100%/1   | Total:  4m 07s | Avg:  4m 07s | Max:  4m 07s | Hits:  98%/561   
  🟩 Clang18            Pass: 100%/4   | Total: 23m 02s | Avg:  5m 45s | Max: 11m 47s | Hits:  98%/2244  
  🟩 GCC10              Pass: 100%/1   | Total:  3m 56s | Avg:  3m 56s | Max:  3m 56s | Hits:  98%/563   
  🟩 GCC11              Pass: 100%/1   | Total:  4m 12s | Avg:  4m 12s | Max:  4m 12s | Hits:  98%/561   
  🟩 GCC12              Pass: 100%/2   | Total: 16m 25s | Avg:  8m 12s | Max: 12m 09s | Hits:  98%/1122  
  🟩 GCC13              Pass: 100%/6   | Total: 32m 12s | Avg:  5m 22s | Max: 13m 54s | Hits:  98%/3366  
  🟩 MSVC14.39          Pass: 100%/1   | Total:  9m 41s | Avg:  9m 41s | Max:  9m 41s | Hits:  60%/262   
  🟩 MSVC14.42          Pass: 100%/1   | Total:  9m 35s | Avg:  9m 35s | Max:  9m 35s | Hits:  60%/262   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 12m 47s | Avg:  6m 23s | Max:  6m 37s | Hits:  95%/712   
🟩 cxx_family
  🟩 Clang              Pass: 100%/8   | Total: 39m 15s | Avg:  4m 54s | Max: 11m 47s | Hits:  98%/4490  
  🟩 GCC                Pass: 100%/10  | Total: 56m 45s | Avg:  5m 40s | Max: 13m 54s | Hits:  98%/5612  
  🟩 MSVC               Pass: 100%/2   | Total: 19m 16s | Avg:  9m 38s | Max:  9m 41s | Hits:  60%/524   
  🟩 NVHPC              Pass: 100%/2   | Total: 12m 47s | Avg:  6m 23s | Max:  6m 37s | Hits:  95%/712   
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 17m 24s | Avg:  8m 42s | Max: 13m 54s | Hits:  98%/1122  
  🟩 rtx2080            Pass: 100%/20  | Total:  1h 50m | Avg:  5m 31s | Max: 12m 09s | Hits:  96%/10216 
🟩 jobs
  🟩 Build              Pass: 100%/19  | Total:  1h 30m | Avg:  4m 44s | Max:  9m 41s | Hits:  96%/9655  
  🟩 Test               Pass: 100%/3   | Total: 37m 50s | Avg: 12m 36s | Max: 13m 54s | Hits:  99%/1683  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total: 20m 55s | Avg:  6m 58s | Max: 13m 54s | Hits:  98%/1683  
  🟩 90a                Pass: 100%/1   | Total:  3m 35s | Avg:  3m 35s | Max:  3m 35s | Hits:  98%/561   
🟩 std
  🟩 17                 Pass: 100%/4   | Total: 17m 27s | Avg:  4m 21s | Max:  6m 37s | Hits:  97%/2039  
  🟩 20                 Pass: 100%/18  | Total:  1h 50m | Avg:  6m 08s | Max: 13m 54s | Hits:  96%/9299

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 15m 31s | Avg: 7m 45s | Max: 12m 54s | Hits: 97%/308

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 15m 31s | Avg:  7m 45s | Max: 12m 54s | Hits:  97%/308   
🟩 ctk
  🟩 12.8               Pass: 100%/2   | Total: 15m 31s | Avg:  7m 45s | Max: 12m 54s | Hits:  97%/308   
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/2   | Total: 15m 31s | Avg:  7m 45s | Max: 12m 54s | Hits:  97%/308   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 15m 31s | Avg:  7m 45s | Max: 12m 54s | Hits:  97%/308   
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 15m 31s | Avg:  7m 45s | Max: 12m 54s | Hits:  97%/308   
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 15m 31s | Avg:  7m 45s | Max: 12m 54s | Hits:  97%/308   
🟩 gpu
  🟩 rtx2080            Pass: 100%/2   | Total: 15m 31s | Avg:  7m 45s | Max: 12m 54s | Hits:  97%/308   
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 37s | Avg:  2m 37s | Max:  2m 37s | Hits:  96%/154   
  🟩 Test               Pass: 100%/1   | Total: 12m 54s | Avg: 12m 54s | Max: 12m 54s | Hits:  98%/154

🟩 python: Pass: 100%/1 | Total: 51m 53s | Avg: 51m 53s | Max: 51m 53s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 51m 53s | Avg: 51m 53s | Max: 51m 53s
🟩 ctk
  🟩 12.8               Pass: 100%/1   | Total: 51m 53s | Avg: 51m 53s | Max: 51m 53s
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/1   | Total: 51m 53s | Avg: 51m 53s | Max: 51m 53s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 51m 53s | Avg: 51m 53s | Max: 51m 53s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 51m 53s | Avg: 51m 53s | Max: 51m 53s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 51m 53s | Avg: 51m 53s | Max: 51m 53s
🟩 gpu
  🟩 rtx2080            Pass: 100%/1   | Total: 51m 53s | Avg: 51m 53s | Max: 51m 53s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 51m 53s | Avg: 51m 53s | Max: 51m 53s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 158)

#	Runner
111	`linux-amd64-cpu16`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
8	`linux-amd64-gpu-rtx2080-latest-1`
6	`linux-amd64-gpu-rtxa6000-latest-1`
5	`linux-amd64-gpu-h100-latest-1`
3	`linux-amd64-gpu-rtx4090-latest-1`

libcudacxx/include/cuda/std/__bit/integral.h

github-actions · 2025-02-26T11:14:09Z

🟩 CI finished in 1h 33m: Pass: 100%/158 | Total: 3d 00h | Avg: 27m 27s | Max: 1h 18m | Hits: 76%/248762

🟩 cub: Pass: 100%/45 | Total: 1d 16h | Avg: 54m 21s | Max: 1h 18m | Hits: 46%/53485

🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total:  1d 14h | Avg: 53m 58s | Max:  1h 18m | Hits:  46%/51055 
  🟩 arm64              Pass: 100%/2   | Total:  2h 05m | Avg:  1h 02m | Max:  1h 04m | Hits:  37%/2430  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total:  5h 02m | Avg:  1h 00m | Max:  1h 03m | Hits:  32%/5908  
  🟩 12.5               Pass: 100%/2   | Total:  2h 18m | Avg:  1h 09m | Max:  1h 11m | Hits:  34%/2248  
  🟩 12.8               Pass: 100%/38  | Total:  1d 09h | Avg: 52m 45s | Max:  1h 18m | Hits:  48%/45329 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total:  2h 08m | Avg:  1h 04m | Max:  1h 05m | Hits:  38%/2100  
  🟩 nvcc12.0           Pass: 100%/5   | Total:  5h 02m | Avg:  1h 00m | Max:  1h 03m | Hits:  32%/5908  
  🟩 nvcc12.5           Pass: 100%/2   | Total:  2h 18m | Avg:  1h 09m | Max:  1h 11m | Hits:  34%/2248  
  🟩 nvcc12.8           Pass: 100%/36  | Total:  1d 07h | Avg: 52m 07s | Max:  1h 18m | Hits:  49%/43229 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  2h 08m | Avg:  1h 04m | Max:  1h 05m | Hits:  38%/2100  
  🟩 nvcc               Pass: 100%/43  | Total:  1d 14h | Avg: 53m 54s | Max:  1h 18m | Hits:  46%/51385 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total:  3h 55m | Avg: 58m 53s | Max:  1h 00m | Hits:  37%/4868  
  🟩 Clang15            Pass: 100%/2   | Total:  1h 59m | Avg: 59m 48s | Max:  1h 01m | Hits:  37%/2430  
  🟩 Clang16            Pass: 100%/2   | Total:  1h 55m | Avg: 57m 55s | Max: 58m 02s | Hits:  37%/2430  
  🟩 Clang17            Pass: 100%/2   | Total:  1h 57m | Avg: 58m 48s | Max:  1h 00m | Hits:  37%/2430  
  🟩 Clang18            Pass: 100%/7   | Total:  5h 53m | Avg: 50m 26s | Max:  1h 05m | Hits:  56%/8175  
  🟩 GCC7               Pass: 100%/2   | Total:  1h 53m | Avg: 56m 38s | Max: 57m 05s | Hits:  36%/2434  
  🟩 GCC8               Pass: 100%/1   | Total: 58m 09s | Avg: 58m 09s | Max: 58m 09s | Hits:  37%/1217  
  🟩 GCC9               Pass: 100%/2   | Total:  2h 04m | Avg:  1h 02m | Max:  1h 03m | Hits:  37%/2434  
  🟩 GCC10              Pass: 100%/2   | Total:  2h 01m | Avg:  1h 00m | Max:  1h 03m | Hits:  37%/2434  
  🟩 GCC11              Pass: 100%/2   | Total:  1h 57m | Avg: 58m 41s | Max: 59m 05s | Hits:  36%/2430  
  🟩 GCC12              Pass: 100%/2   | Total:  2h 10m | Avg:  1h 05m | Max:  1h 06m | Hits:  36%/2430  
  🟩 GCC13              Pass: 100%/11  | Total:  6h 53m | Avg: 37m 35s | Max:  1h 09m | Hits:  71%/13365 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  2h 14m | Avg:  1h 07m | Max:  1h 10m | Hits:  12%/2080  
  🟩 MSVC14.42          Pass: 100%/2   | Total:  2h 32m | Avg:  1h 16m | Max:  1h 18m | Hits:  12%/2080  
  🟩 NVHPC24.7          Pass: 100%/2   | Total:  2h 18m | Avg:  1h 09m | Max:  1h 11m | Hits:  34%/2248  
🟩 cxx_family
  🟩 Clang              Pass: 100%/17  | Total: 15h 41m | Avg: 55m 23s | Max:  1h 05m | Hits:  44%/20333 
  🟩 GCC                Pass: 100%/22  | Total: 17h 58m | Avg: 49m 00s | Max:  1h 09m | Hits:  54%/26744 
  🟩 MSVC               Pass: 100%/4   | Total:  4h 47m | Avg:  1h 11m | Max:  1h 18m | Hits:  12%/4160  
  🟩 NVHPC              Pass: 100%/2   | Total:  2h 18m | Avg:  1h 09m | Max:  1h 11m | Hits:  34%/2248  
🟩 gpu
  🟩 h100               Pass: 100%/3   | Total:  1h 12m | Avg: 24m 04s | Max: 26m 05s | Hits:  78%/3645  
  🟩 rtx2080            Pass: 100%/34  | Total:  1d 11h | Avg:  1h 02m | Max:  1h 18m | Hits:  34%/40120 
  🟩 rtxa6000           Pass: 100%/8   | Total:  4h 04m | Avg: 30m 33s | Max:  1h 00m | Hits:  84%/9720  
🟩 jobs
  🟩 Build              Pass: 100%/37  | Total:  1d 13h | Avg:  1h 01m | Max:  1h 18m | Hits:  34%/43765 
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 21m 33s | Avg: 21m 33s | Max: 21m 33s | Hits:  99%/1215  
  🟩 GraphCapture       Pass: 100%/1   | Total: 16m 50s | Avg: 16m 50s | Max: 16m 50s | Hits:  99%/1215  
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 09m | Avg: 23m 17s | Max: 24m 28s | Hits:  99%/3645  
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 02m | Avg: 20m 52s | Max: 21m 41s | Hits:  99%/3645  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total:  1h 12m | Avg: 24m 04s | Max: 26m 05s | Hits:  78%/3645  
  🟩 90;90a;100         Pass: 100%/1   | Total:  1h 09m | Avg:  1h 09m | Max:  1h 09m | Hits:  36%/1215  
🟩 std
  🟩 17                 Pass: 100%/20  | Total: 20h 47m | Avg:  1h 02m | Max:  1h 18m | Hits:  33%/23535 
  🟩 20                 Pass: 100%/25  | Total: 19h 59m | Avg: 47m 57s | Max:  1h 14m | Hits:  56%/29950

🟩 thrust: Pass: 100%/45 | Total: 20h 57m | Avg: 27m 56s | Max: 55m 24s | Hits: 77%/80136

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 34m 00s | Avg: 17m 00s | Max: 22m 52s | Hits:  88%/3564  
🟩 cpu
  🟩 amd64              Pass: 100%/43  | Total: 20h 04m | Avg: 28m 00s | Max: 55m 24s | Hits:  77%/76573 
  🟩 arm64              Pass: 100%/2   | Total: 52m 41s | Avg: 26m 20s | Max: 27m 54s | Hits:  76%/3563  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total:  2h 42m | Avg: 32m 24s | Max: 50m 00s | Hits:  72%/8901  
  🟩 12.5               Pass: 100%/2   | Total:  1h 33m | Avg: 46m 37s | Max: 47m 05s | Hits:  64%/3562  
  🟩 12.8               Pass: 100%/38  | Total: 16h 41m | Avg: 26m 21s | Max: 55m 24s | Hits:  78%/67673 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 48m 05s | Avg: 24m 02s | Max: 25m 15s | Hits:  77%/3562  
  🟩 nvcc12.0           Pass: 100%/5   | Total:  2h 42m | Avg: 32m 24s | Max: 50m 00s | Hits:  72%/8901  
  🟩 nvcc12.5           Pass: 100%/2   | Total:  1h 33m | Avg: 46m 37s | Max: 47m 05s | Hits:  64%/3562  
  🟩 nvcc12.8           Pass: 100%/36  | Total: 15h 53m | Avg: 26m 29s | Max: 55m 24s | Hits:  78%/64111 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 48m 05s | Avg: 24m 02s | Max: 25m 15s | Hits:  77%/3562  
  🟩 nvcc               Pass: 100%/43  | Total: 20h 08m | Avg: 28m 06s | Max: 55m 24s | Hits:  77%/76574 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total:  1h 50m | Avg: 27m 39s | Max: 28m 22s | Hits:  77%/7124  
  🟩 Clang15            Pass: 100%/2   | Total: 53m 52s | Avg: 26m 56s | Max: 27m 05s | Hits:  77%/3562  
  🟩 Clang16            Pass: 100%/2   | Total: 53m 31s | Avg: 26m 45s | Max: 26m 55s | Hits:  77%/3562  
  🟩 Clang17            Pass: 100%/2   | Total: 53m 57s | Avg: 26m 58s | Max: 27m 06s | Hits:  77%/3562  
  🟩 Clang18            Pass: 100%/7   | Total:  2h 21m | Avg: 20m 16s | Max: 26m 24s | Hits:  83%/12467 
  🟩 GCC7               Pass: 100%/2   | Total: 53m 41s | Avg: 26m 50s | Max: 27m 01s | Hits:  76%/3564  
  🟩 GCC8               Pass: 100%/1   | Total: 26m 11s | Avg: 26m 11s | Max: 26m 11s | Hits:  76%/1782  
  🟩 GCC9               Pass: 100%/2   | Total: 58m 33s | Avg: 29m 16s | Max: 30m 22s | Hits:  76%/3564  
  🟩 GCC10              Pass: 100%/2   | Total: 59m 57s | Avg: 29m 58s | Max: 31m 16s | Hits:  76%/3564  
  🟩 GCC11              Pass: 100%/2   | Total: 55m 21s | Avg: 27m 40s | Max: 27m 58s | Hits:  76%/3564  
  🟩 GCC12              Pass: 100%/2   | Total: 57m 49s | Avg: 28m 54s | Max: 29m 11s | Hits:  76%/3564  
  🟩 GCC13              Pass: 100%/10  | Total:  3h 22m | Avg: 20m 16s | Max: 32m 42s | Hits:  86%/17820 
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 38m | Avg: 49m 16s | Max: 50m 00s | Hits:  54%/3550  
  🟩 MSVC14.42          Pass: 100%/3   | Total:  2h 17m | Avg: 45m 41s | Max: 55m 24s | Hits:  60%/5325  
  🟩 NVHPC24.7          Pass: 100%/2   | Total:  1h 33m | Avg: 46m 37s | Max: 47m 05s | Hits:  64%/3562  
🟩 cxx_family
  🟩 Clang              Pass: 100%/17  | Total:  6h 53m | Avg: 24m 20s | Max: 28m 22s | Hits:  79%/30277 
  🟩 GCC                Pass: 100%/21  | Total:  8h 34m | Avg: 24m 29s | Max: 32m 42s | Hits:  81%/37422 
  🟩 MSVC               Pass: 100%/5   | Total:  3h 55m | Avg: 47m 07s | Max: 55m 24s | Hits:  58%/8875  
  🟩 NVHPC              Pass: 100%/2   | Total:  1h 33m | Avg: 46m 37s | Max: 47m 05s | Hits:  64%/3562  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 27m 40s | Avg: 13m 50s | Max: 16m 13s | Hits:  88%/3564  
  🟩 rtx2080            Pass: 100%/33  | Total: 16h 50m | Avg: 30m 37s | Max: 50m 00s | Hits:  74%/58769 
  🟩 rtx4090            Pass: 100%/10  | Total:  3h 38m | Avg: 21m 50s | Max: 55m 24s | Hits:  85%/17803 
🟩 jobs
  🟩 Build              Pass: 100%/38  | Total: 19h 24m | Avg: 30m 38s | Max: 55m 24s | Hits:  74%/67671 
  🟩 TestCPU            Pass: 100%/3   | Total: 48m 14s | Avg: 16m 04s | Max: 32m 35s | Hits:  90%/5338  
  🟩 TestGPU            Pass: 100%/4   | Total: 44m 19s | Avg: 11m 04s | Max: 11m 30s | Hits:  99%/7127  
🟩 sm
  🟩 90                 Pass: 100%/2   | Total: 27m 40s | Avg: 13m 50s | Max: 16m 13s | Hits:  88%/3564  
  🟩 90;90a;100         Pass: 100%/1   | Total: 30m 26s | Avg: 30m 26s | Max: 30m 26s | Hits:  76%/1782  
🟩 std
  🟩 17                 Pass: 100%/20  | Total: 10h 35m | Avg: 31m 47s | Max: 50m 00s | Hits:  73%/35611 
  🟩 20                 Pass: 100%/23  | Total:  9h 47m | Avg: 25m 31s | Max: 55m 24s | Hits:  80%/40961

🟩 libcudacxx: Pass: 100%/43 | Total: 7h 14m | Avg: 10m 06s | Max: 26m 44s | Hits: 88%/103495

🟩 cpu
  🟩 amd64              Pass: 100%/41  | Total:  7h 02m | Avg: 10m 18s | Max: 26m 44s | Hits:  88%/97818 
  🟩 arm64              Pass: 100%/2   | Total: 12m 05s | Avg:  6m 02s | Max:  6m 12s | Hits:  92%/5677  
🟩 ctk
  🟩 12.0               Pass: 100%/5   | Total: 48m 25s | Avg:  9m 41s | Max: 23m 48s | Hits:  92%/13731 
  🟩 12.5               Pass: 100%/2   | Total: 23m 39s | Avg: 11m 49s | Max: 12m 06s | Hits:  92%/5622  
  🟩 12.8               Pass: 100%/36  | Total:  6h 02m | Avg: 10m 04s | Max: 26m 44s | Hits:  88%/84142 
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/2   | Total: 40m 49s | Avg: 20m 24s | Max: 21m 50s | Hits:  26%/5638  
  🟩 nvcc12.0           Pass: 100%/5   | Total: 48m 25s | Avg:  9m 41s | Max: 23m 48s | Hits:  92%/13731 
  🟩 nvcc12.5           Pass: 100%/2   | Total: 23m 39s | Avg: 11m 49s | Max: 12m 06s | Hits:  92%/5622  
  🟩 nvcc12.8           Pass: 100%/34  | Total:  5h 21m | Avg:  9m 27s | Max: 26m 44s | Hits:  92%/78504 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 40m 49s | Avg: 20m 24s | Max: 21m 50s | Hits:  26%/5638  
  🟩 nvcc               Pass: 100%/41  | Total:  6h 33m | Avg:  9m 36s | Max: 26m 44s | Hits:  92%/97857 
🟩 cxx
  🟩 Clang14            Pass: 100%/4   | Total: 27m 42s | Avg:  6m 55s | Max:  7m 54s | Hits:  92%/11246 
  🟩 Clang15            Pass: 100%/2   | Total: 14m 02s | Avg:  7m 01s | Max:  7m 07s | Hits:  92%/5634  
  🟩 Clang16            Pass: 100%/2   | Total: 14m 27s | Avg:  7m 13s | Max:  7m 28s | Hits:  92%/5634  
  🟩 Clang17            Pass: 100%/2   | Total: 15m 04s | Avg:  7m 32s | Max:  7m 38s | Hits:  92%/5634  
  🟩 Clang18            Pass: 100%/6   | Total:  1h 16m | Avg: 12m 46s | Max: 21m 50s | Hits:  66%/14110 
  🟩 GCC7               Pass: 100%/2   | Total: 11m 50s | Avg:  5m 55s | Max:  6m 27s | Hits:  92%/5572  
  🟩 GCC8               Pass: 100%/1   | Total:  5m 52s | Avg:  5m 52s | Max:  5m 52s | Hits:  92%/2796  
  🟩 GCC9               Pass: 100%/2   | Total: 13m 48s | Avg:  6m 54s | Max:  7m 09s | Hits:  92%/5584  
  🟩 GCC10              Pass: 100%/2   | Total: 14m 04s | Avg:  7m 02s | Max:  7m 15s | Hits:  92%/5640  
  🟩 GCC11              Pass: 100%/2   | Total: 13m 09s | Avg:  6m 34s | Max:  6m 36s | Hits:  92%/5636  
  🟩 GCC12              Pass: 100%/2   | Total: 13m 21s | Avg:  6m 40s | Max:  6m 44s | Hits:  92%/5636  
  🟩 GCC13              Pass: 100%/10  | Total:  1h 29m | Avg:  8m 55s | Max: 17m 15s | Hits:  92%/14371 
  🟩 MSVC14.29          Pass: 100%/2   | Total: 49m 59s | Avg: 24m 59s | Max: 26m 11s | Hits:  92%/5110  
  🟩 MSVC14.42          Pass: 100%/2   | Total: 51m 52s | Avg: 25m 56s | Max: 26m 44s | Hits:  92%/5270  
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 23m 39s | Avg: 11m 49s | Max: 12m 06s | Hits:  92%/5622  
🟩 cxx_family
  🟩 Clang              Pass: 100%/16  | Total:  2h 27m | Avg:  9m 14s | Max: 21m 50s | Hits:  83%/42258 
  🟩 GCC                Pass: 100%/21  | Total:  2h 41m | Avg:  7m 40s | Max: 17m 15s | Hits:  92%/45235 
  🟩 MSVC               Pass: 100%/4   | Total:  1h 41m | Avg: 25m 27s | Max: 26m 44s | Hits:  92%/10380 
  🟩 NVHPC              Pass: 100%/2   | Total: 23m 39s | Avg: 11m 49s | Max: 12m 06s | Hits:  92%/5622  
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 19m 02s | Avg:  9m 31s | Max: 13m 34s | Hits:  92%/2928  
  🟩 rtx2080            Pass: 100%/41  | Total:  6h 55m | Avg: 10m 08s | Max: 26m 44s | Hits:  88%/100567
🟩 jobs
  🟩 Build              Pass: 100%/37  | Total:  6h 02m | Avg:  9m 48s | Max: 26m 44s | Hits:  88%/103455
  🟩 NVRTC              Pass: 100%/2   | Total: 32m 01s | Avg: 16m 00s | Max: 17m 15s | Hits:  90%/40    
  🟩 Test               Pass: 100%/3   | Total: 37m 33s | Avg: 12m 31s | Max: 15m 07s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 20s | Avg:  2m 20s | Max:  2m 20s
🟩 sm
  🟩 75                 Pass: 100%/2   | Total: 32m 01s | Avg: 16m 00s | Max: 17m 15s | Hits:  90%/40    
  🟩 90                 Pass: 100%/2   | Total: 19m 02s | Avg:  9m 31s | Max: 13m 34s | Hits:  92%/2928  
  🟩 90;90a;100         Pass: 100%/1   | Total:  6m 57s | Avg:  6m 57s | Max:  6m 57s | Hits:  92%/2928  
🟩 std
  🟩 17                 Pass: 100%/21  | Total:  3h 45m | Avg: 10m 43s | Max: 26m 11s | Hits:  89%/55186 
  🟩 20                 Pass: 100%/21  | Total:  3h 27m | Avg:  9m 51s | Max: 26m 44s | Hits:  88%/48309

🟩 cudax: Pass: 100%/22 | Total: 2h 12m | Avg: 6m 01s | Max: 14m 43s | Hits: 96%/11338

🟩 cpu
  🟩 amd64              Pass: 100%/18  | Total:  1h 57m | Avg:  6m 32s | Max: 14m 43s | Hits:  96%/9094  
  🟩 arm64              Pass: 100%/4   | Total: 14m 38s | Avg:  3m 39s | Max:  3m 44s | Hits:  98%/2244  
🟩 ctk
  🟩 12.0               Pass: 100%/1   | Total: 11m 00s | Avg: 11m 00s | Max: 11m 00s | Hits:  60%/262   
  🟩 12.5               Pass: 100%/2   | Total: 12m 24s | Avg:  6m 12s | Max:  6m 26s | Hits:  95%/712   
  🟩 12.8               Pass: 100%/19  | Total:  1h 49m | Avg:  5m 44s | Max: 14m 43s | Hits:  97%/10364 
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/1   | Total: 11m 00s | Avg: 11m 00s | Max: 11m 00s | Hits:  60%/262   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 12m 24s | Avg:  6m 12s | Max:  6m 26s | Hits:  95%/712   
  🟩 nvcc12.8           Pass: 100%/19  | Total:  1h 49m | Avg:  5m 44s | Max: 14m 43s | Hits:  97%/10364 
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/22  | Total:  2h 12m | Avg:  6m 01s | Max: 14m 43s | Hits:  96%/11338 
🟩 cxx
  🟩 Clang14            Pass: 100%/1   | Total:  3m 58s | Avg:  3m 58s | Max:  3m 58s | Hits:  98%/563   
  🟩 Clang15            Pass: 100%/1   | Total:  4m 19s | Avg:  4m 19s | Max:  4m 19s | Hits:  98%/561   
  🟩 Clang16            Pass: 100%/1   | Total:  4m 03s | Avg:  4m 03s | Max:  4m 03s | Hits:  98%/561   
  🟩 Clang17            Pass: 100%/1   | Total:  4m 11s | Avg:  4m 11s | Max:  4m 11s | Hits:  98%/561   
  🟩 Clang18            Pass: 100%/4   | Total: 23m 22s | Avg:  5m 50s | Max: 11m 58s | Hits:  98%/2244  
  🟩 GCC10              Pass: 100%/1   | Total:  3m 56s | Avg:  3m 56s | Max:  3m 56s | Hits:  98%/563   
  🟩 GCC11              Pass: 100%/1   | Total:  4m 08s | Avg:  4m 08s | Max:  4m 08s | Hits:  98%/561   
  🟩 GCC12              Pass: 100%/2   | Total: 18m 57s | Avg:  9m 28s | Max: 14m 43s | Hits:  98%/1122  
  🟩 GCC13              Pass: 100%/6   | Total: 32m 03s | Avg:  5m 20s | Max: 14m 02s | Hits:  98%/3366  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 11m 00s | Avg: 11m 00s | Max: 11m 00s | Hits:  60%/262   
  🟩 MSVC14.42          Pass: 100%/1   | Total: 10m 03s | Avg: 10m 03s | Max: 10m 03s | Hits:  60%/262   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 12m 24s | Avg:  6m 12s | Max:  6m 26s | Hits:  95%/712   
🟩 cxx_family
  🟩 Clang              Pass: 100%/8   | Total: 39m 53s | Avg:  4m 59s | Max: 11m 58s | Hits:  98%/4490  
  🟩 GCC                Pass: 100%/10  | Total: 59m 04s | Avg:  5m 54s | Max: 14m 43s | Hits:  98%/5612  
  🟩 MSVC               Pass: 100%/2   | Total: 21m 03s | Avg: 10m 31s | Max: 11m 00s | Hits:  60%/524   
  🟩 NVHPC              Pass: 100%/2   | Total: 12m 24s | Avg:  6m 12s | Max:  6m 26s | Hits:  95%/712   
🟩 gpu
  🟩 h100               Pass: 100%/2   | Total: 17m 36s | Avg:  8m 48s | Max: 14m 02s | Hits:  98%/1122  
  🟩 rtx2080            Pass: 100%/20  | Total:  1h 54m | Avg:  5m 44s | Max: 14m 43s | Hits:  96%/10216 
🟩 jobs
  🟩 Build              Pass: 100%/19  | Total:  1h 31m | Avg:  4m 49s | Max: 11m 00s | Hits:  96%/9655  
  🟩 Test               Pass: 100%/3   | Total: 40m 43s | Avg: 13m 34s | Max: 14m 43s | Hits:  99%/1683  
🟩 sm
  🟩 90                 Pass: 100%/3   | Total: 21m 01s | Avg:  7m 00s | Max: 14m 02s | Hits:  98%/1683  
  🟩 90a                Pass: 100%/1   | Total:  3m 35s | Avg:  3m 35s | Max:  3m 35s | Hits:  98%/561   
🟩 std
  🟩 17                 Pass: 100%/4   | Total: 16m 38s | Avg:  4m 09s | Max:  5m 58s | Hits:  97%/2039  
  🟩 20                 Pass: 100%/18  | Total:  1h 55m | Avg:  6m 25s | Max: 14m 43s | Hits:  96%/9299

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 15m 24s | Avg: 7m 42s | Max: 12m 53s | Hits: 97%/308

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 53s | Hits:  97%/308   
🟩 ctk
  🟩 12.8               Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 53s | Hits:  97%/308   
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 53s | Hits:  97%/308   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 53s | Hits:  97%/308   
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 53s | Hits:  97%/308   
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 53s | Hits:  97%/308   
🟩 gpu
  🟩 rtx2080            Pass: 100%/2   | Total: 15m 24s | Avg:  7m 42s | Max: 12m 53s | Hits:  97%/308   
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 31s | Avg:  2m 31s | Max:  2m 31s | Hits:  96%/154   
  🟩 Test               Pass: 100%/1   | Total: 12m 53s | Avg: 12m 53s | Max: 12m 53s | Hits:  98%/154

🟩 python: Pass: 100%/1 | Total: 51m 25s | Avg: 51m 25s | Max: 51m 25s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 51m 25s | Avg: 51m 25s | Max: 51m 25s
🟩 ctk
  🟩 12.8               Pass: 100%/1   | Total: 51m 25s | Avg: 51m 25s | Max: 51m 25s
🟩 cudacxx
  🟩 nvcc12.8           Pass: 100%/1   | Total: 51m 25s | Avg: 51m 25s | Max: 51m 25s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 51m 25s | Avg: 51m 25s | Max: 51m 25s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 51m 25s | Avg: 51m 25s | Max: 51m 25s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 51m 25s | Avg: 51m 25s | Max: 51m 25s
🟩 gpu
  🟩 rtx2080            Pass: 100%/1   | Total: 51m 25s | Avg: 51m 25s | Max: 51m 25s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 51m 25s | Avg: 51m 25s | Max: 51m 25s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 158)

#	Runner
111	`linux-amd64-cpu16`
15	`windows-amd64-cpu16`
10	`linux-arm64-cpu16`
8	`linux-amd64-gpu-rtx2080-latest-1`
6	`linux-amd64-gpu-rtxa6000-latest-1`
5	`linux-amd64-gpu-h100-latest-1`
3	`linux-amd64-gpu-rtx4090-latest-1`

fbusato added 2 commits January 9, 2025 00:10

optimize bit_floor, bit_ceil, bit_width

2aeb329

document performance considerations

187ff31

fbusato requested review from a team as code owners January 9, 2025 00:12

fbusato requested review from wmaxey and griwes January 9, 2025 00:12

fbusato changed the title ~~Optimize bit_floor, bit_ceil, bit_width~~ [DO NOT MERGE] Optimize bit_floor, bit_ceil, bit_width Jan 9, 2025

miscco reviewed Jan 9, 2025

View reviewed changes

fbusato and others added 3 commits January 9, 2025 09:52

Update libcudacxx/include/cuda/std/__type_traits/is_unsigned_integer.h

5f40fc1

Co-authored-by: Michael Schellenberger Costa <[email protected]>

use default macro for builtin_assume and avoid integer promotion

294222b

Merge branch 'main' into optmize-bit-width-ceil-floor

4d9fa39

fbusato self-assigned this Jan 15, 2025

wmaxey reviewed Jan 15, 2025

View reviewed changes

libcudacxx/include/cuda/std/__bit/integral.h Outdated Show resolved Hide resolved

Update libcudacxx/include/cuda/std/__bit/integral.h

31743f8

Co-authored-by: Wesley Maxey <[email protected]>

fbusato requested a review from a team as a code owner January 15, 2025 23:37

fbusato added 3 commits January 15, 2025 16:58

revert __cccl_is_unsigned_integer_v to avoid conflict

079780e

remove bfind

66a0710

simplify the logic

2dce21e

fbusato added the 3.0 Targeted for 3.0 release label Jan 16, 2025

fbusato and others added 2 commits January 24, 2025 11:09

Merge branch 'main' into optmize-bit-width-ceil-floor

977a355

clean up

499b4f6

fbusato changed the title ~~[DO NOT MERGE] Optimize bit_floor, bit_ceil, bit_width~~ Optimize bit_floor, bit_ceil, bit_width Jan 24, 2025

fbusato added the blocked This PR cannot be merged due to various reasons label Feb 14, 2025

fbusato and others added 2 commits February 21, 2025 12:28

Merge branch 'main' into optmize-bit-width-ceil-floor

573fb29

revert bit documentation

6c3b6e7

simplify the code

f6091f6

fix MSVC warning

cba67a2

miscco requested changes Feb 24, 2025

View reviewed changes

fbusato changed the title ~~Optimize bit_floor, bit_ceil, bit_width~~ [BLOCKED] Optimize bit_floor, bit_ceil, bit_width Feb 25, 2025

fbusato and others added 2 commits February 25, 2025 14:33

Merge branch 'main' into optmize-bit-width-ceil-floor

3d0ded9

add PTX shl and shr

fc0e646

fbusato changed the title ~~[BLOCKED] Optimize bit_floor, bit_ceil, bit_width~~ Optimize bit_floor, bit_ceil, bit_width Feb 25, 2025

fbusato requested a review from miscco February 25, 2025 23:10

fbusato removed the blocked This PR cannot be merged due to various reasons label Feb 26, 2025

miscco requested changes Feb 26, 2025

View reviewed changes

libcudacxx/include/cuda/std/__bit/integral.h Outdated Show resolved Hide resolved

Use proper return type

bacdd2b

miscco approved these changes Feb 26, 2025

View reviewed changes

fbusato merged commit 00b545b into NVIDIA:main Feb 26, 2025
170 of 173 checks passed

		// #include <cuda/__ptx/instructions/shl.h>
		// #include <cuda/__ptx/instructions/shr.h>

Optimize bit_floor, bit_ceil, bit_width #3296

Optimize bit_floor, bit_ceil, bit_width #3296

Conversation

fbusato commented Jan 9, 2025 • edited Loading

Description

github-actions bot commented Feb 21, 2025

🟨 cub: Pass: 6%/45 | Total: 20h 12m | Avg: 26m 56s | Max: 1h 11m | Hits: 12%/3120

🟨 libcudacxx: Pass: 2%/43 | Total: 7h 41m | Avg: 10m 43s | Max: 28m 30s

🟨 thrust: Pass: 91%/45 | Total: 21h 48m | Avg: 29m 04s | Max: 1h 04m | Hits: 57%/73024

🟨 cudax: Pass: 90%/22 | Total: 2h 10m | Avg: 5m 55s | Max: 13m 43s | Hits: 98%/10740

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 15m 24s | Avg: 7m 42s | Max: 12m 48s | Hits: 97%/308

🟩 python: Pass: 100%/1 | Total: 39m 59s | Avg: 39m 59s | Max: 39m 59s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 158)

github-actions bot commented Feb 22, 2025

🟨 libcudacxx: Pass: 90%/43 | Total: 9h 33m | Avg: 13m 19s | Max: 34m 06s | Hits: 75%/92787

🟩 cub: Pass: 100%/45 | Total: 1d 17h | Avg: 54m 46s | Max: 1h 26m | Hits: 46%/53485

🟩 thrust: Pass: 100%/45 | Total: 21h 20m | Avg: 28m 27s | Max: 59m 50s | Hits: 76%/80136

🟩 cudax: Pass: 100%/22 | Total: 2h 13m | Avg: 6m 03s | Max: 17m 58s | Hits: 96%/11264

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 14m 44s | Avg: 7m 22s | Max: 12m 17s | Hits: 97%/308

🟩 python: Pass: 100%/1 | Total: 40m 55s | Avg: 40m 55s | Max: 40m 55s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 158)

github-actions bot commented Feb 22, 2025

🟩 cub: Pass: 100%/45 | Total: 1d 16h | Avg: 54m 08s | Max: 1h 17m | Hits: 46%/53485

🟩 thrust: Pass: 100%/45 | Total: 21h 11m | Avg: 28m 15s | Max: 52m 20s | Hits: 77%/80136

🟩 libcudacxx: Pass: 100%/43 | Total: 8h 33m | Avg: 11m 56s | Max: 32m 43s | Hits: 81%/103127

🟩 cudax: Pass: 100%/22 | Total: 2h 10m | Avg: 5m 55s | Max: 13m 52s | Hits: 96%/11264

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 20m 35s | Avg: 10m 17s | Max: 18m 09s | Hits: 97%/308

🟩 python: Pass: 100%/1 | Total: 41m 22s | Avg: 41m 22s | Max: 41m 22s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 158)

miscco Feb 24, 2025

Choose a reason for hiding this comment

fbusato Feb 24, 2025

Choose a reason for hiding this comment

miscco Feb 24, 2025

Choose a reason for hiding this comment

miscco Feb 24, 2025

Choose a reason for hiding this comment

fbusato Feb 24, 2025

Choose a reason for hiding this comment

fbusato commented Feb 25, 2025

github-actions bot commented Feb 26, 2025

🟩 cub: Pass: 100%/45 | Total: 1d 17h | Avg: 54m 50s | Max: 1h 18m | Hits: 46%/53485

🟩 thrust: Pass: 100%/45 | Total: 21h 23m | Avg: 28m 31s | Max: 55m 00s | Hits: 77%/80136

🟩 libcudacxx: Pass: 100%/43 | Total: 7h 43m | Avg: 10m 46s | Max: 30m 12s | Hits: 88%/103495

🟩 cudax: Pass: 100%/22 | Total: 2h 08m | Avg: 5m 49s | Max: 13m 54s | Hits: 96%/11338

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 15m 31s | Avg: 7m 45s | Max: 12m 54s | Hits: 97%/308

🟩 python: Pass: 100%/1 | Total: 51m 53s | Avg: 51m 53s | Max: 51m 53s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 158)

github-actions bot commented Feb 26, 2025

🟩 cub: Pass: 100%/45 | Total: 1d 16h | Avg: 54m 21s | Max: 1h 18m | Hits: 46%/53485

🟩 thrust: Pass: 100%/45 | Total: 20h 57m | Avg: 27m 56s | Max: 55m 24s | Hits: 77%/80136

🟩 libcudacxx: Pass: 100%/43 | Total: 7h 14m | Avg: 10m 06s | Max: 26m 44s | Hits: 88%/103495

🟩 cudax: Pass: 100%/22 | Total: 2h 12m | Avg: 6m 01s | Max: 14m 43s | Hits: 96%/11338

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 15m 24s | Avg: 7m 42s | Max: 12m 53s | Hits: 97%/308

🟩 python: Pass: 100%/1 | Total: 51m 25s | Avg: 51m 25s | Max: 51m 25s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 158)

Optimize `bit_floor`, `bit_ceil`, `bit_width` #3296

Optimize `bit_floor`, `bit_ceil`, `bit_width` #3296

fbusato commented Jan 9, 2025 •

edited

Loading