Reorganize PTX headers to match generator #2925

bernhardmgruber · 2024-11-21T10:46:13Z

This PR splits the cuda::ptx headers into the generated and manually written part. It's just moving around content and renaming files. No other changes.

github-actions · 2024-11-21T14:21:44Z

🟨 CI finished in 3h 06m: Pass: 99%/396 | Total: 4d 14h | Avg: 16m 47s | Max: 1h 11m | Hits: 75%/21915

🟨 cudax: Pass: 98%/54 | Total: 4h 47m | Avg: 5m 19s | Max: 24m 26s | Hits: 90%/123

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  98%/50  | Total:  4h 37m | Avg:  5m 32s | Max: 24m 26s | Hits:  90%/123   
  🟩 arm64              Pass: 100%/4   | Total: 10m 02s | Avg:  2m 30s | Max:  2m 31s
🔍 ctk: 12.0 🔍
  🔍 12.0               Pass:  94%/19  | Total:  1h 44m | Avg:  5m 30s | Max: 24m 26s
  🟩 12.5               Pass: 100%/2   | Total: 11m 33s | Avg:  5m 46s | Max:  5m 49s
  🟩 12.6               Pass: 100%/33  | Total:  2h 51m | Avg:  5m 11s | Max: 21m 11s | Hits:  90%/123   
🔍 cudacxx: nvcc12.0 🔍
  🔍 nvcc12.0           Pass:  94%/19  | Total:  1h 44m | Avg:  5m 30s | Max: 24m 26s
  🟩 nvcc12.5           Pass: 100%/2   | Total: 11m 33s | Avg:  5m 46s | Max:  5m 49s
  🟩 nvcc12.6           Pass: 100%/33  | Total:  2h 51m | Avg:  5m 11s | Max: 21m 11s | Hits:  90%/123   
🚨 cxx: MSVC14.36 🚨
  🟩 Clang9             Pass: 100%/2   | Total:  7m 53s | Avg:  3m 56s | Max:  4m 16s
  🟩 Clang10            Pass: 100%/2   | Total:  8m 07s | Avg:  4m 03s | Max:  4m 31s
  🟩 Clang11            Pass: 100%/4   | Total: 14m 01s | Avg:  3m 30s | Max:  3m 59s
  🟩 Clang12            Pass: 100%/4   | Total: 14m 51s | Avg:  3m 42s | Max:  4m 06s
  🟩 Clang13            Pass: 100%/4   | Total: 15m 18s | Avg:  3m 49s | Max:  4m 09s
  🟩 Clang14            Pass: 100%/4   | Total: 35m 38s | Avg:  8m 54s | Max: 24m 26s
  🟩 Clang15            Pass: 100%/2   | Total:  8m 02s | Avg:  4m 01s | Max:  4m 06s
  🟩 Clang16            Pass: 100%/4   | Total: 12m 59s | Avg:  3m 14s | Max:  4m 04s
  🟩 Clang17            Pass: 100%/2   | Total:  8m 03s | Avg:  4m 01s | Max:  4m 05s
  🟩 Clang18            Pass: 100%/2   | Total: 23m 06s | Avg: 11m 33s | Max: 18m 41s
  🟩 GCC9               Pass: 100%/2   | Total:  5m 30s | Avg:  2m 45s | Max:  2m 53s
  🟩 GCC10              Pass: 100%/4   | Total: 11m 55s | Avg:  2m 58s | Max:  3m 05s
  🟩 GCC11              Pass: 100%/4   | Total: 12m 19s | Avg:  3m 04s | Max:  3m 28s
  🟩 GCC12              Pass: 100%/7   | Total:  1h 13m | Avg: 10m 29s | Max: 21m 11s
  🟩 GCC13              Pass: 100%/3   | Total:  7m 48s | Avg:  2m 36s | Max:  2m 47s
  🔥 MSVC14.36          Pass:   0%/1   | Total:  9m 13s | Avg:  9m 13s | Max:  9m 13s
  🟩 MSVC14.39          Pass: 100%/1   | Total:  7m 46s | Avg:  7m 46s | Max:  7m 46s | Hits:  90%/123   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 11m 33s | Avg:  5m 46s | Max:  5m 49s
🔍 cxx_family: MSVC 🔍
  🟩 Clang              Pass: 100%/30  | Total:  2h 27m | Avg:  4m 55s | Max: 24m 26s
  🟩 GCC                Pass: 100%/20  | Total:  1h 50m | Avg:  5m 32s | Max: 21m 11s
  🔍 MSVC               Pass:  50%/2   | Total: 16m 59s | Avg:  8m 29s | Max:  9m 13s | Hits:  90%/123   
  🟩 NVHPC              Pass: 100%/2   | Total: 11m 33s | Avg:  5m 46s | Max:  5m 49s
🔍 jobs: Build 🔍
  🔍 Build              Pass:  97%/49  | Total:  3h 03m | Avg:  3m 44s | Max:  9m 13s | Hits:  90%/123   
  🟩 Test               Pass: 100%/5   | Total:  1h 44m | Avg: 20m 50s | Max: 24m 26s
🔍 std: 20 🔍
  🟩 17                 Pass: 100%/29  | Total:  2h 13m | Avg:  4m 36s | Max: 20m 21s
  🔍 20                 Pass:  96%/25  | Total:  2h 34m | Avg:  6m 09s | Max: 24m 26s | Hits:  90%/123   
🟨 cudacxx_family
  🟨 nvcc               Pass:  98%/54  | Total:  4h 47m | Avg:  5m 19s | Max: 24m 26s | Hits:  90%/123   
🟨 gpu
  🟨 v100               Pass:  98%/54  | Total:  4h 47m | Avg:  5m 19s | Max: 24m 26s | Hits:  90%/123   
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 38s | Avg:  2m 38s | Max:  2m 38s
  🟩 90a                Pass: 100%/1   | Total:  2m 47s | Avg:  2m 47s | Max:  2m 47s

🟩 libcudacxx: Pass: 100%/118 | Total: 17h 07m | Avg: 8m 42s | Max: 43m 38s | Hits: 66%/9504

🟩 cpu
  🟩 amd64              Pass: 100%/110 | Total: 16h 38m | Avg:  9m 04s | Max: 43m 38s | Hits:  66%/9504  
  🟩 arm64              Pass: 100%/8   | Total: 28m 15s | Avg:  3m 31s | Max:  4m 03s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 43m | Avg:  6m 54s | Max: 33m 45s | Hits:  34%/2182  
  🟩 11.8               Pass: 100%/3   | Total: 34m 31s | Avg: 11m 30s | Max: 16m 46s
  🟩 12.5               Pass: 100%/4   | Total:  1h 39m | Avg: 24m 58s | Max: 43m 38s
  🟩 12.6               Pass: 100%/96  | Total: 13h 09m | Avg:  8m 13s | Max: 35m 55s | Hits:  75%/7322  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/12  | Total:  2h 32m | Avg: 12m 40s | Max: 20m 01s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 43m | Avg:  6m 54s | Max: 33m 45s | Hits:  34%/2182  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 34m 31s | Avg: 11m 30s | Max: 16m 46s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  1h 39m | Avg: 24m 58s | Max: 43m 38s
  🟩 nvcc12.6           Pass: 100%/84  | Total: 10h 37m | Avg:  7m 35s | Max: 35m 55s | Hits:  75%/7322  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/12  | Total:  2h 32m | Avg: 12m 40s | Max: 20m 01s
  🟩 nvcc               Pass: 100%/106 | Total: 14h 35m | Avg:  8m 15s | Max: 43m 38s | Hits:  66%/9504  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 55m 18s | Avg:  9m 13s | Max: 21m 42s
  🟩 Clang10            Pass: 100%/3   | Total: 16m 23s | Avg:  5m 27s | Max:  5m 39s
  🟩 Clang11            Pass: 100%/4   | Total: 18m 01s | Avg:  4m 30s | Max:  5m 02s
  🟩 Clang12            Pass: 100%/4   | Total: 19m 17s | Avg:  4m 49s | Max:  5m 38s
  🟩 Clang13            Pass: 100%/4   | Total: 18m 32s | Avg:  4m 38s | Max:  5m 00s
  🟩 Clang14            Pass: 100%/4   | Total: 18m 30s | Avg:  4m 37s | Max:  5m 10s
  🟩 Clang15            Pass: 100%/4   | Total: 18m 49s | Avg:  4m 42s | Max:  4m 59s
  🟩 Clang16            Pass: 100%/4   | Total: 18m 47s | Avg:  4m 41s | Max:  5m 10s
  🟩 Clang17            Pass: 100%/4   | Total: 19m 01s | Avg:  4m 45s | Max:  5m 05s
  🟩 Clang18            Pass: 100%/18  | Total:  3h 12m | Avg: 10m 41s | Max: 20m 22s
  🟩 GCC6               Pass: 100%/2   | Total:  5m 52s | Avg:  2m 56s | Max:  3m 00s
  🟩 GCC7               Pass: 100%/6   | Total: 26m 57s | Avg:  4m 29s | Max: 10m 18s
  🟩 GCC8               Pass: 100%/6   | Total: 30m 48s | Avg:  5m 08s | Max: 14m 36s
  🟩 GCC9               Pass: 100%/6   | Total: 21m 27s | Avg:  3m 34s | Max:  4m 24s
  🟩 GCC10              Pass: 100%/4   | Total: 24m 35s | Avg:  6m 08s | Max: 13m 15s
  🟩 GCC11              Pass: 100%/7   | Total: 50m 28s | Avg:  7m 12s | Max: 16m 46s
  🟩 GCC12              Pass: 100%/4   | Total: 16m 26s | Avg:  4m 06s | Max:  4m 30s
  🟩 GCC13              Pass: 100%/17  | Total:  3h 05m | Avg: 10m 55s | Max: 31m 02s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  1h 15m | Avg: 25m 01s | Max: 30m 04s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 33m 45s | Avg: 33m 45s | Max: 33m 45s | Hits:  34%/2182  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 47m 31s | Avg: 23m 45s | Max: 35m 55s | Hits:  63%/4727  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 13m 43s | Avg: 13m 43s | Max: 13m 43s | Hits:  98%/2595  
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  1h 39m | Avg: 24m 58s | Max: 43m 38s
🟩 cxx_family
  🟩 Clang              Pass: 100%/55  | Total:  6h 34m | Avg:  7m 10s | Max: 21m 42s
  🟩 GCC                Pass: 100%/52  | Total:  6h 02m | Avg:  6m 58s | Max: 31m 02s
  🟩 Intel              Pass: 100%/3   | Total:  1h 15m | Avg: 25m 01s | Max: 30m 04s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 34m | Avg: 23m 44s | Max: 35m 55s | Hits:  66%/9504  
  🟩 NVHPC              Pass: 100%/4   | Total:  1h 39m | Avg: 24m 58s | Max: 43m 38s
🟩 gpu
  🟩 v100               Pass: 100%/118 | Total: 17h 07m | Avg:  8m 42s | Max: 43m 38s | Hits:  66%/9504  
🟩 jobs
  🟩 Build              Pass: 100%/110 | Total: 14h 18m | Avg:  7m 48s | Max: 43m 38s | Hits:  66%/9504  
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 56m | Avg: 29m 09s | Max: 31m 02s
  🟩 Test               Pass: 100%/3   | Total: 50m 12s | Avg: 16m 44s | Max: 20m 22s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 02s | Avg:  2m 02s | Max:  2m 02s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 34m 31s | Avg: 11m 30s | Max: 16m 46s
  🟩 90                 Pass: 100%/4   | Total: 40m 08s | Avg: 10m 02s | Max: 11m 54s
  🟩 90a                Pass: 100%/8   | Total:  1h 01m | Avg:  7m 40s | Max: 15m 56s
🟩 std
  🟩 11                 Pass: 100%/32  | Total:  3h 34m | Avg:  6m 41s | Max: 25m 47s
  🟩 14                 Pass: 100%/32  | Total:  4h 30m | Avg:  8m 27s | Max: 33m 45s | Hits:  67%/4467  
  🟩 17                 Pass: 100%/30  | Total:  5h 01m | Avg: 10m 02s | Max: 43m 38s | Hits:  30%/2442  
  🟩 20                 Pass: 100%/23  | Total:  3h 58m | Avg: 10m 22s | Max: 38m 58s | Hits:  98%/2595

🟩 thrust: Pass: 100%/111 | Total: 1d 11h | Avg: 19m 20s | Max: 1h 11m | Hits: 84%/9260

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 28m 17s | Avg: 14m 08s | Max: 22m 31s
🟩 cpu
  🟩 amd64              Pass: 100%/103 | Total:  1d 10h | Avg: 20m 14s | Max:  1h 11m | Hits:  84%/9260  
  🟩 arm64              Pass: 100%/8   | Total:  1h 01m | Avg:  7m 40s | Max: 12m 31s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  3h 25m | Avg: 13m 40s | Max:  1h 11m | Hits:  81%/1852  
  🟩 11.8               Pass: 100%/3   | Total: 16m 10s | Avg:  5m 23s | Max:  6m 01s
  🟩 12.5               Pass: 100%/4   | Total:  3h 36m | Avg: 54m 04s | Max:  1h 02m
  🟩 12.6               Pass: 100%/89  | Total:  1d 04h | Avg: 19m 12s | Max: 56m 59s | Hits:  85%/7408  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total: 20m 03s | Avg:  5m 00s | Max:  5m 17s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  3h 25m | Avg: 13m 40s | Max:  1h 11m | Hits:  81%/1852  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 16m 10s | Avg:  5m 23s | Max:  6m 01s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  3h 36m | Avg: 54m 04s | Max:  1h 02m
  🟩 nvcc12.6           Pass: 100%/85  | Total:  1d 04h | Avg: 19m 52s | Max: 56m 59s | Hits:  85%/7408  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total: 20m 03s | Avg:  5m 00s | Max:  5m 17s
  🟩 nvcc               Pass: 100%/107 | Total:  1d 11h | Avg: 19m 52s | Max:  1h 11m | Hits:  84%/9260  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total:  3h 02m | Avg: 30m 27s | Max: 35m 20s
  🟩 Clang10            Pass: 100%/3   | Total:  1h 43m | Avg: 34m 25s | Max: 37m 53s
  🟩 Clang11            Pass: 100%/4   | Total:  2h 11m | Avg: 32m 56s | Max: 38m 49s
  🟩 Clang12            Pass: 100%/4   | Total:  2h 08m | Avg: 32m 04s | Max: 33m 48s
  🟩 Clang13            Pass: 100%/4   | Total:  2h 15m | Avg: 33m 59s | Max: 40m 44s
  🟩 Clang14            Pass: 100%/4   | Total:  2h 10m | Avg: 32m 31s | Max: 35m 08s
  🟩 Clang15            Pass: 100%/4   | Total:  2h 12m | Avg: 33m 10s | Max: 37m 01s
  🟩 Clang16            Pass: 100%/4   | Total:  2h 19m | Avg: 34m 56s | Max: 43m 53s
  🟩 Clang17            Pass: 100%/4   | Total:  2h 21m | Avg: 35m 23s | Max: 45m 41s
  🟩 Clang18            Pass: 100%/11  | Total:  1h 54m | Avg: 10m 25s | Max: 32m 42s
  🟩 GCC6               Pass: 100%/2   | Total:  9m 56s | Avg:  4m 58s | Max:  6m 13s
  🟩 GCC7               Pass: 100%/6   | Total: 28m 15s | Avg:  4m 42s | Max:  5m 59s
  🟩 GCC8               Pass: 100%/6   | Total: 28m 51s | Avg:  4m 48s | Max:  5m 39s
  🟩 GCC9               Pass: 100%/6   | Total: 29m 29s | Avg:  4m 54s | Max:  5m 37s
  🟩 GCC10              Pass: 100%/4   | Total: 21m 14s | Avg:  5m 18s | Max:  5m 50s
  🟩 GCC11              Pass: 100%/7   | Total: 38m 56s | Avg:  5m 33s | Max:  6m 01s
  🟩 GCC12              Pass: 100%/4   | Total: 23m 50s | Avg:  5m 57s | Max:  6m 15s
  🟩 GCC13              Pass: 100%/16  | Total:  2h 26m | Avg:  9m 09s | Max: 28m 40s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 19m 58s | Avg:  6m 39s | Max:  7m 28s
  🟩 MSVC14.16          Pass: 100%/1   | Total:  1h 11m | Avg:  1h 11m | Max:  1h 11m | Hits:  81%/1852  
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 31m | Avg: 45m 36s | Max: 46m 09s | Hits:  82%/3704  
  🟩 MSVC14.39          Pass: 100%/2   | Total:  1h 19m | Avg: 39m 57s | Max: 56m 59s | Hits:  89%/3704  
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  3h 36m | Avg: 54m 04s | Max:  1h 02m
🟩 cxx_family
  🟩 Clang              Pass: 100%/48  | Total: 22h 20m | Avg: 27m 55s | Max: 45m 41s
  🟩 GCC                Pass: 100%/51  | Total:  5h 26m | Avg:  6m 24s | Max: 28m 40s
  🟩 Intel              Pass: 100%/3   | Total: 19m 58s | Avg:  6m 39s | Max:  7m 28s
  🟩 MSVC               Pass: 100%/5   | Total:  4h 02m | Avg: 48m 31s | Max:  1h 11m | Hits:  84%/9260  
  🟩 NVHPC              Pass: 100%/4   | Total:  3h 36m | Avg: 54m 04s | Max:  1h 02m
🟩 gpu
  🟩 v100               Pass: 100%/111 | Total:  1d 11h | Avg: 19m 20s | Max:  1h 11m | Hits:  84%/9260  
🟩 jobs
  🟩 Build              Pass: 100%/103 | Total:  1d 09h | Avg: 19m 32s | Max:  1h 11m | Hits:  81%/7408  
  🟩 TestCPU            Pass: 100%/4   | Total: 45m 12s | Avg: 11m 18s | Max: 22m 55s | Hits:  99%/1852  
  🟩 TestGPU            Pass: 100%/4   | Total:  1h 28m | Avg: 22m 00s | Max: 28m 40s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 16m 10s | Avg:  5m 23s | Max:  6m 01s
  🟩 90a                Pass: 100%/4   | Total: 18m 48s | Avg:  4m 42s | Max:  5m 32s
🟩 std
  🟩 11                 Pass: 100%/30  | Total:  7h 14m | Avg: 14m 29s | Max: 43m 48s
  🟩 14                 Pass: 100%/29  | Total: 10h 07m | Avg: 20m 57s | Max:  1h 11m | Hits:  81%/3704  
  🟩 17                 Pass: 100%/27  | Total:  9h 02m | Avg: 20m 05s | Max: 53m 37s | Hits:  81%/1852  
  🟩 20                 Pass: 100%/23  | Total:  8h 53m | Avg: 23m 10s | Max:  1h 02m | Hits:  89%/3704

🟩 cub: Pass: 100%/110 | Total: 2d 04h | Avg: 28m 47s | Max: 1h 08m | Hits: 76%/3028

🟩 cpu
  🟩 amd64              Pass: 100%/102 | Total:  2d 01h | Avg: 29m 11s | Max:  1h 08m | Hits:  76%/3028  
  🟩 arm64              Pass: 100%/8   | Total:  3h 08m | Avg: 23m 35s | Max: 42m 37s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  3h 45m | Avg: 15m 03s | Max: 46m 56s | Hits:  76%/757   
  🟩 11.8               Pass: 100%/3   | Total: 18m 14s | Avg:  6m 04s | Max:  6m 53s
  🟩 12.5               Pass: 100%/4   | Total:  4h 05m | Avg:  1h 01m | Max:  1h 02m
  🟩 12.6               Pass: 100%/88  | Total:  1d 20h | Avg: 30m 25s | Max:  1h 08m | Hits:  76%/2271  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total: 16m 58s | Avg:  4m 14s | Max:  4m 31s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  3h 45m | Avg: 15m 03s | Max: 46m 56s | Hits:  76%/757   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 18m 14s | Avg:  6m 04s | Max:  6m 53s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  4h 05m | Avg:  1h 01m | Max:  1h 02m
  🟩 nvcc12.6           Pass: 100%/84  | Total:  1d 20h | Avg: 31m 39s | Max:  1h 08m | Hits:  76%/2271  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total: 16m 58s | Avg:  4m 14s | Max:  4m 31s
  🟩 nvcc               Pass: 100%/106 | Total:  2d 04h | Avg: 29m 42s | Max:  1h 08m | Hits:  76%/3028  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total:  4h 56m | Avg: 49m 28s | Max: 58m 00s
  🟩 Clang10            Pass: 100%/3   | Total:  2h 48m | Avg: 56m 07s | Max: 58m 02s
  🟩 Clang11            Pass: 100%/4   | Total:  3h 33m | Avg: 53m 21s | Max: 54m 25s
  🟩 Clang12            Pass: 100%/4   | Total:  3h 35m | Avg: 53m 56s | Max: 55m 05s
  🟩 Clang13            Pass: 100%/4   | Total:  3h 26m | Avg: 51m 34s | Max: 52m 15s
  🟩 Clang14            Pass: 100%/4   | Total:  3h 41m | Avg: 55m 18s | Max: 57m 26s
  🟩 Clang15            Pass: 100%/4   | Total:  3h 35m | Avg: 53m 45s | Max: 56m 18s
  🟩 Clang16            Pass: 100%/4   | Total:  3h 31m | Avg: 52m 46s | Max: 53m 39s
  🟩 Clang17            Pass: 100%/4   | Total:  3h 34m | Avg: 53m 39s | Max: 58m 39s
  🟩 Clang18            Pass: 100%/11  | Total:  5h 05m | Avg: 27m 47s | Max: 56m 42s
  🟩 GCC6               Pass: 100%/2   | Total:  9m 55s | Avg:  4m 57s | Max:  5m 02s
  🟩 GCC7               Pass: 100%/6   | Total: 28m 33s | Avg:  4m 45s | Max:  5m 25s
  🟩 GCC8               Pass: 100%/6   | Total: 28m 28s | Avg:  4m 44s | Max:  5m 23s
  🟩 GCC9               Pass: 100%/6   | Total: 28m 39s | Avg:  4m 46s | Max:  5m 30s
  🟩 GCC10              Pass: 100%/4   | Total: 20m 29s | Avg:  5m 07s | Max:  5m 19s
  🟩 GCC11              Pass: 100%/7   | Total: 39m 27s | Avg:  5m 38s | Max:  6m 53s
  🟩 GCC12              Pass: 100%/4   | Total: 22m 12s | Avg:  5m 33s | Max:  5m 59s
  🟩 GCC13              Pass: 100%/16  | Total:  4h 06m | Avg: 15m 23s | Max:  1h 08m
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 18m 04s | Avg:  6m 01s | Max:  6m 04s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 46m 56s | Avg: 46m 56s | Max: 46m 56s | Hits:  76%/757   
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 46m | Avg: 53m 08s | Max: 56m 04s | Hits:  77%/1514  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 57m 06s | Avg: 57m 06s | Max: 57m 06s | Hits:  76%/757   
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  4h 05m | Avg:  1h 01m | Max:  1h 02m
🟩 cxx_family
  🟩 Clang              Pass: 100%/48  | Total:  1d 13h | Avg: 47m 15s | Max: 58m 39s
  🟩 GCC                Pass: 100%/51  | Total:  7h 03m | Avg:  8m 18s | Max:  1h 08m
  🟩 Intel              Pass: 100%/3   | Total: 18m 04s | Avg:  6m 01s | Max:  6m 04s
  🟩 MSVC               Pass: 100%/4   | Total:  3h 30m | Avg: 52m 34s | Max: 57m 06s | Hits:  76%/3028  
  🟩 NVHPC              Pass: 100%/4   | Total:  4h 05m | Avg:  1h 01m | Max:  1h 02m
🟩 gpu
  🟩 v100               Pass: 100%/110 | Total:  2d 04h | Avg: 28m 47s | Max:  1h 08m | Hits:  76%/3028  
🟩 jobs
  🟩 Build              Pass: 100%/102 | Total:  2d 00h | Avg: 28m 28s | Max:  1h 02m | Hits:  76%/3028  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 31m 58s | Avg: 31m 58s | Max: 31m 58s
  🟩 GraphCapture       Pass: 100%/1   | Total: 25m 18s | Avg: 25m 18s | Max: 25m 18s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 09m | Avg: 23m 04s | Max: 25m 56s
  🟩 TestGPU            Pass: 100%/3   | Total:  2h 14m | Avg: 44m 59s | Max:  1h 08m
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 18m 14s | Avg:  6m 04s | Max:  6m 53s
  🟩 90a                Pass: 100%/4   | Total: 17m 14s | Avg:  4m 18s | Max:  4m 21s
🟩 std
  🟩 11                 Pass: 100%/30  | Total: 12h 30m | Avg: 25m 01s | Max:  1h 00m
  🟩 14                 Pass: 100%/29  | Total: 13h 38m | Avg: 28m 14s | Max:  1h 02m | Hits:  76%/1514  
  🟩 17                 Pass: 100%/27  | Total: 12h 35m | Avg: 27m 58s | Max:  1h 01m | Hits:  76%/757   
  🟩 20                 Pass: 100%/24  | Total: 14h 01m | Avg: 35m 03s | Max:  1h 08m | Hits:  76%/757

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 9m 49s | Avg: 4m 54s | Max: 7m 36s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total:  9m 49s | Avg:  4m 54s | Max:  7m 36s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total:  9m 49s | Avg:  4m 54s | Max:  7m 36s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total:  9m 49s | Avg:  4m 54s | Max:  7m 36s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total:  9m 49s | Avg:  4m 54s | Max:  7m 36s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total:  9m 49s | Avg:  4m 54s | Max:  7m 36s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total:  9m 49s | Avg:  4m 54s | Max:  7m 36s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total:  9m 49s | Avg:  4m 54s | Max:  7m 36s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 13s | Avg:  2m 13s | Max:  2m 13s
  🟩 Test               Pass: 100%/1   | Total:  7m 36s | Avg:  7m 36s | Max:  7m 36s

🟩 python: Pass: 100%/1 | Total: 15m 19s | Avg: 15m 19s | Max: 15m 19s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 15m 19s | Avg: 15m 19s | Max: 15m 19s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 15m 19s | Avg: 15m 19s | Max: 15m 19s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 15m 19s | Avg: 15m 19s | Max: 15m 19s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 15m 19s | Avg: 15m 19s | Max: 15m 19s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 15m 19s | Avg: 15m 19s | Max: 15m 19s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 15m 19s | Avg: 15m 19s | Max: 15m 19s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 15m 19s | Avg: 15m 19s | Max: 15m 19s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 15m 19s | Avg: 15m 19s | Max: 15m 19s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 396)

#	Runner
327	`linux-amd64-cpu16`
28	`linux-arm64-cpu16`
26	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`

miscco · 2024-11-21T15:45:33Z

What would be the issue of adding header guards around the .inc files?

The code is autogenerated, so we should be able to generate those as well

bernhardmgruber · 2024-11-21T16:35:47Z

What would be the issue of adding header guards around the .inc files?

If you promise me to never need to change the header guard because you want to move the generated files to a different place, then I am fine!

bernhardmgruber · 2024-11-21T18:29:21Z

What would be the issue of adding header guards around the .inc files?

Can I add #pragma once?

miscco · 2024-11-21T19:02:30Z

What would be the issue of adding header guards around the .inc files?

Can I add #pragma once?

Dont you already have the name of the instrinsic stored when printing out?

github-actions · 2024-11-21T21:35:22Z

🟨 CI finished in 3h 04m: Pass: 96%/396 | Total: 3d 22h | Avg: 14m 17s | Max: 56m 30s | Hits: 83%/22038

🟨 libcudacxx: Pass: 89%/118 | Total: 20h 46m | Avg: 10m 33s | Max: 56m 30s | Hits: 62%/9504

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  89%/110 | Total: 19h 57m | Avg: 10m 53s | Max: 56m 30s | Hits:  62%/9504  
  🟩 arm64              Pass: 100%/8   | Total: 49m 29s | Avg:  6m 11s | Max: 16m 43s
🔍 ctk: 12.6 🔍
  🟩 11.1               Pass: 100%/15  | Total:  1h 44m | Avg:  6m 56s | Max: 24m 26s | Hits:  98%/2182  
  🟩 11.8               Pass: 100%/3   | Total: 40m 14s | Avg: 13m 24s | Max: 19m 56s
  🟩 12.5               Pass: 100%/4   | Total:  1h 07m | Avg: 16m 54s | Max: 42m 45s
  🔍 12.6               Pass:  87%/96  | Total: 17h 14m | Avg: 10m 46s | Max: 56m 30s | Hits:  51%/7322  
🔍 jobs: Build 🔍
  🔍 Build              Pass:  89%/110 | Total: 17h 48m | Avg:  9m 43s | Max: 44m 43s | Hits:  62%/9504  
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 23m | Avg: 20m 58s | Max: 23m 01s
  🟩 Test               Pass: 100%/3   | Total:  1h 32m | Avg: 30m 40s | Max: 56m 30s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 03s | Avg:  2m 03s | Max:  2m 03s
🟨 cudacxx
  🟨 ClangCUDA18        Pass:  33%/12  | Total:  2h 30m | Avg: 12m 31s | Max: 21m 21s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 44m | Avg:  6m 56s | Max: 24m 26s | Hits:  98%/2182  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 40m 14s | Avg: 13m 24s | Max: 19m 56s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  1h 07m | Avg: 16m 54s | Max: 42m 45s
  🟨 nvcc12.6           Pass:  95%/84  | Total: 14h 44m | Avg: 10m 31s | Max: 56m 30s | Hits:  51%/7322  
🟨 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 49m 13s | Avg:  8m 12s | Max: 15m 42s
  🟩 Clang10            Pass: 100%/3   | Total: 28m 14s | Avg:  9m 24s | Max: 17m 37s
  🟩 Clang11            Pass: 100%/4   | Total: 17m 41s | Avg:  4m 25s | Max:  4m 53s
  🟩 Clang12            Pass: 100%/4   | Total: 53m 47s | Avg: 13m 26s | Max: 21m 03s
  🟩 Clang13            Pass: 100%/4   | Total: 30m 30s | Avg:  7m 37s | Max: 17m 09s
  🟩 Clang14            Pass: 100%/4   | Total: 27m 48s | Avg:  6m 57s | Max: 15m 03s
  🟩 Clang15            Pass: 100%/4   | Total: 19m 56s | Avg:  4m 59s | Max:  5m 50s
  🟩 Clang16            Pass: 100%/4   | Total: 36m 09s | Avg:  9m 02s | Max: 21m 13s
  🟩 Clang17            Pass: 100%/4   | Total: 38m 58s | Avg:  9m 44s | Max: 15m 14s
  🟨 Clang18            Pass:  55%/18  | Total:  3h 53m | Avg: 12m 59s | Max: 56m 30s
  🟩 GCC6               Pass: 100%/2   | Total: 28m 55s | Avg: 14m 27s | Max: 16m 30s
  🟩 GCC7               Pass: 100%/6   | Total: 46m 07s | Avg:  7m 41s | Max: 18m 57s
  🟩 GCC8               Pass: 100%/6   | Total: 32m 36s | Avg:  5m 26s | Max: 15m 24s
  🟩 GCC9               Pass: 100%/6   | Total: 21m 13s | Avg:  3m 32s | Max:  4m 10s
  🟩 GCC10              Pass: 100%/4   | Total: 33m 12s | Avg:  8m 18s | Max: 15m 01s
  🟩 GCC11              Pass: 100%/7   | Total:  1h 16m | Avg: 10m 57s | Max: 19m 56s
  🟩 GCC12              Pass: 100%/4   | Total: 33m 34s | Avg:  8m 23s | Max: 20m 45s
  🟨 GCC13              Pass:  76%/17  | Total:  3h 17m | Avg: 11m 38s | Max: 23m 01s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 51m 04s | Avg: 17m 01s | Max: 27m 11s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 24m 26s | Avg: 24m 26s | Max: 24m 26s | Hits:  98%/2182  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 52m 39s | Avg: 26m 19s | Max: 40m 49s | Hits:  63%/4727  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 44m 43s | Avg: 44m 43s | Max: 44m 43s | Hits:  29%/2595  
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  1h 07m | Avg: 16m 54s | Max: 42m 45s
🟨 cxx_family
  🟨 Clang              Pass:  85%/55  | Total:  8h 56m | Avg:  9m 44s | Max: 56m 30s
  🟨 GCC                Pass:  92%/52  | Total:  7h 50m | Avg:  9m 02s | Max: 23m 01s
  🟩 Intel              Pass: 100%/3   | Total: 51m 04s | Avg: 17m 01s | Max: 27m 11s
  🟩 MSVC               Pass: 100%/4   | Total:  2h 01m | Avg: 30m 27s | Max: 44m 43s | Hits:  62%/9504  
  🟩 NVHPC              Pass: 100%/4   | Total:  1h 07m | Avg: 16m 54s | Max: 42m 45s
🟨 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 40m 14s | Avg: 13m 24s | Max: 19m 56s
  🟥 90                 Pass:   0%/4   | Total: 41m 28s | Avg: 10m 22s | Max: 13m 25s
  🟥 90a                Pass:   0%/8   | Total: 58m 16s | Avg:  7m 17s | Max: 13m 26s
🟨 gpu
  🟨 v100               Pass:  89%/118 | Total: 20h 46m | Avg: 10m 33s | Max: 56m 30s | Hits:  62%/9504  
🟨 cudacxx_family
  🟨 ClangCUDA          Pass:  33%/12  | Total:  2h 30m | Avg: 12m 31s | Max: 21m 21s
  🟨 nvcc               Pass:  96%/106 | Total: 18h 16m | Avg: 10m 20s | Max: 56m 30s | Hits:  62%/9504  
🟨 std
  🟨 11                 Pass:  90%/32  | Total:  4h 09m | Avg:  7m 47s | Max: 27m 11s
  🟨 14                 Pass:  90%/32  | Total:  5h 04m | Avg:  9m 31s | Max: 24m 26s | Hits:  98%/4467  
  🟨 17                 Pass:  90%/30  | Total:  6h 18m | Avg: 12m 36s | Max: 42m 45s | Hits:  30%/2442  
  🟨 20                 Pass:  86%/23  | Total:  5h 12m | Avg: 13m 34s | Max: 56m 30s | Hits:  29%/2595

🟩 thrust: Pass: 100%/111 | Total: 19h 28m | Avg: 10m 31s | Max: 37m 50s | Hits: 99%/9260

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 24m 04s | Avg: 12m 02s | Max: 13m 51s
🟩 cpu
  🟩 amd64              Pass: 100%/103 | Total: 18h 47m | Avg: 10m 56s | Max: 37m 50s | Hits:  99%/9260  
  🟩 arm64              Pass: 100%/8   | Total: 40m 47s | Avg:  5m 05s | Max:  9m 05s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 19m | Avg:  5m 19s | Max: 18m 22s | Hits:  99%/1852  
  🟩 11.8               Pass: 100%/3   | Total: 16m 22s | Avg:  5m 27s | Max:  5m 40s
  🟩 12.5               Pass: 100%/4   | Total:  2h 10m | Avg: 32m 31s | Max: 37m 50s
  🟩 12.6               Pass: 100%/89  | Total: 15h 41m | Avg: 10m 35s | Max: 32m 58s | Hits:  99%/7408  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total: 18m 32s | Avg:  4m 38s | Max:  4m 51s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 19m | Avg:  5m 19s | Max: 18m 22s | Hits:  99%/1852  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 16m 22s | Avg:  5m 27s | Max:  5m 40s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  2h 10m | Avg: 32m 31s | Max: 37m 50s
  🟩 nvcc12.6           Pass: 100%/85  | Total: 15h 23m | Avg: 10m 51s | Max: 32m 58s | Hits:  99%/7408  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total: 18m 32s | Avg:  4m 38s | Max:  4m 51s
  🟩 nvcc               Pass: 100%/107 | Total: 19h 09m | Avg: 10m 44s | Max: 37m 50s | Hits:  99%/9260  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 45m 41s | Avg:  7m 36s | Max: 14m 36s
  🟩 Clang10            Pass: 100%/3   | Total: 36m 05s | Avg: 12m 01s | Max: 15m 07s
  🟩 Clang11            Pass: 100%/4   | Total: 41m 36s | Avg: 10m 24s | Max: 13m 37s
  🟩 Clang12            Pass: 100%/4   | Total: 38m 58s | Avg:  9m 44s | Max: 13m 36s
  🟩 Clang13            Pass: 100%/4   | Total: 58m 26s | Avg: 14m 36s | Max: 32m 58s
  🟩 Clang14            Pass: 100%/4   | Total: 39m 51s | Avg:  9m 57s | Max: 13m 40s
  🟩 Clang15            Pass: 100%/4   | Total: 41m 21s | Avg: 10m 20s | Max: 14m 04s
  🟩 Clang16            Pass: 100%/4   | Total: 39m 59s | Avg:  9m 59s | Max: 14m 08s
  🟩 Clang17            Pass: 100%/4   | Total: 37m 54s | Avg:  9m 28s | Max: 12m 38s
  🟩 Clang18            Pass: 100%/11  | Total:  1h 09m | Avg:  6m 20s | Max: 14m 23s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 21s | Avg:  4m 10s | Max:  4m 26s
  🟩 GCC7               Pass: 100%/6   | Total: 40m 40s | Avg:  6m 46s | Max: 11m 13s
  🟩 GCC8               Pass: 100%/6   | Total: 38m 07s | Avg:  6m 21s | Max: 10m 50s
  🟩 GCC9               Pass: 100%/6   | Total: 45m 14s | Avg:  7m 32s | Max: 13m 48s
  🟩 GCC10              Pass: 100%/4   | Total: 36m 56s | Avg:  9m 14s | Max: 11m 35s
  🟩 GCC11              Pass: 100%/7   | Total:  1h 19m | Avg: 11m 22s | Max: 30m 19s
  🟩 GCC12              Pass: 100%/4   | Total: 44m 39s | Avg: 11m 09s | Max: 14m 38s
  🟩 GCC13              Pass: 100%/16  | Total:  2h 32m | Avg:  9m 31s | Max: 32m 50s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 49m 51s | Avg: 16m 37s | Max: 21m 11s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 18m 22s | Avg: 18m 22s | Max: 18m 22s | Hits:  99%/1852  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 35m 05s | Avg: 17m 32s | Max: 20m 32s | Hits:  99%/3704  
  🟩 MSVC14.39          Pass: 100%/2   | Total: 39m 22s | Avg: 19m 41s | Max: 21m 07s | Hits:  99%/3704  
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  2h 10m | Avg: 32m 31s | Max: 37m 50s
🟩 cxx_family
  🟩 Clang              Pass: 100%/48  | Total:  7h 29m | Avg:  9m 21s | Max: 32m 58s
  🟩 GCC                Pass: 100%/51  | Total:  7h 26m | Avg:  8m 44s | Max: 32m 50s
  🟩 Intel              Pass: 100%/3   | Total: 49m 51s | Avg: 16m 37s | Max: 21m 11s
  🟩 MSVC               Pass: 100%/5   | Total:  1h 32m | Avg: 18m 33s | Max: 21m 07s | Hits:  99%/9260  
  🟩 NVHPC              Pass: 100%/4   | Total:  2h 10m | Avg: 32m 31s | Max: 37m 50s
🟩 gpu
  🟩 v100               Pass: 100%/111 | Total: 19h 28m | Avg: 10m 31s | Max: 37m 50s | Hits:  99%/9260  
🟩 jobs
  🟩 Build              Pass: 100%/103 | Total: 17h 29m | Avg: 10m 11s | Max: 37m 50s | Hits:  99%/7408  
  🟩 TestCPU            Pass: 100%/4   | Total: 43m 08s | Avg: 10m 47s | Max: 21m 07s | Hits:  99%/1852  
  🟩 TestGPU            Pass: 100%/4   | Total:  1h 15m | Avg: 18m 49s | Max: 32m 50s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 16m 22s | Avg:  5m 27s | Max:  5m 40s
  🟩 90a                Pass: 100%/4   | Total: 17m 58s | Avg:  4m 29s | Max:  4m 48s
🟩 std
  🟩 11                 Pass: 100%/30  | Total:  3h 43m | Avg:  7m 26s | Max: 32m 50s
  🟩 14                 Pass: 100%/29  | Total:  5h 21m | Avg: 11m 05s | Max: 32m 58s | Hits:  99%/3704  
  🟩 17                 Pass: 100%/27  | Total:  5h 15m | Avg: 11m 40s | Max: 37m 50s | Hits:  99%/1852  
  🟩 20                 Pass: 100%/23  | Total:  4h 44m | Avg: 12m 20s | Max: 37m 05s | Hits:  99%/3704

🟩 cub: Pass: 100%/110 | Total: 2d 01h | Avg: 26m 57s | Max: 54m 43s | Hits: 99%/3028

🟩 cpu
  🟩 amd64              Pass: 100%/102 | Total:  2d 00h | Avg: 28m 42s | Max: 54m 43s | Hits:  99%/3028  
  🟩 arm64              Pass: 100%/8   | Total: 37m 09s | Avg:  4m 38s | Max:  5m 00s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  2h 36m | Avg: 10m 26s | Max: 33m 31s | Hits:  99%/757   
  🟩 11.8               Pass: 100%/3   | Total: 16m 09s | Avg:  5m 23s | Max:  5m 55s
  🟩 12.5               Pass: 100%/4   | Total:  2h 53m | Avg: 43m 17s | Max: 44m 02s
  🟩 12.6               Pass: 100%/88  | Total:  1d 19h | Avg: 29m 46s | Max: 54m 43s | Hits:  99%/2271  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  3h 25m | Avg: 51m 27s | Max: 54m 43s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  2h 36m | Avg: 10m 26s | Max: 33m 31s | Hits:  99%/757   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 16m 09s | Avg:  5m 23s | Max:  5m 55s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  2h 53m | Avg: 43m 17s | Max: 44m 02s
  🟩 nvcc12.6           Pass: 100%/84  | Total:  1d 16h | Avg: 28m 44s | Max: 39m 53s | Hits:  99%/2271  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  3h 25m | Avg: 51m 27s | Max: 54m 43s
  🟩 nvcc               Pass: 100%/106 | Total:  1d 21h | Avg: 26m 01s | Max: 44m 02s | Hits:  99%/3028  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total:  3h 28m | Avg: 34m 43s | Max: 39m 29s
  🟩 Clang10            Pass: 100%/3   | Total:  1h 50m | Avg: 36m 41s | Max: 36m 54s
  🟩 Clang11            Pass: 100%/4   | Total:  2h 22m | Avg: 35m 34s | Max: 38m 27s
  🟩 Clang12            Pass: 100%/4   | Total:  2h 14m | Avg: 33m 44s | Max: 34m 49s
  🟩 Clang13            Pass: 100%/4   | Total:  2h 16m | Avg: 34m 02s | Max: 34m 25s
  🟩 Clang14            Pass: 100%/4   | Total:  2h 16m | Avg: 34m 11s | Max: 34m 51s
  🟩 Clang15            Pass: 100%/4   | Total:  2h 18m | Avg: 34m 35s | Max: 38m 02s
  🟩 Clang16            Pass: 100%/4   | Total:  2h 20m | Avg: 35m 11s | Max: 37m 07s
  🟩 Clang17            Pass: 100%/4   | Total:  2h 22m | Avg: 35m 34s | Max: 37m 31s
  🟩 Clang18            Pass: 100%/11  | Total:  5h 06m | Avg: 27m 52s | Max: 54m 43s
  🟩 GCC6               Pass: 100%/2   | Total:  8m 32s | Avg:  4m 16s | Max:  4m 19s
  🟩 GCC7               Pass: 100%/6   | Total:  1h 56m | Avg: 19m 23s | Max: 35m 53s
  🟩 GCC8               Pass: 100%/6   | Total:  1h 54m | Avg: 19m 05s | Max: 34m 35s
  🟩 GCC9               Pass: 100%/6   | Total:  2h 01m | Avg: 20m 12s | Max: 36m 56s
  🟩 GCC10              Pass: 100%/4   | Total:  2h 22m | Avg: 35m 42s | Max: 36m 47s
  🟩 GCC11              Pass: 100%/7   | Total:  2h 31m | Avg: 21m 39s | Max: 35m 03s
  🟩 GCC12              Pass: 100%/4   | Total:  2h 24m | Avg: 36m 04s | Max: 39m 03s
  🟩 GCC13              Pass: 100%/16  | Total:  3h 56m | Avg: 14m 47s | Max: 39m 53s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  1h 47m | Avg: 35m 53s | Max: 37m 41s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 13m 58s | Avg: 13m 58s | Max: 13m 58s | Hits:  99%/757   
  🟩 MSVC14.29          Pass: 100%/2   | Total: 24m 26s | Avg: 12m 13s | Max: 12m 33s | Hits:  99%/1514  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 13m 23s | Avg: 13m 23s | Max: 13m 23s | Hits:  99%/757   
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  2h 53m | Avg: 43m 17s | Max: 44m 02s
🟩 cxx_family
  🟩 Clang              Pass: 100%/48  | Total:  1d 02h | Avg: 33m 15s | Max: 54m 43s
  🟩 GCC                Pass: 100%/51  | Total: 17h 16m | Avg: 20m 18s | Max: 39m 53s
  🟩 Intel              Pass: 100%/3   | Total:  1h 47m | Avg: 35m 53s | Max: 37m 41s
  🟩 MSVC               Pass: 100%/4   | Total: 51m 47s | Avg: 12m 56s | Max: 13m 58s | Hits:  99%/3028  
  🟩 NVHPC              Pass: 100%/4   | Total:  2h 53m | Avg: 43m 17s | Max: 44m 02s
🟩 gpu
  🟩 v100               Pass: 100%/110 | Total:  2d 01h | Avg: 26m 57s | Max: 54m 43s | Hits:  99%/3028  
🟩 jobs
  🟩 Build              Pass: 100%/102 | Total:  1d 22h | Avg: 27m 25s | Max: 54m 43s | Hits:  99%/3028  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 18m 59s | Avg: 18m 59s | Max: 18m 59s
  🟩 GraphCapture       Pass: 100%/1   | Total: 16m 11s | Avg: 16m 11s | Max: 16m 11s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 00m | Avg: 20m 11s | Max: 22m 22s
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 11m | Avg: 23m 58s | Max: 24m 51s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 16m 09s | Avg:  5m 23s | Max:  5m 55s
  🟩 90a                Pass: 100%/4   | Total: 17m 00s | Avg:  4m 15s | Max:  4m 25s
🟩 std
  🟩 11                 Pass: 100%/30  | Total: 13h 14m | Avg: 26m 28s | Max: 49m 39s
  🟩 14                 Pass: 100%/29  | Total: 12h 30m | Avg: 25m 51s | Max: 54m 43s | Hits:  99%/1514  
  🟩 17                 Pass: 100%/27  | Total: 12h 20m | Avg: 27m 26s | Max: 50m 30s | Hits:  99%/757   
  🟩 20                 Pass: 100%/24  | Total: 11h 20m | Avg: 28m 20s | Max: 50m 58s | Hits:  99%/757

🟩 cudax: Pass: 100%/54 | Total: 4h 10m | Avg: 4m 38s | Max: 20m 31s | Hits: 90%/246

🟩 cpu
  🟩 amd64              Pass: 100%/50  | Total:  4h 00m | Avg:  4m 48s | Max: 20m 31s | Hits:  90%/246   
  🟩 arm64              Pass: 100%/4   | Total: 10m 50s | Avg:  2m 42s | Max:  3m 26s
🟩 ctk
  🟩 12.0               Pass: 100%/19  | Total:  1h 26m | Avg:  4m 33s | Max: 16m 35s | Hits:  90%/123   
  🟩 12.5               Pass: 100%/2   | Total: 10m 21s | Avg:  5m 10s | Max:  5m 30s
  🟩 12.6               Pass: 100%/33  | Total:  2h 34m | Avg:  4m 40s | Max: 20m 31s | Hits:  90%/123   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/19  | Total:  1h 26m | Avg:  4m 33s | Max: 16m 35s | Hits:  90%/123   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 10m 21s | Avg:  5m 10s | Max:  5m 30s
  🟩 nvcc12.6           Pass: 100%/33  | Total:  2h 34m | Avg:  4m 40s | Max: 20m 31s | Hits:  90%/123   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/54  | Total:  4h 10m | Avg:  4m 38s | Max: 20m 31s | Hits:  90%/246   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  6m 53s | Avg:  3m 26s | Max:  3m 48s
  🟩 Clang10            Pass: 100%/2   | Total:  6m 47s | Avg:  3m 23s | Max:  3m 42s
  🟩 Clang11            Pass: 100%/4   | Total: 12m 24s | Avg:  3m 06s | Max:  3m 21s
  🟩 Clang12            Pass: 100%/4   | Total: 11m 50s | Avg:  2m 57s | Max:  3m 12s
  🟩 Clang13            Pass: 100%/4   | Total: 11m 48s | Avg:  2m 57s | Max:  3m 08s
  🟩 Clang14            Pass: 100%/4   | Total: 25m 53s | Avg:  6m 28s | Max: 16m 35s
  🟩 Clang15            Pass: 100%/2   | Total:  6m 27s | Avg:  3m 13s | Max:  3m 16s
  🟩 Clang16            Pass: 100%/4   | Total: 11m 44s | Avg:  2m 56s | Max:  3m 25s
  🟩 Clang17            Pass: 100%/2   | Total:  6m 24s | Avg:  3m 12s | Max:  3m 22s
  🟩 Clang18            Pass: 100%/2   | Total: 19m 34s | Avg:  9m 47s | Max: 16m 23s
  🟩 GCC9               Pass: 100%/2   | Total:  5m 53s | Avg:  2m 56s | Max:  3m 04s
  🟩 GCC10              Pass: 100%/4   | Total: 12m 18s | Avg:  3m 04s | Max:  3m 27s
  🟩 GCC11              Pass: 100%/4   | Total: 11m 41s | Avg:  2m 55s | Max:  3m 18s
  🟩 GCC12              Pass: 100%/7   | Total:  1h 05m | Avg:  9m 19s | Max: 20m 31s
  🟩 GCC13              Pass: 100%/3   | Total:  8m 41s | Avg:  2m 53s | Max:  3m 26s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  8m 13s | Avg:  8m 13s | Max:  8m 13s | Hits:  90%/123   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  8m 51s | Avg:  8m 51s | Max:  8m 51s | Hits:  90%/123   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 10m 21s | Avg:  5m 10s | Max:  5m 30s
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  1h 59m | Avg:  3m 59s | Max: 16m 35s
  🟩 GCC                Pass: 100%/20  | Total:  1h 43m | Avg:  5m 11s | Max: 20m 31s
  🟩 MSVC               Pass: 100%/2   | Total: 17m 04s | Avg:  8m 32s | Max:  8m 51s | Hits:  90%/246   
  🟩 NVHPC              Pass: 100%/2   | Total: 10m 21s | Avg:  5m 10s | Max:  5m 30s
🟩 gpu
  🟩 v100               Pass: 100%/54  | Total:  4h 10m | Avg:  4m 38s | Max: 20m 31s | Hits:  90%/246   
🟩 jobs
  🟩 Build              Pass: 100%/49  | Total:  2h 44m | Avg:  3m 21s | Max:  8m 51s | Hits:  90%/246   
  🟩 Test               Pass: 100%/5   | Total:  1h 26m | Avg: 17m 18s | Max: 20m 31s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  2m 31s | Avg:  2m 31s | Max:  2m 31s
  🟩 90a                Pass: 100%/1   | Total:  2m 50s | Avg:  2m 50s | Max:  2m 50s
🟩 std
  🟩 17                 Pass: 100%/29  | Total:  1h 57m | Avg:  4m 02s | Max: 17m 14s
  🟩 20                 Pass: 100%/25  | Total:  2h 13m | Avg:  5m 21s | Max: 20m 31s | Hits:  90%/246

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 25s | Avg: 5m 12s | Max: 8m 28s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 10m 25s | Avg:  5m 12s | Max:  8m 28s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total: 10m 25s | Avg:  5m 12s | Max:  8m 28s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total: 10m 25s | Avg:  5m 12s | Max:  8m 28s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 10m 25s | Avg:  5m 12s | Max:  8m 28s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 10m 25s | Avg:  5m 12s | Max:  8m 28s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 10m 25s | Avg:  5m 12s | Max:  8m 28s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total: 10m 25s | Avg:  5m 12s | Max:  8m 28s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  1m 57s | Avg:  1m 57s | Max:  1m 57s
  🟩 Test               Pass: 100%/1   | Total:  8m 28s | Avg:  8m 28s | Max:  8m 28s

🟩 python: Pass: 100%/1 | Total: 15m 56s | Avg: 15m 56s | Max: 15m 56s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 15m 56s | Avg: 15m 56s | Max: 15m 56s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 15m 56s | Avg: 15m 56s | Max: 15m 56s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 15m 56s | Avg: 15m 56s | Max: 15m 56s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 15m 56s | Avg: 15m 56s | Max: 15m 56s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 15m 56s | Avg: 15m 56s | Max: 15m 56s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 15m 56s | Avg: 15m 56s | Max: 15m 56s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 15m 56s | Avg: 15m 56s | Max: 15m 56s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 15m 56s | Avg: 15m 56s | Max: 15m 56s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 396)

#	Runner
327	`linux-amd64-cpu16`
28	`linux-arm64-cpu16`
26	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`

bernhardmgruber · 2024-11-21T22:18:50Z

Alright, I can add a header guard. But if you would want to do it properly, we would also need to put the generated code into the right namespace, which means surrounding it with _LIBCUDACXX_BEGIN_NAMESPACE_CUDA_PTX etc. That's exactly what I want to avoid though, because the macro name can get out of sync again.

miscco · 2024-11-22T07:15:53Z

libcudacxx/include/cuda/__ptx/instructions/tensormap_cp_fenceproxy.h

-      __cuda_ptx_tensormap_cp_fenceproxy_is_not_supported_before_SM_90__();));
-}
-#endif // __cccl_ptx_isa >= 830
+#include <cuda/__ptx/instructions/generated/tensormap_cp_fenceproxy.inc>


I am fine with this being a temporary step and merging it as is, but I do not see a reason why a code generator that does generate a tensormap_cp_fenceproxy.inc

cannot generate a tensormap_cp_fenceproxy.h with an #ifdef _CUDA_PTX_TENSORMAP_CP_FENCEPROXY_H at the beginning

cannot generate a tensormap_cp_fenceproxy.h with an #ifdef _CUDA_PTX_TENSORMAP_CP_FENCEPROXY_H at the beginning

That will break, because that macro is already defined in this header. The idea is to maximize the decoupling between the generated code and CCCL. CCCL is not the only customer of this generated code.

@miscco I will add the header guards in a follow-up PR.
@ahendriksen I think adding header guards will still support your internal use cases. But we can discuss this offline.

miscco · 2024-11-22T08:10:13Z

That's exactly what I want to avoid though, because the macro name can get out of sync again.

That is almost certainly not going to happen and depends solely on us.

ahendriksen

Mostly LGTM! Thanks to CI, I found that mbarrier_test_wait was missing some content. Do you think that could have happened elsewhere as well?

libcudacxx/include/cuda/__ptx/instructions/generated/mbarrier_test_wait.inc

ahendriksen

LGTM!

github-actions · 2024-11-22T12:37:38Z

🟩 CI finished in 1h 47m: Pass: 100%/396 | Total: 6d 20h | Avg: 24m 53s | Max: 1h 11m | Hits: 66%/22042

🟩 libcudacxx: Pass: 100%/118 | Total: 19h 55m | Avg: 10m 08s | Max: 41m 09s | Hits: 63%/9508

🟩 cpu
  🟩 amd64              Pass: 100%/110 | Total: 19h 10m | Avg: 10m 27s | Max: 41m 09s | Hits:  63%/9508  
  🟩 arm64              Pass: 100%/8   | Total: 45m 31s | Avg:  5m 41s | Max: 14m 43s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  2h 19m | Avg:  9m 17s | Max: 34m 39s | Hits:  33%/2183  
  🟩 11.8               Pass: 100%/3   | Total:  1h 00m | Avg: 20m 01s | Max: 30m 45s
  🟩 12.5               Pass: 100%/4   | Total:  1h 54m | Avg: 28m 38s | Max: 40m 59s
  🟩 12.6               Pass: 100%/96  | Total: 14h 42m | Avg:  9m 11s | Max: 41m 09s | Hits:  72%/7325  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/12  | Total:  2h 32m | Avg: 12m 44s | Max: 20m 11s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  2h 19m | Avg:  9m 17s | Max: 34m 39s | Hits:  33%/2183  
  🟩 nvcc11.8           Pass: 100%/3   | Total:  1h 00m | Avg: 20m 01s | Max: 30m 45s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  1h 54m | Avg: 28m 38s | Max: 40m 59s
  🟩 nvcc12.6           Pass: 100%/84  | Total: 12h 09m | Avg:  8m 40s | Max: 41m 09s | Hits:  72%/7325  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/12  | Total:  2h 32m | Avg: 12m 44s | Max: 20m 11s
  🟩 nvcc               Pass: 100%/106 | Total: 17h 23m | Avg:  9m 50s | Max: 41m 09s | Hits:  63%/9508  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 29m 33s | Avg:  4m 55s | Max:  6m 11s
  🟩 Clang10            Pass: 100%/3   | Total: 19m 55s | Avg:  6m 38s | Max:  8m 13s
  🟩 Clang11            Pass: 100%/4   | Total: 20m 44s | Avg:  5m 11s | Max:  6m 02s
  🟩 Clang12            Pass: 100%/4   | Total: 19m 40s | Avg:  4m 55s | Max:  6m 00s
  🟩 Clang13            Pass: 100%/4   | Total: 21m 55s | Avg:  5m 28s | Max:  6m 06s
  🟩 Clang14            Pass: 100%/4   | Total: 19m 46s | Avg:  4m 56s | Max:  6m 13s
  🟩 Clang15            Pass: 100%/4   | Total: 20m 21s | Avg:  5m 05s | Max:  5m 57s
  🟩 Clang16            Pass: 100%/4   | Total: 23m 56s | Avg:  5m 59s | Max:  7m 03s
  🟩 Clang17            Pass: 100%/4   | Total: 33m 14s | Avg:  8m 18s | Max: 15m 04s
  🟩 Clang18            Pass: 100%/18  | Total:  3h 28m | Avg: 11m 33s | Max: 33m 43s
  🟩 GCC6               Pass: 100%/2   | Total:  6m 17s | Avg:  3m 08s | Max:  3m 11s
  🟩 GCC7               Pass: 100%/6   | Total: 26m 52s | Avg:  4m 28s | Max:  7m 53s
  🟩 GCC8               Pass: 100%/6   | Total:  1h 05m | Avg: 10m 56s | Max: 21m 19s
  🟩 GCC9               Pass: 100%/6   | Total: 44m 40s | Avg:  7m 26s | Max: 22m 17s
  🟩 GCC10              Pass: 100%/4   | Total: 19m 38s | Avg:  4m 54s | Max:  5m 46s
  🟩 GCC11              Pass: 100%/7   | Total:  1h 32m | Avg: 13m 15s | Max: 30m 45s
  🟩 GCC12              Pass: 100%/4   | Total: 21m 08s | Avg:  5m 17s | Max:  7m 20s
  🟩 GCC13              Pass: 100%/17  | Total:  3h 45m | Avg: 13m 15s | Max: 41m 09s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  1h 00m | Avg: 20m 00s | Max: 30m 47s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 34m 39s | Avg: 34m 39s | Max: 34m 39s | Hits:  33%/2183  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 51m 32s | Avg: 25m 46s | Max: 38m 48s | Hits:  61%/4729  
  🟩 MSVC14.39          Pass: 100%/1   | Total: 15m 36s | Avg: 15m 36s | Max: 15m 36s | Hits:  92%/2596  
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  1h 54m | Avg: 28m 38s | Max: 40m 59s
🟩 cxx_family
  🟩 Clang              Pass: 100%/55  | Total:  6h 57m | Avg:  7m 35s | Max: 33m 43s
  🟩 GCC                Pass: 100%/52  | Total:  8h 22m | Avg:  9m 39s | Max: 41m 09s
  🟩 Intel              Pass: 100%/3   | Total:  1h 00m | Avg: 20m 00s | Max: 30m 47s
  🟩 MSVC               Pass: 100%/4   | Total:  1h 41m | Avg: 25m 26s | Max: 38m 48s | Hits:  63%/9508  
  🟩 NVHPC              Pass: 100%/4   | Total:  1h 54m | Avg: 28m 38s | Max: 40m 59s
🟩 gpu
  🟩 v100               Pass: 100%/118 | Total: 19h 55m | Avg: 10m 08s | Max: 41m 09s | Hits:  63%/9508  
🟩 jobs
  🟩 Build              Pass: 100%/110 | Total: 16h 42m | Avg:  9m 06s | Max: 40m 59s | Hits:  63%/9508  
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 38m | Avg: 24m 36s | Max: 31m 15s
  🟩 Test               Pass: 100%/3   | Total:  1h 32m | Avg: 30m 57s | Max: 41m 09s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 32s | Avg:  2m 32s | Max:  2m 32s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total:  1h 00m | Avg: 20m 01s | Max: 30m 45s
  🟩 90                 Pass: 100%/4   | Total: 42m 38s | Avg: 10m 39s | Max: 11m 52s
  🟩 90a                Pass: 100%/8   | Total:  1h 12m | Avg:  9m 02s | Max: 12m 26s
🟩 std
  🟩 11                 Pass: 100%/32  | Total:  4h 42m | Avg:  8m 50s | Max: 25m 47s
  🟩 14                 Pass: 100%/32  | Total:  5h 06m | Avg:  9m 34s | Max: 36m 34s | Hits:  64%/4469  
  🟩 17                 Pass: 100%/30  | Total:  5h 12m | Avg: 10m 24s | Max: 38m 48s | Hits:  29%/2443  
  🟩 20                 Pass: 100%/23  | Total:  4h 52m | Avg: 12m 41s | Max: 41m 09s | Hits:  92%/2596

🟩 thrust: Pass: 100%/111 | Total: 2d 06h | Avg: 29m 42s | Max: 1h 06m | Hits: 70%/9260

🟩 cmake_options
  🟩 -DTHRUST_DISPATCH_TYPE=Force32bit Pass: 100%/2   | Total: 45m 18s | Avg: 22m 39s | Max: 30m 11s
🟩 cpu
  🟩 amd64              Pass: 100%/103 | Total:  2d 02h | Avg: 29m 37s | Max:  1h 06m | Hits:  70%/9260  
  🟩 arm64              Pass: 100%/8   | Total:  4h 05m | Avg: 30m 42s | Max: 36m 19s
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  2h 52m | Avg: 11m 31s | Max: 55m 41s | Hits:  63%/1852  
  🟩 11.8               Pass: 100%/3   | Total: 17m 26s | Avg:  5m 48s | Max:  6m 02s
  🟩 12.5               Pass: 100%/4   | Total:  3h 49m | Avg: 57m 16s | Max:  1h 03m
  🟩 12.6               Pass: 100%/89  | Total:  1d 23h | Avg: 32m 19s | Max:  1h 06m | Hits:  72%/7408  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  1h 46m | Avg: 26m 31s | Max: 31m 44s
  🟩 nvcc11.1           Pass: 100%/15  | Total:  2h 52m | Avg: 11m 31s | Max: 55m 41s | Hits:  63%/1852  
  🟩 nvcc11.8           Pass: 100%/3   | Total: 17m 26s | Avg:  5m 48s | Max:  6m 02s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  3h 49m | Avg: 57m 16s | Max:  1h 03m
  🟩 nvcc12.6           Pass: 100%/85  | Total:  1d 22h | Avg: 32m 36s | Max:  1h 06m | Hits:  72%/7408  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  1h 46m | Avg: 26m 31s | Max: 31m 44s
  🟩 nvcc               Pass: 100%/107 | Total:  2d 05h | Avg: 29m 49s | Max:  1h 06m | Hits:  70%/9260  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total:  2h 48m | Avg: 28m 01s | Max: 37m 49s
  🟩 Clang10            Pass: 100%/3   | Total:  1h 48m | Avg: 36m 01s | Max: 40m 16s
  🟩 Clang11            Pass: 100%/4   | Total:  2h 17m | Avg: 34m 21s | Max: 38m 00s
  🟩 Clang12            Pass: 100%/4   | Total:  2h 14m | Avg: 33m 41s | Max: 36m 06s
  🟩 Clang13            Pass: 100%/4   | Total:  2h 09m | Avg: 32m 26s | Max: 34m 25s
  🟩 Clang14            Pass: 100%/4   | Total:  2h 15m | Avg: 33m 57s | Max: 37m 57s
  🟩 Clang15            Pass: 100%/4   | Total:  2h 15m | Avg: 33m 50s | Max: 38m 08s
  🟩 Clang16            Pass: 100%/4   | Total:  2h 09m | Avg: 32m 23s | Max: 35m 11s
  🟩 Clang17            Pass: 100%/4   | Total:  2h 12m | Avg: 33m 04s | Max: 35m 54s
  🟩 Clang18            Pass: 100%/11  | Total:  4h 37m | Avg: 25m 16s | Max: 34m 23s
  🟩 GCC6               Pass: 100%/2   | Total:  9m 00s | Avg:  4m 30s | Max:  4m 31s
  🟩 GCC7               Pass: 100%/6   | Total:  1h 56m | Avg: 19m 25s | Max: 39m 04s
  🟩 GCC8               Pass: 100%/6   | Total:  1h 55m | Avg: 19m 10s | Max: 37m 16s
  🟩 GCC9               Pass: 100%/6   | Total:  1h 58m | Avg: 19m 46s | Max: 39m 54s
  🟩 GCC10              Pass: 100%/4   | Total:  2h 17m | Avg: 34m 17s | Max: 38m 57s
  🟩 GCC11              Pass: 100%/7   | Total:  2h 36m | Avg: 22m 21s | Max: 37m 40s
  🟩 GCC12              Pass: 100%/4   | Total:  2h 27m | Avg: 36m 59s | Max: 41m 48s
  🟩 GCC13              Pass: 100%/16  | Total:  6h 28m | Avg: 24m 18s | Max: 42m 38s
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  2h 02m | Avg: 40m 57s | Max: 43m 55s
  🟩 MSVC14.16          Pass: 100%/1   | Total: 55m 41s | Avg: 55m 41s | Max: 55m 41s | Hits:  63%/1852  
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 57m | Avg: 58m 54s | Max:  1h 00m | Hits:  63%/3704  
  🟩 MSVC14.39          Pass: 100%/2   | Total:  1h 32m | Avg: 46m 19s | Max:  1h 06m | Hits:  81%/3704  
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  3h 49m | Avg: 57m 16s | Max:  1h 03m
🟩 cxx_family
  🟩 Clang              Pass: 100%/48  | Total:  1d 00h | Avg: 31m 01s | Max: 40m 16s
  🟩 GCC                Pass: 100%/51  | Total: 19h 49m | Avg: 23m 19s | Max: 42m 38s
  🟩 Intel              Pass: 100%/3   | Total:  2h 02m | Avg: 40m 57s | Max: 43m 55s
  🟩 MSVC               Pass: 100%/5   | Total:  4h 26m | Avg: 53m 13s | Max:  1h 06m | Hits:  70%/9260  
  🟩 NVHPC              Pass: 100%/4   | Total:  3h 49m | Avg: 57m 16s | Max:  1h 03m
🟩 gpu
  🟩 v100               Pass: 100%/111 | Total:  2d 06h | Avg: 29m 42s | Max:  1h 06m | Hits:  70%/9260  
🟩 jobs
  🟩 Build              Pass: 100%/103 | Total:  2d 04h | Avg: 30m 49s | Max:  1h 06m | Hits:  63%/7408  
  🟩 TestCPU            Pass: 100%/4   | Total: 49m 09s | Avg: 12m 17s | Max: 25m 40s | Hits:  99%/1852  
  🟩 TestGPU            Pass: 100%/4   | Total:  1h 11m | Avg: 17m 59s | Max: 28m 47s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 17m 26s | Avg:  5m 48s | Max:  6m 02s
  🟩 90a                Pass: 100%/4   | Total:  1h 20m | Avg: 20m 00s | Max: 22m 14s
🟩 std
  🟩 11                 Pass: 100%/30  | Total: 11h 30m | Avg: 23m 01s | Max: 51m 52s
  🟩 14                 Pass: 100%/29  | Total: 15h 02m | Avg: 31m 07s | Max:  1h 00m | Hits:  63%/3704  
  🟩 17                 Pass: 100%/27  | Total: 14h 45m | Avg: 32m 48s | Max:  1h 03m | Hits:  63%/1852  
  🟩 20                 Pass: 100%/23  | Total: 12h 52m | Avg: 33m 34s | Max:  1h 06m | Hits:  81%/3704

🟩 cub: Pass: 100%/110 | Total: 3d 11h | Avg: 45m 36s | Max: 1h 11m | Hits: 65%/3028

🟩 cpu
  🟩 amd64              Pass: 100%/102 | Total:  3d 03h | Avg: 44m 41s | Max:  1h 11m | Hits:  65%/3028  
  🟩 arm64              Pass: 100%/8   | Total:  7h 37m | Avg: 57m 11s | Max:  1h 08m
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  3h 21m | Avg: 13m 25s | Max: 53m 32s | Hits:  65%/757   
  🟩 11.8               Pass: 100%/3   | Total: 17m 03s | Avg:  5m 41s | Max:  5m 56s
  🟩 12.5               Pass: 100%/4   | Total:  4h 13m | Avg:  1h 03m | Max:  1h 09m
  🟩 12.6               Pass: 100%/88  | Total:  3d 03h | Avg: 51m 38s | Max:  1h 11m | Hits:  65%/2271  
🟩 cudacxx
  🟩 ClangCUDA18        Pass: 100%/4   | Total:  3h 57m | Avg: 59m 17s | Max:  1h 02m
  🟩 nvcc11.1           Pass: 100%/15  | Total:  3h 21m | Avg: 13m 25s | Max: 53m 32s | Hits:  65%/757   
  🟩 nvcc11.8           Pass: 100%/3   | Total: 17m 03s | Avg:  5m 41s | Max:  5m 56s
  🟩 nvcc12.5           Pass: 100%/4   | Total:  4h 13m | Avg:  1h 03m | Max:  1h 09m
  🟩 nvcc12.6           Pass: 100%/84  | Total:  2d 23h | Avg: 51m 16s | Max:  1h 11m | Hits:  65%/2271  
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/4   | Total:  3h 57m | Avg: 59m 17s | Max:  1h 02m
  🟩 nvcc               Pass: 100%/106 | Total:  3d 07h | Avg: 45m 05s | Max:  1h 11m | Hits:  65%/3028  
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total:  4h 27m | Avg: 44m 37s | Max: 57m 15s
  🟩 Clang10            Pass: 100%/3   | Total:  2h 43m | Avg: 54m 34s | Max: 59m 56s
  🟩 Clang11            Pass: 100%/4   | Total:  3h 39m | Avg: 54m 56s | Max: 57m 16s
  🟩 Clang12            Pass: 100%/4   | Total:  3h 32m | Avg: 53m 10s | Max: 56m 49s
  🟩 Clang13            Pass: 100%/4   | Total:  3h 49m | Avg: 57m 17s | Max: 58m 22s
  🟩 Clang14            Pass: 100%/4   | Total:  3h 39m | Avg: 54m 47s | Max: 57m 51s
  🟩 Clang15            Pass: 100%/4   | Total:  3h 31m | Avg: 52m 52s | Max: 53m 53s
  🟩 Clang16            Pass: 100%/4   | Total:  3h 41m | Avg: 55m 20s | Max: 59m 01s
  🟩 Clang17            Pass: 100%/4   | Total:  3h 38m | Avg: 54m 38s | Max: 57m 42s
  🟩 Clang18            Pass: 100%/11  | Total:  9h 28m | Avg: 51m 43s | Max:  1h 08m
  🟩 GCC6               Pass: 100%/2   | Total:  8m 36s | Avg:  4m 18s | Max:  4m 27s
  🟩 GCC7               Pass: 100%/6   | Total:  2h 51m | Avg: 28m 32s | Max: 54m 16s
  🟩 GCC8               Pass: 100%/6   | Total:  2h 56m | Avg: 29m 23s | Max: 57m 23s
  🟩 GCC9               Pass: 100%/6   | Total:  2h 54m | Avg: 29m 00s | Max: 54m 04s
  🟩 GCC10              Pass: 100%/4   | Total:  3h 40m | Avg: 55m 14s | Max: 56m 46s
  🟩 GCC11              Pass: 100%/7   | Total:  4h 17m | Avg: 36m 50s | Max:  1h 11m
  🟩 GCC12              Pass: 100%/4   | Total:  3h 39m | Avg: 54m 53s | Max: 59m 58s
  🟩 GCC13              Pass: 100%/16  | Total:  9h 45m | Avg: 36m 36s | Max:  1h 02m
  🟩 Intel2023.2.0      Pass: 100%/3   | Total:  2h 58m | Avg: 59m 39s | Max:  1h 00m
  🟩 MSVC14.16          Pass: 100%/1   | Total: 53m 32s | Avg: 53m 32s | Max: 53m 32s | Hits:  65%/757   
  🟩 MSVC14.29          Pass: 100%/2   | Total:  2h 02m | Avg:  1h 01m | Max:  1h 03m | Hits:  65%/1514  
  🟩 MSVC14.39          Pass: 100%/1   | Total:  1h 00m | Avg:  1h 00m | Max:  1h 00m | Hits:  65%/757   
  🟩 NVHPC24.7          Pass: 100%/4   | Total:  4h 13m | Avg:  1h 03m | Max:  1h 09m
🟩 cxx_family
  🟩 Clang              Pass: 100%/48  | Total:  1d 18h | Avg: 52m 45s | Max:  1h 08m
  🟩 GCC                Pass: 100%/51  | Total:  1d 06h | Avg: 35m 34s | Max:  1h 11m
  🟩 Intel              Pass: 100%/3   | Total:  2h 58m | Avg: 59m 39s | Max:  1h 00m
  🟩 MSVC               Pass: 100%/4   | Total:  3h 56m | Avg: 59m 14s | Max:  1h 03m | Hits:  65%/3028  
  🟩 NVHPC              Pass: 100%/4   | Total:  4h 13m | Avg:  1h 03m | Max:  1h 09m
🟩 gpu
  🟩 v100               Pass: 100%/110 | Total:  3d 11h | Avg: 45m 36s | Max:  1h 11m | Hits:  65%/3028  
🟩 jobs
  🟩 Build              Pass: 100%/102 | Total:  3d 08h | Avg: 47m 19s | Max:  1h 11m | Hits:  65%/3028  
  🟩 DeviceLaunch       Pass: 100%/1   | Total: 20m 56s | Avg: 20m 56s | Max: 20m 56s
  🟩 GraphCapture       Pass: 100%/1   | Total: 19m 48s | Avg: 19m 48s | Max: 19m 48s
  🟩 HostLaunch         Pass: 100%/3   | Total:  1h 05m | Avg: 21m 40s | Max: 24m 04s
  🟩 TestGPU            Pass: 100%/3   | Total:  1h 23m | Avg: 27m 55s | Max: 30m 55s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 17m 03s | Avg:  5m 41s | Max:  5m 56s
  🟩 90a                Pass: 100%/4   | Total:  1h 33m | Avg: 23m 29s | Max: 25m 42s
🟩 std
  🟩 11                 Pass: 100%/30  | Total: 21h 05m | Avg: 42m 10s | Max:  1h 02m
  🟩 14                 Pass: 100%/29  | Total: 22h 02m | Avg: 45m 37s | Max:  1h 11m | Hits:  65%/1514  
  🟩 17                 Pass: 100%/27  | Total: 21h 31m | Avg: 47m 49s | Max:  1h 08m | Hits:  65%/757   
  🟩 20                 Pass: 100%/24  | Total: 18h 56m | Avg: 47m 22s | Max:  1h 09m | Hits:  65%/757

🟩 cudax: Pass: 100%/54 | Total: 5h 22m | Avg: 5m 58s | Max: 22m 30s | Hits: 82%/246

🟩 cpu
  🟩 amd64              Pass: 100%/50  | Total:  5h 07m | Avg:  6m 08s | Max: 22m 30s | Hits:  82%/246   
  🟩 arm64              Pass: 100%/4   | Total: 14m 54s | Avg:  3m 43s | Max:  4m 02s
🟩 ctk
  🟩 12.0               Pass: 100%/19  | Total:  1h 59m | Avg:  6m 18s | Max: 22m 26s | Hits:  77%/123   
  🟩 12.5               Pass: 100%/2   | Total: 14m 53s | Avg:  7m 26s | Max:  7m 32s
  🟩 12.6               Pass: 100%/33  | Total:  3h 07m | Avg:  5m 41s | Max: 22m 30s | Hits:  87%/123   
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/19  | Total:  1h 59m | Avg:  6m 18s | Max: 22m 26s | Hits:  77%/123   
  🟩 nvcc12.5           Pass: 100%/2   | Total: 14m 53s | Avg:  7m 26s | Max:  7m 32s
  🟩 nvcc12.6           Pass: 100%/33  | Total:  3h 07m | Avg:  5m 41s | Max: 22m 30s | Hits:  87%/123   
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/54  | Total:  5h 22m | Avg:  5m 58s | Max: 22m 30s | Hits:  82%/246   
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  9m 34s | Avg:  4m 47s | Max:  5m 33s
  🟩 Clang10            Pass: 100%/2   | Total:  8m 45s | Avg:  4m 22s | Max:  5m 04s
  🟩 Clang11            Pass: 100%/4   | Total: 15m 49s | Avg:  3m 57s | Max:  4m 14s
  🟩 Clang12            Pass: 100%/4   | Total: 15m 41s | Avg:  3m 55s | Max:  4m 13s
  🟩 Clang13            Pass: 100%/4   | Total: 16m 37s | Avg:  4m 09s | Max:  4m 55s
  🟩 Clang14            Pass: 100%/4   | Total: 35m 55s | Avg:  8m 58s | Max: 22m 26s
  🟩 Clang15            Pass: 100%/2   | Total:  8m 00s | Avg:  4m 00s | Max:  4m 13s
  🟩 Clang16            Pass: 100%/4   | Total: 16m 58s | Avg:  4m 14s | Max:  4m 56s
  🟩 Clang17            Pass: 100%/2   | Total:  8m 31s | Avg:  4m 15s | Max:  4m 24s
  🟩 Clang18            Pass: 100%/2   | Total: 20m 31s | Avg: 10m 15s | Max: 16m 22s
  🟩 GCC9               Pass: 100%/2   | Total:  8m 06s | Avg:  4m 03s | Max:  4m 46s
  🟩 GCC10              Pass: 100%/4   | Total: 18m 53s | Avg:  4m 43s | Max:  5m 41s
  🟩 GCC11              Pass: 100%/4   | Total: 18m 15s | Avg:  4m 33s | Max:  5m 32s
  🟩 GCC12              Pass: 100%/7   | Total:  1h 16m | Avg: 10m 58s | Max: 22m 30s
  🟩 GCC13              Pass: 100%/3   | Total: 11m 09s | Avg:  3m 43s | Max:  4m 12s
  🟩 MSVC14.36          Pass: 100%/1   | Total:  8m 53s | Avg:  8m 53s | Max:  8m 53s | Hits:  77%/123   
  🟩 MSVC14.39          Pass: 100%/1   | Total:  9m 05s | Avg:  9m 05s | Max:  9m 05s | Hits:  87%/123   
  🟩 NVHPC24.7          Pass: 100%/2   | Total: 14m 53s | Avg:  7m 26s | Max:  7m 32s
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  2h 36m | Avg:  5m 12s | Max: 22m 26s
  🟩 GCC                Pass: 100%/20  | Total:  2h 13m | Avg:  6m 39s | Max: 22m 30s
  🟩 MSVC               Pass: 100%/2   | Total: 17m 58s | Avg:  8m 59s | Max:  9m 05s | Hits:  82%/246   
  🟩 NVHPC              Pass: 100%/2   | Total: 14m 53s | Avg:  7m 26s | Max:  7m 32s
🟩 gpu
  🟩 v100               Pass: 100%/54  | Total:  5h 22m | Avg:  5m 58s | Max: 22m 30s | Hits:  82%/246   
🟩 jobs
  🟩 Build              Pass: 100%/49  | Total:  3h 45m | Avg:  4m 36s | Max:  9m 05s | Hits:  82%/246   
  🟩 Test               Pass: 100%/5   | Total:  1h 36m | Avg: 19m 22s | Max: 22m 30s
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  4m 32s | Avg:  4m 32s | Max:  4m 32s
  🟩 90a                Pass: 100%/1   | Total:  4m 12s | Avg:  4m 12s | Max:  4m 12s
🟩 std
  🟩 17                 Pass: 100%/29  | Total:  2h 41m | Avg:  5m 34s | Max: 22m 30s
  🟩 20                 Pass: 100%/25  | Total:  2h 40m | Avg:  6m 25s | Max: 22m 26s | Hits:  82%/246

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 04s | Avg: 5m 02s | Max: 7m 37s

🟩 cpu
  🟩 amd64              Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  7m 37s
🟩 ctk
  🟩 12.6               Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  7m 37s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  7m 37s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  7m 37s
🟩 cxx
  🟩 GCC13              Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  7m 37s
🟩 cxx_family
  🟩 GCC                Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  7m 37s
🟩 gpu
  🟩 v100               Pass: 100%/2   | Total: 10m 04s | Avg:  5m 02s | Max:  7m 37s
🟩 jobs
  🟩 Build              Pass: 100%/1   | Total:  2m 27s | Avg:  2m 27s | Max:  2m 27s
  🟩 Test               Pass: 100%/1   | Total:  7m 37s | Avg:  7m 37s | Max:  7m 37s

🟩 python: Pass: 100%/1 | Total: 15m 23s | Avg: 15m 23s | Max: 15m 23s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 15m 23s | Avg: 15m 23s | Max: 15m 23s
🟩 ctk
  🟩 12.6               Pass: 100%/1   | Total: 15m 23s | Avg: 15m 23s | Max: 15m 23s
🟩 cudacxx
  🟩 nvcc12.6           Pass: 100%/1   | Total: 15m 23s | Avg: 15m 23s | Max: 15m 23s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 15m 23s | Avg: 15m 23s | Max: 15m 23s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 15m 23s | Avg: 15m 23s | Max: 15m 23s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 15m 23s | Avg: 15m 23s | Max: 15m 23s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 15m 23s | Avg: 15m 23s | Max: 15m 23s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 15m 23s | Avg: 15m 23s | Max: 15m 23s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	python
	CCCL C Parallel Library
	Catch2Helper

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	python
+/-	CCCL C Parallel Library
+/-	Catch2Helper

🏃‍ Runner counts (total jobs: 396)

#	Runner
327	`linux-amd64-cpu16`
28	`linux-arm64-cpu16`
26	`linux-amd64-gpu-v100-latest-1`
15	`windows-amd64-cpu16`

bernhardmgruber force-pushed the ptx_gen branch from 8118516 to e77f1d2 Compare November 21, 2024 11:10

bernhardmgruber force-pushed the ptx_gen branch from e77f1d2 to 542f32d Compare November 21, 2024 15:18

bernhardmgruber force-pushed the ptx_gen branch 4 times, most recently from 8a35ce5 to e55e5f8 Compare November 21, 2024 18:27

bernhardmgruber changed the title ~~Split off generated PTX fragments~~ Reorganize PTX headers to match generator Nov 21, 2024

bernhardmgruber added the libcu++ For all items related to libcu++ label Nov 21, 2024

bernhardmgruber marked this pull request as ready for review November 21, 2024 18:33

bernhardmgruber requested review from a team as code owners November 21, 2024 18:33

bernhardmgruber requested review from wmaxey and elstehle November 21, 2024 18:33

miscco approved these changes Nov 22, 2024

View reviewed changes

ahendriksen requested changes Nov 22, 2024

View reviewed changes

libcudacxx/include/cuda/__ptx/instructions/generated/mbarrier_test_wait.inc Show resolved Hide resolved

bernhardmgruber added 2 commits November 22, 2024 11:31

Reorganize PTX headers to match generator

c0b593a

Add missing content

11041a7

bernhardmgruber force-pushed the ptx_gen branch from e55e5f8 to 11041a7 Compare November 22, 2024 10:47

bernhardmgruber requested a review from ahendriksen November 22, 2024 11:47

ahendriksen approved these changes Nov 22, 2024

View reviewed changes

bernhardmgruber enabled auto-merge (squash) November 22, 2024 12:34

bernhardmgruber merged commit b27d512 into NVIDIA:main Nov 22, 2024
413 checks passed

bernhardmgruber deleted the ptx_gen branch November 22, 2024 12:40

davebayer pushed a commit to davebayer/cccl that referenced this pull request Nov 22, 2024

Reorganize PTX headers to match generator (NVIDIA#2925)

14484a6

trxcllnt pushed a commit to trxcllnt/cccl that referenced this pull request Nov 23, 2024

Reorganize PTX headers to match generator (NVIDIA#2925)

7f26982

davebayer pushed a commit to davebayer/cccl that referenced this pull request Dec 2, 2024

Reorganize PTX headers to match generator (NVIDIA#2925)

cc11592

Reorganize PTX headers to match generator #2925

Reorganize PTX headers to match generator #2925

Conversation

bernhardmgruber commented Nov 21, 2024 • edited Loading

github-actions bot commented Nov 21, 2024

🟨 cudax: Pass: 98%/54 | Total: 4h 47m | Avg: 5m 19s | Max: 24m 26s | Hits: 90%/123

🟩 libcudacxx: Pass: 100%/118 | Total: 17h 07m | Avg: 8m 42s | Max: 43m 38s | Hits: 66%/9504

🟩 thrust: Pass: 100%/111 | Total: 1d 11h | Avg: 19m 20s | Max: 1h 11m | Hits: 84%/9260

🟩 cub: Pass: 100%/110 | Total: 2d 04h | Avg: 28m 47s | Max: 1h 08m | Hits: 76%/3028

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 9m 49s | Avg: 4m 54s | Max: 7m 36s

🟩 python: Pass: 100%/1 | Total: 15m 19s | Avg: 15m 19s | Max: 15m 19s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 396)

miscco commented Nov 21, 2024

bernhardmgruber commented Nov 21, 2024

bernhardmgruber commented Nov 21, 2024

miscco commented Nov 21, 2024

github-actions bot commented Nov 21, 2024

🟨 libcudacxx: Pass: 89%/118 | Total: 20h 46m | Avg: 10m 33s | Max: 56m 30s | Hits: 62%/9504

🟩 thrust: Pass: 100%/111 | Total: 19h 28m | Avg: 10m 31s | Max: 37m 50s | Hits: 99%/9260

🟩 cub: Pass: 100%/110 | Total: 2d 01h | Avg: 26m 57s | Max: 54m 43s | Hits: 99%/3028

🟩 cudax: Pass: 100%/54 | Total: 4h 10m | Avg: 4m 38s | Max: 20m 31s | Hits: 90%/246

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 25s | Avg: 5m 12s | Max: 8m 28s

🟩 python: Pass: 100%/1 | Total: 15m 56s | Avg: 15m 56s | Max: 15m 56s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 396)

bernhardmgruber commented Nov 21, 2024

miscco Nov 22, 2024

Choose a reason for hiding this comment

ahendriksen Nov 22, 2024

Choose a reason for hiding this comment

bernhardmgruber Nov 22, 2024

Choose a reason for hiding this comment

miscco commented Nov 22, 2024

ahendriksen left a comment

Choose a reason for hiding this comment

ahendriksen left a comment

Choose a reason for hiding this comment

github-actions bot commented Nov 22, 2024

🟩 libcudacxx: Pass: 100%/118 | Total: 19h 55m | Avg: 10m 08s | Max: 41m 09s | Hits: 63%/9508

🟩 thrust: Pass: 100%/111 | Total: 2d 06h | Avg: 29m 42s | Max: 1h 06m | Hits: 70%/9260

🟩 cub: Pass: 100%/110 | Total: 3d 11h | Avg: 45m 36s | Max: 1h 11m | Hits: 65%/3028

🟩 cudax: Pass: 100%/54 | Total: 5h 22m | Avg: 5m 58s | Max: 22m 30s | Hits: 82%/246

🟩 cccl_c_parallel: Pass: 100%/2 | Total: 10m 04s | Avg: 5m 02s | Max: 7m 37s

🟩 python: Pass: 100%/1 | Total: 15m 23s | Avg: 15m 23s | Max: 15m 23s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 396)

bernhardmgruber commented Nov 21, 2024 •

edited

Loading