Enable including atomics and friends in TUs that do not support them. #1736

wmaxey · 2024-05-13T22:28:44Z

Description

This removes most #error protections from atomics headers. This allows them to be included in TUs where they previously would force a failure if the __CUDA_ARCH__ list included an architecture that was not supported.

Link time failures are emitted when compiling for architectures where the API is not supported.

For example:

#include <cuda/std/atomic>

__global__ void test(cuda::std::atomic<int>* atom) {
    atom->load();
}

results in:

PS C:\cccl> nvcc test.cu -Ilibcudacxx/include -arch=sm_52
ptxas fatal   : Unresolved extern function '__atomic_is_not_supported_pre_sm_60'

closes: #1083

Checklist

New or existing tests cover these changes.
The documentation is up to date with these changes.

github-actions · 2024-05-14T01:33:41Z

🟩 CI Results [ Failed: 0 | Passed: 302 | Total: 302 ]

🟩 Project cub [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 cpu
  🟩 amd64 (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 arm64 (0% Fail)              Failed:  0  -- Passed:  8  -- Total:  8 
🟩 ctk
  🟩 11.1 (0% Fail)               Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 12.4 (0% Fail)               Failed:  0  -- Passed: 81  -- Total: 81 
🟩 cudacxx_full
  🟩 clang-cuda16 (0% Fail)       Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc11.1 (0% Fail)           Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 nvcc12.4 (0% Fail)           Failed:  0  -- Passed: 79  -- Total: 79 
🟩 cudacxx_name
  🟩 clang-cuda (0% Fail)         Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc (0% Fail)               Failed:  0  -- Passed: 97  -- Total: 97 
🟩 cxx_full
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 clang11 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang12 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang13 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang14 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang15 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang16 (0% Fail)            Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 gcc6 (0% Fail)               Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟩 gcc12 (0% Fail)              Failed:  0  -- Passed: 16  -- Total: 16 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🟩 cxx_name
  🟩 clang (0% Fail)              Failed:  0  -- Passed: 43  -- Total: 43 
  🟩 gcc (0% Fail)                Failed:  0  -- Passed: 47  -- Total: 47 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🟩 gpu
  🟩 v100 (0% Fail)               Failed:  0  -- Passed: 99  -- Total: 99 
🟩 jobs
  🟩 build (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 test (0% Fail)               Failed:  0  -- Passed:  8  -- Total:  8 
🟩 os
  🟩 ubuntu18.04 (0% Fail)        Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 ubuntu20.04 (0% Fail)        Failed:  0  -- Passed: 35  -- Total: 35 
  🟩 ubuntu22.04 (0% Fail)        Failed:  0  -- Passed: 44  -- Total: 44 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟩 sm
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 90a (0% Fail)                Failed:  0  -- Passed:  4  -- Total:  4 
🟩 std
  🟩 11 (0% Fail)                 Failed:  0  -- Passed: 26  -- Total: 26 
  🟩 14 (0% Fail)                 Failed:  0  -- Passed: 29  -- Total: 29 
  🟩 17 (0% Fail)                 Failed:  0  -- Passed: 28  -- Total: 28 
  🟩 20 (0% Fail)                 Failed:  0  -- Passed: 16  -- Total: 16

🟩 Project thrust [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 cpu
  🟩 amd64 (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 arm64 (0% Fail)              Failed:  0  -- Passed:  8  -- Total:  8 
🟩 ctk
  🟩 11.1 (0% Fail)               Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 12.4 (0% Fail)               Failed:  0  -- Passed: 81  -- Total: 81 
🟩 cudacxx_full
  🟩 clang-cuda16 (0% Fail)       Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc11.1 (0% Fail)           Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 nvcc12.4 (0% Fail)           Failed:  0  -- Passed: 79  -- Total: 79 
🟩 cudacxx_name
  🟩 clang-cuda (0% Fail)         Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc (0% Fail)               Failed:  0  -- Passed: 97  -- Total: 97 
🟩 cxx_full
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 clang11 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang12 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang13 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang14 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang15 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang16 (0% Fail)            Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 gcc6 (0% Fail)               Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟩 gcc12 (0% Fail)              Failed:  0  -- Passed: 16  -- Total: 16 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🟩 cxx_name
  🟩 clang (0% Fail)              Failed:  0  -- Passed: 43  -- Total: 43 
  🟩 gcc (0% Fail)                Failed:  0  -- Passed: 47  -- Total: 47 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🟩 gpu
  🟩 v100 (0% Fail)               Failed:  0  -- Passed: 99  -- Total: 99 
🟩 jobs
  🟩 build (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 test (0% Fail)               Failed:  0  -- Passed:  8  -- Total:  8 
🟩 os
  🟩 ubuntu18.04 (0% Fail)        Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 ubuntu20.04 (0% Fail)        Failed:  0  -- Passed: 35  -- Total: 35 
  🟩 ubuntu22.04 (0% Fail)        Failed:  0  -- Passed: 44  -- Total: 44 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟩 sm
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 90a (0% Fail)                Failed:  0  -- Passed:  4  -- Total:  4 
🟩 std
  🟩 11 (0% Fail)                 Failed:  0  -- Passed: 26  -- Total: 26 
  🟩 14 (0% Fail)                 Failed:  0  -- Passed: 29  -- Total: 29 
  🟩 17 (0% Fail)                 Failed:  0  -- Passed: 28  -- Total: 28 
  🟩 20 (0% Fail)                 Failed:  0  -- Passed: 16  -- Total: 16

🟩 Project libcudacxx [ Failed: 0 | Passed: 104 | Total: 104 ]

🟩 cpu
  🟩 amd64 (0% Fail)              Failed:  0  -- Passed: 96  -- Total: 96 
  🟩 arm64 (0% Fail)              Failed:  0  -- Passed:  8  -- Total:  8 
🟩 ctk
  🟩 11.1 (0% Fail)               Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 12.4 (0% Fail)               Failed:  0  -- Passed: 86  -- Total: 86 
🟩 cudacxx_full
  🟩 clang-cuda16 (0% Fail)       Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc11.1 (0% Fail)           Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 nvcc12.4 (0% Fail)           Failed:  0  -- Passed: 84  -- Total: 84 
🟩 cudacxx_name
  🟩 clang-cuda (0% Fail)         Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc (0% Fail)               Failed:  0  -- Passed: 102 -- Total: 102
🟩 cxx_full
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 clang11 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang12 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang13 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang14 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang15 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang16 (0% Fail)            Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 gcc6 (0% Fail)               Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟩 gcc12 (0% Fail)              Failed:  0  -- Passed: 21  -- Total: 21 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🟩 cxx_name
  🟩 clang (0% Fail)              Failed:  0  -- Passed: 43  -- Total: 43 
  🟩 gcc (0% Fail)                Failed:  0  -- Passed: 52  -- Total: 52 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🟩 gpu
  🟩 v100 (0% Fail)               Failed:  0  -- Passed: 104 -- Total: 104
🟩 jobs
  🟩 build (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 nvrtc (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 test (0% Fail)               Failed:  0  -- Passed:  8  -- Total:  8 
  🟩 verify_codegen (0% Fail)     Failed:  0  -- Passed:  1  -- Total:  1 
🟩 os
  🟩 ubuntu18.04 (0% Fail)        Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 ubuntu20.04 (0% Fail)        Failed:  0  -- Passed: 35  -- Total: 35 
  🟩 ubuntu22.04 (0% Fail)        Failed:  0  -- Passed: 49  -- Total: 49 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟩 sm
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 90a (0% Fail)                Failed:  0  -- Passed:  4  -- Total:  4 
🟩 std
  🟩 11 (0% Fail)                 Failed:  0  -- Passed: 27  -- Total: 27 
  🟩 14 (0% Fail)                 Failed:  0  -- Passed: 30  -- Total: 30 
  🟩 17 (0% Fail)                 Failed:  0  -- Passed: 29  -- Total: 29 
  🟩 20 (0% Fail)                 Failed:  0  -- Passed: 17  -- Total: 17

🏃‍ Runner counts (total jobs: 302)

#	Runner
232	`linux-amd64-cpu16`
28	`linux-amd64-gpu-v100-latest-1`
24	`linux-arm64-cpu16`
18	`windows-amd64-cpu16`

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental

miscco

Thanks a lot, that has been a long desired feature.

That said, we are missing

Enabling all tests that are currently guarded by pre-sm-70
Adding a test set that ensures that we do fail when passed a lower architecture

libcudacxx/include/cuda/std/__atomic/types/base.h

miscco · 2024-05-14T06:58:56Z

libcudacxx/include/cuda/std/__atomic/types/base.h

    (return __atomic_load_n_cuda(__a->get(), static_cast<__memory_order_underlying_t>(__order), _Sco{});),
+    NV_IS_DEVICE,
+    (__atomic_is_not_supported_pre_sm_60();),


We might need to make this a template that returns __atomic_underlying_t<_Sto> because otherwise we might have no return in that function

Or:

Suggested change

(__atomic_is_not_supported_pre_sm_60();),

(__atomic_is_not_supported_pre_sm_60(); return {};),

Comment applies to a lot more places below.

I think we just should mark the undefined function [[noinline]], that should kill any potential for stupid warnings.

jrhemstad · 2024-05-14T15:49:28Z

I agree with @miscco that I don't think this is functionality we can advertise until we have a way to test it. I believe properly testing this requires us to resolve #1084

miscco · 2024-05-14T17:31:25Z

I agree with @miscco that I don't think this is functionality we can advertise until we have a way to test it. I believe properly testing this requires us to resolve #1084

I dont think so. With us moving towards linker errors we should be able to use NV_IF_TARGET to test this within the current framework

griwes · 2024-05-14T20:16:09Z

Agreed with @miscco's review.

jrhemstad · 2024-05-14T20:39:57Z

use NV_IF_TARGET to test this within the current framework

Sure, you'd just need to rewrite all of the current atomic tests that use pre-sm-70 to instead use NV_IF_TARGET.

miscco · 2024-05-15T06:29:50Z

use NV_IF_TARGET to test this within the current framework

Sure, you'd just need to rewrite all of the current atomic tests that use pre-sm-70 to instead use NV_IF_TARGET.

It depends a bit on the tests, but we have moved towards defining a single test function anyway, which makes this rather easy to do

miscco · 2024-05-29T07:07:39Z

libcudacxx/include/cuda/std/__atomic/types/base.h

@@ -64,11 +64,17 @@ struct __atomic_storage
  }
 };

+#if defined(_CCCL_CUDA_COMPILER)
+extern "C" _CCCL_DEVICE void __atomic_is_not_supported_pre_sm_60();
+#endif


Suggested change

#endif

#endif // _CCCL_CUDA_COMPILER

libcudacxx/include/cuda/std/__atomic/types/base.h

bernhardmgruber · 2024-06-27T13:52:10Z

libcudacxx/include/cuda/std/__atomic/types/base.h

    (return __atomic_load_n_cuda(__a->get(), static_cast<__memory_order_underlying_t>(__order), _Sco{});),
+    NV_IS_DEVICE,
+    (__atomic_is_not_supported_pre_sm_60();),


Comment applies to a lot more places below.

griwes · 2024-08-01T17:03:44Z

libcudacxx/include/cuda/std/__atomic/types/base.h

    (return __atomic_load_n_cuda(__a->get(), static_cast<__memory_order_underlying_t>(__order), _Sco{});),
+    NV_IS_DEVICE,
+    (__atomic_is_not_supported_pre_sm_60();),


I think we just should mark the undefined function [[noinline]], that should kill any potential for stupid warnings.

griwes · 2024-08-01T17:04:34Z

libcudacxx/test/public_headers/CMakeLists.txt

@@ -45,7 +45,7 @@ function(libcudacxx_add_public_header_test header)
  target_compile_options(headertest_${header_name} PRIVATE ${headertest_warning_levels_device})

  # Ensure that if this is an atomic header, we only include the right architectures


This comment is stale with these changes.

github-actions · 2024-08-05T12:07:30Z

🟨 CI finished in 4h 11m: Pass: 99%/417 | Total: 3d 05h | Avg: 11m 11s | Max: 1h 00m | Hits: 94%/524401

🟨 cub: Pass: 98%/131 | Total: 1d 04h | Avg: 13m 08s | Max: 1h 00m | Hits: 97%/109396

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  98%/123 | Total: 22h 25m | Avg: 10m 56s | Max:  1h 00m | Hits:  98%/102460
  🟩 arm64              Pass: 100%/8   | Total:  6h 17m | Avg: 47m 08s | Max: 48m 51s | Hits:  71%/6936  
🔍 ctk: 12.5 🔍
  🟩 11.1               Pass: 100%/15  | Total:  1h 35m | Avg:  6m 20s | Max: 45m 04s | Hits:  98%/11792 
  🟩 11.8               Pass: 100%/3   | Total: 13m 55s | Avg:  4m 38s | Max:  4m 42s | Hits:  99%/2601  
  🔍 12.5               Pass:  98%/113 | Total:  1d 02h | Avg: 14m 16s | Max:  1h 00m | Hits:  96%/95003 
🔍 cudacxx: nvcc12.5 🔍
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  7m 07s | Avg:  3m 33s | Max:  3m 40s | Hits: 100%/1436  
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 35m | Avg:  6m 20s | Max: 45m 04s | Hits:  98%/11792 
  🟩 nvcc11.8           Pass: 100%/3   | Total: 13m 55s | Avg:  4m 38s | Max:  4m 42s | Hits:  99%/2601  
  🔍 nvcc12.5           Pass:  98%/111 | Total:  1d 02h | Avg: 14m 28s | Max:  1h 00m | Hits:  96%/93567 
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 07s | Avg:  3m 33s | Max:  3m 40s | Hits: 100%/1436  
  🔍 nvcc               Pass:  98%/129 | Total:  1d 04h | Avg: 13m 17s | Max:  1h 00m | Hits:  97%/107960
🔍 cxx: Clang17 🔍
  🟩 Clang9             Pass: 100%/6   | Total: 27m 00s | Avg:  4m 30s | Max:  5m 14s | Hits: 100%/4980  
  🟩 Clang10            Pass: 100%/3   | Total: 15m 02s | Avg:  5m 00s | Max:  5m 02s | Hits:  99%/2607  
  🟩 Clang11            Pass: 100%/4   | Total: 17m 56s | Avg:  4m 29s | Max:  4m 43s | Hits: 100%/3476  
  🟩 Clang12            Pass: 100%/4   | Total: 18m 01s | Avg:  4m 30s | Max:  4m 42s | Hits:  99%/3476  
  🟩 Clang13            Pass: 100%/4   | Total: 17m 18s | Avg:  4m 19s | Max:  4m 38s | Hits: 100%/3476  
  🟩 Clang14            Pass: 100%/4   | Total: 17m 39s | Avg:  4m 24s | Max:  4m 31s | Hits: 100%/3476  
  🟩 Clang15            Pass: 100%/4   | Total: 17m 51s | Avg:  4m 27s | Max:  4m 37s | Hits: 100%/3468  
  🟩 Clang16            Pass: 100%/4   | Total: 18m 28s | Avg:  4m 37s | Max:  4m 44s | Hits:  99%/3468  
  🔍 Clang17            Pass:  92%/26  | Total:  8h 44m | Avg: 20m 10s | Max: 47m 45s | Hits:  95%/20510 
  🟩 GCC6               Pass: 100%/2   | Total:  6m 36s | Avg:  3m 18s | Max:  3m 20s | Hits:  99%/1582  
  🟩 GCC7               Pass: 100%/6   | Total: 22m 28s | Avg:  3m 44s | Max:  4m 21s | Hits:  99%/4983  
  🟩 GCC8               Pass: 100%/6   | Total: 23m 27s | Avg:  3m 54s | Max:  4m 33s | Hits:  99%/4983  
  🟩 GCC9               Pass: 100%/6   | Total: 23m 58s | Avg:  3m 59s | Max:  4m 12s | Hits:  99%/4983  
  🟩 GCC10              Pass: 100%/4   | Total: 16m 58s | Avg:  4m 14s | Max:  4m 43s | Hits:  99%/3476  
  🟩 GCC11              Pass: 100%/7   | Total: 31m 20s | Avg:  4m 28s | Max:  4m 42s | Hits:  99%/6069  
  🟩 GCC12              Pass: 100%/4   | Total: 18m 09s | Avg:  4m 32s | Max:  4m 47s | Hits:  99%/3468  
  🟩 GCC13              Pass: 100%/28  | Total:  9h 30m | Avg: 20m 21s | Max: 48m 51s | Hits:  95%/24276 
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 15m 35s | Avg:  5m 11s | Max:  5m 27s | Hits: 100%/2385  
  🟩 MSVC14.16          Pass: 100%/1   | Total: 45m 04s | Avg: 45m 04s | Max: 45m 04s | Hits:  80%/709   
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 44m | Avg: 52m 11s | Max: 52m 52s | Hits:  74%/1418  
  🟩 MSVC14.39          Pass: 100%/3   | Total:  2h 50m | Avg: 56m 52s | Max:  1h 00m | Hits:  76%/2127  
🔍 cxx_family: Clang 🔍
  🔍 Clang              Pass:  96%/59  | Total: 11h 13m | Avg: 11m 25s | Max: 47m 45s | Hits:  98%/48937 
  🟩 GCC                Pass: 100%/63  | Total: 11h 53m | Avg: 11m 19s | Max: 48m 51s | Hits:  97%/53820 
  🟩 Intel              Pass: 100%/3   | Total: 15m 35s | Avg:  5m 11s | Max:  5m 27s | Hits: 100%/2385  
  🟩 MSVC               Pass: 100%/6   | Total:  5h 20m | Avg: 53m 20s | Max:  1h 00m | Hits:  76%/4254  
🔍 std: 11 🔍
  🔍 11                 Pass:  94%/34  | Total:  5h 11m | Avg:  9m 09s | Max: 47m 45s | Hits:  98%/27315 
  🟩 14                 Pass: 100%/37  | Total:  8h 42m | Avg: 14m 06s | Max: 53m 03s | Hits:  96%/31176 
  🟩 17                 Pass: 100%/36  | Total:  7h 56m | Avg: 13m 14s | Max: 57m 29s | Hits:  96%/30394 
  🟩 20                 Pass: 100%/24  | Total:  6h 52m | Avg: 17m 10s | Max:  1h 00m | Hits:  96%/20511 
🟨 jobs
  🟩 Build              Pass: 100%/99  | Total: 17h 43m | Avg: 10m 44s | Max:  1h 00m | Hits:  96%/83386 
  🟨 DeviceLaunch       Pass:  87%/8   | Total:  2h 29m | Avg: 18m 43s | Max: 23m 53s | Hits:  99%/6069  
  🟩 GraphCapture       Pass: 100%/8   | Total:  2h 22m | Avg: 17m 47s | Max: 22m 20s | Hits:  99%/6936  
  🟩 HostLaunch         Pass: 100%/8   | Total:  2h 38m | Avg: 19m 50s | Max: 24m 56s | Hits:  99%/6936  
  🟨 TestGPU            Pass:  87%/8   | Total:  3h 28m | Avg: 26m 00s | Max: 33m 41s | Hits:  99%/6069  
🟨 gpu
  🟨 v100               Pass:  98%/131 | Total:  1d 04h | Avg: 13m 08s | Max:  1h 00m | Hits:  97%/109396
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 13m 55s | Avg:  4m 38s | Max:  4m 42s | Hits:  99%/2601  
  🟩 90a                Pass: 100%/4   | Total: 14m 41s | Avg:  3m 40s | Max:  3m 56s | Hits:  99%/3468

🟩 thrust: Pass: 100%/118 | Total: 16h 36m | Avg: 8m 26s | Max: 45m 08s | Hits: 97%/138912

🟩 cpu
  🟩 amd64              Pass: 100%/110 | Total: 14h 09m | Avg:  7m 43s | Max: 45m 08s | Hits:  98%/129492
  🟩 arm64              Pass: 100%/8   | Total:  2h 27m | Avg: 18m 24s | Max: 23m 05s | Hits:  81%/9420  
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 24m | Avg:  5m 36s | Max: 40m 48s | Hits:  98%/17660 
  🟩 11.8               Pass: 100%/3   | Total: 11m 21s | Avg:  3m 47s | Max:  4m 00s | Hits:  99%/3534  
  🟩 12.5               Pass: 100%/100 | Total: 15h 01m | Avg:  9m 00s | Max: 45m 08s | Hits:  96%/117718
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  7m 24s | Avg:  3m 42s | Max:  3m 45s | Hits: 100%/2354  
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 24m | Avg:  5m 36s | Max: 40m 48s | Hits:  98%/17660 
  🟩 nvcc11.8           Pass: 100%/3   | Total: 11m 21s | Avg:  3m 47s | Max:  4m 00s | Hits:  99%/3534  
  🟩 nvcc12.5           Pass: 100%/98  | Total: 14h 53m | Avg:  9m 07s | Max: 45m 08s | Hits:  96%/115364
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 24s | Avg:  3m 42s | Max:  3m 45s | Hits: 100%/2354  
  🟩 nvcc               Pass: 100%/116 | Total: 16h 29m | Avg:  8m 31s | Max: 45m 08s | Hits:  97%/136558
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 22m 09s | Avg:  3m 41s | Max:  4m 25s | Hits: 100%/7062  
  🟩 Clang10            Pass: 100%/3   | Total: 12m 46s | Avg:  4m 15s | Max:  4m 23s | Hits: 100%/3531  
  🟩 Clang11            Pass: 100%/4   | Total: 14m 13s | Avg:  3m 33s | Max:  3m 58s | Hits: 100%/4708  
  🟩 Clang12            Pass: 100%/4   | Total: 14m 19s | Avg:  3m 34s | Max:  3m 43s | Hits: 100%/4708  
  🟩 Clang13            Pass: 100%/4   | Total: 14m 26s | Avg:  3m 36s | Max:  3m 58s | Hits: 100%/4708  
  🟩 Clang14            Pass: 100%/4   | Total: 14m 19s | Avg:  3m 34s | Max:  3m 45s | Hits: 100%/4708  
  🟩 Clang15            Pass: 100%/4   | Total: 15m 25s | Avg:  3m 51s | Max:  4m 06s | Hits: 100%/4708  
  🟩 Clang16            Pass: 100%/4   | Total: 14m 22s | Avg:  3m 35s | Max:  3m 50s | Hits: 100%/4708  
  🟩 Clang17            Pass: 100%/18  | Total:  3h 38m | Avg: 12m 07s | Max: 34m 48s | Hits:  96%/21186 
  🟩 GCC6               Pass: 100%/2   | Total:  5m 43s | Avg:  2m 51s | Max:  3m 07s | Hits:  99%/2354  
  🟩 GCC7               Pass: 100%/6   | Total: 20m 04s | Avg:  3m 20s | Max:  3m 55s | Hits:  99%/7068  
  🟩 GCC8               Pass: 100%/6   | Total: 19m 58s | Avg:  3m 19s | Max:  3m 38s | Hits:  99%/7068  
  🟩 GCC9               Pass: 100%/6   | Total: 20m 17s | Avg:  3m 22s | Max:  3m 48s | Hits:  99%/7068  
  🟩 GCC10              Pass: 100%/4   | Total: 14m 38s | Avg:  3m 39s | Max:  3m 50s | Hits:  99%/4712  
  🟩 GCC11              Pass: 100%/7   | Total: 26m 20s | Avg:  3m 45s | Max:  4m 00s | Hits:  99%/8246  
  🟩 GCC12              Pass: 100%/4   | Total: 16m 06s | Avg:  4m 01s | Max:  4m 30s | Hits:  99%/4712  
  🟩 GCC13              Pass: 100%/20  | Total:  3h 44m | Avg: 11m 12s | Max: 23m 05s | Hits:  93%/23560 
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 14m 11s | Avg:  4m 43s | Max:  5m 00s | Hits: 100%/3540  
  🟩 MSVC14.16          Pass: 100%/1   | Total: 40m 48s | Avg: 40m 48s | Max: 40m 48s | Hits:  73%/1173  
  🟩 MSVC14.29          Pass: 100%/2   | Total:  1h 22m | Avg: 41m 20s | Max: 43m 33s | Hits:  78%/2346  
  🟩 MSVC14.39          Pass: 100%/6   | Total:  2h 51m | Avg: 28m 36s | Max: 45m 08s | Hits:  89%/7038  
🟩 cxx_family
  🟩 Clang              Pass: 100%/51  | Total:  5h 40m | Avg:  6m 40s | Max: 34m 48s | Hits:  98%/60027 
  🟩 GCC                Pass: 100%/55  | Total:  5h 47m | Avg:  6m 18s | Max: 23m 05s | Hits:  97%/64788 
  🟩 Intel              Pass: 100%/3   | Total: 14m 11s | Avg:  4m 43s | Max:  5m 00s | Hits: 100%/3540  
  🟩 MSVC               Pass: 100%/9   | Total:  4h 55m | Avg: 32m 47s | Max: 45m 08s | Hits:  85%/10557 
🟩 gpu
  🟩 v100               Pass: 100%/118 | Total: 16h 36m | Avg:  8m 26s | Max: 45m 08s | Hits:  97%/138912
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total: 12h 09m | Avg:  7m 22s | Max: 45m 08s | Hits:  96%/116553
  🟩 TestCPU            Pass: 100%/11  | Total:  1h 36m | Avg:  8m 48s | Max: 17m 09s | Hits:  99%/12939 
  🟩 TestGPU            Pass: 100%/8   | Total:  2h 50m | Avg: 21m 19s | Max: 34m 48s | Hits:  99%/9420  
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 11m 21s | Avg:  3m 47s | Max:  4m 00s | Hits:  99%/3534  
  🟩 90a                Pass: 100%/4   | Total: 26m 24s | Avg:  6m 36s | Max: 16m 11s | Hits:  90%/4712  
🟩 std
  🟩 11                 Pass: 100%/30  | Total:  2h 53m | Avg:  5m 47s | Max: 34m 45s | Hits:  98%/35328 
  🟩 14                 Pass: 100%/34  | Total:  5h 33m | Avg:  9m 47s | Max: 40m 48s | Hits:  95%/40020 
  🟩 17                 Pass: 100%/33  | Total:  4h 59m | Avg:  9m 05s | Max: 45m 08s | Hits:  97%/38847 
  🟩 20                 Pass: 100%/21  | Total:  3h 09m | Avg:  9m 02s | Max: 38m 02s | Hits:  97%/24717

🟩 libcudacxx: Pass: 100%/112 | Total: 1d 05h | Avg: 15m 52s | Max: 41m 45s | Hits: 92%/273355

🟩 cpu
  🟩 amd64              Pass: 100%/104 | Total:  1d 03h | Avg: 16m 03s | Max: 41m 45s | Hits:  91%/251001
  🟩 arm64              Pass: 100%/8   | Total:  1h 48m | Avg: 13m 36s | Max: 14m 49s | Hits:  94%/22354 
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  3h 45m | Avg: 15m 03s | Max: 41m 45s | Hits:  94%/39795 
  🟩 11.8               Pass: 100%/3   | Total: 52m 10s | Avg: 17m 23s | Max: 20m 07s | Hits:  70%/8067  
  🟩 12.5               Pass: 100%/94  | Total:  1d 01h | Avg: 15m 57s | Max: 34m 18s | Hits:  92%/225493
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total: 36m 51s | Avg: 18m 25s | Max: 20m 05s | Hits:  37%/6101  
  🟩 nvcc11.1           Pass: 100%/15  | Total:  3h 45m | Avg: 15m 03s | Max: 41m 45s | Hits:  94%/39795 
  🟩 nvcc11.8           Pass: 100%/3   | Total: 52m 10s | Avg: 17m 23s | Max: 20m 07s | Hits:  70%/8067  
  🟩 nvcc12.5           Pass: 100%/92  | Total:  1d 00h | Avg: 15m 54s | Max: 34m 18s | Hits:  94%/219392
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 36m 51s | Avg: 18m 25s | Max: 20m 05s | Hits:  37%/6101  
  🟩 nvcc               Pass: 100%/110 | Total:  1d 05h | Avg: 15m 50s | Max: 41m 45s | Hits:  93%/267254
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total:  1h 20m | Avg: 13m 29s | Max: 15m 57s | Hits:  95%/16166 
  🟩 Clang10            Pass: 100%/3   | Total: 51m 15s | Avg: 17m 05s | Max: 20m 14s | Hits:  90%/8112  
  🟩 Clang11            Pass: 100%/4   | Total: 59m 49s | Avg: 14m 57s | Max: 16m 52s | Hits:  93%/11185 
  🟩 Clang12            Pass: 100%/4   | Total:  1h 03m | Avg: 15m 48s | Max: 19m 37s | Hits:  81%/11185 
  🟩 Clang13            Pass: 100%/4   | Total:  1h 03m | Avg: 15m 55s | Max: 19m 47s | Hits:  87%/11185 
  🟩 Clang14            Pass: 100%/4   | Total: 58m 36s | Avg: 14m 39s | Max: 14m 53s | Hits:  95%/11185 
  🟩 Clang15            Pass: 100%/4   | Total: 57m 14s | Avg: 14m 18s | Max: 15m 07s | Hits:  96%/11177 
  🟩 Clang16            Pass: 100%/4   | Total: 57m 25s | Avg: 14m 21s | Max: 14m 51s | Hits:  96%/11177 
  🟩 Clang17            Pass: 100%/14  | Total:  4h 06m | Avg: 17m 35s | Max: 26m 20s | Hits:  82%/28455 
  🟩 GCC6               Pass: 100%/2   | Total: 20m 23s | Avg: 10m 11s | Max: 10m 18s | Hits:  96%/5047  
  🟩 GCC7               Pass: 100%/6   | Total:  1h 50m | Avg: 18m 27s | Max: 41m 45s | Hits:  93%/16152 
  🟩 GCC8               Pass: 100%/6   | Total:  1h 47m | Avg: 17m 53s | Max: 39m 26s | Hits:  92%/16160 
  🟩 GCC9               Pass: 100%/6   | Total:  1h 13m | Avg: 12m 13s | Max: 14m 26s | Hits:  96%/16164 
  🟩 GCC10              Pass: 100%/4   | Total: 56m 43s | Avg: 14m 10s | Max: 15m 10s | Hits:  96%/11185 
  🟩 GCC11              Pass: 100%/7   | Total:  1h 48m | Avg: 15m 33s | Max: 20m 07s | Hits:  85%/19244 
  🟩 GCC12              Pass: 100%/4   | Total: 57m 44s | Avg: 14m 26s | Max: 15m 49s | Hits:  94%/11177 
  🟩 GCC13              Pass: 100%/21  | Total:  6h 17m | Avg: 17m 57s | Max: 34m 18s | Hits:  94%/33914 
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 52m 49s | Avg: 17m 36s | Max: 22m 17s | Hits:  89%/8108  
  🟩 MSVC14.16          Pass: 100%/1   | Total: 16m 33s | Avg: 16m 33s | Max: 16m 33s | Hits:  98%/2537  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 23m 05s | Avg: 11m 32s | Max: 11m 41s | Hits:  98%/5436  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 35m 28s | Avg: 11m 49s | Max: 12m 15s | Hits:  98%/8404  
🟩 cxx_family
  🟩 Clang              Pass: 100%/47  | Total: 12h 18m | Avg: 15m 42s | Max: 26m 20s | Hits:  90%/119827
  🟩 GCC                Pass: 100%/56  | Total: 15h 12m | Avg: 16m 17s | Max: 41m 45s | Hits:  93%/129043
  🟩 Intel              Pass: 100%/3   | Total: 52m 49s | Avg: 17m 36s | Max: 22m 17s | Hits:  89%/8108  
  🟩 MSVC               Pass: 100%/6   | Total:  1h 15m | Avg: 12m 31s | Max: 16m 33s | Hits:  98%/16377 
🟩 gpu
  🟩 v100               Pass: 100%/112 | Total:  1d 05h | Avg: 15m 52s | Max: 41m 45s | Hits:  92%/273355
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total:  1d 00h | Avg: 14m 41s | Max: 41m 45s | Hits:  92%/273335
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 43m | Avg: 25m 53s | Max: 30m 36s | Hits: 100%/20    
  🟩 Test               Pass: 100%/8   | Total:  3h 38m | Avg: 27m 15s | Max: 34m 18s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  1m 56s | Avg:  1m 56s | Max:  1m 56s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 52m 10s | Avg: 17m 23s | Max: 20m 07s | Hits:  70%/8067  
  🟩 90a                Pass: 100%/4   | Total: 38m 13s | Avg:  9m 33s | Max: 10m 00s | Hits:  93%/11540 
🟩 std
  🟩 11                 Pass: 100%/29  | Total:  8h 41m | Avg: 17m 58s | Max: 41m 45s | Hits:  89%/58228 
  🟩 14                 Pass: 100%/32  | Total:  7h 52m | Avg: 14m 45s | Max: 29m 34s | Hits:  96%/81819 
  🟩 17                 Pass: 100%/31  | Total:  7h 48m | Avg: 15m 07s | Max: 31m 30s | Hits:  89%/84164 
  🟩 20                 Pass: 100%/19  | Total:  5h 14m | Avg: 16m 33s | Max: 30m 36s | Hits:  92%/49144

🟩 cudax: Pass: 100%/55 | Total: 2h 36m | Avg: 2m 51s | Max: 6m 26s | Hits: 87%/2738

🟩 cpu
  🟩 amd64              Pass: 100%/51  | Total:  2h 25m | Avg:  2m 50s | Max:  6m 26s | Hits:  87%/2538  
  🟩 arm64              Pass: 100%/4   | Total: 11m 47s | Avg:  2m 56s | Max:  3m 04s | Hits:  86%/200   
🟩 ctk
  🟩 12.0               Pass: 100%/23  | Total:  1h 05m | Avg:  2m 51s | Max:  6m 26s | Hits:  87%/1144  
  🟩 12.5               Pass: 100%/32  | Total:  1h 30m | Avg:  2m 50s | Max:  6m 22s | Hits:  87%/1594  
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/23  | Total:  1h 05m | Avg:  2m 51s | Max:  6m 26s | Hits:  87%/1144  
  🟩 nvcc12.5           Pass: 100%/32  | Total:  1h 30m | Avg:  2m 50s | Max:  6m 22s | Hits:  87%/1594  
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/55  | Total:  2h 36m | Avg:  2m 51s | Max:  6m 26s | Hits:  87%/2738  
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  4m 30s | Avg:  2m 15s | Max:  2m 19s | Hits:  88%/100   
  🟩 Clang10            Pass: 100%/2   | Total:  5m 09s | Avg:  2m 34s | Max:  2m 48s | Hits:  88%/100   
  🟩 Clang11            Pass: 100%/4   | Total: 10m 08s | Avg:  2m 32s | Max:  3m 02s | Hits:  88%/200   
  🟩 Clang12            Pass: 100%/4   | Total:  9m 08s | Avg:  2m 17s | Max:  2m 21s | Hits:  88%/200   
  🟩 Clang13            Pass: 100%/4   | Total: 10m 34s | Avg:  2m 38s | Max:  2m 46s | Hits:  88%/200   
  🟩 Clang14            Pass: 100%/6   | Total: 18m 21s | Avg:  3m 03s | Max:  4m 52s | Hits:  92%/300   
  🟩 Clang15            Pass: 100%/2   | Total:  4m 37s | Avg:  2m 18s | Max:  2m 22s | Hits:  88%/100   
  🟩 Clang16            Pass: 100%/6   | Total: 18m 59s | Avg:  3m 09s | Max:  4m 07s | Hits:  92%/300   
  🟩 GCC9               Pass: 100%/2   | Total:  4m 46s | Avg:  2m 23s | Max:  2m 31s | Hits:  84%/100   
  🟩 GCC10              Pass: 100%/4   | Total:  9m 05s | Avg:  2m 16s | Max:  2m 22s | Hits:  84%/200   
  🟩 GCC11              Pass: 100%/4   | Total:  8m 50s | Avg:  2m 12s | Max:  2m 22s | Hits:  84%/200   
  🟩 GCC12              Pass: 100%/12  | Total: 36m 54s | Avg:  3m 04s | Max:  5m 06s | Hits:  88%/600   
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  3m 02s | Avg:  3m 02s | Max:  3m 02s | Hits:  88%/50    
  🟩 MSVC14.36          Pass: 100%/1   | Total:  6m 26s | Avg:  6m 26s | Max:  6m 26s | Hits:  72%/44    
  🟩 MSVC14.39          Pass: 100%/1   | Total:  6m 22s | Avg:  6m 22s | Max:  6m 22s | Hits:  72%/44    
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  1h 21m | Avg:  2m 42s | Max:  4m 52s | Hits:  89%/1500  
  🟩 GCC                Pass: 100%/22  | Total: 59m 35s | Avg:  2m 42s | Max:  5m 06s | Hits:  86%/1100  
  🟩 Intel              Pass: 100%/1   | Total:  3m 02s | Avg:  3m 02s | Max:  3m 02s | Hits:  88%/50    
  🟩 MSVC               Pass: 100%/2   | Total: 12m 48s | Avg:  6m 24s | Max:  6m 26s | Hits:  72%/88    
🟩 gpu
  🟩 v100               Pass: 100%/55  | Total:  2h 36m | Avg:  2m 51s | Max:  6m 26s | Hits:  87%/2738  
🟩 jobs
  🟩 Build              Pass: 100%/47  | Total:  2h 03m | Avg:  2m 37s | Max:  6m 26s | Hits:  85%/2338  
  🟩 Test               Pass: 100%/8   | Total: 33m 40s | Avg:  4m 12s | Max:  5m 06s | Hits:  98%/400   
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  1m 59s | Avg:  1m 59s | Max:  1m 59s | Hits:  84%/50    
  🟩 90a                Pass: 100%/1   | Total:  1m 57s | Avg:  1m 57s | Max:  1m 57s | Hits:  84%/50    
🟩 std
  🟩 17                 Pass: 100%/31  | Total:  1h 23m | Avg:  2m 40s | Max:  4m 52s | Hits:  87%/1550  
  🟩 20                 Pass: 100%/24  | Total:  1h 13m | Avg:  3m 04s | Max:  6m 26s | Hits:  87%/1188

🟩 pycuda: Pass: 100%/1 | Total: 11m 15s | Avg: 11m 15s | Max: 11m 15s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 11m 15s | Avg: 11m 15s | Max: 11m 15s
🟩 ctk
  🟩 12.5               Pass: 100%/1   | Total: 11m 15s | Avg: 11m 15s | Max: 11m 15s
🟩 cudacxx
  🟩 nvcc12.5           Pass: 100%/1   | Total: 11m 15s | Avg: 11m 15s | Max: 11m 15s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 11m 15s | Avg: 11m 15s | Max: 11m 15s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 11m 15s | Avg: 11m 15s | Max: 11m 15s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 11m 15s | Avg: 11m 15s | Max: 11m 15s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 11m 15s | Avg: 11m 15s | Max: 11m 15s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 11m 15s | Avg: 11m 15s | Max: 11m 15s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda

🏃‍ Runner counts (total jobs: 417)

#	Runner
305	`linux-amd64-cpu16`
61	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
23	`windows-amd64-cpu16`

TristonC · 2024-09-05T22:47:46Z

When can we expect this to be merged?

jrhemstad · 2024-09-06T16:38:16Z

/ok to test

github-actions · 2024-09-06T23:55:01Z

🟨 CI finished in 7h 05m: Pass: 99%/417 | Total: 2d 09h | Avg: 8m 14s | Max: 38m 15s | Hits: 97%/526130

🟨 libcudacxx: Pass: 99%/112 | Total: 1d 00h | Avg: 13m 06s | Max: 33m 40s | Hits: 96%/273350

🔍 cpu: amd64 🔍
  🔍 amd64              Pass:  99%/104 | Total: 22h 57m | Avg: 13m 14s | Max: 33m 40s | Hits:  96%/250996
  🟩 arm64              Pass: 100%/8   | Total:  1h 31m | Avg: 11m 26s | Max: 13m 40s | Hits:  97%/22354 
🔍 ctk: 12.5 🔍
  🟩 11.1               Pass: 100%/15  | Total:  2h 46m | Avg: 11m 06s | Max: 16m 56s | Hits:  97%/39795 
  🟩 11.8               Pass: 100%/3   | Total: 42m 23s | Avg: 14m 07s | Max: 14m 59s | Hits:  96%/8067  
  🔍 12.5               Pass:  98%/94  | Total: 20h 59m | Avg: 13m 24s | Max: 33m 40s | Hits:  96%/225488
🔍 cudacxx: nvcc12.5 🔍
  🟩 ClangCUDA17        Pass: 100%/2   | Total: 37m 32s | Avg: 18m 46s | Max: 19m 51s | Hits:  37%/6101  
  🟩 nvcc11.1           Pass: 100%/15  | Total:  2h 46m | Avg: 11m 06s | Max: 16m 56s | Hits:  97%/39795 
  🟩 nvcc11.8           Pass: 100%/3   | Total: 42m 23s | Avg: 14m 07s | Max: 14m 59s | Hits:  96%/8067  
  🔍 nvcc12.5           Pass:  98%/92  | Total: 20h 22m | Avg: 13m 17s | Max: 33m 40s | Hits:  97%/219387
🔍 cudacxx_family: nvcc 🔍
  🟩 ClangCUDA          Pass: 100%/2   | Total: 37m 32s | Avg: 18m 46s | Max: 19m 51s | Hits:  37%/6101  
  🔍 nvcc               Pass:  99%/110 | Total: 23h 51m | Avg: 13m 00s | Max: 33m 40s | Hits:  97%/267249
🔍 cxx: GCC13 🔍
  🟩 Clang9             Pass: 100%/6   | Total:  1h 22m | Avg: 13m 44s | Max: 16m 47s | Hits:  97%/16166 
  🟩 Clang10            Pass: 100%/3   | Total: 45m 32s | Avg: 15m 10s | Max: 15m 59s | Hits:  97%/8112  
  🟩 Clang11            Pass: 100%/4   | Total: 46m 49s | Avg: 11m 42s | Max: 14m 37s | Hits:  97%/11185 
  🟩 Clang12            Pass: 100%/4   | Total: 47m 59s | Avg: 11m 59s | Max: 16m 08s | Hits:  97%/11185 
  🟩 Clang13            Pass: 100%/4   | Total: 59m 20s | Avg: 14m 50s | Max: 15m 53s | Hits:  97%/11185 
  🟩 Clang14            Pass: 100%/4   | Total: 25m 25s | Avg:  6m 21s | Max: 13m 35s | Hits:  98%/11185 
  🟩 Clang15            Pass: 100%/4   | Total: 48m 54s | Avg: 12m 13s | Max: 15m 10s | Hits:  97%/11177 
  🟩 Clang16            Pass: 100%/4   | Total: 59m 27s | Avg: 14m 51s | Max: 15m 07s | Hits:  97%/11177 
  🟩 Clang17            Pass: 100%/14  | Total:  3h 47m | Avg: 16m 15s | Max: 30m 58s | Hits:  84%/28455 
  🟩 GCC6               Pass: 100%/2   | Total: 20m 39s | Avg: 10m 19s | Max: 10m 26s | Hits:  97%/5047  
  🟩 GCC7               Pass: 100%/6   | Total:  1h 03m | Avg: 10m 31s | Max: 14m 21s | Hits:  97%/16152 
  🟩 GCC8               Pass: 100%/6   | Total: 41m 38s | Avg:  6m 56s | Max: 10m 42s | Hits:  98%/16160 
  🟩 GCC9               Pass: 100%/6   | Total:  1h 03m | Avg: 10m 39s | Max: 13m 56s | Hits:  97%/16164 
  🟩 GCC10              Pass: 100%/4   | Total: 56m 23s | Avg: 14m 05s | Max: 14m 52s | Hits:  97%/11185 
  🟩 GCC11              Pass: 100%/7   | Total:  1h 27m | Avg: 12m 26s | Max: 14m 59s | Hits:  97%/19244 
  🟩 GCC12              Pass: 100%/4   | Total: 57m 57s | Avg: 14m 29s | Max: 15m 03s | Hits:  97%/11177 
  🔍 GCC13              Pass:  95%/21  | Total:  5h 17m | Avg: 15m 06s | Max: 33m 40s | Hits:  98%/33909 
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 34m 47s | Avg: 11m 35s | Max: 15m 36s | Hits:  98%/8108  
  🟩 MSVC14.16          Pass: 100%/1   | Total: 16m 56s | Avg: 16m 56s | Max: 16m 56s | Hits:  99%/2537  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 24m 45s | Avg: 12m 22s | Max: 12m 40s | Hits:  99%/5436  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 40m 30s | Avg: 13m 30s | Max: 13m 50s | Hits:  99%/8404  
🔍 cxx_family: GCC 🔍
  🟩 Clang              Pass: 100%/47  | Total: 10h 43m | Avg: 13m 41s | Max: 30m 58s | Hits:  94%/119827
  🔍 GCC                Pass:  98%/56  | Total: 11h 48m | Avg: 12m 38s | Max: 33m 40s | Hits:  97%/129038
  🟩 Intel              Pass: 100%/3   | Total: 34m 47s | Avg: 11m 35s | Max: 15m 36s | Hits:  98%/8108  
  🟩 MSVC               Pass: 100%/6   | Total:  1h 22m | Avg: 13m 41s | Max: 16m 56s | Hits:  99%/16377 
🔍 jobs: NVRTC 🔍
  🟩 Build              Pass: 100%/99  | Total: 19h 10m | Avg: 11m 37s | Max: 19m 51s | Hits:  96%/273335
  🔍 NVRTC              Pass:  75%/4   | Total:  1h 53m | Avg: 28m 21s | Max: 33m 40s | Hits: 100%/15    
  🟩 Test               Pass: 100%/8   | Total:  3h 22m | Avg: 25m 17s | Max: 30m 58s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 14s | Avg:  2m 14s | Max:  2m 14s
🔍 std: 17 🔍
  🟩 11                 Pass: 100%/29  | Total:  6h 01m | Avg: 12m 27s | Max: 26m 42s | Hits:  97%/58228 
  🟩 14                 Pass: 100%/32  | Total:  7h 24m | Avg: 13m 52s | Max: 33m 40s | Hits:  97%/81819 
  🔍 17                 Pass:  96%/31  | Total:  6h 39m | Avg: 12m 52s | Max: 31m 42s | Hits:  95%/84159 
  🟩 20                 Pass: 100%/19  | Total:  4h 21m | Avg: 13m 46s | Max: 24m 36s | Hits:  94%/49144 
🟨 gpu
  🟨 v100               Pass:  99%/112 | Total:  1d 00h | Avg: 13m 06s | Max: 33m 40s | Hits:  96%/273350
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 42m 23s | Avg: 14m 07s | Max: 14m 59s | Hits:  96%/8067  
  🟩 90a                Pass: 100%/4   | Total: 13m 36s | Avg:  3m 24s | Max:  3m 37s | Hits:  99%/11540

🟩 cub: Pass: 100%/131 | Total: 18h 32m | Avg: 8m 29s | Max: 38m 15s | Hits: 99%/111130

🟩 cpu
  🟩 amd64              Pass: 100%/123 | Total: 18h 00m | Avg:  8m 46s | Max: 38m 15s | Hits:  99%/104194
  🟩 arm64              Pass: 100%/8   | Total: 32m 36s | Avg:  4m 04s | Max:  4m 20s | Hits:  99%/6936  
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 03m | Avg:  4m 12s | Max: 13m 01s | Hits:  99%/11792 
  🟩 11.8               Pass: 100%/3   | Total: 13m 11s | Avg:  4m 23s | Max:  4m 51s | Hits:  99%/2601  
  🟩 12.5               Pass: 100%/113 | Total: 17h 16m | Avg:  9m 10s | Max: 38m 15s | Hits:  99%/96737 
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  7m 15s | Avg:  3m 37s | Max:  3m 44s | Hits: 100%/1436  
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 03m | Avg:  4m 12s | Max: 13m 01s | Hits:  99%/11792 
  🟩 nvcc11.8           Pass: 100%/3   | Total: 13m 11s | Avg:  4m 23s | Max:  4m 51s | Hits:  99%/2601  
  🟩 nvcc12.5           Pass: 100%/111 | Total: 17h 09m | Avg:  9m 16s | Max: 38m 15s | Hits:  99%/95301 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 15s | Avg:  3m 37s | Max:  3m 44s | Hits: 100%/1436  
  🟩 nvcc               Pass: 100%/129 | Total: 18h 25m | Avg:  8m 34s | Max: 38m 15s | Hits:  99%/109694
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 26m 18s | Avg:  4m 23s | Max:  5m 06s | Hits:  99%/4980  
  🟩 Clang10            Pass: 100%/3   | Total: 15m 41s | Avg:  5m 13s | Max:  5m 31s | Hits: 100%/2607  
  🟩 Clang11            Pass: 100%/4   | Total: 17m 05s | Avg:  4m 16s | Max:  4m 30s | Hits: 100%/3476  
  🟩 Clang12            Pass: 100%/4   | Total: 17m 35s | Avg:  4m 23s | Max:  4m 42s | Hits: 100%/3476  
  🟩 Clang13            Pass: 100%/4   | Total: 18m 07s | Avg:  4m 31s | Max:  4m 45s | Hits: 100%/3476  
  🟩 Clang14            Pass: 100%/4   | Total: 18m 30s | Avg:  4m 37s | Max:  5m 11s | Hits: 100%/3476  
  🟩 Clang15            Pass: 100%/4   | Total: 17m 52s | Avg:  4m 28s | Max:  4m 37s | Hits:  99%/3468  
  🟩 Clang16            Pass: 100%/4   | Total: 17m 35s | Avg:  4m 23s | Max:  4m 26s | Hits:  99%/3468  
  🟩 Clang17            Pass: 100%/26  | Total:  5h 56m | Avg: 13m 43s | Max: 25m 50s | Hits:  99%/22244 
  🟩 GCC6               Pass: 100%/2   | Total:  6m 41s | Avg:  3m 20s | Max:  3m 28s | Hits:  99%/1582  
  🟩 GCC7               Pass: 100%/6   | Total: 22m 13s | Avg:  3m 42s | Max:  4m 08s | Hits:  99%/4983  
  🟩 GCC8               Pass: 100%/6   | Total: 23m 45s | Avg:  3m 57s | Max:  4m 29s | Hits:  99%/4983  
  🟩 GCC9               Pass: 100%/6   | Total: 24m 46s | Avg:  4m 07s | Max:  4m 35s | Hits:  99%/4983  
  🟩 GCC10              Pass: 100%/4   | Total: 17m 34s | Avg:  4m 23s | Max:  4m 38s | Hits:  99%/3476  
  🟩 GCC11              Pass: 100%/7   | Total: 30m 41s | Avg:  4m 23s | Max:  4m 51s | Hits:  99%/6069  
  🟩 GCC12              Pass: 100%/4   | Total: 18m 21s | Avg:  4m 35s | Max:  4m 39s | Hits:  99%/3468  
  🟩 GCC13              Pass: 100%/28  | Total:  6h 17m | Avg: 13m 29s | Max: 38m 15s | Hits:  99%/24276 
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 15m 27s | Avg:  5m 09s | Max:  5m 18s | Hits: 100%/2385  
  🟩 MSVC14.16          Pass: 100%/1   | Total: 13m 01s | Avg: 13m 01s | Max: 13m 01s | Hits:  99%/709   
  🟩 MSVC14.29          Pass: 100%/2   | Total: 22m 10s | Avg: 11m 05s | Max: 11m 16s | Hits:  99%/1418  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 34m 33s | Avg: 11m 31s | Max: 11m 45s | Hits:  99%/2127  
🟩 cxx_family
  🟩 Clang              Pass: 100%/59  | Total:  8h 25m | Avg:  8m 34s | Max: 25m 50s | Hits:  99%/50671 
  🟩 GCC                Pass: 100%/63  | Total:  8h 41m | Avg:  8m 17s | Max: 38m 15s | Hits:  99%/53820 
  🟩 Intel              Pass: 100%/3   | Total: 15m 27s | Avg:  5m 09s | Max:  5m 18s | Hits: 100%/2385  
  🟩 MSVC               Pass: 100%/6   | Total:  1h 09m | Avg: 11m 37s | Max: 13m 01s | Hits:  99%/4254  
🟩 gpu
  🟩 v100               Pass: 100%/131 | Total: 18h 32m | Avg:  8m 29s | Max: 38m 15s | Hits:  99%/111130
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total:  7h 49m | Avg:  4m 44s | Max: 13m 01s | Hits:  99%/83386 
  🟩 DeviceLaunch       Pass: 100%/8   | Total:  2h 32m | Avg: 19m 00s | Max: 23m 14s | Hits:  99%/6936  
  🟩 GraphCapture       Pass: 100%/8   | Total:  2h 07m | Avg: 15m 56s | Max: 18m 24s | Hits:  99%/6936  
  🟩 HostLaunch         Pass: 100%/8   | Total:  2h 29m | Avg: 18m 42s | Max: 20m 33s | Hits:  99%/6936  
  🟩 TestGPU            Pass: 100%/8   | Total:  3h 33m | Avg: 26m 41s | Max: 38m 15s | Hits:  99%/6936  
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 13m 11s | Avg:  4m 23s | Max:  4m 51s | Hits:  99%/2601  
  🟩 90a                Pass: 100%/4   | Total: 15m 04s | Avg:  3m 46s | Max:  4m 01s | Hits:  99%/3468  
🟩 std
  🟩 11                 Pass: 100%/34  | Total:  4h 23m | Avg:  7m 45s | Max: 27m 38s | Hits:  99%/29049 
  🟩 14                 Pass: 100%/37  | Total:  4h 57m | Avg:  8m 02s | Max: 25m 50s | Hits:  99%/31176 
  🟩 17                 Pass: 100%/36  | Total:  4h 57m | Avg:  8m 15s | Max: 29m 44s | Hits:  99%/30394 
  🟩 20                 Pass: 100%/24  | Total:  4h 13m | Avg: 10m 34s | Max: 38m 15s | Hits:  99%/20511

🟩 thrust: Pass: 100%/118 | Total: 11h 51m | Avg: 6m 01s | Max: 34m 45s | Hits: 99%/138912

🟩 cpu
  🟩 amd64              Pass: 100%/110 | Total: 11h 24m | Avg:  6m 13s | Max: 34m 45s | Hits:  98%/129492
  🟩 arm64              Pass: 100%/8   | Total: 26m 49s | Avg:  3m 21s | Max:  3m 53s | Hits:  99%/9420  
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total: 57m 26s | Avg:  3m 49s | Max: 13m 54s | Hits:  99%/17660 
  🟩 11.8               Pass: 100%/3   | Total: 10m 47s | Avg:  3m 35s | Max:  3m 41s | Hits:  99%/3534  
  🟩 12.5               Pass: 100%/100 | Total: 10h 43m | Avg:  6m 25s | Max: 34m 45s | Hits:  98%/117718
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  7m 44s | Avg:  3m 52s | Max:  3m 52s | Hits: 100%/2354  
  🟩 nvcc11.1           Pass: 100%/15  | Total: 57m 26s | Avg:  3m 49s | Max: 13m 54s | Hits:  99%/17660 
  🟩 nvcc11.8           Pass: 100%/3   | Total: 10m 47s | Avg:  3m 35s | Max:  3m 41s | Hits:  99%/3534  
  🟩 nvcc12.5           Pass: 100%/98  | Total: 10h 35m | Avg:  6m 29s | Max: 34m 45s | Hits:  98%/115364
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 44s | Avg:  3m 52s | Max:  3m 52s | Hits: 100%/2354  
  🟩 nvcc               Pass: 100%/116 | Total: 11h 43m | Avg:  6m 03s | Max: 34m 45s | Hits:  99%/136558
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 22m 33s | Avg:  3m 45s | Max:  4m 36s | Hits: 100%/7062  
  🟩 Clang10            Pass: 100%/3   | Total: 14m 37s | Avg:  4m 52s | Max:  4m 57s | Hits: 100%/3531  
  🟩 Clang11            Pass: 100%/4   | Total: 15m 07s | Avg:  3m 46s | Max:  4m 16s | Hits: 100%/4708  
  🟩 Clang12            Pass: 100%/4   | Total: 15m 02s | Avg:  3m 45s | Max:  3m 56s | Hits: 100%/4708  
  🟩 Clang13            Pass: 100%/4   | Total: 15m 38s | Avg:  3m 54s | Max:  4m 19s | Hits: 100%/4708  
  🟩 Clang14            Pass: 100%/4   | Total: 15m 32s | Avg:  3m 53s | Max:  4m 19s | Hits:  99%/4708  
  🟩 Clang15            Pass: 100%/4   | Total: 14m 31s | Avg:  3m 37s | Max:  3m 55s | Hits:  99%/4708  
  🟩 Clang16            Pass: 100%/4   | Total: 16m 14s | Avg:  4m 03s | Max:  4m 17s | Hits:  99%/4708  
  🟩 Clang17            Pass: 100%/18  | Total:  1h 55m | Avg:  6m 25s | Max: 20m 02s | Hits:  99%/21186 
  🟩 GCC6               Pass: 100%/2   | Total:  6m 18s | Avg:  3m 09s | Max:  3m 16s | Hits:  99%/2354  
  🟩 GCC7               Pass: 100%/6   | Total: 19m 30s | Avg:  3m 15s | Max:  4m 09s | Hits:  99%/7068  
  🟩 GCC8               Pass: 100%/6   | Total: 19m 20s | Avg:  3m 13s | Max:  3m 40s | Hits:  99%/7068  
  🟩 GCC9               Pass: 100%/6   | Total: 21m 08s | Avg:  3m 31s | Max:  4m 14s | Hits:  99%/7068  
  🟩 GCC10              Pass: 100%/4   | Total: 15m 01s | Avg:  3m 45s | Max:  4m 15s | Hits:  99%/4712  
  🟩 GCC11              Pass: 100%/7   | Total: 24m 45s | Avg:  3m 32s | Max:  3m 41s | Hits:  99%/8246  
  🟩 GCC12              Pass: 100%/4   | Total: 44m 04s | Avg: 11m 01s | Max: 32m 47s | Hits:  79%/4712  
  🟩 GCC13              Pass: 100%/20  | Total:  2h 40m | Avg:  8m 01s | Max: 34m 45s | Hits:  99%/23560 
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 13m 43s | Avg:  4m 34s | Max:  4m 41s | Hits: 100%/3540  
  🟩 MSVC14.16          Pass: 100%/1   | Total: 13m 54s | Avg: 13m 54s | Max: 13m 54s | Hits:  98%/1173  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 24m 52s | Avg: 12m 26s | Max: 13m 14s | Hits:  98%/2346  
  🟩 MSVC14.39          Pass: 100%/6   | Total:  1h 43m | Avg: 17m 15s | Max: 20m 18s | Hits:  98%/7038  
🟩 cxx_family
  🟩 Clang              Pass: 100%/51  | Total:  4h 04m | Avg:  4m 47s | Max: 20m 02s | Hits:  99%/60027 
  🟩 GCC                Pass: 100%/55  | Total:  5h 10m | Avg:  5m 38s | Max: 34m 45s | Hits:  98%/64788 
  🟩 Intel              Pass: 100%/3   | Total: 13m 43s | Avg:  4m 34s | Max:  4m 41s | Hits: 100%/3540  
  🟩 MSVC               Pass: 100%/9   | Total:  2h 22m | Avg: 15m 48s | Max: 20m 18s | Hits:  98%/10557 
🟩 gpu
  🟩 v100               Pass: 100%/118 | Total: 11h 51m | Avg:  6m 01s | Max: 34m 45s | Hits:  99%/138912
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total:  7h 36m | Avg:  4m 36s | Max: 32m 47s | Hits:  98%/116553
  🟩 TestCPU            Pass: 100%/11  | Total:  2h 02m | Avg: 11m 06s | Max: 20m 18s | Hits:  98%/12939 
  🟩 TestGPU            Pass: 100%/8   | Total:  2h 13m | Avg: 16m 38s | Max: 34m 45s | Hits:  99%/9420  
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 10m 47s | Avg:  3m 35s | Max:  3m 41s | Hits:  99%/3534  
  🟩 90a                Pass: 100%/4   | Total: 13m 59s | Avg:  3m 29s | Max:  3m 52s | Hits:  99%/4712  
🟩 std
  🟩 11                 Pass: 100%/30  | Total:  2h 14m | Avg:  4m 29s | Max: 20m 02s | Hits:  99%/35328 
  🟩 14                 Pass: 100%/34  | Total:  3h 44m | Avg:  6m 36s | Max: 32m 47s | Hits:  97%/40020 
  🟩 17                 Pass: 100%/33  | Total:  3h 21m | Avg:  6m 06s | Max: 19m 50s | Hits:  99%/38847 
  🟩 20                 Pass: 100%/21  | Total:  2h 30m | Avg:  7m 08s | Max: 34m 45s | Hits:  99%/24717

🟩 cudax: Pass: 100%/55 | Total: 2h 12m | Avg: 2m 24s | Max: 7m 52s | Hits: 97%/2738

🟩 cpu
  🟩 amd64              Pass: 100%/51  | Total:  2h 06m | Avg:  2m 28s | Max:  7m 52s | Hits:  97%/2538  
  🟩 arm64              Pass: 100%/4   | Total:  6m 29s | Avg:  1m 37s | Max:  1m 41s | Hits:  98%/200   
🟩 ctk
  🟩 12.0               Pass: 100%/23  | Total: 56m 46s | Avg:  2m 28s | Max:  6m 35s | Hits:  97%/1144  
  🟩 12.5               Pass: 100%/32  | Total:  1h 16m | Avg:  2m 22s | Max:  7m 52s | Hits:  97%/1594  
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/23  | Total: 56m 46s | Avg:  2m 28s | Max:  6m 35s | Hits:  97%/1144  
  🟩 nvcc12.5           Pass: 100%/32  | Total:  1h 16m | Avg:  2m 22s | Max:  7m 52s | Hits:  97%/1594  
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/55  | Total:  2h 12m | Avg:  2m 24s | Max:  7m 52s | Hits:  97%/2738  
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  4m 04s | Avg:  2m 02s | Max:  2m 04s | Hits: 100%/100   
  🟩 Clang10            Pass: 100%/2   | Total:  4m 08s | Avg:  2m 04s | Max:  2m 05s | Hits: 100%/100   
  🟩 Clang11            Pass: 100%/4   | Total:  8m 05s | Avg:  2m 01s | Max:  2m 06s | Hits: 100%/200   
  🟩 Clang12            Pass: 100%/4   | Total:  7m 50s | Avg:  1m 57s | Max:  2m 15s | Hits: 100%/200   
  🟩 Clang13            Pass: 100%/4   | Total:  8m 21s | Avg:  2m 05s | Max:  2m 19s | Hits: 100%/200   
  🟩 Clang14            Pass: 100%/6   | Total: 15m 33s | Avg:  2m 35s | Max:  3m 55s | Hits: 100%/300   
  🟩 Clang15            Pass: 100%/2   | Total:  4m 04s | Avg:  2m 02s | Max:  2m 04s | Hits: 100%/100   
  🟩 Clang16            Pass: 100%/6   | Total: 14m 57s | Avg:  2m 29s | Max:  3m 56s | Hits: 100%/300   
  🟩 GCC9               Pass: 100%/2   | Total:  4m 24s | Avg:  2m 12s | Max:  2m 22s | Hits:  96%/100   
  🟩 GCC10              Pass: 100%/4   | Total:  7m 18s | Avg:  1m 49s | Max:  2m 03s | Hits:  96%/200   
  🟩 GCC11              Pass: 100%/4   | Total:  7m 36s | Avg:  1m 54s | Max:  2m 21s | Hits:  96%/200   
  🟩 GCC12              Pass: 100%/12  | Total: 29m 20s | Avg:  2m 26s | Max:  3m 48s | Hits:  96%/600   
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  2m 42s | Avg:  2m 42s | Max:  2m 42s | Hits: 100%/50    
  🟩 MSVC14.36          Pass: 100%/1   | Total:  6m 35s | Avg:  6m 35s | Max:  6m 35s | Hits:  81%/44    
  🟩 MSVC14.39          Pass: 100%/1   | Total:  7m 52s | Avg:  7m 52s | Max:  7m 52s | Hits:  81%/44    
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  1h 07m | Avg:  2m 14s | Max:  3m 56s | Hits: 100%/1500  
  🟩 GCC                Pass: 100%/22  | Total: 48m 38s | Avg:  2m 12s | Max:  3m 48s | Hits:  96%/1100  
  🟩 Intel              Pass: 100%/1   | Total:  2m 42s | Avg:  2m 42s | Max:  2m 42s | Hits: 100%/50    
  🟩 MSVC               Pass: 100%/2   | Total: 14m 27s | Avg:  7m 13s | Max:  7m 52s | Hits:  81%/88    
🟩 gpu
  🟩 v100               Pass: 100%/55  | Total:  2h 12m | Avg:  2m 24s | Max:  7m 52s | Hits:  97%/2738  
🟩 jobs
  🟩 Build              Pass: 100%/47  | Total:  1h 43m | Avg:  2m 11s | Max:  7m 52s | Hits:  97%/2338  
  🟩 Test               Pass: 100%/8   | Total: 29m 38s | Avg:  3m 42s | Max:  3m 56s | Hits:  98%/400   
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  1m 52s | Avg:  1m 52s | Max:  1m 52s | Hits:  96%/50    
  🟩 90a                Pass: 100%/1   | Total:  2m 18s | Avg:  2m 18s | Max:  2m 18s | Hits:  96%/50    
🟩 std
  🟩 17                 Pass: 100%/31  | Total:  1h 07m | Avg:  2m 11s | Max:  3m 56s | Hits:  98%/1550  
  🟩 20                 Pass: 100%/24  | Total:  1h 04m | Avg:  2m 42s | Max:  7m 52s | Hits:  97%/1188

🟩 pycuda: Pass: 100%/1 | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 ctk
  🟩 12.5               Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 cudacxx
  🟩 nvcc12.5           Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda

🏃‍ Runner counts (total jobs: 417)

#	Runner
305	`linux-amd64-cpu16`
61	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
23	`windows-amd64-cpu16`

github-actions · 2024-09-09T17:08:56Z

🟩 CI finished in 3d 00h: Pass: 100%/417 | Total: 2d 09h | Avg: 8m 12s | Max: 38m 15s | Hits: 97%/526135

🟩 cub: Pass: 100%/131 | Total: 18h 32m | Avg: 8m 29s | Max: 38m 15s | Hits: 99%/111130

🟩 cpu
  🟩 amd64              Pass: 100%/123 | Total: 18h 00m | Avg:  8m 46s | Max: 38m 15s | Hits:  99%/104194
  🟩 arm64              Pass: 100%/8   | Total: 32m 36s | Avg:  4m 04s | Max:  4m 20s | Hits:  99%/6936  
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  1h 03m | Avg:  4m 12s | Max: 13m 01s | Hits:  99%/11792 
  🟩 11.8               Pass: 100%/3   | Total: 13m 11s | Avg:  4m 23s | Max:  4m 51s | Hits:  99%/2601  
  🟩 12.5               Pass: 100%/113 | Total: 17h 16m | Avg:  9m 10s | Max: 38m 15s | Hits:  99%/96737 
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  7m 15s | Avg:  3m 37s | Max:  3m 44s | Hits: 100%/1436  
  🟩 nvcc11.1           Pass: 100%/15  | Total:  1h 03m | Avg:  4m 12s | Max: 13m 01s | Hits:  99%/11792 
  🟩 nvcc11.8           Pass: 100%/3   | Total: 13m 11s | Avg:  4m 23s | Max:  4m 51s | Hits:  99%/2601  
  🟩 nvcc12.5           Pass: 100%/111 | Total: 17h 09m | Avg:  9m 16s | Max: 38m 15s | Hits:  99%/95301 
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 15s | Avg:  3m 37s | Max:  3m 44s | Hits: 100%/1436  
  🟩 nvcc               Pass: 100%/129 | Total: 18h 25m | Avg:  8m 34s | Max: 38m 15s | Hits:  99%/109694
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 26m 18s | Avg:  4m 23s | Max:  5m 06s | Hits:  99%/4980  
  🟩 Clang10            Pass: 100%/3   | Total: 15m 41s | Avg:  5m 13s | Max:  5m 31s | Hits: 100%/2607  
  🟩 Clang11            Pass: 100%/4   | Total: 17m 05s | Avg:  4m 16s | Max:  4m 30s | Hits: 100%/3476  
  🟩 Clang12            Pass: 100%/4   | Total: 17m 35s | Avg:  4m 23s | Max:  4m 42s | Hits: 100%/3476  
  🟩 Clang13            Pass: 100%/4   | Total: 18m 07s | Avg:  4m 31s | Max:  4m 45s | Hits: 100%/3476  
  🟩 Clang14            Pass: 100%/4   | Total: 18m 30s | Avg:  4m 37s | Max:  5m 11s | Hits: 100%/3476  
  🟩 Clang15            Pass: 100%/4   | Total: 17m 52s | Avg:  4m 28s | Max:  4m 37s | Hits:  99%/3468  
  🟩 Clang16            Pass: 100%/4   | Total: 17m 35s | Avg:  4m 23s | Max:  4m 26s | Hits:  99%/3468  
  🟩 Clang17            Pass: 100%/26  | Total:  5h 56m | Avg: 13m 43s | Max: 25m 50s | Hits:  99%/22244 
  🟩 GCC6               Pass: 100%/2   | Total:  6m 41s | Avg:  3m 20s | Max:  3m 28s | Hits:  99%/1582  
  🟩 GCC7               Pass: 100%/6   | Total: 22m 13s | Avg:  3m 42s | Max:  4m 08s | Hits:  99%/4983  
  🟩 GCC8               Pass: 100%/6   | Total: 23m 45s | Avg:  3m 57s | Max:  4m 29s | Hits:  99%/4983  
  🟩 GCC9               Pass: 100%/6   | Total: 24m 46s | Avg:  4m 07s | Max:  4m 35s | Hits:  99%/4983  
  🟩 GCC10              Pass: 100%/4   | Total: 17m 34s | Avg:  4m 23s | Max:  4m 38s | Hits:  99%/3476  
  🟩 GCC11              Pass: 100%/7   | Total: 30m 41s | Avg:  4m 23s | Max:  4m 51s | Hits:  99%/6069  
  🟩 GCC12              Pass: 100%/4   | Total: 18m 21s | Avg:  4m 35s | Max:  4m 39s | Hits:  99%/3468  
  🟩 GCC13              Pass: 100%/28  | Total:  6h 17m | Avg: 13m 29s | Max: 38m 15s | Hits:  99%/24276 
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 15m 27s | Avg:  5m 09s | Max:  5m 18s | Hits: 100%/2385  
  🟩 MSVC14.16          Pass: 100%/1   | Total: 13m 01s | Avg: 13m 01s | Max: 13m 01s | Hits:  99%/709   
  🟩 MSVC14.29          Pass: 100%/2   | Total: 22m 10s | Avg: 11m 05s | Max: 11m 16s | Hits:  99%/1418  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 34m 33s | Avg: 11m 31s | Max: 11m 45s | Hits:  99%/2127  
🟩 cxx_family
  🟩 Clang              Pass: 100%/59  | Total:  8h 25m | Avg:  8m 34s | Max: 25m 50s | Hits:  99%/50671 
  🟩 GCC                Pass: 100%/63  | Total:  8h 41m | Avg:  8m 17s | Max: 38m 15s | Hits:  99%/53820 
  🟩 Intel              Pass: 100%/3   | Total: 15m 27s | Avg:  5m 09s | Max:  5m 18s | Hits: 100%/2385  
  🟩 MSVC               Pass: 100%/6   | Total:  1h 09m | Avg: 11m 37s | Max: 13m 01s | Hits:  99%/4254  
🟩 gpu
  🟩 v100               Pass: 100%/131 | Total: 18h 32m | Avg:  8m 29s | Max: 38m 15s | Hits:  99%/111130
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total:  7h 49m | Avg:  4m 44s | Max: 13m 01s | Hits:  99%/83386 
  🟩 DeviceLaunch       Pass: 100%/8   | Total:  2h 32m | Avg: 19m 00s | Max: 23m 14s | Hits:  99%/6936  
  🟩 GraphCapture       Pass: 100%/8   | Total:  2h 07m | Avg: 15m 56s | Max: 18m 24s | Hits:  99%/6936  
  🟩 HostLaunch         Pass: 100%/8   | Total:  2h 29m | Avg: 18m 42s | Max: 20m 33s | Hits:  99%/6936  
  🟩 TestGPU            Pass: 100%/8   | Total:  3h 33m | Avg: 26m 41s | Max: 38m 15s | Hits:  99%/6936  
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 13m 11s | Avg:  4m 23s | Max:  4m 51s | Hits:  99%/2601  
  🟩 90a                Pass: 100%/4   | Total: 15m 04s | Avg:  3m 46s | Max:  4m 01s | Hits:  99%/3468  
🟩 std
  🟩 11                 Pass: 100%/34  | Total:  4h 23m | Avg:  7m 45s | Max: 27m 38s | Hits:  99%/29049 
  🟩 14                 Pass: 100%/37  | Total:  4h 57m | Avg:  8m 02s | Max: 25m 50s | Hits:  99%/31176 
  🟩 17                 Pass: 100%/36  | Total:  4h 57m | Avg:  8m 15s | Max: 29m 44s | Hits:  99%/30394 
  🟩 20                 Pass: 100%/24  | Total:  4h 13m | Avg: 10m 34s | Max: 38m 15s | Hits:  99%/20511

🟩 thrust: Pass: 100%/118 | Total: 11h 51m | Avg: 6m 01s | Max: 34m 45s | Hits: 99%/138912

🟩 cpu
  🟩 amd64              Pass: 100%/110 | Total: 11h 24m | Avg:  6m 13s | Max: 34m 45s | Hits:  98%/129492
  🟩 arm64              Pass: 100%/8   | Total: 26m 49s | Avg:  3m 21s | Max:  3m 53s | Hits:  99%/9420  
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total: 57m 26s | Avg:  3m 49s | Max: 13m 54s | Hits:  99%/17660 
  🟩 11.8               Pass: 100%/3   | Total: 10m 47s | Avg:  3m 35s | Max:  3m 41s | Hits:  99%/3534  
  🟩 12.5               Pass: 100%/100 | Total: 10h 43m | Avg:  6m 25s | Max: 34m 45s | Hits:  98%/117718
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total:  7m 44s | Avg:  3m 52s | Max:  3m 52s | Hits: 100%/2354  
  🟩 nvcc11.1           Pass: 100%/15  | Total: 57m 26s | Avg:  3m 49s | Max: 13m 54s | Hits:  99%/17660 
  🟩 nvcc11.8           Pass: 100%/3   | Total: 10m 47s | Avg:  3m 35s | Max:  3m 41s | Hits:  99%/3534  
  🟩 nvcc12.5           Pass: 100%/98  | Total: 10h 35m | Avg:  6m 29s | Max: 34m 45s | Hits:  98%/115364
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total:  7m 44s | Avg:  3m 52s | Max:  3m 52s | Hits: 100%/2354  
  🟩 nvcc               Pass: 100%/116 | Total: 11h 43m | Avg:  6m 03s | Max: 34m 45s | Hits:  99%/136558
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total: 22m 33s | Avg:  3m 45s | Max:  4m 36s | Hits: 100%/7062  
  🟩 Clang10            Pass: 100%/3   | Total: 14m 37s | Avg:  4m 52s | Max:  4m 57s | Hits: 100%/3531  
  🟩 Clang11            Pass: 100%/4   | Total: 15m 07s | Avg:  3m 46s | Max:  4m 16s | Hits: 100%/4708  
  🟩 Clang12            Pass: 100%/4   | Total: 15m 02s | Avg:  3m 45s | Max:  3m 56s | Hits: 100%/4708  
  🟩 Clang13            Pass: 100%/4   | Total: 15m 38s | Avg:  3m 54s | Max:  4m 19s | Hits: 100%/4708  
  🟩 Clang14            Pass: 100%/4   | Total: 15m 32s | Avg:  3m 53s | Max:  4m 19s | Hits:  99%/4708  
  🟩 Clang15            Pass: 100%/4   | Total: 14m 31s | Avg:  3m 37s | Max:  3m 55s | Hits:  99%/4708  
  🟩 Clang16            Pass: 100%/4   | Total: 16m 14s | Avg:  4m 03s | Max:  4m 17s | Hits:  99%/4708  
  🟩 Clang17            Pass: 100%/18  | Total:  1h 55m | Avg:  6m 25s | Max: 20m 02s | Hits:  99%/21186 
  🟩 GCC6               Pass: 100%/2   | Total:  6m 18s | Avg:  3m 09s | Max:  3m 16s | Hits:  99%/2354  
  🟩 GCC7               Pass: 100%/6   | Total: 19m 30s | Avg:  3m 15s | Max:  4m 09s | Hits:  99%/7068  
  🟩 GCC8               Pass: 100%/6   | Total: 19m 20s | Avg:  3m 13s | Max:  3m 40s | Hits:  99%/7068  
  🟩 GCC9               Pass: 100%/6   | Total: 21m 08s | Avg:  3m 31s | Max:  4m 14s | Hits:  99%/7068  
  🟩 GCC10              Pass: 100%/4   | Total: 15m 01s | Avg:  3m 45s | Max:  4m 15s | Hits:  99%/4712  
  🟩 GCC11              Pass: 100%/7   | Total: 24m 45s | Avg:  3m 32s | Max:  3m 41s | Hits:  99%/8246  
  🟩 GCC12              Pass: 100%/4   | Total: 44m 04s | Avg: 11m 01s | Max: 32m 47s | Hits:  79%/4712  
  🟩 GCC13              Pass: 100%/20  | Total:  2h 40m | Avg:  8m 01s | Max: 34m 45s | Hits:  99%/23560 
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 13m 43s | Avg:  4m 34s | Max:  4m 41s | Hits: 100%/3540  
  🟩 MSVC14.16          Pass: 100%/1   | Total: 13m 54s | Avg: 13m 54s | Max: 13m 54s | Hits:  98%/1173  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 24m 52s | Avg: 12m 26s | Max: 13m 14s | Hits:  98%/2346  
  🟩 MSVC14.39          Pass: 100%/6   | Total:  1h 43m | Avg: 17m 15s | Max: 20m 18s | Hits:  98%/7038  
🟩 cxx_family
  🟩 Clang              Pass: 100%/51  | Total:  4h 04m | Avg:  4m 47s | Max: 20m 02s | Hits:  99%/60027 
  🟩 GCC                Pass: 100%/55  | Total:  5h 10m | Avg:  5m 38s | Max: 34m 45s | Hits:  98%/64788 
  🟩 Intel              Pass: 100%/3   | Total: 13m 43s | Avg:  4m 34s | Max:  4m 41s | Hits: 100%/3540  
  🟩 MSVC               Pass: 100%/9   | Total:  2h 22m | Avg: 15m 48s | Max: 20m 18s | Hits:  98%/10557 
🟩 gpu
  🟩 v100               Pass: 100%/118 | Total: 11h 51m | Avg:  6m 01s | Max: 34m 45s | Hits:  99%/138912
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total:  7h 36m | Avg:  4m 36s | Max: 32m 47s | Hits:  98%/116553
  🟩 TestCPU            Pass: 100%/11  | Total:  2h 02m | Avg: 11m 06s | Max: 20m 18s | Hits:  98%/12939 
  🟩 TestGPU            Pass: 100%/8   | Total:  2h 13m | Avg: 16m 38s | Max: 34m 45s | Hits:  99%/9420  
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 10m 47s | Avg:  3m 35s | Max:  3m 41s | Hits:  99%/3534  
  🟩 90a                Pass: 100%/4   | Total: 13m 59s | Avg:  3m 29s | Max:  3m 52s | Hits:  99%/4712  
🟩 std
  🟩 11                 Pass: 100%/30  | Total:  2h 14m | Avg:  4m 29s | Max: 20m 02s | Hits:  99%/35328 
  🟩 14                 Pass: 100%/34  | Total:  3h 44m | Avg:  6m 36s | Max: 32m 47s | Hits:  97%/40020 
  🟩 17                 Pass: 100%/33  | Total:  3h 21m | Avg:  6m 06s | Max: 19m 50s | Hits:  99%/38847 
  🟩 20                 Pass: 100%/21  | Total:  2h 30m | Avg:  7m 08s | Max: 34m 45s | Hits:  99%/24717

🟩 libcudacxx: Pass: 100%/112 | Total: 1d 00h | Avg: 13m 00s | Max: 33m 40s | Hits: 96%/273355

🟩 cpu
  🟩 amd64              Pass: 100%/104 | Total: 22h 45m | Avg: 13m 07s | Max: 33m 40s | Hits:  96%/251001
  🟩 arm64              Pass: 100%/8   | Total:  1h 31m | Avg: 11m 26s | Max: 13m 40s | Hits:  97%/22354 
🟩 ctk
  🟩 11.1               Pass: 100%/15  | Total:  2h 46m | Avg: 11m 06s | Max: 16m 56s | Hits:  97%/39795 
  🟩 11.8               Pass: 100%/3   | Total: 42m 23s | Avg: 14m 07s | Max: 14m 59s | Hits:  96%/8067  
  🟩 12.5               Pass: 100%/94  | Total: 20h 47m | Avg: 13m 16s | Max: 33m 40s | Hits:  96%/225493
🟩 cudacxx
  🟩 ClangCUDA17        Pass: 100%/2   | Total: 37m 32s | Avg: 18m 46s | Max: 19m 51s | Hits:  37%/6101  
  🟩 nvcc11.1           Pass: 100%/15  | Total:  2h 46m | Avg: 11m 06s | Max: 16m 56s | Hits:  97%/39795 
  🟩 nvcc11.8           Pass: 100%/3   | Total: 42m 23s | Avg: 14m 07s | Max: 14m 59s | Hits:  96%/8067  
  🟩 nvcc12.5           Pass: 100%/92  | Total: 20h 10m | Avg: 13m 09s | Max: 33m 40s | Hits:  97%/219392
🟩 cudacxx_family
  🟩 ClangCUDA          Pass: 100%/2   | Total: 37m 32s | Avg: 18m 46s | Max: 19m 51s | Hits:  37%/6101  
  🟩 nvcc               Pass: 100%/110 | Total: 23h 39m | Avg: 12m 54s | Max: 33m 40s | Hits:  97%/267254
🟩 cxx
  🟩 Clang9             Pass: 100%/6   | Total:  1h 22m | Avg: 13m 44s | Max: 16m 47s | Hits:  97%/16166 
  🟩 Clang10            Pass: 100%/3   | Total: 45m 32s | Avg: 15m 10s | Max: 15m 59s | Hits:  97%/8112  
  🟩 Clang11            Pass: 100%/4   | Total: 46m 49s | Avg: 11m 42s | Max: 14m 37s | Hits:  97%/11185 
  🟩 Clang12            Pass: 100%/4   | Total: 47m 59s | Avg: 11m 59s | Max: 16m 08s | Hits:  97%/11185 
  🟩 Clang13            Pass: 100%/4   | Total: 59m 20s | Avg: 14m 50s | Max: 15m 53s | Hits:  97%/11185 
  🟩 Clang14            Pass: 100%/4   | Total: 25m 25s | Avg:  6m 21s | Max: 13m 35s | Hits:  98%/11185 
  🟩 Clang15            Pass: 100%/4   | Total: 48m 54s | Avg: 12m 13s | Max: 15m 10s | Hits:  97%/11177 
  🟩 Clang16            Pass: 100%/4   | Total: 59m 27s | Avg: 14m 51s | Max: 15m 07s | Hits:  97%/11177 
  🟩 Clang17            Pass: 100%/14  | Total:  3h 47m | Avg: 16m 15s | Max: 30m 58s | Hits:  84%/28455 
  🟩 GCC6               Pass: 100%/2   | Total: 20m 39s | Avg: 10m 19s | Max: 10m 26s | Hits:  97%/5047  
  🟩 GCC7               Pass: 100%/6   | Total:  1h 03m | Avg: 10m 31s | Max: 14m 21s | Hits:  97%/16152 
  🟩 GCC8               Pass: 100%/6   | Total: 41m 38s | Avg:  6m 56s | Max: 10m 42s | Hits:  98%/16160 
  🟩 GCC9               Pass: 100%/6   | Total:  1h 03m | Avg: 10m 39s | Max: 13m 56s | Hits:  97%/16164 
  🟩 GCC10              Pass: 100%/4   | Total: 56m 23s | Avg: 14m 05s | Max: 14m 52s | Hits:  97%/11185 
  🟩 GCC11              Pass: 100%/7   | Total:  1h 27m | Avg: 12m 26s | Max: 14m 59s | Hits:  97%/19244 
  🟩 GCC12              Pass: 100%/4   | Total: 57m 57s | Avg: 14m 29s | Max: 15m 03s | Hits:  97%/11177 
  🟩 GCC13              Pass: 100%/21  | Total:  5h 05m | Avg: 14m 33s | Max: 33m 40s | Hits:  98%/33914 
  🟩 Intel2023.2.0      Pass: 100%/3   | Total: 34m 47s | Avg: 11m 35s | Max: 15m 36s | Hits:  98%/8108  
  🟩 MSVC14.16          Pass: 100%/1   | Total: 16m 56s | Avg: 16m 56s | Max: 16m 56s | Hits:  99%/2537  
  🟩 MSVC14.29          Pass: 100%/2   | Total: 24m 45s | Avg: 12m 22s | Max: 12m 40s | Hits:  99%/5436  
  🟩 MSVC14.39          Pass: 100%/3   | Total: 40m 30s | Avg: 13m 30s | Max: 13m 50s | Hits:  99%/8404  
🟩 cxx_family
  🟩 Clang              Pass: 100%/47  | Total: 10h 43m | Avg: 13m 41s | Max: 30m 58s | Hits:  94%/119827
  🟩 GCC                Pass: 100%/56  | Total: 11h 36m | Avg: 12m 26s | Max: 33m 40s | Hits:  97%/129043
  🟩 Intel              Pass: 100%/3   | Total: 34m 47s | Avg: 11m 35s | Max: 15m 36s | Hits:  98%/8108  
  🟩 MSVC               Pass: 100%/6   | Total:  1h 22m | Avg: 13m 41s | Max: 16m 56s | Hits:  99%/16377 
🟩 gpu
  🟩 v100               Pass: 100%/112 | Total:  1d 00h | Avg: 13m 00s | Max: 33m 40s | Hits:  96%/273355
🟩 jobs
  🟩 Build              Pass: 100%/99  | Total: 19h 10m | Avg: 11m 37s | Max: 19m 51s | Hits:  96%/273335
  🟩 NVRTC              Pass: 100%/4   | Total:  1h 41m | Avg: 25m 23s | Max: 33m 40s | Hits: 100%/20    
  🟩 Test               Pass: 100%/8   | Total:  3h 22m | Avg: 25m 17s | Max: 30m 58s
  🟩 VerifyCodegen      Pass: 100%/1   | Total:  2m 14s | Avg:  2m 14s | Max:  2m 14s
🟩 sm
  🟩 60;70;80;90        Pass: 100%/3   | Total: 42m 23s | Avg: 14m 07s | Max: 14m 59s | Hits:  96%/8067  
  🟩 90a                Pass: 100%/4   | Total: 13m 36s | Avg:  3m 24s | Max:  3m 37s | Hits:  99%/11540 
🟩 std
  🟩 11                 Pass: 100%/29  | Total:  6h 01m | Avg: 12m 27s | Max: 26m 42s | Hits:  97%/58228 
  🟩 14                 Pass: 100%/32  | Total:  7h 24m | Avg: 13m 52s | Max: 33m 40s | Hits:  97%/81819 
  🟩 17                 Pass: 100%/31  | Total:  6h 27m | Avg: 12m 29s | Max: 30m 58s | Hits:  95%/84164 
  🟩 20                 Pass: 100%/19  | Total:  4h 21m | Avg: 13m 46s | Max: 24m 36s | Hits:  94%/49144

🟩 cudax: Pass: 100%/55 | Total: 2h 12m | Avg: 2m 24s | Max: 7m 52s | Hits: 97%/2738

🟩 cpu
  🟩 amd64              Pass: 100%/51  | Total:  2h 06m | Avg:  2m 28s | Max:  7m 52s | Hits:  97%/2538  
  🟩 arm64              Pass: 100%/4   | Total:  6m 29s | Avg:  1m 37s | Max:  1m 41s | Hits:  98%/200   
🟩 ctk
  🟩 12.0               Pass: 100%/23  | Total: 56m 46s | Avg:  2m 28s | Max:  6m 35s | Hits:  97%/1144  
  🟩 12.5               Pass: 100%/32  | Total:  1h 16m | Avg:  2m 22s | Max:  7m 52s | Hits:  97%/1594  
🟩 cudacxx
  🟩 nvcc12.0           Pass: 100%/23  | Total: 56m 46s | Avg:  2m 28s | Max:  6m 35s | Hits:  97%/1144  
  🟩 nvcc12.5           Pass: 100%/32  | Total:  1h 16m | Avg:  2m 22s | Max:  7m 52s | Hits:  97%/1594  
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/55  | Total:  2h 12m | Avg:  2m 24s | Max:  7m 52s | Hits:  97%/2738  
🟩 cxx
  🟩 Clang9             Pass: 100%/2   | Total:  4m 04s | Avg:  2m 02s | Max:  2m 04s | Hits: 100%/100   
  🟩 Clang10            Pass: 100%/2   | Total:  4m 08s | Avg:  2m 04s | Max:  2m 05s | Hits: 100%/100   
  🟩 Clang11            Pass: 100%/4   | Total:  8m 05s | Avg:  2m 01s | Max:  2m 06s | Hits: 100%/200   
  🟩 Clang12            Pass: 100%/4   | Total:  7m 50s | Avg:  1m 57s | Max:  2m 15s | Hits: 100%/200   
  🟩 Clang13            Pass: 100%/4   | Total:  8m 21s | Avg:  2m 05s | Max:  2m 19s | Hits: 100%/200   
  🟩 Clang14            Pass: 100%/6   | Total: 15m 33s | Avg:  2m 35s | Max:  3m 55s | Hits: 100%/300   
  🟩 Clang15            Pass: 100%/2   | Total:  4m 04s | Avg:  2m 02s | Max:  2m 04s | Hits: 100%/100   
  🟩 Clang16            Pass: 100%/6   | Total: 14m 57s | Avg:  2m 29s | Max:  3m 56s | Hits: 100%/300   
  🟩 GCC9               Pass: 100%/2   | Total:  4m 24s | Avg:  2m 12s | Max:  2m 22s | Hits:  96%/100   
  🟩 GCC10              Pass: 100%/4   | Total:  7m 18s | Avg:  1m 49s | Max:  2m 03s | Hits:  96%/200   
  🟩 GCC11              Pass: 100%/4   | Total:  7m 36s | Avg:  1m 54s | Max:  2m 21s | Hits:  96%/200   
  🟩 GCC12              Pass: 100%/12  | Total: 29m 20s | Avg:  2m 26s | Max:  3m 48s | Hits:  96%/600   
  🟩 Intel2023.2.0      Pass: 100%/1   | Total:  2m 42s | Avg:  2m 42s | Max:  2m 42s | Hits: 100%/50    
  🟩 MSVC14.36          Pass: 100%/1   | Total:  6m 35s | Avg:  6m 35s | Max:  6m 35s | Hits:  81%/44    
  🟩 MSVC14.39          Pass: 100%/1   | Total:  7m 52s | Avg:  7m 52s | Max:  7m 52s | Hits:  81%/44    
🟩 cxx_family
  🟩 Clang              Pass: 100%/30  | Total:  1h 07m | Avg:  2m 14s | Max:  3m 56s | Hits: 100%/1500  
  🟩 GCC                Pass: 100%/22  | Total: 48m 38s | Avg:  2m 12s | Max:  3m 48s | Hits:  96%/1100  
  🟩 Intel              Pass: 100%/1   | Total:  2m 42s | Avg:  2m 42s | Max:  2m 42s | Hits: 100%/50    
  🟩 MSVC               Pass: 100%/2   | Total: 14m 27s | Avg:  7m 13s | Max:  7m 52s | Hits:  81%/88    
🟩 gpu
  🟩 v100               Pass: 100%/55  | Total:  2h 12m | Avg:  2m 24s | Max:  7m 52s | Hits:  97%/2738  
🟩 jobs
  🟩 Build              Pass: 100%/47  | Total:  1h 43m | Avg:  2m 11s | Max:  7m 52s | Hits:  97%/2338  
  🟩 Test               Pass: 100%/8   | Total: 29m 38s | Avg:  3m 42s | Max:  3m 56s | Hits:  98%/400   
🟩 sm
  🟩 90                 Pass: 100%/1   | Total:  1m 52s | Avg:  1m 52s | Max:  1m 52s | Hits:  96%/50    
  🟩 90a                Pass: 100%/1   | Total:  2m 18s | Avg:  2m 18s | Max:  2m 18s | Hits:  96%/50    
🟩 std
  🟩 17                 Pass: 100%/31  | Total:  1h 07m | Avg:  2m 11s | Max:  3m 56s | Hits:  98%/1550  
  🟩 20                 Pass: 100%/24  | Total:  1h 04m | Avg:  2m 42s | Max:  7m 52s | Hits:  97%/1188

🟩 pycuda: Pass: 100%/1 | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s

🟩 cpu
  🟩 amd64              Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 ctk
  🟩 12.5               Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 cudacxx
  🟩 nvcc12.5           Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 cudacxx_family
  🟩 nvcc               Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 cxx
  🟩 GCC13              Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 cxx_family
  🟩 GCC                Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 gpu
  🟩 v100               Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s
🟩 jobs
  🟩 Test               Pass: 100%/1   | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust
	CUDA Experimental
	pycuda

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust
+/-	CUDA Experimental
+/-	pycuda

🏃‍ Runner counts (total jobs: 417)

#	Runner
305	`linux-amd64-cpu16`
61	`linux-amd64-gpu-v100-latest-1`
28	`linux-arm64-cpu16`
23	`windows-amd64-cpu16`

wmaxey · 2024-10-30T18:26:21Z

When can we expect this to be merged?

There are still issues with the solution we've come up with here. It's possible to defer the linker error to runtime when the TU is compiled from PTX to SASS during JIT or with -rdc=true. This is unworkable, especially when the whole module gets a JIT pass regardless of actual usage.

wmaxey added 3 commits May 13, 2024 15:04

Make headers includable in pre-sm_70 TUs.

fd47273

Make atomics emit linker errors when architecture is unsupported.

46b956f

Enable public header testing for atomic and friends.

0166765

wmaxey requested review from a team as code owners May 13, 2024 22:28

wmaxey requested review from alliepiper, gonidelis and griwes May 13, 2024 22:28

miscco requested changes May 14, 2024

View reviewed changes

miscco reviewed May 29, 2024

View reviewed changes

bernhardmgruber approved these changes Jun 27, 2024

View reviewed changes

griwes reviewed Aug 1, 2024

View reviewed changes

Merge branch 'main' into fea/enable_including_arch_protected_headers

b9cf287

miscco approved these changes Aug 5, 2024

View reviewed changes

jrhemstad closed this Sep 6, 2024

jrhemstad reopened this Sep 6, 2024

	(__atomic_is_not_supported_pre_sm_60();),
	(__atomic_is_not_supported_pre_sm_60(); return {};),

		@@ -45,7 +45,7 @@ function(libcudacxx_add_public_header_test header)
		target_compile_options(headertest_${header_name} PRIVATE ${headertest_warning_levels_device})

		# Ensure that if this is an atomic header, we only include the right architectures

Enable including atomics and friends in TUs that do not support them. #1736

Are you sure you want to change the base?

Enable including atomics and friends in TUs that do not support them. #1736

Conversation

wmaxey commented May 13, 2024

Description

Checklist

github-actions bot commented May 14, 2024

🟩 Project cub [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 Project thrust [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 Project libcudacxx [ Failed: 0 | Passed: 104 | Total: 104 ]

🏃‍ Runner counts (total jobs: 302)

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

miscco left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

jrhemstad commented May 14, 2024

miscco commented May 14, 2024

griwes commented May 14, 2024

jrhemstad commented May 14, 2024

miscco commented May 15, 2024

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

github-actions bot commented Aug 5, 2024

🟨 cub: Pass: 98%/131 | Total: 1d 04h | Avg: 13m 08s | Max: 1h 00m | Hits: 97%/109396

🟩 thrust: Pass: 100%/118 | Total: 16h 36m | Avg: 8m 26s | Max: 45m 08s | Hits: 97%/138912

🟩 libcudacxx: Pass: 100%/112 | Total: 1d 05h | Avg: 15m 52s | Max: 41m 45s | Hits: 92%/273355

🟩 cudax: Pass: 100%/55 | Total: 2h 36m | Avg: 2m 51s | Max: 6m 26s | Hits: 87%/2738

🟩 pycuda: Pass: 100%/1 | Total: 11m 15s | Avg: 11m 15s | Max: 11m 15s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 417)

TristonC commented Sep 5, 2024

jrhemstad commented Sep 6, 2024

github-actions bot commented Sep 6, 2024

🟨 libcudacxx: Pass: 99%/112 | Total: 1d 00h | Avg: 13m 06s | Max: 33m 40s | Hits: 96%/273350

🟩 cub: Pass: 100%/131 | Total: 18h 32m | Avg: 8m 29s | Max: 38m 15s | Hits: 99%/111130

🟩 thrust: Pass: 100%/118 | Total: 11h 51m | Avg: 6m 01s | Max: 34m 45s | Hits: 99%/138912

🟩 cudax: Pass: 100%/55 | Total: 2h 12m | Avg: 2m 24s | Max: 7m 52s | Hits: 97%/2738

🟩 pycuda: Pass: 100%/1 | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 417)

github-actions bot commented Sep 9, 2024

🟩 cub: Pass: 100%/131 | Total: 18h 32m | Avg: 8m 29s | Max: 38m 15s | Hits: 99%/111130

🟩 thrust: Pass: 100%/118 | Total: 11h 51m | Avg: 6m 01s | Max: 34m 45s | Hits: 99%/138912

🟩 libcudacxx: Pass: 100%/112 | Total: 1d 00h | Avg: 13m 00s | Max: 33m 40s | Hits: 96%/273355

🟩 cudax: Pass: 100%/55 | Total: 2h 12m | Avg: 2m 24s | Max: 7m 52s | Hits: 97%/2738

🟩 pycuda: Pass: 100%/1 | Total: 10m 57s | Avg: 10m 57s | Max: 10m 57s

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

🏃‍ Runner counts (total jobs: 417)

wmaxey commented Oct 30, 2024