Atomics backend refactor #1631

wmaxey · 2024-04-15T17:01:46Z

Description

closes: #1615

Codegen before and after changes is identical. Though the next step is to compare with additional FileCheck tests.

Checklist

New or existing tests cover these changes.
The documentation is up to date with these changes.

copy-pr-bot · 2024-04-18T21:38:55Z

This pull request requires additional validation before any workflows can run on NVIDIA's runners.

Pull request vetters can view their responsibilities here.

Contributors can view more details about this message here.

* This matches other implementations.

miscco

I like this a lot.

There is still some nitty gritty correctness stuff we need to do but its already looking great

libcudacxx/include/cuda/std/__atomic/api/atomic_impl.h

libcudacxx/include/cuda/std/__atomic/api/atomic_crtp.h

libcudacxx/include/cuda/std/__atomic/api/atomic_impl.h

libcudacxx/include/cuda/std/__cuda/atomic.h

libcudacxx/include/cuda/std/__cuda/barrier.h

libcudacxx/include/cuda/std/atomic

* We previously defined or *clobbered* the existing STL definitions. * See: `ATOMIC_BOOL_LOCK_FREE`->`LIBCUDACXX_ATOMIC_BOOL_LOCK_FREE`

Co-authored-by: Michael Schellenberger Costa <[email protected]>

wmaxey · 2024-05-09T21:53:15Z

libcudacxx/include/cuda/std/__atomic/functions/host.h

+template <typename _Tp>
+__atomic_alignment_wrapper<__remove_cv_t<_Tp>>& __atomic_auto_align(_Tp* __a)
+{
+  using __aligned_t = __atomic_alignment_wrapper<__remove_cv_t<_Tp>>;
+  return *reinterpret_cast<__aligned_t*>(__a);
+};
+template <typename _Tp>
+const __atomic_alignment_wrapper<__remove_cv_t<_Tp>>& __atomic_auto_align(const _Tp* __a)
+{
+  using __aligned_t = const __atomic_alignment_wrapper<__remove_cv_t<_Tp>>;
+  return *reinterpret_cast<__aligned_t*>(__a);
+};
+template <typename _Tp>
+volatile __atomic_alignment_wrapper<__remove_cv_t<_Tp>>& __atomic_auto_align(volatile _Tp* __a)
+{
+  using __aligned_t = volatile __atomic_alignment_wrapper<__remove_cv_t<_Tp>>;
+  return *reinterpret_cast<__aligned_t*>(__a);
+};
+template <typename _Tp>
+const volatile __atomic_alignment_wrapper<__remove_cv_t<_Tp>>& __atomic_auto_align(const volatile _Tp* __a)
+{
+  using __aligned_t = const volatile __atomic_alignment_wrapper<__remove_cv_t<_Tp>>;
+  return *reinterpret_cast<__aligned_t*>(__a);
+};
+
+// Guard ifdef for lock free query in case it is assigned elsewhere (MSVC/CUDA)
+inline void __atomic_thread_fence_host(memory_order __order)
+{
+  __atomic_thread_fence(__atomic_order_to_int(__order));
+}
+
+inline void __atomic_signal_fence_host(memory_order __order)
+{
+  __atomic_signal_fence(__atomic_order_to_int(__order));
+}
+
+template <typename _Tp, typename _Up>
+inline void __atomic_store_host(_Tp* __a, _Up __val, memory_order __order)
+{
+  __atomic_store(
+    &__atomic_auto_align<_Tp>(__a), &__atomic_auto_align<__remove_cv_t<_Tp>>(&__val), __atomic_order_to_int(__order));
+}
+
+template <typename _Tp>
+inline auto __atomic_load_host(_Tp* __a, memory_order __order) -> __remove_cv_t<_Tp>
+{
+  __remove_cv_t<_Tp> __ret;
+  __atomic_load(
+    &__atomic_auto_align<_Tp>(__a), &__atomic_auto_align<__remove_cv_t<_Tp>>(&__ret), __atomic_order_to_int(__order));
+  return __ret;
+}
+
+template <typename _Tp, typename _Up>
+inline auto __atomic_exchange_host(_Tp* __a, _Up __val, memory_order __order) -> __remove_cv_t<_Tp>
+{
+  __remove_cv_t<_Tp> __ret;
+  __atomic_exchange(&__atomic_auto_align<_Tp>(__a),
+                    &__atomic_auto_align<__remove_cv_t<_Tp>>(&__val),
+                    &__atomic_auto_align<__remove_cv_t<_Tp>>(&__ret),
+                    __atomic_order_to_int(__order));
+  return __ret;
+}


@miscco @griwes
Time for excuses: __atomic_auto_align why did I write this?

Because alignment information is lost as we descend into the abyss. And if we continued to link we'd end up requiring libatomic. There could be a better way to write this. Any ideas?

https://gcc.godbolt.org/z/vdxffdnKc

This is where all that wrap/unwrap nastyness came from as well. It was just more or less poorly written when a first pass was made.

…PIs.

…ic>`

github-actions · 2024-05-10T00:10:13Z

🟨 CI Results [ Failed: 21 | Passed: 281 | Total: 302 ]

🟩 Project cub [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 cpu
  🟩 amd64 (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 arm64 (0% Fail)              Failed:  0  -- Passed:  8  -- Total:  8 
🟩 ctk
  🟩 11.1 (0% Fail)               Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 12.4 (0% Fail)               Failed:  0  -- Passed: 81  -- Total: 81 
🟩 cudacxx_full
  🟩 clang-cuda16 (0% Fail)       Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc11.1 (0% Fail)           Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 nvcc12.4 (0% Fail)           Failed:  0  -- Passed: 79  -- Total: 79 
🟩 cudacxx_name
  🟩 clang-cuda (0% Fail)         Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc (0% Fail)               Failed:  0  -- Passed: 97  -- Total: 97 
🟩 cxx_full
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 clang11 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang12 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang13 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang14 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang15 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang16 (0% Fail)            Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 gcc6 (0% Fail)               Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟩 gcc12 (0% Fail)              Failed:  0  -- Passed: 16  -- Total: 16 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🟩 cxx_name
  🟩 clang (0% Fail)              Failed:  0  -- Passed: 43  -- Total: 43 
  🟩 gcc (0% Fail)                Failed:  0  -- Passed: 47  -- Total: 47 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🟩 gpu
  🟩 v100 (0% Fail)               Failed:  0  -- Passed: 99  -- Total: 99 
🟩 jobs
  🟩 build (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 test (0% Fail)               Failed:  0  -- Passed:  8  -- Total:  8 
🟩 os
  🟩 ubuntu18.04 (0% Fail)        Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 ubuntu20.04 (0% Fail)        Failed:  0  -- Passed: 35  -- Total: 35 
  🟩 ubuntu22.04 (0% Fail)        Failed:  0  -- Passed: 44  -- Total: 44 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟩 sm
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 90a (0% Fail)                Failed:  0  -- Passed:  4  -- Total:  4 
🟩 std
  🟩 11 (0% Fail)                 Failed:  0  -- Passed: 26  -- Total: 26 
  🟩 14 (0% Fail)                 Failed:  0  -- Passed: 29  -- Total: 29 
  🟩 17 (0% Fail)                 Failed:  0  -- Passed: 28  -- Total: 28 
  🟩 20 (0% Fail)                 Failed:  0  -- Passed: 16  -- Total: 16

🟨 Project thrust [ Failed: 1 | Passed: 98 | Total: 99 ]

🔍 cpu: amd64 🔍
  🔍 amd64 (1% Fail)              Failed:  1  -- Passed: 90  -- Total: 91 
  🟩 arm64 (0% Fail)              Failed:  0  -- Passed:  8  -- Total:  8 
🔍 ctk: 12.4 🔍
  🟩 11.1 (0% Fail)               Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🔍 12.4 (1% Fail)               Failed:  1  -- Passed: 80  -- Total: 81 
🔍 cudacxx_full: nvcc12.4 🔍
  🟩 clang-cuda16 (0% Fail)       Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc11.1 (0% Fail)           Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🔍 nvcc12.4 (1% Fail)           Failed:  1  -- Passed: 78  -- Total: 79 
🔍 cudacxx_name: nvcc 🔍
  🟩 clang-cuda (0% Fail)         Failed:  0  -- Passed:  2  -- Total:  2 
  🔍 nvcc (1% Fail)               Failed:  1  -- Passed: 96  -- Total: 97 
🔍 cxx_full: MSVC14.29 🔍
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 clang11 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang12 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang13 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang14 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang15 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang16 (0% Fail)            Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 gcc6 (0% Fail)               Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟩 gcc12 (0% Fail)              Failed:  0  -- Passed: 16  -- Total: 16 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🔍 MSVC14.29 (50% Fail)         Failed:  1  -- Passed:  1  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🔍 cxx_name: MSVC 🔍
  🟩 clang (0% Fail)              Failed:  0  -- Passed: 43  -- Total: 43 
  🟩 gcc (0% Fail)                Failed:  0  -- Passed: 47  -- Total: 47 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🔍 MSVC (16% Fail)              Failed:  1  -- Passed:  5  -- Total:  6 
🔍 jobs: build 🔍
  🔍 build (1% Fail)              Failed:  1  -- Passed: 90  -- Total: 91 
  🟩 test (0% Fail)               Failed:  0  -- Passed:  8  -- Total:  8 
🔍 os: windows2022 🔍
  🟩 ubuntu18.04 (0% Fail)        Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 ubuntu20.04 (0% Fail)        Failed:  0  -- Passed: 35  -- Total: 35 
  🟩 ubuntu22.04 (0% Fail)        Failed:  0  -- Passed: 44  -- Total: 44 
  🔍 windows2022 (16% Fail)       Failed:  1  -- Passed:  5  -- Total:  6 
🔍 std: 14 🔍
  🟩 11 (0% Fail)                 Failed:  0  -- Passed: 26  -- Total: 26 
  🔍 14 (3% Fail)                 Failed:  1  -- Passed: 28  -- Total: 29 
  🟩 17 (0% Fail)                 Failed:  0  -- Passed: 28  -- Total: 28 
  🟩 20 (0% Fail)                 Failed:  0  -- Passed: 16  -- Total: 16 
🟨 gpu
  🟨 v100 (1% Fail)               Failed:  1  -- Passed: 98  -- Total: 99 
🟩 sm
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 90a (0% Fail)                Failed:  0  -- Passed:  4  -- Total:  4

🟨 Project libcudacxx [ Failed: 20 | Passed: 84 | Total: 104 ]

🚨 sm: 90a 🚨
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🔥 90a (100% Fail)              Failed:  4  -- Passed:  0  -- Total:  4 
🟨 cpu
  🟨 amd64 (19% Fail)             Failed: 19  -- Passed: 77  -- Total: 96 
  🟨 arm64 (12% Fail)             Failed:  1  -- Passed:  7  -- Total:  8 
🟨 ctk
  🟨 11.1 (13% Fail)              Failed:  2  -- Passed: 13  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟨 12.4 (20% Fail)              Failed: 18  -- Passed: 68  -- Total: 86 
🟨 cudacxx_full
  🟥 clang-cuda16 (100% Fail)     Failed:  2  -- Passed:  0  -- Total:  2 
  🟨 nvcc11.1 (13% Fail)          Failed:  2  -- Passed: 13  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟨 nvcc12.4 (19% Fail)          Failed: 16  -- Passed: 68  -- Total: 84 
🟨 cudacxx_name
  🟥 clang-cuda (100% Fail)       Failed:  2  -- Passed:  0  -- Total:  2 
  🟨 nvcc (17% Fail)              Failed: 18  -- Passed: 84  -- Total: 102
🟨 cxx_full
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟨 clang11 (25% Fail)           Failed:  1  -- Passed:  3  -- Total:  4 
  🟨 clang12 (25% Fail)           Failed:  1  -- Passed:  3  -- Total:  4 
  🟨 clang13 (25% Fail)           Failed:  1  -- Passed:  3  -- Total:  4 
  🟨 clang14 (25% Fail)           Failed:  1  -- Passed:  3  -- Total:  4 
  🟨 clang15 (25% Fail)           Failed:  1  -- Passed:  3  -- Total:  4 
  🟨 clang16 (35% Fail)           Failed:  5  -- Passed:  9  -- Total: 14 
  🟥 gcc6 (100% Fail)             Failed:  2  -- Passed:  0  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟨 gcc12 (38% Fail)             Failed:  8  -- Passed: 13  -- Total: 21 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🟨 cxx_name
  🟨 clang (23% Fail)             Failed: 10  -- Passed: 33  -- Total: 43 
  🟨 gcc (19% Fail)               Failed: 10  -- Passed: 42  -- Total: 52 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🟨 jobs
  🟨 build (16% Fail)             Failed: 15  -- Passed: 76  -- Total: 91 
  🟥 nvrtc (100% Fail)            Failed:  4  -- Passed:  0  -- Total:  4 
  🟨 test (12% Fail)              Failed:  1  -- Passed:  7  -- Total:  8 
  🟩 verify_codegen (0% Fail)     Failed:  0  -- Passed:  1  -- Total:  1 
🟨 os
  🟨 ubuntu18.04 (14% Fail)       Failed:  2  -- Passed: 12  -- Total: 14 
  🟨 ubuntu20.04 (11% Fail)       Failed:  4  -- Passed: 31  -- Total: 35 
  🟨 ubuntu22.04 (28% Fail)       Failed: 14  -- Passed: 35  -- Total: 49 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟨 std
  🟨 11 (11% Fail)                Failed:  3  -- Passed: 24  -- Total: 27 
  🟨 14 (10% Fail)                Failed:  3  -- Passed: 27  -- Total: 30 
  🟨 17 (10% Fail)                Failed:  3  -- Passed: 26  -- Total: 29 
  🟨 20 (64% Fail)                Failed: 11  -- Passed:  6  -- Total: 17 
🟨 gpu
  🟨 v100 (19% Fail)              Failed: 20  -- Passed: 84  -- Total: 104

🏃‍ Runner counts (total jobs: 302)

#	Runner
232	`linux-amd64-cpu16`
28	`linux-amd64-gpu-v100-latest-1`
24	`linux-arm64-cpu16`
18	`windows-amd64-cpu16`

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust

github-actions · 2024-05-10T02:49:44Z

🟨 CI Results [ Failed: 20 | Passed: 282 | Total: 302 ]

🟩 Project cub [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 cpu
  🟩 amd64 (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 arm64 (0% Fail)              Failed:  0  -- Passed:  8  -- Total:  8 
🟩 ctk
  🟩 11.1 (0% Fail)               Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 12.4 (0% Fail)               Failed:  0  -- Passed: 81  -- Total: 81 
🟩 cudacxx_full
  🟩 clang-cuda16 (0% Fail)       Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc11.1 (0% Fail)           Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 nvcc12.4 (0% Fail)           Failed:  0  -- Passed: 79  -- Total: 79 
🟩 cudacxx_name
  🟩 clang-cuda (0% Fail)         Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc (0% Fail)               Failed:  0  -- Passed: 97  -- Total: 97 
🟩 cxx_full
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 clang11 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang12 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang13 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang14 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang15 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang16 (0% Fail)            Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 gcc6 (0% Fail)               Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟩 gcc12 (0% Fail)              Failed:  0  -- Passed: 16  -- Total: 16 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🟩 cxx_name
  🟩 clang (0% Fail)              Failed:  0  -- Passed: 43  -- Total: 43 
  🟩 gcc (0% Fail)                Failed:  0  -- Passed: 47  -- Total: 47 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🟩 gpu
  🟩 v100 (0% Fail)               Failed:  0  -- Passed: 99  -- Total: 99 
🟩 jobs
  🟩 build (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 test (0% Fail)               Failed:  0  -- Passed:  8  -- Total:  8 
🟩 os
  🟩 ubuntu18.04 (0% Fail)        Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 ubuntu20.04 (0% Fail)        Failed:  0  -- Passed: 35  -- Total: 35 
  🟩 ubuntu22.04 (0% Fail)        Failed:  0  -- Passed: 44  -- Total: 44 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟩 sm
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 90a (0% Fail)                Failed:  0  -- Passed:  4  -- Total:  4 
🟩 std
  🟩 11 (0% Fail)                 Failed:  0  -- Passed: 26  -- Total: 26 
  🟩 14 (0% Fail)                 Failed:  0  -- Passed: 29  -- Total: 29 
  🟩 17 (0% Fail)                 Failed:  0  -- Passed: 28  -- Total: 28 
  🟩 20 (0% Fail)                 Failed:  0  -- Passed: 16  -- Total: 16

🟩 Project thrust [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 cpu
  🟩 amd64 (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 arm64 (0% Fail)              Failed:  0  -- Passed:  8  -- Total:  8 
🟩 ctk
  🟩 11.1 (0% Fail)               Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 12.4 (0% Fail)               Failed:  0  -- Passed: 81  -- Total: 81 
🟩 cudacxx_full
  🟩 clang-cuda16 (0% Fail)       Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc11.1 (0% Fail)           Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 nvcc12.4 (0% Fail)           Failed:  0  -- Passed: 79  -- Total: 79 
🟩 cudacxx_name
  🟩 clang-cuda (0% Fail)         Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc (0% Fail)               Failed:  0  -- Passed: 97  -- Total: 97 
🟩 cxx_full
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 clang11 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang12 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang13 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang14 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang15 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang16 (0% Fail)            Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 gcc6 (0% Fail)               Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟩 gcc12 (0% Fail)              Failed:  0  -- Passed: 16  -- Total: 16 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🟩 cxx_name
  🟩 clang (0% Fail)              Failed:  0  -- Passed: 43  -- Total: 43 
  🟩 gcc (0% Fail)                Failed:  0  -- Passed: 47  -- Total: 47 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🟩 gpu
  🟩 v100 (0% Fail)               Failed:  0  -- Passed: 99  -- Total: 99 
🟩 jobs
  🟩 build (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 test (0% Fail)               Failed:  0  -- Passed:  8  -- Total:  8 
🟩 os
  🟩 ubuntu18.04 (0% Fail)        Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 ubuntu20.04 (0% Fail)        Failed:  0  -- Passed: 35  -- Total: 35 
  🟩 ubuntu22.04 (0% Fail)        Failed:  0  -- Passed: 44  -- Total: 44 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟩 sm
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 90a (0% Fail)                Failed:  0  -- Passed:  4  -- Total:  4 
🟩 std
  🟩 11 (0% Fail)                 Failed:  0  -- Passed: 26  -- Total: 26 
  🟩 14 (0% Fail)                 Failed:  0  -- Passed: 29  -- Total: 29 
  🟩 17 (0% Fail)                 Failed:  0  -- Passed: 28  -- Total: 28 
  🟩 20 (0% Fail)                 Failed:  0  -- Passed: 16  -- Total: 16

🟨 Project libcudacxx [ Failed: 20 | Passed: 84 | Total: 104 ]

🚨 sm: 90a 🚨
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🔥 90a (100% Fail)              Failed:  4  -- Passed:  0  -- Total:  4 
🟨 cpu
  🟨 amd64 (19% Fail)             Failed: 19  -- Passed: 77  -- Total: 96 
  🟨 arm64 (12% Fail)             Failed:  1  -- Passed:  7  -- Total:  8 
🟨 ctk
  🟨 11.1 (13% Fail)              Failed:  2  -- Passed: 13  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟨 12.4 (20% Fail)              Failed: 18  -- Passed: 68  -- Total: 86 
🟨 cudacxx_full
  🟥 clang-cuda16 (100% Fail)     Failed:  2  -- Passed:  0  -- Total:  2 
  🟨 nvcc11.1 (13% Fail)          Failed:  2  -- Passed: 13  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟨 nvcc12.4 (19% Fail)          Failed: 16  -- Passed: 68  -- Total: 84 
🟨 cudacxx_name
  🟥 clang-cuda (100% Fail)       Failed:  2  -- Passed:  0  -- Total:  2 
  🟨 nvcc (17% Fail)              Failed: 18  -- Passed: 84  -- Total: 102
🟨 cxx_full
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟨 clang11 (25% Fail)           Failed:  1  -- Passed:  3  -- Total:  4 
  🟨 clang12 (25% Fail)           Failed:  1  -- Passed:  3  -- Total:  4 
  🟨 clang13 (25% Fail)           Failed:  1  -- Passed:  3  -- Total:  4 
  🟨 clang14 (25% Fail)           Failed:  1  -- Passed:  3  -- Total:  4 
  🟨 clang15 (25% Fail)           Failed:  1  -- Passed:  3  -- Total:  4 
  🟨 clang16 (35% Fail)           Failed:  5  -- Passed:  9  -- Total: 14 
  🟥 gcc6 (100% Fail)             Failed:  2  -- Passed:  0  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟨 gcc12 (38% Fail)             Failed:  8  -- Passed: 13  -- Total: 21 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🟨 cxx_name
  🟨 clang (23% Fail)             Failed: 10  -- Passed: 33  -- Total: 43 
  🟨 gcc (19% Fail)               Failed: 10  -- Passed: 42  -- Total: 52 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🟨 jobs
  🟨 build (16% Fail)             Failed: 15  -- Passed: 76  -- Total: 91 
  🟥 nvrtc (100% Fail)            Failed:  4  -- Passed:  0  -- Total:  4 
  🟨 test (12% Fail)              Failed:  1  -- Passed:  7  -- Total:  8 
  🟩 verify_codegen (0% Fail)     Failed:  0  -- Passed:  1  -- Total:  1 
🟨 os
  🟨 ubuntu18.04 (14% Fail)       Failed:  2  -- Passed: 12  -- Total: 14 
  🟨 ubuntu20.04 (11% Fail)       Failed:  4  -- Passed: 31  -- Total: 35 
  🟨 ubuntu22.04 (28% Fail)       Failed: 14  -- Passed: 35  -- Total: 49 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟨 std
  🟨 11 (11% Fail)                Failed:  3  -- Passed: 24  -- Total: 27 
  🟨 14 (10% Fail)                Failed:  3  -- Passed: 27  -- Total: 30 
  🟨 17 (10% Fail)                Failed:  3  -- Passed: 26  -- Total: 29 
  🟨 20 (64% Fail)                Failed: 11  -- Passed:  6  -- Total: 17 
🟨 gpu
  🟨 v100 (19% Fail)              Failed: 20  -- Passed: 84  -- Total: 104

🏃‍ Runner counts (total jobs: 302)

#	Runner
232	`linux-amd64-cpu16`
28	`linux-amd64-gpu-v100-latest-1`
24	`linux-arm64-cpu16`
18	`windows-amd64-cpu16`

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust

github-actions · 2024-05-10T10:04:33Z

🟨 CI Results [ Failed: 2 | Passed: 300 | Total: 302 ]

🟩 Project cub [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 cpu
  🟩 amd64 (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 arm64 (0% Fail)              Failed:  0  -- Passed:  8  -- Total:  8 
🟩 ctk
  🟩 11.1 (0% Fail)               Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 12.4 (0% Fail)               Failed:  0  -- Passed: 81  -- Total: 81 
🟩 cudacxx_full
  🟩 clang-cuda16 (0% Fail)       Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc11.1 (0% Fail)           Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 nvcc12.4 (0% Fail)           Failed:  0  -- Passed: 79  -- Total: 79 
🟩 cudacxx_name
  🟩 clang-cuda (0% Fail)         Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc (0% Fail)               Failed:  0  -- Passed: 97  -- Total: 97 
🟩 cxx_full
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 clang11 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang12 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang13 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang14 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang15 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang16 (0% Fail)            Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 gcc6 (0% Fail)               Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟩 gcc12 (0% Fail)              Failed:  0  -- Passed: 16  -- Total: 16 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🟩 cxx_name
  🟩 clang (0% Fail)              Failed:  0  -- Passed: 43  -- Total: 43 
  🟩 gcc (0% Fail)                Failed:  0  -- Passed: 47  -- Total: 47 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🟩 gpu
  🟩 v100 (0% Fail)               Failed:  0  -- Passed: 99  -- Total: 99 
🟩 jobs
  🟩 build (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 test (0% Fail)               Failed:  0  -- Passed:  8  -- Total:  8 
🟩 os
  🟩 ubuntu18.04 (0% Fail)        Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 ubuntu20.04 (0% Fail)        Failed:  0  -- Passed: 35  -- Total: 35 
  🟩 ubuntu22.04 (0% Fail)        Failed:  0  -- Passed: 44  -- Total: 44 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟩 sm
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 90a (0% Fail)                Failed:  0  -- Passed:  4  -- Total:  4 
🟩 std
  🟩 11 (0% Fail)                 Failed:  0  -- Passed: 26  -- Total: 26 
  🟩 14 (0% Fail)                 Failed:  0  -- Passed: 29  -- Total: 29 
  🟩 17 (0% Fail)                 Failed:  0  -- Passed: 28  -- Total: 28 
  🟩 20 (0% Fail)                 Failed:  0  -- Passed: 16  -- Total: 16

🟩 Project thrust [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 cpu
  🟩 amd64 (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 arm64 (0% Fail)              Failed:  0  -- Passed:  8  -- Total:  8 
🟩 ctk
  🟩 11.1 (0% Fail)               Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 12.4 (0% Fail)               Failed:  0  -- Passed: 81  -- Total: 81 
🟩 cudacxx_full
  🟩 clang-cuda16 (0% Fail)       Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc11.1 (0% Fail)           Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 nvcc12.4 (0% Fail)           Failed:  0  -- Passed: 79  -- Total: 79 
🟩 cudacxx_name
  🟩 clang-cuda (0% Fail)         Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc (0% Fail)               Failed:  0  -- Passed: 97  -- Total: 97 
🟩 cxx_full
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 clang11 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang12 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang13 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang14 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang15 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang16 (0% Fail)            Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 gcc6 (0% Fail)               Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟩 gcc12 (0% Fail)              Failed:  0  -- Passed: 16  -- Total: 16 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🟩 cxx_name
  🟩 clang (0% Fail)              Failed:  0  -- Passed: 43  -- Total: 43 
  🟩 gcc (0% Fail)                Failed:  0  -- Passed: 47  -- Total: 47 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🟩 gpu
  🟩 v100 (0% Fail)               Failed:  0  -- Passed: 99  -- Total: 99 
🟩 jobs
  🟩 build (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 test (0% Fail)               Failed:  0  -- Passed:  8  -- Total:  8 
🟩 os
  🟩 ubuntu18.04 (0% Fail)        Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 ubuntu20.04 (0% Fail)        Failed:  0  -- Passed: 35  -- Total: 35 
  🟩 ubuntu22.04 (0% Fail)        Failed:  0  -- Passed: 44  -- Total: 44 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟩 sm
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 90a (0% Fail)                Failed:  0  -- Passed:  4  -- Total:  4 
🟩 std
  🟩 11 (0% Fail)                 Failed:  0  -- Passed: 26  -- Total: 26 
  🟩 14 (0% Fail)                 Failed:  0  -- Passed: 29  -- Total: 29 
  🟩 17 (0% Fail)                 Failed:  0  -- Passed: 28  -- Total: 28 
  🟩 20 (0% Fail)                 Failed:  0  -- Passed: 16  -- Total: 16

🟨 Project libcudacxx [ Failed: 2 | Passed: 102 | Total: 104 ]

🔍 cpu: amd64 🔍
  🔍 amd64 (2% Fail)              Failed:  2  -- Passed: 94  -- Total: 96 
  🟩 arm64 (0% Fail)              Failed:  0  -- Passed:  8  -- Total:  8 
🔍 ctk: 11.1 🔍
  🔍 11.1 (13% Fail)              Failed:  2  -- Passed: 13  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 12.4 (0% Fail)               Failed:  0  -- Passed: 86  -- Total: 86 
🔍 cudacxx_full: nvcc11.1 🔍
  🟩 clang-cuda16 (0% Fail)       Failed:  0  -- Passed:  2  -- Total:  2 
  🔍 nvcc11.1 (13% Fail)          Failed:  2  -- Passed: 13  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 nvcc12.4 (0% Fail)           Failed:  0  -- Passed: 84  -- Total: 84 
🔍 cudacxx_name: nvcc 🔍
  🟩 clang-cuda (0% Fail)         Failed:  0  -- Passed:  2  -- Total:  2 
  🔍 nvcc (1% Fail)               Failed:  2  -- Passed: 100 -- Total: 102
🚨 cxx_full: gcc6 🚨
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 clang11 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang12 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang13 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang14 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang15 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang16 (0% Fail)            Failed:  0  -- Passed: 14  -- Total: 14 
  🔥 gcc6 (100% Fail)             Failed:  2  -- Passed:  0  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟩 gcc12 (0% Fail)              Failed:  0  -- Passed: 21  -- Total: 21 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🔍 cxx_name: gcc 🔍
  🟩 clang (0% Fail)              Failed:  0  -- Passed: 43  -- Total: 43 
  🔍 gcc (3% Fail)                Failed:  2  -- Passed: 50  -- Total: 52 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🔍 jobs: build 🔍
  🔍 build (2% Fail)              Failed:  2  -- Passed: 89  -- Total: 91 
  🟩 nvrtc (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 test (0% Fail)               Failed:  0  -- Passed:  8  -- Total:  8 
  🟩 verify_codegen (0% Fail)     Failed:  0  -- Passed:  1  -- Total:  1 
🔍 os: ubuntu18.04 🔍
  🔍 ubuntu18.04 (14% Fail)       Failed:  2  -- Passed: 12  -- Total: 14 
  🟩 ubuntu20.04 (0% Fail)        Failed:  0  -- Passed: 35  -- Total: 35 
  🟩 ubuntu22.04 (0% Fail)        Failed:  0  -- Passed: 49  -- Total: 49 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟨 std
  🟨 11 (3% Fail)                 Failed:  1  -- Passed: 26  -- Total: 27 
  🟨 14 (3% Fail)                 Failed:  1  -- Passed: 29  -- Total: 30 
  🟩 17 (0% Fail)                 Failed:  0  -- Passed: 29  -- Total: 29 
  🟩 20 (0% Fail)                 Failed:  0  -- Passed: 17  -- Total: 17 
🟨 gpu
  🟨 v100 (1% Fail)               Failed:  2  -- Passed: 102 -- Total: 104
🟩 sm
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 90a (0% Fail)                Failed:  0  -- Passed:  4  -- Total:  4

🏃‍ Runner counts (total jobs: 302)

#	Runner
232	`linux-amd64-cpu16`
28	`linux-amd64-gpu-v100-latest-1`
24	`linux-arm64-cpu16`
18	`windows-amd64-cpu16`

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust

wmaxey · 2024-05-10T20:24:16Z

pre-commit.ci autofix

wmaxey · 2024-05-10T20:25:14Z

/ok to test

github-actions · 2024-05-10T23:32:43Z

🟩 CI Results [ Failed: 0 | Passed: 302 | Total: 302 ]

🟩 Project cub [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 cpu
  🟩 amd64 (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 arm64 (0% Fail)              Failed:  0  -- Passed:  8  -- Total:  8 
🟩 ctk
  🟩 11.1 (0% Fail)               Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 12.4 (0% Fail)               Failed:  0  -- Passed: 81  -- Total: 81 
🟩 cudacxx_full
  🟩 clang-cuda16 (0% Fail)       Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc11.1 (0% Fail)           Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 nvcc12.4 (0% Fail)           Failed:  0  -- Passed: 79  -- Total: 79 
🟩 cudacxx_name
  🟩 clang-cuda (0% Fail)         Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc (0% Fail)               Failed:  0  -- Passed: 97  -- Total: 97 
🟩 cxx_full
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 clang11 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang12 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang13 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang14 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang15 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang16 (0% Fail)            Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 gcc6 (0% Fail)               Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟩 gcc12 (0% Fail)              Failed:  0  -- Passed: 16  -- Total: 16 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🟩 cxx_name
  🟩 clang (0% Fail)              Failed:  0  -- Passed: 43  -- Total: 43 
  🟩 gcc (0% Fail)                Failed:  0  -- Passed: 47  -- Total: 47 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🟩 gpu
  🟩 v100 (0% Fail)               Failed:  0  -- Passed: 99  -- Total: 99 
🟩 jobs
  🟩 build (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 test (0% Fail)               Failed:  0  -- Passed:  8  -- Total:  8 
🟩 os
  🟩 ubuntu18.04 (0% Fail)        Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 ubuntu20.04 (0% Fail)        Failed:  0  -- Passed: 35  -- Total: 35 
  🟩 ubuntu22.04 (0% Fail)        Failed:  0  -- Passed: 44  -- Total: 44 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟩 sm
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 90a (0% Fail)                Failed:  0  -- Passed:  4  -- Total:  4 
🟩 std
  🟩 11 (0% Fail)                 Failed:  0  -- Passed: 26  -- Total: 26 
  🟩 14 (0% Fail)                 Failed:  0  -- Passed: 29  -- Total: 29 
  🟩 17 (0% Fail)                 Failed:  0  -- Passed: 28  -- Total: 28 
  🟩 20 (0% Fail)                 Failed:  0  -- Passed: 16  -- Total: 16

🟩 Project thrust [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 cpu
  🟩 amd64 (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 arm64 (0% Fail)              Failed:  0  -- Passed:  8  -- Total:  8 
🟩 ctk
  🟩 11.1 (0% Fail)               Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 12.4 (0% Fail)               Failed:  0  -- Passed: 81  -- Total: 81 
🟩 cudacxx_full
  🟩 clang-cuda16 (0% Fail)       Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc11.1 (0% Fail)           Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 nvcc12.4 (0% Fail)           Failed:  0  -- Passed: 79  -- Total: 79 
🟩 cudacxx_name
  🟩 clang-cuda (0% Fail)         Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc (0% Fail)               Failed:  0  -- Passed: 97  -- Total: 97 
🟩 cxx_full
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 clang11 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang12 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang13 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang14 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang15 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang16 (0% Fail)            Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 gcc6 (0% Fail)               Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟩 gcc12 (0% Fail)              Failed:  0  -- Passed: 16  -- Total: 16 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🟩 cxx_name
  🟩 clang (0% Fail)              Failed:  0  -- Passed: 43  -- Total: 43 
  🟩 gcc (0% Fail)                Failed:  0  -- Passed: 47  -- Total: 47 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🟩 gpu
  🟩 v100 (0% Fail)               Failed:  0  -- Passed: 99  -- Total: 99 
🟩 jobs
  🟩 build (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 test (0% Fail)               Failed:  0  -- Passed:  8  -- Total:  8 
🟩 os
  🟩 ubuntu18.04 (0% Fail)        Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 ubuntu20.04 (0% Fail)        Failed:  0  -- Passed: 35  -- Total: 35 
  🟩 ubuntu22.04 (0% Fail)        Failed:  0  -- Passed: 44  -- Total: 44 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟩 sm
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 90a (0% Fail)                Failed:  0  -- Passed:  4  -- Total:  4 
🟩 std
  🟩 11 (0% Fail)                 Failed:  0  -- Passed: 26  -- Total: 26 
  🟩 14 (0% Fail)                 Failed:  0  -- Passed: 29  -- Total: 29 
  🟩 17 (0% Fail)                 Failed:  0  -- Passed: 28  -- Total: 28 
  🟩 20 (0% Fail)                 Failed:  0  -- Passed: 16  -- Total: 16

🟩 Project libcudacxx [ Failed: 0 | Passed: 104 | Total: 104 ]

🟩 cpu
  🟩 amd64 (0% Fail)              Failed:  0  -- Passed: 96  -- Total: 96 
  🟩 arm64 (0% Fail)              Failed:  0  -- Passed:  8  -- Total:  8 
🟩 ctk
  🟩 11.1 (0% Fail)               Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 11.8 (0% Fail)               Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 12.4 (0% Fail)               Failed:  0  -- Passed: 86  -- Total: 86 
🟩 cudacxx_full
  🟩 clang-cuda16 (0% Fail)       Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc11.1 (0% Fail)           Failed:  0  -- Passed: 15  -- Total: 15 
  🟩 nvcc11.8 (0% Fail)           Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 nvcc12.4 (0% Fail)           Failed:  0  -- Passed: 84  -- Total: 84 
🟩 cudacxx_name
  🟩 clang-cuda (0% Fail)         Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 nvcc (0% Fail)               Failed:  0  -- Passed: 102 -- Total: 102
🟩 cxx_full
  🟩 clang9 (0% Fail)             Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 clang10 (0% Fail)            Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 clang11 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang12 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang13 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang14 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang15 (0% Fail)            Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 clang16 (0% Fail)            Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 gcc6 (0% Fail)               Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 gcc7 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc8 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc9 (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
  🟩 gcc10 (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 gcc11 (0% Fail)              Failed:  0  -- Passed:  7  -- Total:  7 
  🟩 gcc12 (0% Fail)              Failed:  0  -- Passed: 21  -- Total: 21 
  🟩 Intel2023.2.0 (0% Fail)      Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC14.16 (0% Fail)          Failed:  0  -- Passed:  1  -- Total:  1 
  🟩 MSVC14.29 (0% Fail)          Failed:  0  -- Passed:  2  -- Total:  2 
  🟩 MSVC14.39 (0% Fail)          Failed:  0  -- Passed:  3  -- Total:  3 
🟩 cxx_name
  🟩 clang (0% Fail)              Failed:  0  -- Passed: 43  -- Total: 43 
  🟩 gcc (0% Fail)                Failed:  0  -- Passed: 52  -- Total: 52 
  🟩 Intel (0% Fail)              Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 MSVC (0% Fail)               Failed:  0  -- Passed:  6  -- Total:  6 
🟩 gpu
  🟩 v100 (0% Fail)               Failed:  0  -- Passed: 104 -- Total: 104
🟩 jobs
  🟩 build (0% Fail)              Failed:  0  -- Passed: 91  -- Total: 91 
  🟩 nvrtc (0% Fail)              Failed:  0  -- Passed:  4  -- Total:  4 
  🟩 test (0% Fail)               Failed:  0  -- Passed:  8  -- Total:  8 
  🟩 verify_codegen (0% Fail)     Failed:  0  -- Passed:  1  -- Total:  1 
🟩 os
  🟩 ubuntu18.04 (0% Fail)        Failed:  0  -- Passed: 14  -- Total: 14 
  🟩 ubuntu20.04 (0% Fail)        Failed:  0  -- Passed: 35  -- Total: 35 
  🟩 ubuntu22.04 (0% Fail)        Failed:  0  -- Passed: 49  -- Total: 49 
  🟩 windows2022 (0% Fail)        Failed:  0  -- Passed:  6  -- Total:  6 
🟩 sm
  🟩 60;70;80;90 (0% Fail)        Failed:  0  -- Passed:  3  -- Total:  3 
  🟩 90a (0% Fail)                Failed:  0  -- Passed:  4  -- Total:  4 
🟩 std
  🟩 11 (0% Fail)                 Failed:  0  -- Passed: 27  -- Total: 27 
  🟩 14 (0% Fail)                 Failed:  0  -- Passed: 30  -- Total: 30 
  🟩 17 (0% Fail)                 Failed:  0  -- Passed: 29  -- Total: 29 
  🟩 20 (0% Fail)                 Failed:  0  -- Passed: 17  -- Total: 17

🏃‍ Runner counts (total jobs: 302)

#	Runner
232	`linux-amd64-cpu16`
28	`linux-amd64-gpu-v100-latest-1`
24	`linux-arm64-cpu16`
18	`windows-amd64-cpu16`

👃 Inspect Changes

Modifications in project?

	Project
	CCCL Infrastructure
+/-	libcu++
	CUB
	Thrust

Modifications in project or dependencies?

	Project
	CCCL Infrastructure
+/-	libcu++
+/-	CUB
+/-	Thrust

The `trie_mt.cpp` example doesn't use libcu++, so `LIBCUDACXX_ATOMIC_VAR_INIT` is undeclared: /root/cccl/libcudacxx/examples/trie_mt.cpp:39:30: error: 'LIBCUDACXX_ATOMIC_VAR_INIT' was not declared in this scope 39 | std::atomic<trie*> ptr = LIBCUDACXX_ATOMIC_VAR_INIT(nullptr); | ^~~~~~~~~~~~~~~~~~~~~~~~~~ /root/cccl/libcudacxx/examples/trie_mt.cpp:41:29: error: 'LIBCUDACXX_ATOMIC_VAR_INIT' was not declared in this scope 41 | std::atomic_flag flag = LIBCUDACXX_ATOMIC_VAR_INIT(0); | ^~~~~~~~~~~~~~~~~~~~~~~~~~ /root/cccl/libcudacxx/examples/trie_mt.cpp:43:28: error: 'LIBCUDACXX_ATOMIC_VAR_INIT' was not declared in this scope 43 | std::atomic<int> count = LIBCUDACXX_ATOMIC_VAR_INIT(0); | ^~~~~~~~~~~~~~~~~~~~~~~~~~ gmake[2]: *** [CMakeFiles/trie_mt.dir/build.make:76: CMakeFiles/trie_mt.dir/trie_mt.cpp.o] Error 1 gmake[1]: *** [CMakeFiles/Makefile2:117: CMakeFiles/trie_mt.dir/all] Error 2 gmake: *** [Makefile:91: all] Error 2 This issue is introduced in PR NVIDIA#1631 and commit 12c2892

wmaxey requested review from a team as code owners April 15, 2024 17:01

wmaxey requested review from robertmaynard, gonidelis and ericniebler April 15, 2024 17:01

wmaxey marked this pull request as draft April 17, 2024 22:23

wmaxey added 6 commits April 18, 2024 13:47

Delete <cuda/std/atomic> header

32a0227

Move atomic from libcxx to top-level

4be887d

Move PTX backends from libcxx to <cuda/std/__atomic/...>

b36fec6

Delete remaining atomics backends. Move MSVC backend

52a60bb

First pass at making atomic use new backends

76294d1

Change atomic_storage operator()() to get()

a780c26

wmaxey force-pushed the fea/atomic_refactor_simplify branch from e085e18 to a780c26 Compare April 18, 2024 21:38

wmaxey added 7 commits April 18, 2024 14:43

Fixup: Change desired of compexch to accept by value.

217527d

* This matches other implementations.

Fix merge conflicts (LIBCUDACXX->CCCL)

eaaa670

Fix another merge conflict (LIBCUDACXX->CCCL)

452fc3b

Simplify tag dispatch in the atomic backend

91f8b11

Make tests work when full path is specified to lit.

0e6c0c0

Update barrier, latch, and semaphore, to use new atomic_impl.

a370a02

Make changes to atomic work.

bf801ce

miscco reviewed Apr 29, 2024

View reviewed changes

wmaxey added 7 commits May 2, 2024 10:54

Rearrange headers and update latch/barrier.

64b31af

Update codegen to reflect new header layout.

a625d3f

Make platform.h define LIBCUDACXX_ATOMIC_BLAH_LOCK_FREE.

4a4782b

* We previously defined or *clobbered* the existing STL definitions. * See: `ATOMIC_BOOL_LOCK_FREE`->`LIBCUDACXX_ATOMIC_BOOL_LOCK_FREE`

Fix missing <cstdint> in generated ptx file.

fc97437

__cuda_std__ mode does not require use of host atomics checks.

f91a7c1

Fix missing _If in types.h.

8fb4c6e

Fix missing <cstdint> in derived PTX file.

c4546f5

Add missing type_traits to host.h

1cdffdb

Co-authored-by: Michael Schellenberger Costa <[email protected]>

wmaxey commented May 9, 2024

View reviewed changes

wmaxey added 10 commits May 9, 2024 15:28

Use _LIBCUDACXX_INLINE_VISIBILITY for API functions.

082137f

Reorder derived PTX functions attribute declarations.

45a75d2

traits fixups in __atomic/types

aaf5e94

Default ctors and sprinkle noexcept around on some __atomic/types A…

a015830

…PIs.

Apply suggestions to common.h.

8d90f56

Remove full namespace qualifier in atomic storage trait.

63b6f5d

modernization fixes to order.h.

6620229

Move includes cuda/atomic.h and cuda/barrier.h.

e00ebf3

Adjust header error block and add missing includes in `<cuda/std/atom…

310f06a

…ic>`

Add missing system header block in cuda/atomic

1398c3c

wmaxey and others added 3 commits May 9, 2024 17:12

Fix invalid use of typename.

678006c

_LIBCUDACXX_TRAITS->_CCCL_TRAIT

b3a24fe

[pre-commit.ci] auto code formatting

923f61e

wmaxey added 3 commits May 9, 2024 20:44

Fix return type of host atomics.

3ade90a

Fix cassert missing from generated atomic header.

b297715

Fix visibility of host atomics in NVRTC build.

f40a59f

wmaxey added 2 commits May 10, 2024 12:59

Add more tests to bad_atomic_alignment.pass.cpp

b841304

Fix alignment warnings in host compare_exchange layer.

52788ff

[pre-commit.ci] auto code formatting

044b350

wmaxey merged commit 12c2892 into NVIDIA:main May 10, 2024
2 checks passed

wmaxey deleted the fea/atomic_refactor_simplify branch May 11, 2024 03:46

Atomics backend refactor #1631

Atomics backend refactor #1631

Conversation

wmaxey commented Apr 15, 2024 • edited Loading

Description

Checklist

copy-pr-bot bot commented Apr 18, 2024

miscco left a comment

Choose a reason for hiding this comment

wmaxey May 9, 2024 • edited Loading

Choose a reason for hiding this comment

github-actions bot commented May 10, 2024

🟩 Project cub [ Failed: 0 | Passed: 99 | Total: 99 ]

🟨 Project thrust [ Failed: 1 | Passed: 98 | Total: 99 ]

🟨 Project libcudacxx [ Failed: 20 | Passed: 84 | Total: 104 ]

🏃‍ Runner counts (total jobs: 302)

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

github-actions bot commented May 10, 2024

🟩 Project cub [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 Project thrust [ Failed: 0 | Passed: 99 | Total: 99 ]

🟨 Project libcudacxx [ Failed: 20 | Passed: 84 | Total: 104 ]

🏃‍ Runner counts (total jobs: 302)

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

github-actions bot commented May 10, 2024

🟩 Project cub [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 Project thrust [ Failed: 0 | Passed: 99 | Total: 99 ]

🟨 Project libcudacxx [ Failed: 2 | Passed: 102 | Total: 104 ]

🏃‍ Runner counts (total jobs: 302)

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

wmaxey commented May 10, 2024

wmaxey commented May 10, 2024

github-actions bot commented May 10, 2024

🟩 Project cub [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 Project thrust [ Failed: 0 | Passed: 99 | Total: 99 ]

🟩 Project libcudacxx [ Failed: 0 | Passed: 104 | Total: 104 ]

🏃‍ Runner counts (total jobs: 302)

👃 Inspect Changes

Modifications in project?

Modifications in project or dependencies?

wmaxey commented Apr 15, 2024 •

edited

Loading

wmaxey May 9, 2024 •

edited

Loading