ambitiousCC

Follow

Q's repo ambitiousCC

Follow

22 followers · 26 following

Hong Kong
12:26 (UTC +08:00)

Achievements

Achievements

Highlights

Pro

ambitiousCC/README.md

Hi there 👋

Pinned Loading

kvcache-ai/ktransformers kvcache-ai/ktransformers Public

A Flexible Framework for Experiencing Cutting-edge LLM Inference Optimizations

Python 14.3k 1k
chitu chitu Public

Forked from thu-pacman/chitu

High-performance inference framework for large language models, focusing on efficiency, flexibility, and availability.

Python
fastllm fastllm Public

Forked from ztxz16/fastllm

fastllm是c++实现，后端无依赖（仅依赖CUDA，无需依赖PyTorch）的高性能大模型推理库。可实现单4090推理DeepSeek R1 671B INT4模型，单路可达20+tps。

C++
sglang sglang Public

Forked from sgl-project/sglang

SGLang is a fast serving framework for large language models and vision language models.

Python
vllm vllm Public

Forked from vllm-project/vllm

A high-throughput and memory-efficient inference and serving engine for LLMs

Python
vllm-ascend vllm-ascend Public

Forked from vllm-project/vllm-ascend

Community maintained hardware plugin for vLLM on Ascend

Python