Awesome Pretrained Chinese NLP Models

在自然语言处理领域中，预训练语言模型（Pretrained Language Models）已成为非常重要的基础技术，本仓库主要收集目前网上公开的一些高质量中文预训练模型、中文多模态模型、中文大语言模型等内容(感谢分享资源的大佬)，并将持续更新......

国内下载HuggingFace仓库模型推荐使用HuggingFace镜像地址: https://hf-mirror.com/

Expand Table of Contents

更新日志
通用基础大模型
垂直基础大模型
通用对话大模型
垂直对话大模型
多模态对话大模型
推理类大模型
大模型评估基准
在线体验大模型
开源模型库平台
开源数据集库
开源中文指令数据集
Embedding
Other-Awesome
NLU系列
- BERT
- RoBERTa
- ALBERT
- NEZHA
- XLNET
- MacBERT
- WoBERT
- ELECTRA
- ZEN
- ERNIE
- ERNIE3
- RoFormer
- StructBERT
- Lattice-BERT
- Mengzi-BERT
- ChineseBERT
- TaCL
- MC-BERT
- 二郎神
- PERT
- MobileBERT
- GAU-α
- DeBERTa
- GlyphBERT
- CKBERT
- LERT
- RoCBert
- m3e
- LEALLA

NLG系列
- GPT
- GPT-3
- NEZHA-GEN
- CPM-Generate
- T5
- T5-PEGASUS
- Mengzi-T5
- 盘古α
- EVA
- BART
- 闻仲
- 余元
- RWKV
- Bloom
- PromptCLUE
- ChatYuan
- SkyText
- ProphetNet

NLU-NLG系列
- UniLM
- Simbert
- RoFormer-sim
- CPM-2
- CPT
- 周文王
- GLM
- PLUG
- OPD
Multi-Modal
- WenLan
- CogView
- 紫东太初
- Mengzi-oscar
- R2D2
- Chinese-CLIP
- TaiYi-CLIP
- AltCLIP
- AltDiffusion
- Taiyi-Stable-Diffusion
- wukong
- OFA
- QA-CLIP

Table
- SDCUP

备注

ND: Non-Causal Decoder or Prefix LM

CD: Causal Decoder

ED: Encoder-Decoder

Base-LLM

大规模基础模型：表格中只罗列出参数量大于7B以上模型。

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	架构	文献	备注
XVERSE-MoE	255B/A36B	2024-09	中英	通用	🤗HF	XVERSE-MoE-A36B	xverse-ai	MoE
Qwen-2.5	0.5/1.5/3/7/14/32/72B	2024-09	中英	通用	🤗HF	Qwen2.5	QwenLM	CD	Blog
Tele-FLM	52B/102B/1TB	2024-07	多语	通用	[🤗HF]	/	CofeAI	CD	Tele-FLM Technical Report
meta-llama-3.1	8/70/405B	2024-07	多语	通用	[🤗HF]	llama3	meta-llama	CD
internlm2.5-Base	7B	2024-07	中英	通用	[🤗HF]	InternLM	InternLM	CD	📜Technical Report
MAP-NEO-Base	2/7B	2024-06	中英	通用	🤗HF	MAP-NEO	multimodal-art-projection	CD	Paper
Nemotron-4-Base	340B	2024-06	多语	通用	🤗HF	/	NVIDIA	CD	technical report.
Index-Base	1.9B	2024-06	中英	通用	🤗HF	Index-1.9B	bilibili	CD	Report
Qwen2-Base	0.5/2/5/7/72B	2024-06	多语	通用	🤗HF	Qwen2	QwenLM	CD	Blog
GLM-4-Base	9B	2024-06	多语	通用	🤗HF	GLM-4	THUDM	/
Yi-1.5-Base	6/9/34B	2024-05	中英	通用	🤗HF	Yi-1.5	01-ai	CD	Paper
DeepSeek-V2-Base	A21B/236B	2024-05	中英	通用	🤗HF	DeepSeek-V2	deepseek-ai	MOE	Paper
Llama-3-Base	8/70B	2024-04	多语	通用	🤗HF	llama3	Meta Llama	CD
Zhinao-Base	7B	2024-04	中英	通用	🤗HF 🤖	/	奇虎科技	CD
XVERSE-MoE	A4.2B/25.8B	2024-04	中英	通用	🤗HF	XVERSE-MoE-A4.2B	xverse-ai	MoE
SoftTiger-Base	13/70B	2024-04	中英	通用	🤗HF	TigerBot	TigerResearch	CD
HammerLLM	1.4b	2024-04	中英	通用	🤗HF	HammerLLM	DataHammer
Mengzi3-Base	13B	2024-04	中英	通用	🤗HF	Mengzi3	Langboat	CD
Breeze-Base	7B	2024-02	中英	通用	🤗HF	/	MediaTek Research
TowerBase	7/13B	2024-02	多语	通用	[🤗HF]	/	Unbabel	CD
Qwen1.5-Base	0.5/1.8/4 7/14/32/72/110B	2024-02	中英	通用	[🤗HF]	Qwen1.5	Qwen	/	Blog
LongAlign-Base	6/7/13B	2024-02	中英	通用	[🤗HF]	LongAlign	THUDM	/	Paper
Chinese-Mixtral-Base	8x7B	2024-02	中英	通用	[Baidu] [🤗HF]	Chinese-Mixtral	Yiming Cui	MOE
iFlytekSpark-Base	13B	2024-01	中英	通用	mindspore	/	科大讯飞	CD
Orion-Base	14B	2024-01	多语	通用	[🤗HF]	Orion	OrionStarAI	CD	Paper	RAG Plugin
YaYi2-Base	30B	2023-12	多语	通用	[🤗HF]	YAYI2	wenge-research	CD	Paper
Aquila2-Base	7/34/70B	2023-12	中英	通用	[🤗HF]	Aquila2	FlagAI	CD
Alaya-Base	7B	2023-12	中英	通用	[🤗HF]	Alaya	DataCanvas	CD
Qwen-Base	1.8/7 14/72B	2023-12	中英	通用	[🤗HF]	Qwen	阿里云	CD	Paper Report Report2
DeepSeek-Base	7/67B	2023-11	中英	通用	[🤗HF]	DeepSeek-LLM	deepseek-ai	CD
Yuan-2.0	2/51 102B	2023-11	中英	通用	baidu [🤗HF]	Yuan-2.0	IEIT-Yuan	CD
Alaya-Base	7B	2023-11	中英	通用	[🤗HF]	Alaya	DataCanvasIO	CD
Yi-Base	6/9/34B	2023-11	中英	通用	[🤗HF]	Yi	01.AI	CD
XVERSE-Base	7/13 65B	2023-11	多语	通用	[🤗HF]	XVERSE	元象科技	CD
Nanbeige-Base	16B	2023-11	中英	通用	[🤗HF]	Nanbeige	Nanbeige LLM Lab	CD
LingoWhale	8B	2023-11	中英	通用	[🤗HF]	LingoWhale-8B	DeepLang AI	CD
Skywork-base	13B	2023-10	中文	通用	[🤗HF]	Skywork	SkyworkAI	CD	Paper
BlueLM-Base	7B	2023-11	中英	通用	[🤗HF]	BlueLM	vivo AI Lab	CD
Chatglm3-base	6B	2023-10	中英	通用	[🤗HF]	ChatGLM3	THUDM	ND
Ziya2-Base	13B	2023-10	中英	通用	[🤗HF]	Fengshenbang-LM	IDEA研究院	CD
OpenBA-LM	15B	2023-09	中英	通用	[🤗HF]	OpenBA	OpenNLG Group	ED	Paper
TigerBot-Base-70B	80B	2023-09	多语	通用	[🤗HF]	TigerBot	虎博科技	CD	Paper
FLM	101B	2023-09	中英	通用	[🤗HF]	/	CofeAI	CD
falcon	7/40 180B	2023-09	多语	通用	[🤗HF]	/	Technology Innovation Institute	CD
Baichuan2	7/13B	2023-09	中文	通用	[🤗HF]	Baichuan2	百川智能	CD
Chinese-LLaMA-2-16K	7/13B	2023-08	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca-2	Yiming Cui	CD
YuLan-LLaMA-2	13B	2023-08	中英	通用	[🤗HF]	YuLan-Chat	中国人民大学	CD
Aquila-Base-33B	33B	2023-08	中英	通用	TODO	Aquila	FlagAI	CD
TigerBot-Base-13B	13B	2023-08	多语	通用	[🤗HF]	TigerBot	虎博科技	CD
Linly-Chinese-LLaMA-2	7/13B	2023-07	中英	通用	[🤗HF]	Linly	深圳大学计算机视觉研究所	CD
Chinese-LLaMA-2	7B	2023-07	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca-2	Yiming Cui	CD
Jiang-base	13B	2023-07	中文	通用	[🤗HF]	/	知未智能	CD
bwx	7/13B	2023-07	中文	通用	[🤗HF]	/	蓝鲸国数	CD
Llama2	7/13 70B	2023-07	多语	通用	[🤗HF]	llama	Meta	CD	Paper
PolyLM	13B	2023-07	多语	通用	[🤗HF]	PolyLM	达摩院	CD	Paper
Baichuan-13B	13B	2023-07	中文	通用	[🤗HF]	Baichuan-13B	百川智能	CD
TigerBot	7B	2023-07	多语	通用	[🤗HF]	TigerBot	虎博科技	CD
InternLM-base	7/20B	2023-07	中文	通用	[🤗HF]	InternLM	上海人工智能实验室	CD	report
MPT	7/30B	2023-06	多语	通用	[🤗HF]	llm-foundry	MosaicML	CD
Baichuan	7B	2023-06	中英	通用	[🤗HF]	baichuan-7B	百川智能	CD
Chinese-Falcon	7B	2023-06	中英	通用	[🤗HF]	Linly	深圳大学计算机视觉研究所	CD	Blog
AtomGPT	13B	2023-06	中英	通用	[🤗HF]	/	原子回声	CD
Aquila	7B	2023-06	中英	通用	[🤗HF]	Aquila	FlagAI	CD
Chinese-LLaMA	33B	2023-06	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca	Yiming Cui	CD
TigerBot	7B	2023-06	多语	通用	[🤗HF]	TigerBot	虎博科技	CD
Panda-OpenLLaMA	7B	2023-05	中英	通用	[🤗HF]	pandallm	dandelionsllm	CD
Panda	7/13B	2023-05	中英	通用	[🤗HF]	pandallm	dandelionsllm	CD
OpenLLaMA	13B	2023-05	中英	通用	[🤗HF]	Linly	深圳大学计算机视觉研究所	CD
BiLLa-LLM	7B	2023-05	中英	通用	[🤗HF]	BiLLa	Zhongli Li	CD
Ziya-LLaMA-Reward	7B	2023-05	中英	通用	[🤗HF]	Fengshenbang-LM	IDEA研究院	CD
YuYan	11B	2023-04	中文	通用	[🤗HF]	/	网易伏羲	CD	Paper
Chinese-LLaMA	7/13/33B	2023-04	中文	通用	[🤗HF]	Linly	深圳大学计算机视觉研究所	CD	Blog
OpenChineseLLaMA	7B	2023-04	中英	通用	[🤗HF]	OpenChineseLLaMA	OpenLMLab	CD
MOSS-003	16B	2023-04	中英	通用	[🤗HF]	MOSS	复旦大学	CD
BBT-2-Text	13B	2023-04	中文	通用	申请	BBT-FinCUGE-Applications	超对称	CD	Paper
BBT-2-Text	12B	2023-04	中文	通用	申请	BBT-FinCUGE-Applications	超对称	CD	Paper
Chinese-LLaMA	13B	2023-04	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca	Yiming Cui	CD
flan-ul2	20B	2023-03	多语	通用	[🤗HF]	ul2	Google	ED	Paper
CPM-Bee	10B	2023-01	中英	通用	[🤗HF]	CPM-Bee	OpenBMB	CD
BLOOM	176B	2022-11	多语	通用	[🤗HF]	Megatron-DeepSpeed	BigScience	CD	Paper
BLOOMZ	176B	2022-11	多语	通用	[🤗HF]	Megatron-DeepSpeed	BigScience	CD	Paper
flan-t5-xxl	11B	2022-11	多语	通用	[🤗HF]	t5x	Google	ED	paper
CPM-Ant+	10B	2022-10	中英	通用	BMB	CPM-Live	OpenBMB	CD	blog
GLM	130B	2022-10	中英	通用	申请	GLM-130B	清华大学	ND	paper
CPM-Ant	10B	2022-09	中文	通用	[🤗HF]	CPM-Live	OpenBMB	CD	blog
GLM	10B	2022-09	中文	通用	[🤗HF]	GLM	清华大学	ND	paper
源1.0	245B	2021-09	中文	通用	API	Yian-1.0	浪潮	CD	paper
CPM-2	10/11/ 200B	2021-06	中文	通用	申请	CPM	智源研究院	ED	paper
PanGu-Alpha	13/200B	2021-05	中文	通用	[🤗HF]	PanGu-Alpha	鹏城实验室	CD	paper
PLUG	27B	2021-04	中文	通用	申请	AliceMind	阿里巴巴	ED
GPT-3	13/30B	2021-04	中文	通用	TODO	GPT-3	达摩院	CD

Name		Name	Last commit message	Last commit date
Latest commit History 426 Commits
resources		resources
LICENSE		LICENSE
README.md		README.md

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	架构	文献
Qwen-2.5	1.5/7B	2024-09	中英	代码	🤗HF	Qwen2.5	QwenLM	CD	Blog
Qwen-2.5	1.5/7/72B	2024-09	中英	数学	🤗HF	Qwen2.5	QwenLM	CD	Blog
Tongyi-Finance-Base	14B	2023-11	中文	金融	ModelScope	通义金融-14B	通义金融大模型	CD
ChiMed-GPT	13B	2023-10	中文	医疗	[🤗HF]	ChiMed-GPT	中国科学技术大学	CD	Paper
CodeShell-base	7B	2023-10	中英	代码	[🤗HF]	codeshell	WisdomShell	CD
WiNGPT-base	7B	2023-09	中文	医学	[🤗HF]	WiNGPT2	Winning Health AI Research	CD
XuanYuan	70B	2023-09	中文	金融	[🤗HF]	XuanYuan	度小满	CD	Report
CodeLLAma	7/13/ 34B	2023-08	多语	代码	[🤗HF]	codellama	Meta Research	CD	Paper
educhat-base-002	7/13B	2023-06	中英	教育	[🤗HF]	EduChat	华东师范大学	CD
AquilaCode-NV	7B	2023-06	中英	代码	[🤗HF]	Aquila	FlagAI	CD
AquilaCode-TS	7B	2023-06	中英	代码	[🤗HF]	Aquila	FlagAI	CD
LaWGPT	7B	2023-05	中英	法律	[🤗HF]	LawGPT	Pengxiao Song	CD
CodeGeeX	13B	2022-06	多语	代码	申请	CodeGeeX	清华大学	CD	blog

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	架构	文献
Moonlight	A3/16B	2025-02	中英	通用	🤗HF	Moonlight	MoonshotAI	MoE	Tech Report
phi-4	14B	2025--01	多语	通用	🤗HF	/	Microsoft	CD	Phi-4 Technical Report
InternLM3	8B	2025--01	中英	通用	🤗HF	InternLM	InternLM	CD	Technical Report
deepseek-v3	671B	2024-12	多语	通用	🤗HF	DeepSeek-V3	deepseek-ai	MoE	Paper Link
Megrez-3B-Instruct	3B	2024-12	中英	通用	🤗HF	Infini-Megrez	infinigence	CD
Athene-V2-Chat	72B	2024-11	中英	通用	🤗HF	/	Nexusflow	CD	Blog
Athene-V2-Agent	72B	2024-11	中英	工具调用	🤗HF	/	Nexusflow	CD	Blog
Hunyuan-Large	A52/389B	2024-11	中英	通用	🤗HF	Tencent-Hunyuan-Large	Tencent	MoE	Paper
Aya-Expanse	8/32B	2024-10	多语	通用	🤗HF	/	Cohere For AI	CD
Granite 3.0	1/2/3/8B	2024-10	多语	通用	🤗HF	granite-3.0-language-models	ibm-granite	CD	Paper
Granite 3.0-MoE	1B/3B/A400M	2024-10	多语	通用	🤗HF	granite-3.0-language-models	ibm-granite	MoE	Paper
TeleChat2	115B	2024-09	中英	通用	🤖 ModelScope	TeleChat2	Tele-AI	CD
Qwen-2.5	0.5/1.5/3/7/14/32/72B	2024-09	中英	通用	🤗HF	Qwen2.5	QwenLM	CD	Blog
XVERSE-MoE	255B/A36B	2024-09	中英	通用	🤗HF	XVERSE-MoE-A36B	xverse-ai	MoE
DeepSeek-V2.5	236B/A21B	2024-09	中英	通用	🤗HF	DeepSeek-V2	deepseek-ai	MOE	Paper
MiniCPM3	4B	2024-09	中英	通用	🤗HF	MiniCPM	OpenBMB	CD	MiniCPM Paper
C4AI Command R+ 08-2024	104B	2024-08	多语	通用	🤗HF	/	CohereForAI	CD
JIUTIAN-Chat	39/A13B	2024-07	中英	通用	🤖MS	/	中国移动JiuTian-AI	MOE
meta-llama-3.1	8/70/405B	2024-07	多语	通用	[🤗HF]	llama3	meta-llama	CD
internlm2.5-chat	7B	2024-07	中英	通用	[🤗HF]	InternLM	InternLM	CD	📜Technical Report
Mistral-large-insruct-2407	123B	2024-07	多语	通用	🤗HF	/	Mistral AI		blog post
DeepSeek-V2-Chat-0628	236B	2024-07	中英	通用	🤗HF	DeepSeek-V2	deepseek-ai	MOE	Paper
C4ai-command-r-plus	104B	2024-07	多语	通用	🤗HF	/	CohereForAI	CD
Gemma-2-chat	9/27B	2024-06	多语	通用	🤗HF	/	Google	CD
MAP-NEO-Chat	2/7B	2024-06	中英	通用	🤗HF	MAP-NEO	multimodal-art-projection	CD	Paper
GEB-Chat	1.3B	2024-06	中英	通用	🤗HF	/	GEB-AGI	CD	Paper
Nemotron-4-Chat	340B	2024-06	多语	通用	🤗HF	/	NVIDIA	CD	technical report.
Index-Chat	1.9B	2024-06	中英	通用	🤗HF	Index-1.9B	bilibili	CD	Report
Qwen2-MoE	57B/A14B	2024-06	多语	通用	🤗HF	Qwen2	QwenLM	MoE	Blog
Qwen2-Chat	0.5/2/5/7/72B	2024-06	多语	通用	🤗HF	Qwen2	QwenLM	CD	Blog
GLM-4-Chat	9B	2024-06	多语	通用	🤗HF	GLM-4	THUDM	/
Skywork-MoE	16/A22B/146B	2024-06	中英	通用	🤗HF	Skywork-MoE	SkyworkAI	MoE	Tech Report
Yuan2.0	40/A3.7B	2024-05	中英	通用	🤗HF	Yuan2.0-M32	IEIT-Yuan	MOE	Paper
星辰-Chat	52B	2024-05	中英	通用	🤗HF	TeleChat-52B	Tele-AI	CD
LingLong	317M	2024-05	中英	通用	🤗HF	linglong	nkcs-iclab	CD
Sailor	14B	2024-05	7语	通用	🤗HF	sailor-llm	sail-sg	CD	Paper
Nanbeige2	8/16B	2024-05	中英	通用	🤗HF	Nanbeige	Nanbeige	CD
Yi-1.5-Chat	6/9/34B	2024-05	中英	通用	🤗HF	Yi-1.5	01-ai	CD	Paper
DeepSeek-V2-Chat	A21B/236B	2024-05	中英	通用	🤗HF	DeepSeek-V2	deepseek-ai	MOE	Paper
XVERSE-MoE	A4.2B/25.8B	2024-05	中英	通用	🤗HF	XVERSE-MoE-A4.2B	xverse-ai	MOE
Llama3-zh	8/70B	2024-04	中英	通用	🤗HF	/	/	CD	llama3中文列表
Llama3-Chinese-Chat	8B	2024-04	中英	通用	🤗HF	/	Shenzhi Wang	CD
Llama-3-Chat	8/70B	2024-04	多语	通用	🤗HF	llama3	Meta Llama	CD
Zhinao-Chat	7B	2024-04	中英	通用	🤗HF 🤖	/	奇虎科技	CD
MiniCPM-MoE	8x2B	2024-04	中英	通用	🤗HF	MiniCPM	OpenBMB	MoE
Nanbeige2-Chat	8B	2024-04	中英	通用	🤗HF	Nanbeige	Nanbeige LLM Lab	CD
Sailor	7B	2024-04	多语	通用	🤗HF	sailor-llm	Sea AI Lab	CD	Paper
Mengzi3-Chat	13B	2024-04	中英	通用	🤗HF	Mengzi3	Langboat	CD
Qwen-MoE	2.7B	2024-03	中英	通用	🤗HF	Qwen1.5	Qwen	MoE	Blog
Command-R	35B	2024-03	多语	通用	🤗HF	/	CohereForAI	CD
Breeze-Instruct	7B	2024-02	中英	通用	🤗HF	/	MediaTek Research
aya-101	13B	2024-02	多语	通用	🤗HF	/	Cohere For AI	CD	Paper
ChemLLM	7B	2024-02	多语	通用	🤗HF	/	AI4Chem	CD	Paper
TowerInstruct	7/13B	2024-02	多语	通用	[🤗HF]	/	Unbabel	CD
Qwen1.5-Chat	0.5/1.8/4/ 7/14/32/72/110B	2024-02	中英	通用	[🤗HF]	Qwen1.5	Qwen	/	Blog
MiniCPM	2B	2024-02	中英	通用	[🤗HF] ModelScope	MiniCPM	OpenBMB	/	Report
LongAlign-Chat	6/7/13B	2024-02	中英	通用	[🤗HF]	LongAlign	THUDM	/	Paper
Chinese-Mixtral-Chat	8x7B	2024-02	中英	通用	[Baidu] [🤗HF]	Chinese-Mixtral	Yiming Cui	MOE
iFlytekSpark-Chat	13B	2024-01	中英	通用	mindspore	/	科大讯飞	CD
rwkv-5-world	0.1/1/ 3/7B	2023-01	多语	通用	[🤗HF]	RWKV-LM	BlinkDL		URL
Orion-Chat	14B	2024-01	多语	通用	[🤗HF]	Orion	OrionStarAI	CD	Paper
internlm2-chat	7/20B	2024-01	中英	通用	[🤗HF]	InternLM	InternLM	CD	Report
Chinese-Mixtral	8x7B	2023-01	中英	通用	[🤗HF]	/	HIT-SCIR	CD-MOE
Telechat	7/12B	2024-01	中英	通用	[🤗HF]	Telechatx	Tele-AI	CD	Report
kagentlms	7/13B	2024-01	中英	通用	[🤗HF]	KwaiAgents	KwaiKEG
YaYi2-Chat	30B	2023-12	多语	通用	[🤗HF]	YAYI2	wenge-research	CD	Paper
SUS-Chat	34/72B	2023-12	中英	通用	[🤗HF]	SUS-Chat	SUSTech-IDEA	CD
Aquila2-Chat	7/34/70B	2023-12	中英	通用	[🤗HF]	Aquila2	FlagAI	CD
Alaya-Chat	7B	2023-12	中英	通用	[🤗HF]	Alaya	DataCanvas	CD
Qwen-Chat	1.8/7/ 14/72B	2023-12	中英	通用	[🤗HF]	Qwen	阿里云	CD	Paper Report Report2
DeepSeek-Chat	7/67B	2023-11	中英	通用	[🤗HF]	DeepSeek-LLM	deepseek-ai	CD
Yi-Chat	6/34B	2023-11	中英	通用	[🤗HF]	Yi	01.AI	CD
Alaya-Chat	7B	2023-11	中英	通用	[🤗HF]	Alaya	DataCanvasIO	CD
OrionStar-Yi-Chat	34B	2023-11	中英	通用	[🤗HF]	OrionStar-Yi-34B-Chat	OrionStarAI	CD
Nanbeige-Chat	16B	2023-11	中英	通用	[🤗HF]	Nanbeige	Nanbeige LLM Lab	CD
OpenChat 3.5	7B	2023-11	中英	通用	[🤗HF]	openchat	OpenChat	CD	Paper
XVERSE-Chat	7/13B	2023-11	多语	通用	[🤗HF]	XVERSE	元象科技	CD
AndesGPT	7B	2023-11	中文	通用	[🤗HF]	AndesGPT-7B	OPPO-Mente-Lab	CD
SeaLLM-Chat	13B	2023-11	多语	通用	[🤗HF]	SeaLLMs	SeaLLMs	CD
BlueLM	7B	2023-11	中英	通用	[🤗HF]	BlueLM	vivo AI Lab	CD
Skywork-chat	13B	2023-10	中文	通用	[🤗HF]	Skywork	SkyworkAI	CD	Paper
Zephyr	7B	2023-10	多语	通用	[🤗HF]	alignment-handbook	Hugging Face H4	CD	Paper
Mistral	7B	2023-10	多语	通用	[🤗HF]	mistral-src	Mistral AI	CD	Paper
chatglm3	6B	2023-10	中英	通用	[🤗HF]	ChatGLM3	THUDM	ND
Zhiyin-chat	7B	2023-10	中英	通用	[🤗HF]	Zhiyin	中科院声学所	CD
Ziya2-Chat	13B	2023-10	中英	通用	[🤗HF]	Fengshenbang-LM	IDEA研究院	CD
Vulture	40/180B	2023-10	多语	通用	[🤗HF]	/	VILM-AI		TODO
Vulture	3/7/ 40/180B	2023-09	多语	通用	[🤗HF]	/	VILM	CD
Colossal-LLaMA-2	7B	2023-09	中英	通用	[🤗HF]	ColossalAI	HPC-AI Tech	CD	Blog
OpenBA-chat	15B	2023-09	中英	通用	TODO	OpenBA	OpenNLG Group	ED	Paper
WeMix-LLaMA2	7/70B	2023-09	中英	通用	[🤗HF]	WeMix-LLM	Alpha-VLLM	CD
Stable Beluga	7/13/70B	2023-09	中英	通用	[🤗HF]	/	Stability AI	CD
TigerBot-chat	70B	2023-09	中英	通用	[🤗HF]	TigerBot	虎博科技	CD	Paper
Openbuddy_llama	70B	2023-09	多语	通用	[🤗HF]	OpenBuddy	OpenBuddy	CD
falcon-180B-chat	180B	2023-09	多语	通用	[🤗HF]	/	Technology Innovation Institute	CD
Baichuan2	7/13B	2023-09	中文	通用	[🤗HF]	Baichuan2	百川智能	CD
Chinese-Alpaca-2-16K	7/13B	2023-09	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca-2	Yiming Cui	CD
InternLM-Chat-8k	7B	2023-08	中文	通用	[🤗HF]	InternLM	上海人工智能实验室	CD	report
InternLM-Chat-v1.1	7B	2023-08	中文	通用	[🤗HF]	InternLM	上海人工智能实验室	CD	report
YuLan-Chat-2	13B	2023-08	中英	通用	[🤗HF]	YuLan-Chat	中国人民大学	CD
falcon	7/40B	2023-06	多语	通用	[🤗HF]	[🤗HF]	Technology Innovation Institute	CD
Toucan	7B	2023-08	中英	通用	[🤗HF]	Toucan-LLM	Kendryte	CD
Zhuzhi	6B	2023-08	中英	通用	[🤗HF]	Zhuzhi-6B	竹间智能	ND
Atom	7B	2023-08	中英	通用	[🤗HF]	Llama2-Chinese	FlagAlpha	CD
openbuddy	3/7/ 13/40B	2023-08	多语	通用	[🤗HF]	OpenBuddy	OpenBuddy	CD
Aquila-Chat-33B	33B	2023-08	中英	通用	TODO	Aquila	FlagAI	CD
vicuna-V1.5-16K	7/13B	2023-08	多语	通用	[🤗HF]	FastChat	lm-sys	CD	Paper
vicuna-V1.5	7/13B	2023-08	多语	通用	[🤗HF]	FastChat	lm-sys	CD	Paper
Chinese-Alpaca-2	13B	2023-08	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca-2	Yiming Cui	CD
WizardLM-V1.0	70B	2023-08	多语	通用	[🤗HF]	WizardLM	operatorx	CD
TigerBot-chat-13B	13B	2023-07	中英	通用	[🤗HF]	TigerBot	虎博科技	CD
huozi	7B	2023-08	中英	通用	[🤗HF]	huozi	哈工大	CD
Chinese-Alpaca-2	7B	2023-07	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca-2	Yiming Cui	CD
AntX	7/13B	2023-07	中文	通用	[🤗HF]	/	AntX.ai	CD
BatGPT	15B	2023-07	中英	通用	[🤗HF]	BatGPT	上海交通大学	ND	Paper
WizardLM-V1.2	13B	2023-07	多语	通用	[🤗HF]	WizardLM	operatorx	CD	Paper
llama2-Chinese-chat	13B	2023-07	中英	通用	[🤗HF]	llama2-Chinese-chat	Ke Bai	CD
Jiang-chat	13B	2023-07	中文	通用	[🤗HF]	/	知未智能	CD
Llama2-chinese-chat	7/13B	2023-07	中英	通用	[🤗HF]	Llama2-Chinese	FlagAlpha	CD
LL7M	7B	2023-07	多语	通用	[🤗HF]	/	Joseph Cheung	CD
Chinese-Llama-2	7B	2023-07	中英	通用	[🤗HF]	Chinese-Llama-2-7b	LinkSoul-AI	CD
Llama2-chat	7/13/70B	2023-07	多语	通用	[🤗HF]	llama	Meta	CD	Paper
PolyLM-chat	13B	2023-07	多语	通用	[🤗HF]	PolyLM	达摩院	CD	Paper
Baichuan-13B-chat	13B	2023-07	中文	通用	[🤗HF]	Baichuan-13B	百川智能	CD
vicuna-V1.3	7/13/33B	2023-07	多语	通用	[🤗HF]	FastChat	lm-sys	CD	Paper
WizardLM-V1.0	7/13/30B	2023-07	多语	通用	[🤗HF]	WizardLM	operatorx	CD	Paper
TigerBot-v2-sft	7B	2023-07	多语	通用	[🤗HF]	TigerBot	虎博科技	CD
InternLM-chat	7/20B	2023-07	中文	通用	[🤗HF]	InternLM	上海人工智能实验室	CD	report
vicuna汉化版	33B	2023-07	中文	通用	baidu-hiks	chinese-StableVicuna	ziwang-com	CD
CuteGPT	13B	2023-07	中英	通用	[🤗HF]	CuteGPT	复旦大学知识工场	CD
MPT-chat	7/30B	2023-06	多语	通用	[🤗HF]	llm-foundry	MosaicML	CD
ChatGLM2	6B	2023-06	中英	通用	[🤗HF]	ChatGLM2-6B	清华大学	ND
BayLing	7/13B	2023-06	中英	通用	[🤗HF]	BayLing	中国科学院	CD
ZhiXi-Diff	13B	2023-06	中英	通用	[🤗HF]	KnowLLM	浙江大学	CD
Anima	33B	2023-06	中文	通用	[🤗HF]	Anima	Gavin Li	CD
OpenLLaMA-Chinese	3/7/13B	2023-06	中文	通用	[🤗HF]	OpenLLaMA-Chinese	FittenTech	CD
openbuddy-falcon-7b-v1.5	7B	2023-06	多语	通用	[🤗HF]	OpenBuddy	OpenBuddy	CD
AtomGPT_chat	13B	2023-06	中英	通用	[🤗HF]	AtomGPT	原子回声	CD
AquilaChat	7B	2023-06	中英	通用	[🤗HF]	Aquila	FlagAI	CD
YuLan-Chat	13/65B	2023-06	中英	通用	[🤗HF]	YuLan-Chat	中国人民大学	CD
Chinese-Alpaca	33B	2023-06	中文	通用	[🤗HF]	Chinese-LLaMA-Alpaca	Yiming Cui	CD
TigerBot-sft	7/180B	2023-06	多语	通用	[🤗HF]	TigerBot	虎博科技	CD
ChatYuan	7B	2023-06	中英	通用	[🤗HF]	ChatYuan-7B	ClueAI	CD
Panda-Instruct	13B	2023-05	中英	通用	[🤗HF]	pandallm	dandelionsllm	CD
Panda-Instruct	7B	2023-05	中英	通用	[🤗HF]	pandallm	dandelionsllm	CD
BiLLa-SFT	7B	2023-05	中英	通用	[🤗HF]	BiLLa	Zhongli Li	CD
Ziya-LLaMA-v1	13B	2023-05	中英	通用	[🤗HF]	Fengshenbang-LM	IDEA研究院	CD	Blog
BLOOMChat V1.0	176B	2023-05	多语	通用	[🤗HF]	bloomchat	SambaNova Systems	CD	Blog
BiLLa	7B	2023-05	中英	通用	[🤗HF]	BiLLa	Zhongli Li	CD
Bactrian-X	7/13B	2023-05	多语	通用	[🤗HF]	bactrian-x	MBZUAI	CD
Bactrian-ZH	7B	2023-05	中文	通用	[🤗HF]	bactrian-x	MBZUAI	CD
ChatFlow	7/13B	2023-05	中英	通用	[🤗HF]	Linly	深圳大学计算机视觉研究所	CD
OpenBuddy	7/13B	2023-05	多语	通用	[🤗HF]	OpenBuddy	OpenBuddy	CD
YuYan-dialogue	11B	2023-04	中文	通用	[🤗HF]	/	网易伏羲	CD	paper
Moss-moon-003-sft-plugin	16B	2023-04	中英	通用	[🤗HF]	MOSS	复旦大学	CD
moss-moon-003-sft	16B	2023-04	中英	通用	[🤗HF]	MOSS	复旦大学	CD
RWKV-4-Raven	3/7/14B	2023-04	中英	通用	[🤗HF]	ChatRWKV	BlinkDL	RNN	Blog
Phoenix-inst-chat	7B	2023-04	中文	通用	[🤗HF]	LLMZoo	香港中文大学	CD
Phoenix-chat	7B	2023-04	中文	通用	[🤗HF]	LLMZoo	香港中文大学	CD
ChatPLUG	3.7B	2023-04	中文	通用	[🤗HF]	ChatPLUG	阿里巴巴	ED	Paper
Chinese-Alpaca	13B	2023-04	中文	通用	[🤗HF]	Chinese-LLaMA-Alpaca	Yiming Cui	CD
BELLE-LLAMA	13B	2023-04	中文	通用	[🤗HF]	BELLE	贝壳	CD
LLaMA-tuned	7/13/ 33/65B	2023-04	中文	通用	[🤗HF]	LMFlow	香港科技大学	CD
Chinese-Vicuna	7/13B	2023-03	中文	通用	[🤗HF]	Chinese-Vicuna	Facico	CD
ChatYuan-V2	0.7B	2023-03	中英	通用	[🤗HF]	ChatYuan	元语智能	ED
Chinese-Alpaca	7B	2023-03	中文	通用	[🤗HF]	Chinese-LLaMA-Alpaca	Yiming Cui	CD
Luotuo	7B	2023-03	中文	通用	[🤗HF]	Chinese-alpaca-lora	华中师范大学	CD
BELLE-LLAMA	7B	2023-03	中英	通用	[🤗HF]	BELLE	贝壳	CD
ChatGLM	6B	2023-03	中英	通用	[🤗HF]	ChatGLM-6B	清华大学	ND

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	架构	文献
Qwen-coder-2.5	0.5/1.5/14/32B	2024-11	中英	代码	🤗HF	Qwen2.5-Coder	QwenLM	CD	Paper
OpenCoder-Instruct	1.5/8B	2024-11	中英	代码	🤗HF	OpenCoder-llm	OpenCoder-llm	CD	Paper
珠算	2.7B	2024-09	中英	代码	🤗HF	Abacus	HIT-SCIR	CD
Qwen-2.5-code	1.5/7B	2024-09	中英	代码	🤗HF	Qwen2.5	QwenLM	CD	Blog
Qwen-2.5-math	1.5/7/72B	2024-09	中英	数学	🤗HF	Qwen2.5	QwenLM	CD	Blog
Yi-Coder	1.5/9B	2024-09	中英	代码	🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel	Yi-Coder	01-ai	CD	Paper Blog
CodeGeeX4	9B	2024-07	多语	代码	🤗HF	CodeGeeX4	THUDM
DeepSeek-Coder-V2	A16B/236B	2024-06	中英	代码	🤗HF	DeepSeek-V2	deepseek-ai	MoE	Paper
AutoCoder	6.7/33B	2024-06	/	代码	🤗HF	AutoCoder	Bin Lei	CD	Paper
Codestral	22B	2024-05	/	代码	🤗HF	/	mistralai	/	Blog
CodeQwen1.5-Chat	7B	2024-04	中英	代码	🤗HF	Qwen1.5	Qwen	CD	Blog
codegemma	2/7B	2024-04	多语	代码	🤗HF	/	Google
WaveCoder	6.7B	2024-04	多语	代码	🤗HF	WaveCoder	microsoft		Paper
ChemDFM	13B	2024-03	中英	化学	🤗HF	/	OpenDFM	CD	Paper
starcoder2	3/7/15B	2024-02	中英	代码	🤗HF	starcoder2	bigcode-project	CD	Paper
TuringMM-Chat	34B	2024-02	中英	教育	🤗HuggingFace 🤖ModelScope	/	光年无限	CD
deepseek-moe	16B	2024-01	中英	代码	[🤗HF]	DeepSeekMoE	DeepSeek	CD-MOE
Code Millenials	1/3/ 13/34B	2023-01	多语	代码	[🤗HF]	code-millenials	BudEcosystem	CD
WizardCoder	15/33B	2024-01	多语	代码	[🤗HF]	WizardLM	operatorx	CD	Paper
DeepSeek-Coder	1/7/33B	2023-11	中英	代码	[🤗HF]	DeepSeek-Coder	deepseek-ai		Blog
Phind	34B	2023-10	多语	代码	[🤗HF]	/	Phind	CD	Blog zh
Tongyi-Finance-Chat	14B	2023-11	中文	金融	ModelScope	通义金融-14B-Chat	通义金融大模型	CD
Skywork-math	13B	2023-10	中文	数学	[🤗HF]	Skywork	SkyworkAI	CD	Paper
XuanYuan-Chat	70B	2023-10	中英	金融	[🤗HF]	XuanYuan	Duxiaoman度小满	CD
zhilu	13B	2023-10	中英	金融	[🤗HF]	/	SYSU-MUCFC-FinTech-Research-Center	CD
TestGPT	7B	2023-10	中文	测试	[🤗HF]	Test-Agent	codefuse-ai	CD
cross	7/13B	2023-10	多语	数学	[🤗HF]	/	Mathoctopus	CD
CodeFuse	13/14/ 15/34B	2023-10	中文	代码	[🤗HF]	MFTCoder	codefuse-ai	CD
Taiyi	7B	2023-10	中英	医学	[🤗HF]	Taiyi-LLM	DUTIR-BioNLP	CD
CodeShell-chat	7B	2023-10	中英	代码	[🤗HF]	codeshell	WisdomShell	CD
DISC-LawLLM	13B	2023-09	中文	法律	[🤗HF]	/	ShengbinYue	CD	Report
WiNGPT-chat	7B	2023-09	中文	医学	[🤗HF]	WiNGPT2	Winning Health AI Research	CD
ziya-coding	15/34B	2023-09	中英	代码	[🤗HF]	Fengshenbang-LM	IDEA研究院	CD
AgriGPT	6/13b	2023-09	中文	农业	[🤗HF]	AgriGPTs	AgriGPTs
XuanYuan-chat	70B	2023-09	中文	金融	TODO	XuanYuan	度小满	CD	Report
夫子•明察	6B	2023-09	中文	司法	[🤗HF]	fuzi.mingcha	山东大学	ND
仲景	13B	2023-09	中文	医学	[🤗HF]	Zhongjing	Songhua Yang	CD	Paper
CodeFuse	13/34B	2023-09	中英	代码	[🤗HF]	MFTCoder	codefuse-ai	CD
EcomGPT	7B	2023-09	中英	电商	TODO	EcomGPT	Alibaba
DISC-MedLLM	13B	2023-08	中文	医疗	[🤗HF]	DISC-MedLLM	FudanDISC	CD	Paper
K2	7B	2023-08	中英	科学	[🤗HF]	k2	daven	CD
CodeLLAma	7/13/34B	2023-08	多语	代码	[🤗HF]	codellama	Meta Research	CD	Paper
sqlcoder	15B	2023-08	中英	代码	[🤗HF]	sqlcoder	Defog.ai	CD
智海-录问	7B	2023-08	中文	法律	[🤗HF]	wisdomInterrogatory	zhihaiLLM	CD
WizardMath-V1.0	7/13/70B	2023-08	多语	数学	[🤗HF]	WizardLM	operatorx	CD
QiaoBan	7B	2023-08	中文	情感	[🤗HF]	QiaoBen	哈尔滨工业大学
HuangDi	13B	2023-08	中文	中医	[🤗HF]	HuangDI	Zlasejd	CD
ZhongJing		2023-08	中文	中医	TODO	CMLM-ZhongJing	复旦大学
TCMLLM	6B	2023-08	中文	中医	[🤗HF]	TCMLLM	2020MEAI	ND
AutoAudit	7B	2023-07	中文	安全	[🤗HF]	AutoAudit	Jiaying Li	CD
Lychee	10B	2023-07	中文	法律	[🤗HF]	lychee_law	davidpig	ND
IvyGPT	6B	2023-07	中文	医学	[🤗HF]	IvyGPT	WangRongsheng
MING	7B	2023-07	中文	医学	[🤗HF]	MING	上海交通大学	CD
Mozi	7B	2023-07	中英	科技	[🤗HF]	science-llm	GMFTBY	CD
StarGLM	6B	2023-07	中文	天文	[🤗HF]	StarGLM	LI YUYANG	ND
TransGPT	7B	2023-07	中英	交通	[🤗HF]	TransGPT	北京交通大学	CD
CodeGeeX2	6B	2023-07	中英	代码	[🤗HF]	CodeGeeX2	清华大学	ND
Yayi-llama2	7/13B	2023-07	中英	舆情	[🤗HF]	Yayi	中科闻歌	CD
Ziya-Writing	13B	2023-07	中英	写作	[🤗HF]	Fengshenbang-LM	IDEA研究院	CD
MindChat	13B	2023-07	中文	心理	[🤗HF]	MindChat	华东理工大学	CD
ShenNong-TCM-LLM	7B	2023-07	中英	医学	[🤗HF]	ShenNong-TCM-LLM	michael-wzhu	CD
ailawyer	13B	2023-07	中英	法律	[🤗HF]	JurisLMs	openkg	CD
educhat	7B/13B	2023-06	中英	教育	[🤗HF]	EduChat	华东师范大学	CD
Sunsimiao	7B	2023-06	中英	医学	[🤗HF]	Sunsimiao	华东理工大学	CD
Media LLaMA	7B	2023-06	中文	媒体	baidu	Media-LLaMA	智媒开源研究院	CD
PULSE	7/14B	2023-06	中文	医学	[🤗HF]	PULSE	OpenMEDLab	CD
ChatLaw	13/33B	2023-06	中文	法律	[🤗HF]	ChatLaw	北京大学	CD
BaoLuo	6B	2023-06	中文	法律	[🤗HF]	BaoLuo-LawAssisant	LeiZi	ND
CoLLaMA	7B	2023-06	中英	代码	[🤗HF]	CoLLaMA	Denilah	CD
TechGPT	7B	2023-06	中英	教育	[🤗HF]	TechGPT	东北大学	CD
Yayi	7B	2023-06	中英	舆情	[🤗HF]	Yayi	中科闻歌	CD
MeChat	6B	2023-06	中文	医学	[🤗HF]	smile	qiuhuachuan	ND
ziya-medical	13b	2023-06	中英	医学	[🤗HF]	MedicalGPT	Ming Xu	CD
Taoli	7B	2023-06	中英	教育	待开源	taoli	北京语言大学	CD
Lawyer-llama	13B	2023-06	中英	法律	[🤗HF]	lawyer-llama	Quzhe Huang	CD
QiZhen-CaMA	13B	2023-06	中英	医学	[🤗HF]	QiZhenGPT	浙江大学	CD
扁鹊-2.0	6B	2023-06	中文	医学	[🤗HF]	BianQue	华南理工大学	ND
SoulChat	6B	2023-06	中文	心理	[🤗HF]	SoulChat	华南理工大学	ND
HanFei	7B	2023-05	中文	法律	baidu-d6t5	HanFei	中国科学院深圳先进院	CD
QiZhen	6B	2023-05	中英	医学	[baidu]	QiZhenGPT	浙江大学	CD
ChatMed-Consult	7B	2023-05	中英	医学	[🤗HF]	ChatMed	michael-wzhu	CD
LaWGPT-beta1.1	7B	2023-05	中英	法律	[🤗HF]	LawGPT	Pengxiao Song	CD
Cornucopia	7B	2023-05	中英	金融	[🤗HF]	Cornucopia-LLaMA-Fin-Chinese	yuyangmu	CD
HuatuoGPT	7B	2023-05	中文	医学	[🤗HF]	HuatuoGPT	香港中文大学	CD	Paper
LexiLaw	6B	2023-05	中文	法律	[🤗HF]	LexiLaw	Haitao Li	ND	Paper
XuanYuan	176B	2023-05	中文	金融	申请	XuanYuan	度小满	CD	Paper
LawGPT	6B	2023-05	中文	法律	[🤗HF]	LAW-GPT	hongchengliu	N
扁鹊-1.0	0.7B	2023-04	中文	医学	[🤗HF]	BianQue	scutcyr	ED
ChatGLM-Med	6B	2023-04	中文	医学	[🤗HF]	Med-ChatGLM	哈尔滨工业大学	ED
BenTsao	7B	2023-04	中文	医学	[🤗HF]	Huatuo-Llama-Med-Chinese	哈尔滨工业大学	CD
DoctorGLM	6B	2023-04	中文	医学	TODO	DoctorGLM	xionghonglin	ND
Firefly	1/2/7B	2023-04	中文	文化	[🤗HF]	Firefly	Yang JianXin	CD
ChatRWKV	7B	2023-01	中英	小说	[🤗HF]	ChatRWKV	BlinkDL	RNN	Blog

模型	大小	时间	语言模型	非语言模型	语言	领域	下载	项目地址	机构/个人	文献
Wan2.1	1.3/14B	2025-02	/	/	中英	文视图	🤗 HF	Wan2.1	Wan-Video	/
Step-Audio-Chat	130B	2025-02	Step-1	/	多语	文音	🤗 HF	Step-Audio	stepfun-ai	Paper
Ovis2	1/4/16/34B	2025-02	Qwen2.5	aimv2-large	中英	文图视	🤗 HF	Ovis	AIDC-AI	Paper
Janus-Pro	1.5/7B	2025-02	deepseek-llm	SigLIP-L	中英	文图	🤗 HF	Janus	deepseek-ai	paper
OuteTTS		2025-01	Qwen2.5-0.5B	OLMo-1B	多语	文音	🤗 HF	OuteTTS	edwko	Blog
MiniCPM-o	8B	2025-01	Qwen2.5-7B	SigLip-400M、Whisper-medium-300M, ChatTTS-200M	中英	文音图	🤗 HF	MiniCPM-o	OpenBMB
Sa2VA	1/4/8B	2024-12	Qwen2.5	InternVL2.5	中英	文视图	🤗 HF	Sa2VA	magic-research/ Sa2VA	Paper
QVQ-72B-Preview	72B	2024-12	/	/	中英	文视图	🤗 HF	Qwen2-VL	QwenLM	Blog
Megrez-3B-Omni	3B	2024-12	Megrez-3B-Instruct	SigLip-400M/Qwen2-Audio/whisper-large-v3	中英	文音图	🤗 HF	Infini-Megrez-Omni	infinigence
DeepSeek-VL2	1/2.8/4.5B	2024-12	/	/		文图	🤗 HF	DeepSeek-VL2	deepseek-ai	Paper
InternVL 2.5	2/4/8/26/38/78B	2024-12	Qwen-2.5	InternVit	多语	文图	🤗 HF	InternVL	OpenGVLab	blog
Pixtral-Large-Instruct	124B	2024-11	Mistral-Large-Instruct-2407	/	多语	文图	🤗 Huggingface	/	mistralai	Pixtral Large blog post
fish-agent	3B	2024-11	Qwen-2.5	/	多语	文音	🤗 Huggingface	fish-speech	fishaudio
GLM-4-Voice	9B	2024-10	GLM-4-9B	Whisper	中英	文音	🤗 Huggingface	GLM-4-Voice	THUDM
Pangea	7B	2024-10	Qwen2-7B-Instruct	LLaVA-NeXT	多语	图文	🤗HF	Pangea	neulab	Paper
GOT-OCR-2.0	/	2024-09	Qwen	/	中英	图文	🤗HF	GOT-OCR2.0	StepFun-AI	Paper
Ovis-1.6	9B	2024-09	Gemma2-9B-It	Siglip-400M	中英	图文	🤗	Ovis	AIDC-AI	Paper
Qwen2-VL	2/7/72B	2024-08	/	/	多语	图文视	🤗 🤖	Qwen2-VL	QwenLM
CogVideoX	2/5B	2024-08	/	/	中英	文视	🤗 link	CogVideo	THUDM
MiniCPM-V 2.6	8B	2024-08	Qwen2-7B	SigLip-400M	中英	文图视	🤗 link	MiniCPM-V	OpenBMB
InternVL2	1/2/4/8/26/40/76B	2024-07	Qwen2/internlm2/llama3	InternViT	中英	文图	🤗 link 🤖 link	InternVL	OpenGVLab	report
Qwen2-Audio	8.2B	2024-07	Qwen2	Whisper-large-V3	中英	文音	🤗HF	Qwen2-Audio	QwenLM	report
Kolors	/	2024-07	ChatGLM3-Base	/	中英	文图	🤗HF	Kolors	Kwai-Kolors	Paper
ChatTTS	/	2024-06	/	/	中英	文音	🤗HF	ChatTTS	2noise	/
GLM-4V	9B	2024-06	GLM-4	/	多语	文图	🤗HF	GLM-4	THUDM	/
HunyuanDiT	1.5B	2024-05	multilingual T5 encoder	CLIP	中英	文图	🤗	HunyuanDiT	Tencent	Paper
CogVLM2		2024-05	Meta-Llama-3-8B-Instruct	/	中英	文图	🤗	CogVLM	Skip to content
360VL	8/70B	2024-05	LLama3	CLIP-ViT	中英	文图	🤗	360VL	360CVGroup
XVERSE-V	13B	2024-05	XVERSE-13B-Chat	clip-vit-large-patch14-224	中英	文图	🤖	XVERSE-V-13B	xverse-ai
MiniCPM-V 2.0	2.8B	2024-04	MiniCPM-2.4B	SigLip-400M	中英	文图	🤗 🤖	MiniCPM-V	OpenBMB	Blog
Qwen-Audio	7B	2024-03	Qwen-7B	Whisper-large-v2	中英	文音	🤗HF	Qwen-Audio	Qwen	Paper
DeepSeek-VL	1.3/7B	2024-03	DeepSeek	SigLip/SAM	中英	图文	🤗HF	DeepSeek-VL	deepseek-ai	Paper
OmniLMM	3/12B	2024-02	MiniCPM	SigLip	中英	图文	🤗HF	OmniLMM	[OpenBMB](https://github.com/01-ai)
MiniCPM-V	3B	2024-02	MiniCPM-2.4B	SigLip-400M	中英	图文	🤗HF	OmniLMM	[OpenBMB](https://github.com/01-ai)
Yi-VL	6/34B	2024-01	Yi	CLIP-VIT	中英	图文	[🤗HF]	Yi	01-ai
Lyrics	14B	2023-12	/	/	中英	图文	[🤗HF]	Fengshenbang-LM	IDEA研究院
Qwen-Audio	7B	2023-12	Qwen-7B	Whisper-large-v2	中英	文音	[🤗HF]	Qwen-Audio	Qwen	Paper
SPHINX	13B	2023-10	/	/	中英	图文	[🤗HF]	LLaMA2-Accessory	Alpha-VLLM
Skywork-MM	13B	2023-10	/	/	中英	图文	[🤗HF]	Skywork	SkyworkAI	Paper
CogVLM	7/14B	2023-10	Qwen	ViT	中英	图文	[🤗HF]	/	CausalLM
fuyu	8B	2023-10	/	/	中英	图文	[🤗HF]	/	Adept AI Labs	Blog
Ziya-Visual	14B	2023-10	LLaMA	InstructBLIP	中英	图文	[🤗HF]	Fengshenbang-LM	IDEA研究院	Paper
CogVLM	17B	2023-10	EVA2-CLIP-E	Vicuna-v1.5	中英	图文	TODO	CogVLM	THUDM	Paper
idefics	9/80B	2023-10	LLaMA	CLIP-ViT	中英	图文	[🤗HF]	/	HuggingFaceM4	log
InternLM-XComposer	7B	2023-10	InternLM	EVA-CLIP	中英	图文	[🤗HF]	InternLM-XComposer	InternLM	Report
WeMix-LLM	13B	2023-09	LLama2	/	中英	图文	[🤗HF]	WeMix-LLM	Alpha-VLLM
Vally	7/13B	2023-08	BelleGroup/BELLE-LLaMA-EXT	OFA-Sys/chinese-clip-vit-large-patch14	中英	图文	[🤗HF] [🤗HF]	Valley	罗瑞璞	Paper
SALMONN	/	2023-08	/	/	中英	语音	TODO	SALMONN	Bytedance
IDEFICS	9/80B	2023-08	llama	CLIP-ViT	中英	图文-通用	[🤗HF]	m4-logs	HuggingFaceM4	Paper
Qwen-VL	7B	2023-08	Qwen-7B	Openclip ViT-bigG	中英	通用	[🤗HF]	Qwen-VL	阿里云
Qwen-VL-chat	7B	2023-08	Qwen-7B	Openclip ViT-bigG	中英	通用	[🤗HF]	Qwen-VL	阿里云
LLasM	7B	2023-07	Chinese-Llama2	whisper-large-v2	中英	语音	[🤗HF]	LLaSM	北京灵琐
Chinese-LLaVA	7B	2023-07	Chinese-Llama2	Clip-vit	中英	视觉	[🤗HF]	Chinese-LLaVA	北京灵琐
RemoteGLM	6B	2023-07	VisualGLM-6B	VisualGLM-6B	中文	遥感	TODO	RemoteGLM	lzw-lzw
VisualCLA	7B	2023-07	Chinese-Alpaca-Plus	CLIP-ViT-L/14	中文	视觉	[🤗HF]	Visual-Chinese-LLaMA-Alpaca	Ziqing Yang
yuren	7B	2023-07	baichuan-7B	CLIP	中英	视觉	[🤗HF]	yuren-baichuan-7b	Pleisto
VisCPM-Chat	10B	2023-06	CPM-Bee	Q-Former	中英	视觉	[🤗HF]	VisCPM	OpenBMB
VisCPM-Paint	10B	2023-06	CPM-Bee	Stable Diffusion 2.1	中英	视觉	[🤗HF]	VisCPM	OpenBMB
XrayPULSE	7B	2023-06	PULSE	MedCLIP	中文	医学	[🤗HF]	XrayPULSE	OpenMEDLab
SEEChat	6B	2023-06	ChatGLM	CLIP-ViT	中文	/	[🤗HF]	SEEChat	360
Ziya-BLIP2-14B-Visual-v1	14B	2023-06	LLaMA-13B	BLIP2	中英	通用	[🤗HF]	Fengshenbang-LM	IDEA研究院
Video-LLaMA-BiLLA	7B	2023-05	BiLLa-7B	MiniGPT-4	中英	通用	[🤗HF]	Video-LLaMA	达摩院多语言NLP	Paper
Video-LLaMA-Ziya	13B	2023-05	Ziya-13B	MiniGPT-4	中英	通用	[🤗HF]	Video-LLaMA	达摩院多语言NLP	Paper
XrayGLM	6B	2023-05	ChatGLM-6B	BLIP2-Qformer	中英	医学	[🤗HF]	XrayGLM	澳门理工大学
X-LLM		2023-05	ChatGLM	ViT-g	中文	/	TODO	X-LLM	中科院自动化所	Paper
VisualGLM	6B	2023-05	ChatGLM-6B	BLIP2-Qformer	中英	视觉	[🤗HF]	VisualGLM-6B	清华大学

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	结构	文
DeepSeek-R1	A37/671B	2025-01	中英	通用	🤗HF	DeepSeek-R1	deepseek-ai	MoE	Paper Link👁️
DeepSeek-R1-Zero	A37/671B	2025-01	中英	通用	🤗HF	DeepSeek-R1	deepseek-ai	MoE	Paper Link👁️
DeepSeek-R1-Distill-Qwen	1.5/7/14/32B	2025-01	中英	通用	🤗HF	DeepSeek-R1	deepseek-ai	MoE	Paper Link👁️
MiniMax-Text-01	A46/456B	2025-01	中英	通用	🤗HF	MiniMax-01	MiniMax-AI	MoE	Paper
MiniMax-VL-01	A46/456B	2025-01	中英	多模态	🤗HF	MiniMax-01	MiniMax-AI	MoE	Paper
Sky-T1	32B	2025-01	中英	通用	🤗HF	SkyThought	NovaSky-AI	CD	Blog
Search-O1		2025-01	中英	通用	/	Search-o1	sunnynexus	CD	Paper
HuatuoGPT-o1	7/8/70/72B	2025-01	中英	医疗	🤗HF	HuatuoGPT-o1	FreedomIntelligence/	CD	Paper
QwQ-32B-Preview	32B	2024-11	中英	通用	🤗HF	/	QwenLM	CD
Marco-o1	7B	2024-11	中英	通用	🤗HF	Marco-o1	AIDC-AI	CD	Paper
Skywork-01-Open	8B	2024-11	中英	通用	🤗HF	skywork-o1-prm-inference	SkyworkAI	CD	Blog
HK-01aw	8B	2024-11	中文	法律	🤗HF	HK-O1aw	HKAIR-Lab	CD
QVQ-72B-Preview	72B	2024-12	中英	多模	🤗 HF	Qwen2-VL	QwenLM		Blog

名称	大小	时间	语言	下载	项目地址	作者	备注
FinCorpus	50G	2023-09	中文	dataset	XuanYuan	度小满	金融领域
TransGPT-sft	346k	2023-07	中文	dataset	TransGPT	北京交通大学
TransGPT-pt	58k	2023-07	中文	dataset	TransGPT	北京交通大学
ShareGPT-Chinese-English	90K	2023-07	中英	dataset	llama2-Chinese-chat	Ke Bai
educhat-sft-002-data-osm	400w	2023-06	中英	dataset	EduChat	华东师范大学	教育
chatgpt-corpus	3M	2023-06	中文	dataset	chatgpt-corpus	plex
Simle	350k	2023-06	中文	dataset	smile	qiuhuachuan	心理健康
QiZhen	20k	2023-06	中文	dataset	QiZhenGPT	浙江大学	医学
BayLing-80	80	2023-06	中英	dataset	BayLing	中国科学院	多轮指令
Tigerbot-dataset	120k	2023-06	中英	dataset	TigerBot	虎博科技
lawyer-llama	/	2023-05	中文	dataset	lawyer-llama	Quzhe Huang	法律
Bactrian-X	67K	2023-05	多语	dataset	bactrian-x	MBZUAI
CrimeKgAssitant	52k	2023-05	中文	dataset	LAW-GPT	hongchengliu	法律
moss-002-sft-data	1.1M	2023-04	中英	dataset	MOSS	复旦大学
moss-003-sft-data	1.1M	2023-04	中英	dataset	MOSS	复旦大学
moss-003-sft-plugin-data	300K	2023-04	中英	dataset	MOSS	复旦大学
Safety-Prompts	100K	2023-04	中文	dataset	Safety-Prompts	清华大学	评测平台
OASST1	/	2023-04	多语	dataset	Open-Assistant	OpenAssistant
ShareChat	90K	2023-04	中英	dataset	ShareChat	czhko
GPT-4-LLM	52K	2023-04	中文	dataset	GPT-4-LLM	Instruction-Tuning-with-GPT-4	paper
COIG	200K	2023-04	中文	dataset	FlagInstruct	BAAI	paper
RedGPT	50k	2023-04	中文	dataset	RedGPT	MiniGPT
shareGPT_cn	20k	2023-04	中文	dataset	shareGPT_cn	shareAI
generated_chat_0.4M	0.4M	2023-04	中文	dataset	BELLE	Ke Technologies	角色对话
multiturn_chat_0.8M	0.8M	2023-04	中文	dataset	BELLE	Ke Technologies	多轮任务
school_math_0.25M	0.25M	2023-04	中文	dataset	BELLE	Ke Technologies	数学题
Zhihu-KOL	/	2023-03	中文	dataset	Zhihu-KOL	Rui Wang
InstructionWild	104k	2023-03	中英	dataset	InstructionWild	Xue Fuzhao
Alpaca-CoT	/.	2023-03	中英	dataset	Alpaca-CoT	Qingyi Si
GuanacoDataset	/	2023-03	多语	dataset	guanaco-model	Guanaco
Traditional-Chinese-alpaca	52K	2023-03	中文	dataset	Traditional-Chinese Alpaca	NTU NLP Lab	gpt翻译
alpaca_chinese_dataset	/	2023-03	中文	dataset	alpaca_chinese_dataset	akou	人工校验
alpaca-chinese-dataset	/	2023-03	中文	dataset	alpaca-chinese-dataset	carbonz	机器翻译
train_2M_CN	2M	2023-03	中文	dataset	BELLE	Ke Technologies
train_1M_CN	1M	2023-03	中文	dataset	BELLE	Ke Technologies
train_0.5M_CN	0.5M	2023-03	中文	dataset	BELLE	Ke Technologies
HC3 人类-ChatGPT 问答	/	2023-03	中文	dataset	chatgpt-comparison-detection	SimpleAI
firefly-train-1.1M	1.1M	2023-03	中文	dataset	Firefly	Jianxin Yang

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	文
JinaColBERT V2	large	2024-08	多语	通用	[🤗HF]	/	Jina AI	Paper
Conan-embedding-v1	large	2024-08	中文	通用	[🤗HF]	/	TencentABC	Paper
xiaobu-v2	large	2024-07	中文	通用	[🤗HF]	/	lier007
zpoint_large	Large	2024-06	中文	通用	[🤗HF]	/	yang
BCE	279M	2024-01	多语	通用	[🤗HF]	BCEmbedding	netease-youdao
Cohere	Base	2023-09	多语	通用	[🤗HF]	/	Cohere	Blog
jina	Base	2023-10	中英	通用	[🤗HF]	/	Jina AI
Dmeta	400MB	2024-02	中文	通用	[🤗HF]	/	DMetaSoul
bge-m3		2024-02	中文	通用	[🤗HF]	/	BAAI	Paper
tao-8k		2023-11	中文	通用	[🤗HF]		amu
bge	s/b/l	2023-10	中文	通用	[🤗HF]	/	BAAI
gte-zh	s/b/l	2023-08	中文	通用	[🤗HF]	/	Alibaba DAMO	Paper
m3e	s/b/l	2023-06	中文	通用	[🤗HF]	/	Moka-AI
LaBSE			多语	通用	[🤗HF]	/	Sentence Transformers

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
BERT-Base	base	Google Drive		Google Research	github	通用
BERT-wwm	base	Google Drive 讯飞云-07Xj	Google Drive	Yiming Cui	github	通用
BERT-wwm-ext	base	Google Drive 讯飞云-4cMG	Google Drive	Yiming Cui	github	通用
bert-base-民事	base	阿里云		THUNLP	github	司法
bert-base-刑事	base	阿里云		THUNLP	github	司法
BAAI-JDAI-BERT	base	京东云		JDAI	github	电商客服对话
FinBERT	base	Google Drive 百度网盘-1cmp	Google Drive 百度网盘-986f	Value Simplex	github	金融科技领域
EduBERT	base	好未来AI	好未来AI	tal-tech	github	教育领域
guwenbert-base	base		百度网盘-4jng [🤗HF]	Ethan	github	古文领域
guwenbert-large	large		百度网盘-m5sz [🤗HF]	Ethan	github	古文领域
BERT-CCPoem	small		thunlp	THUNLP-AIPoet	github	古典诗歌

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
ChineseBERT	base		[🤗HF]	ShannonAI	github	通用
ChineseBERT	large		[🤗HF]	ShannonAI	github	通用

模型	版本	PaddlePaddle	PyTorch	作者	源地址	应用领域
ernie-3.0-base	12-layer, 768-hidden, 12-heads	link	[🤗HF]	PaddlePaddle	github	通用
ernie-3.0-medium	6-layer, 768-hidden, 12-heads	link	[🤗HF]	PaddlePaddle	github	通用
ernie-3.0-mini	6-layer, 384-hidden, 12-heads	link	[🤗HF]	PaddlePaddle	github	通用
ernie-3.0-micro	4-layer, 384-hidden, 12-heads	link	[🤗HF]	PaddlePaddle	github	通用
ernie-3.0-nano	4-layer, 312-hidden, 12-heads	link	[🤗HF]	PaddlePaddle	github	通用

模型	版本	TensorFlow	作者	源地址	应用领域
roformer	base(L12)	百度网盘-xy9x	ZhuiyiTechnology	github	通用
roformer	small(L6)	百度网盘-gy97	ZhuiyiTechnology	github	通用
roformer-char	base(L12)	百度网盘-bt94	ZhuiyiTechnology	github	通用
roformerV2	small(L6)	百度网盘-ttn4 追一	ZhuiyiTechnology	github	通用
roformerV2	base(L12)	百度网盘-pfoh 追一	ZhuiyiTechnology	github	通用
roformerV2	large(L24)	百度网盘-npfv 追一	ZhuiyiTechnology	github	通用

模型	版本	PyTorch	作者	源地址	备注
m3e-base	base	m3e-base	Moka-AI	uniem	文本嵌入模型
M3e-small	Small	m3e-small	Moka-AI	uniem	文本嵌入模型

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
GPT2	30亿语料		Google Drive 百度网盘-ffz6	Caspar ZHANG	gpt2-ml	通用
GPT2	15亿语料		Google Drive 百度网盘-q9vr	Caspar ZHANG	gpt2-ml	通用
CDial-GPTLCCC-base	base		[🤗HF]	thu-coai	CDial-GPT	中文对话
CDial-GPT2LCCC-base	base		[🤗HF]	thu-coai	CDial-GPT	中文对话
CDial-GPTLCCC-large	large		[🤗HF]	thu-coai	CDial-GPT	中文对话
GPT2-dialogue	base		Google Drive 百度网盘-osi6	yangjianxin1	GPT2-chitchat	闲聊对话
GPT2-mmi	base		Google Drive 百度网盘-1j88	yangjianxin1	GPT2-chitchat	闲聊对话
GPT2-散文模型	base		Google Drive 百度网盘-fpyu	Zeyao Du	GPT2-Chinese	散文
GPT2-诗词模型	base		Google Drive 百度网盘-7fev	Zeyao Du	GPT2-Chinese	诗词
GPT2-对联模型	base		Google Drive 百度网盘-i5n0	Zeyao Du	GPT2-Chinese	对联
roformer-gpt	base(L12)	百度网盘-2nnn		ZhuiyiTechnology	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
RoBERTa-tiny-clue	tiny	Google Drive	百度网盘-8qvb	CLUE	github	通用
RoBERTa-tiny-pair	tiny	google drive	百度网盘-8qvb	CLUE	github	通用
RoBERTa-tiny3L768-clue	tiny	Google Drive		CLUE	github	通用
RoBERTa-tiny3L312-clue	tiny	google drive	百度网盘-8qvb	CLUE	github	通用
RoBERTa-large-pair	large	Google Drive	百度网盘-8qvb	CLUE	github	通用
RoBERTa-large-clue	large	google drive	百度网盘-8qvb	CLUE	github	通用
RBT3	3层base	Google Drive 讯飞云-b9nx	Google Drive	Yiming Cui	github	通用
RBTL3	3层large	Google Drive 讯飞云-vySW	Google Drive	Yiming Cui	github	通用
RBTL4	4层large	讯飞云-e8dN		Yiming Cui	github	通用
RBTL6	6层large	讯飞云-XNMA		Yiming Cui	github	通用
RoBERTa-wwm-ext	base	Google Drive 讯飞云-Xe1p	Google Drive	Yiming Cui	github	通用
RoBERTa-wwm-ext-large	large	Google Drive 讯飞云-u6gC	Google Drive	Yiming Cui	github	通用
RoBERTa-base	base	Google Drive 百度网盘	Google Drive 百度网盘	brightmart	github	通用
RoBERTa-Large	large	Google Drive 百度网盘	Google Drive	brightmart	github	通用
RoBERTa-tiny	tiny	[🤗HF]	[🤗HF]	DBIIR @ RUC	UER	通用
RoBERTa-mini	mini	[🤗HF]	[🤗HF]	DBIIR @ RUC	UER	通用
RoBERTa-small	small	[🤗HF]	[🤗HF]	DBIIR @ RUC	UER	通用
RoBERTa-medium	medium	[🤗HF]	[🤗HF]	DBIIR @ RUC	UER	通用
RoBERTa-base	base	[🤗HF]	[🤗HF]	DBIIR @ RUC	UER	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
Albert_tiny	tiny	Google Drive	Google Drive	brightmart	github	通用
Albert_base_zh	base	Google Drive	Google Drive	brightmart	github	通用
Albert_large_zh	large	Google Drive	Google Drive	brightmart	github	通用
Albert_xlarge_zh	xlarge	Google Drive	Google Drive	brightmart	github	通用
Albert_base	base	Google Drive		Google Research	github	通用
Albert_large	large	Google Drive		Google Research	github	通用
Albert_xlarge	xlarge	Google Drive		Google Research	github	通用
Albert_xxlarge	xxlarge	Google Drive		Google Research	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
NEZHA-base	base	Google Drive 百度网盘-ntn3	lonePatient	HUAWEI	github	通用
NEZHA-base-wwm	base	Google Drive 百度网盘-f68o	lonePatient	HUAWEI	github	通用
NEZHA-large	large	Google Drive 百度网盘-7thu	lonePatient	HUAWEI	github	通用
NEZHA-large-wwm	large	Google Drive 百度网盘-ni4o	lonePatient	HUAWEI	github	通用
WoNEZHA (word-base)	base	百度网盘-qgkq		ZhuiyiTechnology	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
MacBERT-base	base	Google Drive 讯飞云-E2cP		Yiming Cui	github	通用
MacBERT-large	large	Google Drive 讯飞云-3Yg3		Yiming Cui	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
WoBERT	base	百度网盘-kim2		ZhuiyiTechnology	github	通用
WoBERT-plus	base	百度网盘-aedw		ZhuiyiTechnology	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
XLNet-base	base	Google Drive 讯飞云-uCpe	Google Drive	Yiming Cui	github	通用
XLNet-mid	middle	Google Drive 讯飞云-68En	Google Drive	Yiming Cui	github	通用
XLNet_zh_Large	large	百度网盘		brightmart	github	通用

模型	版本	TensorFlow	作者	源地址	应用领域
ELECTRA-180g-large	large	Google Drive 讯飞云-Yfcy	Yiming Cui	github	通用
ELECTRA-180g-small-ex	small	Google Drive 讯飞云-GUdp	Yiming Cui	github	通用
ELECTRA-180g-base	base	Google Drive 讯飞云-Xcvm	Yiming Cui	github	通用
ELECTRA-180g-small	small	Google Drive 讯飞云-qsHj	Yiming Cui	github	通用
legal-ELECTRA-large	large	Google Drive 讯飞云-7f7b	Yiming Cui	github	司法领域
legal-ELECTRA-base	base	Google Drive 讯飞云-7f7b	Yiming Cui	github	司法领域
legal-ELECTRA-small	small	Google Drive 讯飞云-7f7b	Yiming Cui	github	司法领域
ELECTRA-tiny	tiny	Google Drive 百度网盘-rs99	CLUE	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
ZEN-Base	base		Google Drive 百度网盘	Sinovation Ventures AI Institute	github	通用
Erlangshen-ZEN2	large		[🤗HF]	IDEA-CCNL	github	通用

模型	版本	PaddlePaddle	作者	源地址	应用领域
ernie-1.0-base	base	link	PaddlePaddle	github	通用
ernie_1.0_skep_large	large	link	Baidu	github	情感分析
ernie-gram	base	link	Baidu	github	通用

模型	版本	PyTorch	作者	源地址	应用领域
LatticeBERT	tiny(L4)	阿里云	Alibaba	github	通用
LatticeBERT	small(L6)	阿里云	Alibaba	github	通用
LatticeBERT	base(L12)	阿里云	Alibaba	github	通用

License

lonePatient/awesome-pretrained-chinese-nlp-models

Folders and files

Latest commit

History

Repository files navigation

Awesome Pretrained Chinese NLP Models

Expand Table of Contents

Base-LLM

Domain-Base-LLM

ChatLLM

Domain-ChatLLM

MultiModal-ChatLLM

ReasoningLLM

中文指令数据集

Embedding

大模型评估基准

1. C-Eval

2. FlagEval

3. SuperCLUElyb

4. XiezhiBenchmark

5. Open LLM Leaderboard

6. 中文大模型安全评测平台

7. OpenCompass大语言模型评测

在线体验大模型

1. ChatGPT--OpenAI

2. New bing--微软

3. 文心一言--百度

4. 通义大模型--阿里

5. 星火认知大模型--科大讯飞

6. Claude--Anthropic

7. ChatGLM--智谱AI

8. 天工大模型--昆仑万维

9. 序列猴子大模型--出门问问

10. MOSS--复旦大学

11. 360智脑大模--360

12. 曹植GPT大语言模型--达观数据

13. 日日新--商汤

14. 天燕大模型--APUS

15. 元乘象--智子引擎

16. 西湖大模型--西湖心辰

17. Dongni--深思考

18. 山海大模型--云知声

19. MiniMax大模型--MiniMax

开源模型库平台

开源数据集库

other-awesome

1. Awesome-Chatgpt github

2. Awesome-ChatGPT-Prompts github

3. Awesome-LLM github

4. Awesome-LangChain github

5. Awesome-Open-Gpt github

6. Awesome-Multimodal-Large-Language-Models github

7. Awesome-Transformer-Attention github

8. Awesome-Prompt-Engineering github

9. Awesome-AITools github

10. Awesome-Chinese-LLM github

11. Awesome-LLM4Tool github

12. Awesome LLM Security github

13. Awesome AI Agents github

14. Awesome-LLM-Large-Language-Models-Notes github

15. Awesome-Efficient-LLM github

16. Awesome Datasets for LLM Training github

17. Awesome-Align-LLM-Human github

18. Awesome RLHF (RL with Human Feedback) github

19. Prompt-in-context-learning github

20. Awesome Instruction Learning github

21. Awesome-Foundation-Models github

22. Awesome-AI-Devtools github

23. Awesome-Autonomous-GPT github

24. Awesome-Papers-Autonomous-Agent github

25. Awesome-Code-LLM github

26. Awesome-LLM-Compression github

27. Autonomous-Agents github

28. Awesome-Large-Multimodal-Agents github

29. Awesome-LLM-Prompt-Optimization github

30. Awesome-LLMs-Datasets github

30. Awesome-RAG-Survey github

31. Awesome-Tool-LLM github

32. LLM-Tool-Survey github

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
Mengzi-BERT	base(L12)		[🤗HF]	Langboat	github	通用
Mengzi-BERT-fin	base(L12)		[🤗HF]	Langboat	github	金融财经

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
PERT-base	base(12L)	百度网盘-rcsw	[🤗HF]	Yiming Cui	github	通用
PERT-large	large(24L)	百度网盘-e9hs	[🤗HF]	Yiming Cui	github	通用

模型	版本	TensorFlow	作者	源地址	应用领域
Chinese-MobileBERT-base-f2	base	百度网盘-56bj	Yiming Cui	github	通用
Chinese-MobileBERT-base-f4	base	百度网盘-v2v7	Yiming Cui	github	通用
Chinese-MobileBERT-large-f2	large	百度网盘-6m5a	Yiming Cui	github	通用
Chinese-MobileBERT-large-f4	large	百度网盘-3h9b	Yiming Cui	github	通用

模型	版本	PyTorch	作者	源地址	应用领域
DeBERTa-v2-Large	large	[🤗HF]	IDEA-CCNL	github	通用
DeBERTa-v2-xLarge	xlarge	[🤗HF]	IDEA-CCNL	github	通用
DeBERTa-v2	base	[🤗HF]	IDEA-CCNL	github	通用

模型	版本	PyTorch	作者	源地址	应用领域
pai-ckbert-base-zh	base	[🤗HF]	Alibaba	github	通用
pai-ckbert-large-zh	large	[🤗HF]	Alibaba	github	通用
pai-ckbert-huge-zh	huge	[🤗HF]	Alibaba	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
Chinese-LERT-small	15m	百度网盘-4vuy	[🤗HF]	Yiming Cui	github	通用
Chinese-LERT-base	400m	百度网盘-9jgi	[🤗HF]	Yiming Cui	github	通用
Chinese-LERT-large	1.2G	百度网盘-s82t	[🤗HF]	Yiming Cui	github	通用

模型	版本	PyTorch	作者	源地址	备注
LEALLA-base	base	LEALLA-base	Google Research	/	文本嵌入模型
LEALLA-large	large	LEALLA-large	Google Research	/	文本嵌入模型

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
NEZHA-Gen	base	Google Drive 百度网盘-rb5m		HUAWEI	github	通用
NEZHA-Gen	base	Google Drive 百度网盘-ytim		HUAWEI	github	诗歌

模型	版本	Keras	PyTorch	作者	源地址	应用领域
T5 PEGASUS	base	百度网盘-3sfn		ZhuiyiTechnology	github	通用
T5 PEGASUS	small	百度网盘-qguk		ZhuiyiTechnology	github	通用

模型	版本	资源	下载地址	作者	源地址	应用领域
盘古α-2.6B	2.6G	项目首页	模型下载	PCL-Platform.Intelligence	github	通用
盘古α-13B	12G	项目首页	模型下载	PCL-Platform.Intelligence	github	通用
盘古α-2.6B pytorch版本	2.6G	项目首页	模型下载	PCL-Platform.Intelligence	github	通用
盘古α-13B pytorch版本	12G	项目首页	模型下载	PCL-Platform.Intelligence	github	通用