生成式人工智能API免费的大模型列表

大模型免费版本免费限制控制台文档地址
百度千帆ERNIE-Speed-8K
ERNIE-Speed-128K
ERNIE Speed-AppBuilder
ERNIE-Lite-8K-0922
ERNIE-Lite-8K
ERNIE-Tiny-8K
Yi-34B-Chat
Fuyu-8B
Yi-34B-Chat(限额)
Fuyu-8B(限额)
Lite、Speed-8K:RPM=300,TPM=300000
Speed-128K:RPM=60,TPM=300000
访问链接文档查看
腾讯混元hunyuan-lite
hunyuan-pro
hunyuan-standard
hunyuan-standard-256k
hunyuan-embedding
hunyuan-pro(限时限额)
hunyuan-standard(限时限额)
hunyuan-standard-256k(限时限额)
hunyuan-embedding(限时限额)限制并发数为5路
访问链接链接
讯飞星火Spark Lite
Spark Pro
Spark3.5 Max
tokens:总量无限;QPS:2;有效期:不限
Spark Pro和Spark3.5 Max限时限额
访问链接文档查看
Google Geminigemini-1.5-pro
gemini-1.5-flash
gemini-1.0-pro
15RPM(每分钟请求数);100万TPM(每分钟令牌);1500RPD(每天请求数)访问链接文档查看
Cloudflare Workers AIwhisper
whisper-tiny-en
resnet-50
llava-1.5-7b-hf
uform-gen2-qwen-500m
detr-resnet-50
bart-large-cnn
distilbert-sst-2-int8
bge-base-en-v1.5
bge-large-en-v1.5
bge-small-en-v1.5
llama-2-7b-chat-fp16
llama-2-7b-chat-int8
mistral-7b-instruct-v0.1
deepseek-coder-6.7b-base-awq
deepseek-coder-6.7b-instruct-awq
deepseek-math-7b-base
deepseek-math-7b-instruct
discolm-german-7b-v1-awq
falcon-7b-instruct
gemma-2b-it-lora
gemma-7b-it
gemma-7b-it-lora
hermes-2-pro-mistral-7b
llama-2-13b-chat-awq
llama-2-7b-chat-hf-lora
llama-3-8b-instruct
llama-3-8b-instruct-awq
llamaguard-7b-awq
mistral-7b-instruct-v0.1-awq
mistral-7b-instruct-v0.2
mistral-7b-instruct-v0.2-lora
neural-chat-7b-v3-1-awq
openchat-3.5-0106
openhermes-2.5-mistral-7b-awq
phi-2
qwen1.5-0.5b-chat
qwen1.5-1.8b-chat
qwen1.5-14b-chat-awq
qwen1.5-7b-chat-awq
sqlcoder-7b-2
starling-lm-7b-
tinyllama-1.1b-chat-v1.0
una-cybertron-7b-v2-bf16
zephyr-7b--awq
stable-diffusion-v1-5-img2img
stable-diffusion-v1-5-inpainting
stable-diffusion-xl-base-1.0
stable-diffusion-xl-lightning
m2m100-1.2b
免费可以每天使用1万次,一个月可以30万次;测试版本本的模型无限制访问链接文档查看
字节扣子(coze.cn)豆包·Function call模型 32K
豆包·角色扮演模型 32K
通义千问-Max 8K
智谱 GLM-4 128K
MiniMax 6.5s 245K
Moonshot 8K
Moonshot 32K
Moonshot 128K
百川智能 Baichuan4 32K
当前扣子API免费供开发者使用,每个空间的API请求限额如下:QPS(每秒发送的请求数):2;QPM(每分钟发送的请求数):60;QPD(每天发送的请求数):3000访问链接文档查看
字节火山方舟Doubao-lite-4k
Doubao-lite-32k
Doubao-lite-128k
Doubao-pro-4k
Doubao-pro-32k
Doubao-pro-128k
Doubao-embedding
Doubao-声音复刻
豆包-文生图模型-智能绘图
Llama3-8B
Llama3-70B
Moonshot-v1-8k
Moonshot-v1-32k
Moonshot-v1-128k
GLM3-130B
GLM3-130B金融模型
Mistral-7B
2024年5月15日至8月30日期间,为您提供一次独特的机会,即高达5亿tokens的免费权益。访问链接文档查看
Llama FamilyAtom-13B-Chat
Atom-7B-Chat
Atom-1B-Chat
Llama3-Chinese-8B-Instruct
1.每天8-22点:接口限速每分钟20次并发;2.每天22-次日8点:接口限速每分钟50次并发访问链接文档查看
groqgemma-7b-it
mixtral-8x7b-32768
llama3-70b-8192
llama3-8b-8192
rpm为30,rpd为14400,TOKENSPERMINUTE也有限制访问链接文档查看
硅基流动Qwen/Qwen2-7B-Instruct
Qwen/Qwen2-1.5B-Instruct
Qwen/Qwen1.5-7B-Chat
THUDM/glm-4-9b-chat
THUDM/chatglm3-6b
01-ai/Yi-1.5-9B-Chat-16K
01-ai/Yi-1.5-6B-Chat
访问链接文档查看
groqgemma-7b-it
mixtral-8x7b-32768
llama3-70b-8192
llama3-8b-8192
rpm为30,rpd为14400,TOKENSPERMINUTE也有限制访问链接文档查看
阿里qwen-long
qwen-turbo
qwen-plus
qwen-max
qwen-max-longcontext
qwen-audio-turbo
qwen-audio-chat
llama3-8b-instruct
llama3-70b-instruct
llama2-7b-chat-v2
llama2-13b-chat-v2
qwen-vl-v1
qwen-vl-chat-v1
qwen2-1.5b-instruct
qwen2-0.5b-instruct
qwen1.5-1.8b-chat
qwen1.5-0.5b-chat
qwen1.5-110b-chat
qwen-1.8b-chat
baichuan-7b-v1
chatglm3-6b
yi-6b-chat
yi-34b-chat
aquilachat-7b
deepseek-7b-chat
internlm-7b-chat
belle-llama-13b-2m-v1
dolly-12b-v2
访问链接文档查看