生成式人工智能API免费的大模型列表
生成式人工智能API免费的大模型列表
大模型 | 免费版本 | 免费限制 | 控制台 | 文档地址 |
---|---|---|---|---|
百度千帆 | ERNIE-Speed-8K ERNIE-Speed-128K ERNIE Speed-AppBuilder ERNIE-Lite-8K-0922 ERNIE-Lite-8K ERNIE-Tiny-8K Yi-34B-Chat Fuyu-8B | Yi-34B-Chat(限额) Fuyu-8B(限额) Lite、Speed-8K:RPM=300,TPM=300000 Speed-128K:RPM=60,TPM=300000 | 访问链接 | 文档查看 |
腾讯混元 | hunyuan-lite hunyuan-pro hunyuan-standard hunyuan-standard-256k hunyuan-embedding | hunyuan-pro(限时限额) hunyuan-standard(限时限额) hunyuan-standard-256k(限时限额) hunyuan-embedding(限时限额)限制并发数为5路 | 访问链接 | 链接 |
讯飞星火 | Spark Lite Spark Pro Spark3.5 Max | tokens:总量无限;QPS:2;有效期:不限 Spark Pro和Spark3.5 Max限时限额 | 访问链接 | 文档查看 |
Google Gemini | gemini-1.5-pro gemini-1.5-flash gemini-1.0-pro | 15RPM(每分钟请求数);100万TPM(每分钟令牌);1500RPD(每天请求数) | 访问链接 | 文档查看 |
Cloudflare Workers AI | whisper whisper-tiny-en resnet-50 llava-1.5-7b-hf uform-gen2-qwen-500m detr-resnet-50 bart-large-cnn distilbert-sst-2-int8 bge-base-en-v1.5 bge-large-en-v1.5 bge-small-en-v1.5 llama-2-7b-chat-fp16 llama-2-7b-chat-int8 mistral-7b-instruct-v0.1 deepseek-coder-6.7b-base-awq deepseek-coder-6.7b-instruct-awq deepseek-math-7b-base deepseek-math-7b-instruct discolm-german-7b-v1-awq falcon-7b-instruct gemma-2b-it-lora gemma-7b-it gemma-7b-it-lora hermes-2-pro-mistral-7b llama-2-13b-chat-awq llama-2-7b-chat-hf-lora llama-3-8b-instruct llama-3-8b-instruct-awq llamaguard-7b-awq mistral-7b-instruct-v0.1-awq mistral-7b-instruct-v0.2 mistral-7b-instruct-v0.2-lora neural-chat-7b-v3-1-awq openchat-3.5-0106 openhermes-2.5-mistral-7b-awq phi-2 qwen1.5-0.5b-chat qwen1.5-1.8b-chat qwen1.5-14b-chat-awq qwen1.5-7b-chat-awq sqlcoder-7b-2 starling-lm-7b- tinyllama-1.1b-chat-v1.0 una-cybertron-7b-v2-bf16 zephyr-7b--awq stable-diffusion-v1-5-img2img stable-diffusion-v1-5-inpainting stable-diffusion-xl-base-1.0 stable-diffusion-xl-lightning m2m100-1.2b | 免费可以每天使用1万次,一个月可以30万次;测试版本本的模型无限制 | 访问链接 | 文档查看 |
字节扣子(coze.cn) | 豆包·Function call模型 32K 豆包·角色扮演模型 32K 通义千问-Max 8K 智谱 GLM-4 128K MiniMax 6.5s 245K Moonshot 8K Moonshot 32K Moonshot 128K 百川智能 Baichuan4 32K | 当前扣子API免费供开发者使用,每个空间的API请求限额如下:QPS(每秒发送的请求数):2;QPM(每分钟发送的请求数):60;QPD(每天发送的请求数):3000 | 访问链接 | 文档查看 |
字节火山方舟 | Doubao-lite-4k Doubao-lite-32k Doubao-lite-128k Doubao-pro-4k Doubao-pro-32k Doubao-pro-128k Doubao-embedding Doubao-声音复刻 豆包-文生图模型-智能绘图 Llama3-8B Llama3-70B Moonshot-v1-8k Moonshot-v1-32k Moonshot-v1-128k GLM3-130B GLM3-130B金融模型 Mistral-7B | 2024年5月15日至8月30日期间,为您提供一次独特的机会,即高达5亿tokens的免费权益。 | 访问链接 | 文档查看 |
Llama Family | Atom-13B-Chat Atom-7B-Chat Atom-1B-Chat Llama3-Chinese-8B-Instruct | 1.每天8-22点:接口限速每分钟20次并发;2.每天22-次日8点:接口限速每分钟50次并发 | 访问链接 | 文档查看 |
groq | gemma-7b-it mixtral-8x7b-32768 llama3-70b-8192 llama3-8b-8192 | rpm为30,rpd为14400,TOKENSPERMINUTE也有限制 | 访问链接 | 文档查看 |
硅基流动 | Qwen/Qwen2-7B-Instruct Qwen/Qwen2-1.5B-Instruct Qwen/Qwen1.5-7B-Chat THUDM/glm-4-9b-chat THUDM/chatglm3-6b 01-ai/Yi-1.5-9B-Chat-16K 01-ai/Yi-1.5-6B-Chat | 访问链接 | 文档查看 | |
groq | gemma-7b-it mixtral-8x7b-32768 llama3-70b-8192 llama3-8b-8192 | rpm为30,rpd为14400,TOKENSPERMINUTE也有限制 | 访问链接 | 文档查看 |
阿里 | qwen-long qwen-turbo qwen-plus qwen-max qwen-max-longcontext qwen-audio-turbo qwen-audio-chat llama3-8b-instruct llama3-70b-instruct llama2-7b-chat-v2 llama2-13b-chat-v2 qwen-vl-v1 qwen-vl-chat-v1 qwen2-1.5b-instruct qwen2-0.5b-instruct qwen1.5-1.8b-chat qwen1.5-0.5b-chat qwen1.5-110b-chat qwen-1.8b-chat baichuan-7b-v1 chatglm3-6b yi-6b-chat yi-34b-chat aquilachat-7b deepseek-7b-chat internlm-7b-chat belle-llama-13b-2m-v1 dolly-12b-v2 | 访问链接 | 文档查看 |