人工智能博客

深度追踪生成式AI技术演进、大模型商业落地及AI2.0时代产业重构，为决策者提供战略级信息坐标，呈现人工智能改变世界的每一个关键节点。

生成式人工智能API免费的大模型列表

生成式人工智能API免费的大模型列表

大模型	免费版本	免费限制	控制台	文档地址
百度千帆	ERNIE-Speed-8K ERNIE-Speed-128K ERNIE Speed-AppBuilder ERNIE-Lite-8K-0922 ERNIE-Lite-8K ERNIE-Tiny-8K Yi-34B-Chat Fuyu-8B	Yi-34B-Chat（限额） Fuyu-8B（限额） Lite、Speed-8K：RPM=300，TPM=300000 Speed-128K：RPM=60，TPM=300000	访问链接	文档查看
腾讯混元	hunyuan-lite hunyuan-pro hunyuan-standard hunyuan-standard-256k hunyuan-embedding	hunyuan-pro（限时限额） hunyuan-standard（限时限额） hunyuan-standard-256k（限时限额） hunyuan-embedding（限时限额）限制并发数为5路	访问链接	链接
讯飞星火	Spark Lite Spark Pro Spark3.5 Max	tokens：总量无限；QPS：2；有效期：不限 Spark Pro和Spark3.5 Max限时限额	访问链接	文档查看
Google Gemini	gemini-2.0-flash gemini-2.0-flash-lite-preview-02-05 gemini-2.0-pro-exp-02-05 gemini-2.0-flash-thinking-exp-01-21 gemini-2.0-flash-exp gemini-1.5-pro gemini-1.5-flash gemini-1.5-flash-8b	15RPM（每分钟请求数）;100万TPM（每分钟令牌）;1500RPD（每天请求数）	访问链接	文档查看
Cloudflare Workers AI	whisper whisper-tiny-en resnet-50 llava-1.5-7b-hf uform-gen2-qwen-500m detr-resnet-50 bart-large-cnn distilbert-sst-2-int8 bge-base-en-v1.5 bge-large-en-v1.5 bge-small-en-v1.5 llama-2-7b-chat-fp16 llama-2-7b-chat-int8 mistral-7b-instruct-v0.1 deepseek-coder-6.7b-base-awq deepseek-coder-6.7b-instruct-awq deepseek-math-7b-base deepseek-math-7b-instruct discolm-german-7b-v1-awq falcon-7b-instruct gemma-2b-it-lora gemma-7b-it gemma-7b-it-lora hermes-2-pro-mistral-7b llama-2-13b-chat-awq llama-2-7b-chat-hf-lora llama-3-8b-instruct llama-3-8b-instruct-awq llamaguard-7b-awq mistral-7b-instruct-v0.1-awq mistral-7b-instruct-v0.2 mistral-7b-instruct-v0.2-lora neural-chat-7b-v3-1-awq openchat-3.5-0106 openhermes-2.5-mistral-7b-awq phi-2 qwen1.5-0.5b-chat qwen1.5-1.8b-chat qwen1.5-14b-chat-awq qwen1.5-7b-chat-awq sqlcoder-7b-2 starling-lm-7b- tinyllama-1.1b-chat-v1.0 una-cybertron-7b-v2-bf16 zephyr-7b--awq stable-diffusion-v1-5-img2img stable-diffusion-v1-5-inpainting stable-diffusion-xl-base-1.0 stable-diffusion-xl-lightning m2m100-1.2b	免费可以每天使用1万次，一个月可以30万次；测试版本本的模型无限制	访问链接	文档查看
字节扣子(coze.cn)	豆包·Function call模型 32K 豆包·角色扮演模型 32K 通义千问-Max 8K 智谱 GLM-4 128K MiniMax 6.5s 245K Moonshot 8K Moonshot 32K Moonshot 128K 百川智能 Baichuan4 32K	当前扣子API免费供开发者使用，每个空间的API请求限额如下：QPS(每秒发送的请求数)：2；QPM(每分钟发送的请求数)：60；QPD(每天发送的请求数)：3000	访问链接	文档查看
字节火山方舟	Doubao-lite-4k Doubao-lite-32k Doubao-lite-128k Doubao-pro-4k Doubao-pro-32k Doubao-pro-128k Doubao-embedding Doubao-声音复刻豆包-文生图模型-智能绘图 Llama3-8B Llama3-70B Moonshot-v1-8k Moonshot-v1-32k Moonshot-v1-128k GLM3-130B GLM3-130B金融模型 Mistral-7B	2024年5月15日至8月30日期间，为您提供一次独特的机会，即高达5亿tokens的免费权益。	访问链接	文档查看
Llama Family	Atom-13B-Chat Atom-7B-Chat Atom-1B-Chat Llama3-Chinese-8B-Instruct	1.每天8-22点：接口限速每分钟20次并发；2.每天22-次日8点：接口限速每分钟50次并发	访问链接	文档查看
groq	deepseek-r1-distill-llama-70b llama-3.3-70b-versatile llama-3.3-70b-specdec llama-3.2-1b-preview llama-3.2-3b-preview llama-3.1-8b-instant llama3-70b-8192 llama3-8b-8192 llama-guard-3-8b mixtral-8x7b-32768 gemma2-9b-it whisper-large-v3 whisper-large-v3-turbo distil-whisper-large-v3-en llama-3.2-11b-vision-preview llama-3.2-90b-vision-preview	rpm为30，rpd为14400，TOKENSPERMINUTE也有限制	访问链接	文档查看
硅基流动	Qwen/Qwen2-7B-Instruct Qwen/Qwen2-1.5B-Instruct Qwen/Qwen1.5-7B-Chat THUDM/glm-4-9b-chat THUDM/chatglm3-6b 01-ai/Yi-1.5-9B-Chat-16K 01-ai/Yi-1.5-6B-Chat		访问链接	文档查看
groq	gemma-7b-it mixtral-8x7b-32768 llama3-70b-8192 llama3-8b-8192	rpm为30，rpd为14400，TOKENSPERMINUTE也有限制	访问链接	文档查看
阿里	qwen-long qwen-turbo qwen-plus qwen-max qwen-max-longcontext qwen-audio-turbo qwen-audio-chat llama3-8b-instruct llama3-70b-instruct llama2-7b-chat-v2 llama2-13b-chat-v2 qwen-vl-v1 qwen-vl-chat-v1 qwen2-1.5b-instruct qwen2-0.5b-instruct qwen1.5-1.8b-chat qwen1.5-0.5b-chat qwen1.5-110b-chat qwen-1.8b-chat baichuan-7b-v1 chatglm3-6b yi-6b-chat yi-34b-chat aquilachat-7b deepseek-7b-chat internlm-7b-chat belle-llama-13b-2m-v1 dolly-12b-v2		访问链接	文档查看