更新公告
平台服务调整通知
为了进一步优化资源配置,提供更先进和优质的技术服务,平台将于 2026-04-29 对下列模型进行下线处理:
- Kwaipilot/KAT-Dev
- PaddlePaddle/PaddleOCR-VL
- Qwen/QwQ-32B
- Qwen/Qwen2.5-VL-32B-Instruct
- Qwen/Qwen2.5-VL-72B-Instruct
- deepseek-ai/DeepSeek-R1-Distill-Qwen-32B
- deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
- deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
- Qwen/Qwen2.5-Coder-32B-Instruct
- Qwen/Qwen2-VL-72B-Instruct
- internlm/internlm2_5-7b-chat
- IndexTeam/IndexTTS-2
若您正在使用上述任一模型,建议您尽快切换到其他模型,以免服务受到影响。
平台服务调整通知
为了进一步优化资源配置,提供更先进和优质的技术服务,平台将于 2026-04-22 对下列模型进行下线处理:
- Qwen/Qwen3-Coder-480B-A35B-Instruct
- Qwen/Qwen3-235B-A22B-Thinking-2507
- Qwen/Qwen3-VL-235B-A22B-Thinking
- Qwen/Qwen3-VL-235B-A22B-Instruct
- deepseek-ai/DeepSeek-V2.5
- baidu/ERNIE-4.5-300B-A47B
- ascend-tribe/pangu-pro-moe
若您正在使用上述任一模型,建议您尽快切换到其他模型,以免服务受到影响。
平台服务调整通知
为了进一步优化资源配置,提供更先进和优质的技术服务,平台将于 2026-03-17 对下列模型进行下线处理:
- Pro/MiniMaxAI/MiniMax-M2.1
- Pro/Qwen/Qwen2-7B-Instruct
- Qwen/Qwen2-7B-Instruct
- Pro/THUDM/glm-4-9b-chat
- THUDM/glm-4-9b-chat
- deepseek-ai/deepseek-vl2
- Pro/Qwen/Qwen2.5-VL-7B-Instruct
- Qwen/Qwen3-Next-80B-A3B-Thinking
- Qwen/Qwen3-Next-80B-A3B-Instruct
- Qwen/Qwen2.5-Coder-7B-Instruct
- Pro/Qwen/Qwen2.5-Coder-7B-Instruct
若您正在使用上述任一模型,建议您尽快切换到其他模型,以免服务受到影响。
平台服务调整通知
为了进一步优化资源配置,提供更先进和优质的技术服务,平台将于 2026-02-09 对下列模型进行下线处理:
- MiniMaxAI/MiniMax-M2
- MiniMaxAI/MiniMax-M1-80k
- moonshotai/Kimi-Dev-72B
- Pro/THUDM/GLM-4.1V-9B-Thinking
- Tongyi-Zhiwen/QwenLong-L1-32B
- Qwen/QVQ-72B-Preview
- THUDM/GLM-Z1-Rumination-32B-0414
- Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
- Qwen/Qwen3-30B-A3B
- stepfun-ai/step3
若您正在使用上述任一模型,建议您尽快切换到其他模型,以免服务受到影响。
平台服务调整通知
为了进一步优化资源配置,提供更先进和优质的技术服务,平台将于 2025-12-31 对下列模型进行下线处理:
- zai-org/GLM-4.5
- Qwen/Qwen3-235B-A22B
若您正在使用上述任一模型,建议您尽快切换到其他模型,以免服务受到影响。
平台赠送余额服务调整说明
为更好地保障您的平台权益、提升资源使用效率,平台对赠送余额服务展示形式进行如下调整:
- 2025 年 11 月 30 日前已使用的赠送余额,统一转化为一张已用尽代金券:
- 该代金券总金额、已使用金额均为您历史累计已消耗的赠送余额;
- 该代金券当前剩余可用金额为 0,仅用于记录历史权益,对后续业务不产生影响。
- 2025 年 11 月 30 日前已获得,但尚未使用的赠送余额,转化为一张可用代金券:
- 该代金券总额与 11 月 30 日剩余赠送余额一致;
- 目前,该代金券可用范围与此前的赠送余额可用范围保持一致,可正常抵扣使用,如后续可用范围调整以代金券描述范围为准;
- 该代金券有效期至 2099-12-31 23:59:59
- 2025 年 11 月 30 日后,平台激励以代金券形式发放。。
您可前往 【余额充值 > 代金券】 点击代金券数量,查看代金券列表及代金券详情。
平台服务调整通知
为进一步优化模型服务质量,平台将于今明两日逐步更新Deepseek-V3.2-Exp模型为Deepseek-V3.2版本。您对Pro/deepseek-ai/DeepSeek-V3.2-Exp、deepseek-ai/DeepSeek-V3.2-Exp的请求将分别指向Pro/deepseek-ai/DeepSeek-V3.2、deepseek-ai/DeepSeek-V3.2。
平台服务调整通知
为了进一步优化资源配置,提供更先进和优质的技术服务,平台将于 2025-11-20 对下列模型进行下线处理:
- inclusionAI/Ling-1T
- inclusionAI/Ring-1T
若您正在使用上述任一模型,建议您尽快切换到其他模型,以免服务受到影响。
平台服务调整通知
为进一步优化资源配置,提供更高效、稳定的算力服务,平台将于2025 年 11 月 11 日起对部分模型 Rate Limits 进行调整。
此次调整的模型是:Pro/deepseek-ai/DeepSeek-R1,Pro/deepseek-ai/DeepSeek-V3,Pro/deepseek-ai/DeepSeek-V3.1-Terminus,zai-org/GLM-4.6,inclusionAI/Ling-1T,inclusionAI/Ring-1T,MiniMaxAI/MiniMax-M2;
如您业务对高并发或大规模吞吐有特殊需求,可联系我们申请更高额度。
感谢您的理解与支持。
平台服务调整通知
为了进一步优化资源配置,提供更先进和优质的技术服务,平台将于 2025-10-09 对下列模型进行下线处理:
- deepseek-ai/DeepSeek-V3.1
- Pro/deepseek-ai/DeepSeek-V3.1 若您正在使用上述任一模型,建议您尽快切换到 V3.1 Terminus,以免服务受到影响。
平台服务调整通知
为进一步优化模型服务质量,平台已于 09 月 15 更新 moonshotai/Kimi-K2-Instruct 和 Pro/moonshotai/Kimi-K2-Instruct 模型至最新的 0905 版本,此前的 0711 版本不再继续提供。 模型广场中moonshotai/Kimi-K2-Instruct 和 Pro/moonshotai/Kimi-K2-Instruct 已经下线,所有对应模型请求将被分别指向 moonshotai/Kimi-K2-Instruct-0905 和 Pro/moonshotai/Kimi-K2-Instruct-0905。
平台服务调整通知
为了进一步优化资源配置,提供更先进和优质的技术服务,平台将于 2025 年 9 月 4 日 对下列模型进行下线处理:
- tencent/HunyuanVideo-HD
- Wan-AI/Wan2.1-I2V-14B-720P-Turbo
- Wan-AI/Wan2.1-I2V-14B-720P
- Wan-AI/Wan2.1-T2V-14B-Turbo
- Wan-AI/Wan2.1-T2V-14B
若您正在使用上述任一模型,建议您尽快切换到其他模型,以免服务受到影响。
平台服务调整通知
为了进一步优化资源配置,提供更先进和优质的技术服务,平台将于 2025 年 7 月 3 日 对下列模型进行下线处理:
- Pro/deepseek-ai/DeepSeek-R1-0120
- Pro/deepseek-ai/DeepSeek-V3-1226
- Qwen/QwQ-32B-Preview
若您正在使用上述任一模型,建议您尽快切换到其他模型,以免服务受到影响。
平台维护预告
为提供更加丰富、先进、优质的服务,平台将于 2025 年 6 月 10 日 23 时至 11 日 8 时进行维护。
受系统维护影响:
- cloud.siliconflow.cn 将暂停注册、登录以及包括不限于下列功能的界面操作:
- 模型在线体验/微调/批量推理;
- 官网模型广场查看模型列表及详细信息;
- 在线充值、购买等级包、查询账单、开具发票等;
/user/infoAPI 调整,name/image/email字段将不再返回,固定输出空字符串;
平台 API 服务不受维护影响,可以持续调用,建议您提前关注账户余额,以免因为余额不足导致服务受限。
平台服务调整通知
SiliconFlow 将启动 DeepSeek R1 模型更新。
对于 deepseek-ai/DeepSeek-R1 和 Pro/deepseek-ai/DeepSeek-R1 模型,将“逐步“更新到最新 0528 版本。
更新完成后,上述两个款模型均为 0528 版本。如有需求,在 2025 年 06 月 28 日前,您仍可以通过 Pro/deepseek-ai/DeepSeek-R1-0120 使用旧版模型,以更平滑地完成业务切换。
平台服务调整通知
为了进一步优化资源配置,提供更先进和优质的技术服务,平台将于 2025 年 6 月 5 日 对下列模型进行下线处理:
- Qwen/Qwen2-1.5B-Instruct
- Pro/Qwen/Qwen2-1.5B-Instruct
- Pro/Qwen/Qwen2-VL-7B-Instruct
- THUDM/chatglm3-6b
- internlm/internlm2_5-20b-chat
- deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
- Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
若您正在使用上述任一模型,建议您尽快切换到其他模型,以免服务受到影响。
平台服务调整通知
为了进一步优化资源配置,提供更先进和优质的技术服务,平台将于 2025 年 4 月 29 日 对 HunyuanVideo 模型(非 HunyuanVideo-HD)模型进行下线处理。
若您正在使用该模型,建议您尽快切换其他模型,以免服务受到影响。
平台服务调整通知
截止目前,Pro/deepseek-ai/DeepSeek-V3 和 deepseek-ai/DeepSeek-V3 模型已经更新至最新的 0324 版本。您仍可以通过 Pro/deepseek-ai/DeepSeek-V3-1226 使用旧版模型,以更平滑地完成业务切换。
平台服务调整通知
SiliconFlow 将启动 DeepSeek V3 模型更新。
对于 deepseek-ai/DeepSeek-V3 和 Pro/deepseek-ai/DeepSeek-V3 模型,将“逐步“更新到最新 0324 版本。
更新完成后,上述两个款模型均为 0324 版本。如有需求,在 2025 年 4 月 30 日前,您仍可以通过 deepseek-ai/DeepSeek-V3-1226 使用旧版模型,以更平滑地完成业务切换。
平台服务调整通知
为了更好的服务全球开发者用户,SiliconFlow 即将上线国际站,并逐步开设多个服务区域。
受此调整影响,现有api.siliconflow.com API端点将适时回收,请您尽快切换为api.siliconflow.cn继续使用。
我们已经为.cn端点配置了全球访问加速(GTM),使其与当前的.com端点具有相同的全球接入体验,您只需要将 API 请求的base URL修改为api.siliconflow.cn即可。
我们建议您在本月底(3 月 31 日)前完成迁移,如有任何疑问,请随时联系我们。
平台服务调整通知
为持续提升用户体验,现调整 Rate Limits 策略如下:
去掉 deepseek-ai/DeepSeek-R1、deepseek-ai/DeepSeek-V3 的 RPH 和 RPD 限流
随着流量和负载变化,策略可能会不定时调整,硅基流动保留解释权。
平台服务调整通知
1. 模型下线通知
为了进一步优化资源配置,提供更先进、优质、合规的技术服务,平台将于 2025 年 3 月 6 日 对部分模型进行下线处理。 具体涉及的模型列表如下:
- 对话模型
- AIDC-AI/Marco-o1
- meta-llama/Meta-Llama-3.1-8B-Instruct
- Pro/meta-llama/Meta-Llama-3.1-8B-Instruct
- meta-llama/Meta-Llama-3.1-70B-Instruct
- meta-llama/Meta-Llama-3.1-405B-Instruct
- meta-llama/Llama-3.3-70B-Instruct
- 生图模型
- black-forest-labs/FLUX.1-schnell
- Pro/black-forest-labs/FLUX.1-schnell
- black-forest-labs/FLUX.1-dev
- black-forest-labs/FLUX.1-pro
- stabilityai/stable-diffusion-xl-base-1.0
- stabilityai/stable-diffusion-3-5-large
- stabilityai/stable-diffusion-3-5-large-turbo
- stabilityai/stable-diffusion-2-1
- deepseek-ai/Janus-Pro-7B
- 语音模型
- fishaudio/fish-speech-1.5
- FunAudioLLM/SenseVoiceSmall
- fishaudio/fish-speech-1.4
- RVC-Boss/GPT-SoVITS
- 视频模型
- Lightricks/LTX-Video
- genmo/mochi-1-preview
平台服务调整通知
为保障平台服务质量与资源合理分配,现调整Rate Limits策略如下:
一、调整内容
-
新增 RPH 限制(Requests Per Hour,每小时请求数)
- 模型范围:deepseek-ai/DeepSeek-R1、deepseek-ai/DeepSeek-V3
- 适用对象:所有用户
- 限制标准:30次/小时
-
新增 RPD 限制(Requests Per Day,每日请求数)
- 模型范围:deepseek-ai/DeepSeek-R1、deepseek-ai/DeepSeek-V3
- 适用对象:未完成实名认证用户
- 限制标准:100次/天
随着流量和负载变化,策略可能会不定时调整,硅基流动保留解释权。
平台服务调整通知
1. 模型下线通知
为了提供更稳定、高质量、可持续的服务,以下模型将于 2025 年 02 月 27 日下线:
- 01-ai/Yi-1.5-34B-Chat-16K
- 01-ai/Yi-1.5-6B-Chat
- 01-ai/Yi-1.5-9B-Chat-16K
- stabilityai/stable-diffusion-3-medium
- google/gemma-2-27b-it
- google/gemma-2-9b-it
- Pro/google/gemma-2-9b-it
如果您有使用上述模型,建议尽快迁移至平台上的其他模型。
平台服务调整通知
deepseek-ai/DeepSeek-V3 模型的价格于北京时间 2025年2月9日00:00 起恢复至原价
具体价格:
- 输入:¥2/ M Tokens
- 输出:¥8/ M Tokens
推理模型输出调整通知
推理模型思维链的展示方式,从之前的 content 中的 <think></think> 独立成单独的单独的 reasoning_content 字段,兼容 OpenAI 和 deepseek api 规范,便于各个框架和上层应用在进行多轮会话时进行裁剪。使用方式详见推理模型(DeepSeek-R1)使用。
平台服务调整通知
支持deepseek-ai/DeepSeek-R1和deepseek-ai/DeepSeek-V3模型
具体价格如下:
deepseek-ai/DeepSeek-R1输入:¥4/ M Tokens 输出:¥16/ M Tokensdeepseek-ai/DeepSeek-V3- 即日起至北京时间 2025-02-08 24:00 享受限时折扣价:输入:
¥2¥1/ M Tokens 输出:¥8¥2/ M Tokens,2025-02-09 00:00恢复原价。
- 即日起至北京时间 2025-02-08 24:00 享受限时折扣价:输入:
平台服务调整通知
生成图片及视频 URL 有效期调整为 1 小时
为了持续为您提供更先进、优质的技术服务,从 2025 年 1 月 20 日起,大模型生成的图片、视频 URL 有效期将调整为 1 小时。
若您正在使用图片、视频生成服务,请及时做好转存工作,避免因 URL 过期而影响业务。
平台服务调整通知
LTX-Video 模型即将开始计费通知
为了持续为您提供更先进、优质的技术服务,平台将于 2025 年 1 月 6 日起对 Lightricks/LTX-Video 模型的视频生成请求进行计费,价格为 0.14 元 / 视频。
平台服务调整通知
1. 模型下线通知
为了提供更稳定、高质量、可持续的服务,以下模型将于 2024 年 12 月 19 日下线:
- deepseek-ai/DeepSeek-V2-Chat
- Qwen/Qwen2-72B-Instruct
- Vendor-A/Qwen/Qwen2-72B-Instruct
- OpenGVLab/InternVL2-Llama3-76B
如果您有使用上述模型,建议尽快迁移至平台上的其他模型。
平台服务调整通知
1. 模型下线通知
为了提供更稳定、高质量、可持续的服务,以下模型将于 2024 年 11 月 22 日下线:
- deepseek-ai/DeepSeek-Coder-V2-Instruct
- Qwen/Qwen2-57B-A14B-Instruct
- Pro/internlm/internlm2_5-7b-chat
- Pro/THUDM/chatglm3-6b
- Pro/01-ai/Yi-1.5-9B-Chat-16K
- Pro/01-ai/Yi-1.5-6B-Chat
如果您有使用上述模型,建议尽快迁移至平台上的其他模型。
2.邮箱登录方式更新
为进一步提升服务体验,平台将于 2024 年 11 月 22 日起调整登录方式:由原先的“邮箱账户 + 密码”方式更新为“邮箱账户 + 验证码”方式。
3. 新增海外 API 端点
新增支持海外用户的平台端点:https://api-st.siliconflow.cn。如果您在使用源端点 https://api.siliconflow.cn 时遇到网络连接问题,建议切换至新端点尝试。
部分模型计价调整公告
为了提供更加稳定、优质、可持续的服务,Vendor-A/Qwen/Qwen2-72B-Instruct 限时免费模型将于 2024 年 10 月 17 日开始计费。计费详情如下:
- 限时折扣价:¥ 1.00 / M tokens
- 原价:¥ 4.13 / M tokens(恢复原价时间另行通知)