模型 API 服务 发版记录📝
2025年4月28日-4月30日
新增功能☁️
-
图像/视频 API 新增速率限制机制
图像、视频类 API 产品现已支持 Rate Limit(速率限制)机制,用于控制调用频率,提升接口稳定性与服务公平性:
- IPM(Image Per Minute):限制每分钟可生成的图像数量;
- RPM(Requests Per Minute):限制每分钟的 API 请求次数。
当调用频率超过限制时,将返回速率限制提示。建议合理安排调用计划,避免请求被限制。如需更高调用频率,可提交申请。
更新时间:2025-04-30
-
上线 Qwen3 系列模型
上线 Qwen3 系列模型: Qwen3 0.6B 、Qwen3 1.7B 、 Qwen3 4B 、 Qwen3 8B 以及 Qwen3 14B ,其中 Qwen3 0.6B 、 Qwen3 1.7B 与 Qwen3 4B 为限时免费模型。
更新时间:2025-04-30
-
大语言模型 API 速率限制(Rate Limits)规则更新
根据用户 最近充值金额,系统自动划分为 L1-L5 五个服务级别,不同级别对应不同的 RPM(每分钟请求数) 和 TPM(每分钟 Token 数) 限制。详情请查看文档:调用频率控制(Rate Limits)。
更新时间:2025-04-30
-
上线 Deepseek 新模型
上线 Deepseek 新模型 Deepseek Prover V2 671B 。
更新时间:2025-04-30
-
首批大参数 Qwen3 模型上线
上线大参数 Qwen3 模型 Qwen3-235B-A22B 、Qwen3-30B-A3B 以及 Qwen3-32B 。
更新时间:2025-04-29
2025年4月21日-4月25日
新增功能 👏
-
GLM-4-0414 系列及 Qwen2.5-7B-Instruct 模型上新
今年3月,智谱曾预告会在 4 月中旬开源新的GLM模型,现在,GLM-4-0414 系列准时登场。此次开源的新模型覆盖基座、推理、沉思三大类型,根据官方公布数据显示,部分模型可在性能上比肩 OpenAI 的 GPT-4o 和 DeepSeek 的 V3/R1 系列模型。
作为一站式 AIGC 云服务平台,PPIO 派欧云随即上线了上述模型及 Qwen2.5-7B-Instruct 限时免费版,并对模型进行了全链路优化,在保持原始模型精度的前提下大幅降低推理延迟,开发者通过 API 接口即可高效调用模型。
- thudm/glm-4-9b-0414
- thudm/glm-z1-9b-0414
- thudm/glm-z1-32b-0414
- thudm/glm-4-32b-0414
- thudm/glm-z1-rumination-32b-0414
更新时间:2025-04-25
2025年4月14日-4月18日
新增功能 🤩
-
邀请活动更新
-
在本次规则调整中,对邀请所得代金券的使用范围进行了扩大:代金券支持用于 PPIO 派欧云所有大语言模型
-
针对部分模型开放了限时免费。以下是开放免费使用的模型列表:
baai/bge-m3
thudm/glm-4-9b-chat
qwen/qwen2.5-7b-instruct
meta-llama/llama-3.2-1b-instruct
meta-llama/llama-3.2-3b-instruct
-
RPM 限制调整:对于账户有余额的付费用户,RPM 限制进行了放宽。详情见 RPM 限制文档页:https://ppio.cn/docs/model/llm-rate-limits
更新时间:2025-04-17
-
-
控制台支持大语言模型 rate limit 展示
控制台现已支持 大语言模型的速率限制信息展示,用户可直观查看各模型的默认请求速率,便于合理规划调用频率。
同时,新增速率限制变更申请入口,支持根据业务需求提交速率提升申请。
更新时间:2025-04-17
-
meta-llama/llama-4-maverick-17b-128e-instruct-fp8 上线 Function Calling 功能
meta-llama/llama-4-maverick-17b-128e-instruct-fp8
模型支持 Function Calling 功能。使用方法见接口文档。更新时间:2025-04-14
-
meta-llama/llama-4-scout-17b-16e-instruct 上线 Function Calling 功能
meta-llama/llama-4-scout-17b-16e-instruct
模型支持 Function Calling 功能。使用方法见接口文档。更新时间:2025-04-14
已知问题修复🚩
-
模型广场切换模型时,网页 URL 同步更新
使用模型广场切换模型,网页 URL 会根据模型名称同步更新。
更新时间:2025-04-17
2025年4月7日-4月11日
新增功能 📤
-
新增模型:meta-llama/llama-4-maverick-17b-128e-instruct-fp8
派欧算力新模型部署,Llama 4 Maverick 17B Instruct (128E) 是 Meta 基于混合专家(MoE)架构开发的高性能多模态语言模型,每次推理动态激活 170 亿参数(总参数量达 4000 亿),集成 128 个专家模块。该模型支持 12 种语言的文本/图像输入及文本/代码输出,专为视觉-语言任务优化,通过指令微调实现类助手交互、图像推理和通用多模态应用。
更新时间:2025-04-07
-
新增模型:meta-llama/llama-4-scout-17b-16e-instruct
派欧算力新模型部署,Llama 4 Scout 17B Instruct (16E) 是由 Meta 开发的混合专家(MoE)语言模型,从 1090 亿总参数中动态激活 170 亿参数,支持文本和图像的多模态输入,并能以 12 种语言输出文本和代码。该模型专为智能助手交互和视觉推理设计,每次推理调用 16 个专家模块,具备 1000 万 token 的超长上下文窗口,训练数据规模达 40 万亿 token。
更新时间:2025-04-07
2025年3月31日-4月3日
新增功能 🤖
-
新增模型 Qwen2.5 VL 72B Instruct
Qwen2.5 VL 72B Instruct 是PPIO 派欧云平台推出的最新高性能多模态大语言模型,具备更强的视觉理解能力,在复杂推理和决策能力等方面也具有较好表现。
更新时间:2025-03-31
-
新增模型 Gemma-3-27b-it
Gemma-3-27b-it 是PPIO 派欧云平台推出的最新高性能多模态大语言模型,基于 Gemini 2.0 架构打造,具备跨文本、图像和短视频的多模态推理能力。
更新时间:2025-03-31
2025年3月24日-3月28日
新增功能 💡
-
新增模型 deepseek-v3-0324
deepseek-v3-0324 是PPIO 派欧云平台推出的最新高性能大语言模型,是深度求索(DeepSeek)团队旗舰级对话模型系列的最新版本,采用混合专家(Mixture-of-Experts, MoE)架构,参数量达685B参数。
更新时间:2025-03-26
-
大语言模型服务支持文本检索
大语言模型体验中心支持文件检索。
更新时间:2025-03-24
2025年3月17日-3月21日
新增功能 🎉
-
大语言模型 Playground 支持联网搜索功能
大语言模型在线体验中心支持限时免费联网搜索功能。
更新时间:2025-03-21
2025年3月3日-3月7日
新增功能 ✨
-
PPIO 派欧云发布 Qwen 系列推理模型:Qwen: QwQ 32B
QwQ 是 Qwen 系列的推理模型。与传统的指令调优模型相比,QwQ 具备思考和推理能力,能够在下游任务中实现显著增强的性能,尤其是在解决困难问题方面。QwQ-32B 是中型推理模型,能够在与最先进的推理模型(如 DeepSeek-R1、o1-mini)的对比中取得有竞争力的性能,快速体验入口:https://ppio.cn/llm/qwen-qwq-32b。
更新时间:2025-03-07
-
Deepseek-V3 支持 function calling 功能
Deepseek/deepseek-v3 模型支持 function call 功能。使用方法见接口文档。
更新时间:2025-03-06
-
PPIO 派欧云发布 Deepseek R1/V3 Turbo 性能加速版!
DeepSeek V3 (Turbo) 、DeepSeek R1 (Turbo) 模型是PPIO 派欧云平台提供的最新高性能 DeepSeek V3/R1 模型,全参数,满血版,与官方效果一致,性能更强更稳定。
更新时间:2025-03-05
-
为保障平台资源与服务稳定,调整以下模型 RPM 为 10,详情请参考调用频率控制。
deepseek/deepseek-r1/community
deepseek/deepseek-v3/community
更新时间:2025-03-04