2025年4月28日-4月30日

新增功能☁️

  • 图像/视频 API 新增速率限制机制

    图像、视频类 API 产品现已支持 Rate Limit(速率限制)机制,用于控制调用频率,提升接口稳定性与服务公平性:

    1. IPM(Image Per Minute):限制每分钟可生成的图像数量;
    2. RPM(Requests Per Minute):限制每分钟的 API 请求次数。

    当调用频率超过限制时,将返回速率限制提示。建议合理安排调用计划,避免请求被限制。如需更高调用频率,可提交申请。

    更新时间:2025-04-30

  • 上线 Qwen3 系列模型

    上线 Qwen3 系列模型: Qwen3 0.6B Qwen3 1.7BQwen3 4BQwen3 8B 以及 Qwen3 14B ,其中 Qwen3 0.6BQwen3 1.7BQwen3 4B限时免费模型。

    更新时间:2025-04-30

  • 大语言模型 API 速率限制(Rate Limits)规则更新

    根据用户 最近充值金额,系统自动划分为 L1-L5 五个服务级别,不同级别对应不同的 RPM(每分钟请求数)TPM(每分钟 Token 数) 限制。详情请查看文档:调用频率控制(Rate Limits)

    更新时间:2025-04-30

  • 上线 Deepseek 新模型

    上线 Deepseek 新模型 Deepseek Prover V2 671B

    更新时间:2025-04-30

  • 首批大参数 Qwen3 模型上线

    上线大参数 Qwen3 模型 Qwen3-235B-A22BQwen3-30B-A3B 以及 Qwen3-32B

    更新时间:2025-04-29


2025年4月21日-4月25日

新增功能 👏

  • GLM-4-0414 系列及 Qwen2.5-7B-Instruct 模型上新

    今年3月,智谱曾预告会在 4 月中旬开源新的GLM模型,现在,GLM-4-0414 系列准时登场。此次开源的新模型覆盖基座、推理、沉思三大类型,根据官方公布数据显示,部分模型可在性能上比肩 OpenAI 的 GPT-4o 和 DeepSeek 的 V3/R1 系列模型。

    作为一站式 AIGC 云服务平台,PPIO 派欧云随即上线了上述模型及 Qwen2.5-7B-Instruct 限时免费版,并对模型进行了全链路优化,在保持原始模型精度的前提下大幅降低推理延迟,开发者通过 API 接口即可高效调用模型。

    1. thudm/glm-4-9b-0414
    2. thudm/glm-z1-9b-0414
    3. thudm/glm-z1-32b-0414
    4. thudm/glm-4-32b-0414
    5. thudm/glm-z1-rumination-32b-0414

    更新时间:2025-04-25


2025年4月14日-4月18日

新增功能 🤩

  • 邀请活动更新

    1. 在本次规则调整中,对邀请所得代金券的使用范围进行了扩大:代金券支持用于 PPIO 派欧云所有大语言模型

    2. 针对部分模型开放了限时免费。以下是开放免费使用的模型列表:

      baai/bge-m3

      thudm/glm-4-9b-chat

      qwen/qwen2.5-7b-instruct

      meta-llama/llama-3.2-1b-instruct

      meta-llama/llama-3.2-3b-instruct

    3. RPM 限制调整:对于账户有余额的付费用户,RPM 限制进行了放宽。详情见 RPM 限制文档页:https://ppio.cn/docs/model/llm-rate-limits

    更新时间:2025-04-17

  • 控制台支持大语言模型 rate limit 展示

    控制台现已支持 大语言模型的速率限制信息展示,用户可直观查看各模型的默认请求速率,便于合理规划调用频率。

    同时,新增速率限制变更申请入口,支持根据业务需求提交速率提升申请。

    更新时间:2025-04-17

  • meta-llama/llama-4-maverick-17b-128e-instruct-fp8 上线 Function Calling 功能

    meta-llama/llama-4-maverick-17b-128e-instruct-fp8 模型支持 Function Calling 功能。使用方法见接口文档

    更新时间:2025-04-14

  • meta-llama/llama-4-scout-17b-16e-instruct 上线 Function Calling 功能

    meta-llama/llama-4-scout-17b-16e-instruct模型支持 Function Calling 功能。使用方法见接口文档

    更新时间:2025-04-14

已知问题修复🚩

  • 模型广场切换模型时,网页 URL 同步更新

    使用模型广场切换模型,网页 URL 会根据模型名称同步更新。

    更新时间:2025-04-17


2025年4月7日-4月11日

新增功能 📤

  • 新增模型:meta-llama/llama-4-maverick-17b-128e-instruct-fp8

    派欧算力新模型部署,Llama 4 Maverick 17B Instruct (128E) 是 Meta 基于混合专家(MoE)架构开发的高性能多模态语言模型,每次推理动态激活 170 亿参数(总参数量达 4000 亿),集成 128 个专家模块。该模型支持 12 种语言的文本/图像输入及文本/代码输出,专为视觉-语言任务优化,通过指令微调实现类助手交互、图像推理和通用多模态应用。

    更新时间:2025-04-07

  • 新增模型:meta-llama/llama-4-scout-17b-16e-instruct

    派欧算力新模型部署,Llama 4 Scout 17B Instruct (16E) 是由 Meta 开发的混合专家(MoE)语言模型,从 1090 亿总参数中动态激活 170 亿参数,支持文本和图像的多模态输入,并能以 12 种语言输出文本和代码。该模型专为智能助手交互和视觉推理设计,每次推理调用 16 个专家模块,具备 1000 万 token 的超长上下文窗口,训练数据规模达 40 万亿 token。

    更新时间:2025-04-07


2025年3月31日-4月3日

新增功能 🤖

  • 新增模型 Qwen2.5 VL 72B Instruct

    Qwen2.5 VL 72B Instruct 是PPIO 派欧云平台推出的最新高性能多模态大语言模型,具备更强的视觉理解能力,在复杂推理和决策能力等方面也具有较好表现。

    更新时间:2025-03-31

  • 新增模型 Gemma-3-27b-it

    Gemma-3-27b-it 是PPIO 派欧云平台推出的最新高性能多模态大语言模型,基于 Gemini 2.0 架构打造,具备跨文本、图像和短视频的多模态推理能力。

    更新时间:2025-03-31


2025年3月24日-3月28日

新增功能 💡

  • 新增模型 deepseek-v3-0324

    deepseek-v3-0324 是PPIO 派欧云平台推出的最新高性能大语言模型,是深度求索(DeepSeek)团队旗舰级对话模型系列的最新版本,采用混合专家(Mixture-of-Experts, MoE)架构,参数量达685B参数。

    更新时间:2025-03-26

  • 大语言模型服务支持文本检索

    大语言模型体验中心支持文件检索。

    更新时间:2025-03-24


2025年3月17日-3月21日

新增功能 🎉

  • 大语言模型 Playground 支持联网搜索功能

    大语言模型在线体验中心支持限时免费联网搜索功能。

    更新时间:2025-03-21


2025年3月3日-3月7日

新增功能

  • PPIO 派欧云发布 Qwen 系列推理模型:Qwen: QwQ 32B

    QwQ 是 Qwen 系列的推理模型。与传统的指令调优模型相比,QwQ 具备思考和推理能力,能够在下游任务中实现显著增强的性能,尤其是在解决困难问题方面。QwQ-32B 是中型推理模型,能够在与最先进的推理模型(如 DeepSeek-R1、o1-mini)的对比中取得有竞争力的性能,快速体验入口:https://ppio.cn/llm/qwen-qwq-32b。

    更新时间:2025-03-07

  • Deepseek-V3 支持 function calling 功能

    Deepseek/deepseek-v3 模型支持 function call 功能。使用方法见接口文档

    更新时间:2025-03-06

  • PPIO 派欧云发布 Deepseek R1/V3 Turbo 性能加速版!

    DeepSeek V3 (Turbo) 、DeepSeek R1 (Turbo) 模型是PPIO 派欧云平台提供的最新高性能 DeepSeek V3/R1 模型,全参数,满血版,与官方效果一致,性能更强更稳定。

    更新时间:2025-03-05

  • 为保障平台资源与服务稳定,调整以下模型 RPM 为 10,详情请参考调用频率控制

    deepseek/deepseek-r1/community

    deepseek/deepseek-v3/community

    更新时间:2025-03-04