logo
    控制台
    模型服务GPU 云服务费用设置文档
登录立即注册
登录/注册
免费注册登录
控制台控制台模型服务GPU 云服务费用设置文档
模型广场大语言模型监控上传模型
    模型广场
    大语言模型
    全新上线
    D
    deepseek/deepseek-r1-0528
    输入 ¥4/ 百万 tokens | 输出 ¥16/ 百万 tokensDeepSeek R1 0528 是派欧云平台提供的最新高性能DeepSeek R1 模型。DeepSeek R1 0528 是DeepSeek团队发布的最新开源模型,具备非常强悍的推理性能,尤其在编程、数学、推理任务上达到了开源模型最先进的水平。满血版全参数
    全新上线
    M
    MiniMaxAI/MiniMax-M1-80k
    输入 ¥4/ 百万 tokens | 输出 ¥16/ 百万 tokensMiniMax-M1世界上第一个开放权重、大规模混合注意力推理模型。MiniMax-M1 采用混合专家 (MoE) 架构,并结合闪电注意力机制。该模型总共包含 4560 亿个参数,每个令牌激活了 459 亿个参数。M1 模型原生支持 100 万个令牌的上下文长度,是 DeepSeek R1 上下文大小的 8 倍。同时MiniMax-M1 结合 CISPO 算法与混合注意力设计的高效强化学习训练,在长输入推理与真实软件工程场景中实现了业界领先的性能。
    全新上线
    D
    DeepSeek-R1-0528-Qwen3-8B
    输入 ¥0.4/ 百万 tokens | 输出 ¥0.65/ 百万 tokensDeepSeek-R1-0528-Qwen3-8B 是基于 Qwen3 8B Base 模型,通过融合 DeepSeek-R1-0528 的思维链(Chain-of-Thought)优化训练而成的高性能推理模型。在 AIME 2024 评测中,该模型以开源模型身份达到最先进(SOTA)水平,性能较原版 Qwen3 8B 提升 10%,并展现出与 2350 亿参数的 Qwen3-235B-thinking 相当的推理能力。
    当前热门
    D
    DeepSeek V3 0324
    输入 ¥2/ 百万 tokens | 输出 ¥8/ 百万 tokensDeepSeek V3 0324 是深度求索(DeepSeek)团队旗舰级对话模型系列的最新版本,采用混合专家(Mixture-of-Experts, MoE)架构,参数量达685B参数。满血版全参数
    当前热门
    Q
    Qwen3-235B-A22B
    输入 ¥1.45/ 百万 tokens | 输出 ¥5.8/ 百万 tokens实现推理模式和非推理模式的有效融合,可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-72B-Instruct,达到同规模业界SOTA水平。推理模型
    Q
    Qwen3 32B
    输入 ¥0.72/ 百万 tokens | 输出 ¥3.26/ 百万 tokens实现推理模式和非推理模式的有效融合,可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-32B-Instruct,达到同规模业界SOTA水平。推理模型
    Q
    Qwen3-30B-A3B
    输入 ¥0.72/ 百万 tokens | 输出 ¥3.26/ 百万 tokens实现推理模式和非推理模式的有效融合,可在对话中切换模式。推理能力以更小参数规模比肩QwQ-32B、通用能力显著超过Qwen2.5-14B,达到同规模业界SOTA水平。推理模型
    D
    Deepseek Prover V2 671B
    输入 ¥4/ 百万 tokens | 输出 ¥16/ 百万 tokensDeepseek 全新开源模型 DeepSeek-Prover-V2-671B,专注于数学定理证明任务。该模型基于混合专家 (MoE) 架构,并利用 Lean 4 框架进行形式化推理训练。该模型参数规模达 6710 亿,结合强化学习和大规模合成数据,显著提升了自动化证明能力。满血版全参数
    D
    DeepSeek R1 (Turbo)
    输入 ¥4/ 百万 tokens | 输出 ¥16/ 百万 tokensDeepSeek R1 (Turbo)是派欧算力云平台提供的最新高性能DeepSeek R1 模型。DeepSeek R1是DeepSeek团队发布的最新开源模型,具备非常强悍的推理性能,尤其在数学、编程和推理任务上达到了与OpenAI的o1模型相当的水平。满血版全参数推理模型
    D
    DeepSeek V3 (Turbo)
    输入 ¥2/ 百万 tokens | 输出 ¥8/ 百万 tokensDeepSeek V3 (Turbo) 是派欧算力云平台提供的最新高性能DeepSeek V3 模型。DeepSeek-V3 在推理速度方面实现了比之前模型的重大突破。在开源模型中排名第一,并可与全球最先进的闭源模型相媲美。DeepSeek-V3 采用了多头潜在注意力 (MLA) 和 DeepSeekMoE 架构,这些架构在 DeepSeek-V2 中得到了全面验证。此外,DeepSeek-V3 开创了一种用于负载均衡的辅助无损策略,并设定了多标记预测训练目标以获得更强的性能。满血版全参数
    D
    DeepSeek V3 (Community)
    输入 ¥2/ 百万 tokens | 输出 ¥8/ 百万 tokensDeepSeek-V3在推理速度方面实现了比之前模型的重大突破。在开源模型中排名第一,并可与全球最先进的闭源模型相媲美。DeepSeek-V3 采用了多头潜在注意力 (MLA) 和 DeepSeekMoE 架构,这些架构在 DeepSeek-V2 中得到了全面验证。此外,DeepSeek-V3 开创了一种用于负载均衡的辅助无损策略,并设定了多标记预测训练目标以获得更强的性能。全参数满血版
    D
    DeepSeek R1 (Community)
    输入 ¥4/ 百万 tokens | 输出 ¥16/ 百万 tokensDeepSeek R1是DeepSeek团队发布的最新开源模型,具备非常强悍的推理性能,尤其在数学、编程和推理任务上达到了与OpenAI的o1模型相当的水平。全参数满血版推理模型
    D
    DeepSeek: DeepSeek R1 Distill Qwen 32B
    输入 ¥2.18/ 百万 tokens | 输出 ¥2.18/ 百万 tokensDeepSeek R1 Distill Qwen 32B 是一种基于 Qwen 2.5 32B 的蒸馏大语言模型,通过使用 DeepSeek R1 的输出进行训练而得。该模型在多个基准测试中超越了 OpenAI 的 o1-mini,取得了密集模型(dense models)的最新技术领先成果(state-of-the-art)。以下是一些基准测试的结果: AIME 2024 pass@1: 72.6 MATH-500 pass@1: 94.3 CodeForces Rating: 1691 该模型通过从 DeepSeek R1 的输出中进行微调,展现了与更大规模的前沿模型相当的竞争性能。推理模型
    D
    DeepSeek: DeepSeek R1 Distill Qwen 14B
    输入 ¥1/ 百万 tokens | 输出 ¥1/ 百万 tokensDeepSeek R1 Distill Qwen 14B 是一种基于 Qwen 2.5 14B 的蒸馏大语言模型,通过使用 DeepSeek R1 的输出进行训练而得。该模型在多个基准测试中超越了 OpenAI 的 o1-mini,取得了密集模型(dense models)的最新技术领先成果(state-of-the-art)。以下是一些基准测试的结果: AIME 2024 pass@1: 69.7 MATH-500 pass@1: 93.9 CodeForces Rating: 1481 该模型通过从 DeepSeek R1 的输出中进行微调,展现了与更大规模的前沿模型相当的竞争性能。推理模型
    D
    DeepSeek R1 Distill Llama 70B
    输入 ¥5.8/ 百万 tokens | 输出 ¥5.8/ 百万 tokensDeepSeek R1 Distill Llama 70B是基于Llama3.3 70B的大型语言模型,该模型利用DeepSeek R1输出的微调,实现了与大型前沿模型相当的竞争性能。推理模型
    D
    DeepSeek: DeepSeek R1 Distill Llama 8B
    输入 ¥0.3/ 百万 tokens | 输出 ¥0.3/ 百万 tokensDeepSeek R1 Distill Llama 8B 是一种基于 Llama-3.1-8B-Instruct 的蒸馏大语言模型,通过使用 DeepSeek R1 的输出进行训练而得。推理模型
    Q
    Qwen2.5 72B Instruct
    输入 ¥2.75/ 百万 tokens | 输出 ¥2.88/ 百万 tokensQwen2.5-72B-Instruct 是阿里云发布的最新大语言模型系列之一。该 72B 模型在编码和数学等领域具有显著改进的能力。该模型还提供了多语言支持,覆盖超过 29 种语言,包括中文、英文等。模型在指令跟随、理解结构化数据以及生成结构化输出(尤其是 JSON)方面都有显著提升。
    Q
    Qwen3 8B
    输入 ¥0.25/ 百万 tokens | 输出 ¥1/ 百万 tokens实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力达到同规模业界SOTA水平、通用能力显著超过Qwen2.5-7B。推理模型
    Q
    Qwen2.5 VL 72B Instruct
    输入 ¥4.2/ 百万 tokens | 输出 ¥4.2/ 百万 tokensQwen2.5-VL 是 Qwen2.5 系列最新推出的视觉语言模型。该模型在多方面有显著提升:具备更强的视觉理解能力,能够识别常见物体、分析文本、图表和布局;作为视觉代理能够推理并动态指导工具使用;支持理解超过 1 小时的长视频并捕捉关键事件;能够通过生成边界框或点准确定位图像中的物体;支持生成结构化输出,尤其适用于发票、表格等扫描数据。模型在多项基准测试中表现出色,包括图像、视频和代理任务评测。视觉模型
    Q
    Qwen2.5 32B Instruct
    输入 ¥1.26/ 百万 tokens | 输出 ¥1.26/ 百万 tokensQwen2.5-32B-Instruct 是阿里云发布的最新大语言模型系列之一。该 32B 模型在编码和数学等领域具有显著改进的能力。该模型提供了多语言支持,覆盖超过 29 种语言,包括中文、英文等。模型在指令跟随、理解结构化数据以及生成结构化输出(尤其是 JSON)方面都有显著提升。
    T
    THUDM/GLM-Z1-32B-0414
    输入 ¥1.75/ 百万 tokens | 输出 ¥1.75/ 百万 tokensGLM-Z1-32B-0414 是一个具有深度思考能力的推理模型。该模型基于 GLM-4-32B-0414 通过冷启动和扩展强化学习开发,并在数学、代码和逻辑任务上进行了进一步训练。与基础模型相比,GLM-Z1-32B-0414 显著提升了数学能力和解决复杂任务的能力。在训练过程中,研究团队还引入了基于成对排序反馈的通用强化学习,进一步增强了模型的通用能力。虽然只有 32B 参数,但在部分任务上,其性能已能与拥有 671B 参数的 DeepSeek-R1 相媲美。通过在 AIME 24/25、LiveCodeBench、GPQA 等基准测试中的评估,该模型展现了较强的数理推理能力,能够支持解决更广泛复杂任务。
    T
    THUDM/GLM-4-32B-0414
    输入 ¥1.75/ 百万 tokens | 输出 ¥1.75/ 百万 tokensGLM-4-32B-0414 是 GLM 系列的新一代开源模型,拥有 320 亿参数。该模型性能可与 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列相媲美,并支持非常用户友好的本地部署功能。GLM-4-32B-Base-0414 是在 15T 高质量数据上预训练的,包括大量推理类型的合成数据,为后续的强化学习扩展奠定了基础。在后训练阶段,除了对话场景的人类偏好对齐外,研究团队还使用拒绝采样和强化学习等技术增强了模型在指令遵循、工程代码和函数调用方面的表现,加强了代理任务所需的原子能力。GLM-4-32B-0414 在工程代码、Artifact 生成、函数调用、基于搜索的问答和报告生成等领域取得了良好的成果,部分 Benchmark 指标已接近甚至超越 GPT-4o、DeepSeek-V3-0324(671B)等更大模型的水平。
    T
    THUDM/GLM-Z1-Rumination-32B-0414
    输入 ¥1.75/ 百万 tokens | 输出 ¥1.75/ 百万 tokensGLM-4-32B-Base-0414 在预训练阶段使用了 15 万亿 tokens 的高质量数据,其中包含大量推理类的合成数据,为后续的强化学习扩展奠定了坚实基础。在后训练阶段,除了通过人类偏好对齐优化对话场景的表现外,我们还利用拒绝采样和强化学习等技术,增强了模型在指令理解、工程代码生成、函数调用等方面的能力,从而强化了智能体任务所需的“原子能力”。 GLM-4-32B-0414 在工程代码生成、Artifact 构建、函数调用、基于搜索的问答、报告生成等方面表现优异。在部分评测基准中,其表现甚至可媲美更大规模的模型,如 GPT-4o 和 DeepSeek-V3-0324(参数规模达 671B)。
    免费
    Q
    Qwen 2.5 7B Instruct
    输入 ¥0/ 百万 tokens | 输出 ¥0/ 百万 tokensQwen2.5 是 Qwen 大语言模型的最新系列。在 Qwen2.5 中,发布了多个基础语言模型和指令微调语言模型,参数规模从 0.5 亿到 720 亿不等。相比 Qwen2,Qwen2.5 带来了以下显著提升: - 知识储备显著提升,并在编程和数学能力上有大幅增强,这得益于我们在这些领域训练的专业专家模型。 - 在指令理解与执行、生成长文本(超过8K tokens)、理解结构化数据(如表格)、以及生成结构化输出(尤其是 JSON)方面表现大幅提升。对多样化的系统提示更具适应性,增强了角色扮演实现和聊天机器人的条件设定能力。 - 长上下文支持扩展至最多 128K tokens,最多可生成 8K tokens 的内容。 - 多语言支持涵盖超过 29 种语言,包括中文、英文、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、日语、韩语、越南语、泰语、阿拉伯语等。
    免费
    Q
    Qwen3 4B
    输入 ¥0/ 百万 tokens | 输出 ¥0/ 百万 tokens实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力达到同规模业界SOTA水平、模型人类偏好能力显著增强,创意写作、角色扮演、多轮对话、指令遵循能力均有明显提升,用户体验预期明显更佳。
    免费
    T
    THUDM/GLM-4-9B-0414
    输入 ¥0/ 百万 tokens | 输出 ¥0/ 百万 tokensGLM-4-9B-0414 是 GLM 系列的小型模型,拥有 90 亿参数。该模型继承了 GLM-4-32B 系列的技术特点,但提供了更轻量级的部署选择。尽管规模较小,GLM-4-9B-0414 仍在代码生成、网页设计、SVG 图形生成和基于搜索的写作等任务上展现出色能力。该模型还支持函数调用功能,可以调用外部工具以扩展其能力范围。模型在资源受限的场景中表现出良好的效率与效果平衡,为需要在计算资源有限条件下部署 AI 模型的用户提供了强大选择。与其他同系列模型一样,GLM-4-9B-0414 也展示了在各种基准测试中的竞争性能力。
    免费
    T
    THUDM/GLM-Z1-9B-0414
    输入 ¥0/ 百万 tokens | 输出 ¥0/ 百万 tokensGLM-Z1-9B-0414 是 GLM 系列的小型模型,仅有 90 亿参数,但保持了开源传统的同时展现出惊人的能力。尽管规模较小,该模型在数学推理和通用任务上仍表现出色,其总体性能在同等规模的开源模型中已处于领先水平。研究团队采用了与大模型相同的一系列技术进行训练,使其在资源受限的场景中能够实现效率与效果的绝佳平衡,为寻求轻量级部署的用户提供强大选择。特别是在资源受限的场景下,该模型可以很好地在效率与效果之间取得平衡,为需要轻量化部署的用户提供强有力的选择。
    免费
    T
    GLM4 9B Chat
    输入 ¥0/ 百万 tokens | 输出 ¥0/ 百万 tokens智谱AI发布的GLM-4系列最新一代预训练模型的开源版本。
    嵌入系列模型
    全新上线
    Q
    Qwen3 Embedding 8B
    ¥0.35/ 百万 tokensQwen3 Embedding 8B 模型是通义千问家族最新推出的专为文本嵌入(embedding)专属模型。该模型基于Qwen3系列的稠密基座模型,完整继承了基座模型卓越的多语言能力、长文本理解与推理能力。Qwen3 Embedding系列在文本检索、代码检索、文本分类、文本聚类、双语挖掘等多项文本嵌入任务中实现显著突破。
    免费
    B
    BAAI:BGE-M3
    ¥0/ 百万 tokensBGE-M3 是一款具备多维度能力的文本嵌入模型,可同时实现密集检索、多向量检索和稀疏检索三大核心功能。该模型设计上兼容超过100种语言,并支持从短句到长达8192词元的长文本等多种输入形式。在跨语言检索任务中,BGE-M3展现出显著优势,其性能在MIRACL、MKQA等国际基准测试中位居前列。此外,针对长文档检索场景,该模型在MLDR、NarritiveQA等数据集上的表现同样达到行业领先水平。
    全新上线
    Q
    Qwen3 Reranker 8B
    输入 ¥0.35/ 百万 tokens | 输出 ¥0.35/ 百万 tokensQwen3 Reranker 8B 模型系列是通义千问家族最新推出的排序任务设计的专属模型。该系列基于Qwen3系列的稠密基座模型,完整继承了基座模型卓越的多语言能力、长文本理解与推理能力。Qwen3 Embedding系列在排序任务中实现显著突破,支持语言:100+种,参数量:80亿,上下文长度:32K。
    视频生成模型
    全新上线
    M
    MiniMax Hailuo 02
    ¥1.8/个视频 768P 6s新一代视频生成模型,性能全面升级,更强指令遵循,视频更长更高清
    W
    Wan 2.1
    ¥1.46/个视频 480P 5s开源视频生成模型,支持中英文本特效、多场景生成,消费级GPU即可流畅运行,一键创作专业级动态内容