entry-title"> 青云上新 Qwen3-30B-A3B,大模型 API 一键调用

青云科技旗下 AI 算力云服务——基石智算Coreshub 上线全新大模型 Qwen3-30B-A3B-Instruct-2507。该模型基于 Qwen3-30B 模型微调,采用 A3B 分离推理优化机制(Attention-Acting-As-Batch),在推理性能与响应时延上大幅提升。目前,用户可通过基石智算大模型服务,通过 API 快速调用该模型,满足不同场景下的业务需求。


新模型主要提升指令跟随、逻辑推理、文本理解,以及数学、科学、编程和工具使用等通用能力,官方表示在激活 3B 参数的情况下,性能接近 GPT-4o 和 Qwen3-235B-A22B Non-Thinking

新版模型特点包括:

性能升级。相比传统 Qwen3-30B-Instruct,A3B 版本在 H100 GPU 上推理速度提升最高可达 2 倍,延迟下降约 30%。

更强泛化能力。优化后的指令微调流程覆盖通用问答、工具调用、逻辑推理等能力,在多个基准评测中表现优异。

基石智算对 Qwen3-30B-A3B-Instruct-2507 完成底层容器化部署与多机并行优化,支持弹性伸缩、Token 计费与 API 调用方式。


快来基石智算 coreshub.cn 体验吧!

热门标签
Ubuntu
边缘计算
飞腾
教育
超融合
云易捷
数据
存储
U10000
云服务器
RadonDB
数据库
复制成功
百度 搜狗 360搜索 如何评价 GPT-4o 生成的宫崎骏吉卜力风格图片? 跳水世界杯墨西哥站陈芋汐摘金 全红婵夺银 小米SU7碰撞事故7天后:事故路段电子屏提醒“慎用智驾” 漫无边际的幻想成为开发契机:宫崎英高谈新作《The DuskBloods》 【8点见】深圳北地铁站发生人员踩踏?官方回应

      <code id='670e0'></code><style id='faa46'></style>
    • <acronym id='20864'></acronym>
      <center id='fe816'><center id='0d13f'><tfoot id='62d36'></tfoot></center><abbr id='cb16f'><dir id='0ceee'><tfoot id='537b7'></tfoot><noframes id='dbbb7'>

    • <optgroup id='25149'><strike id='84295'><sup id='83a80'></sup></strike><code id='3cd18'></code></optgroup>
        1. <b id='bac05'><label id='58b3d'><select id='fb68a'><dt id='935ef'><span id='2a51f'></span></dt></select></label></b><u id='40ceb'></u>
          <i id='b4a29'><strike id='67c8b'><tt id='437e3'><pre id='5fbee'></pre></tt></strike></i>