V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
asuka321
V2EX  ›  程序员

智普 coding plan 的模型是缩水的吗,还是单独微调过的?

  •  
  •   asuka321 · 1 天前 · 1724 次点击
    起因是我发现有个问题明明上下文已经够非常充足了,但 glm5 一直答错,我一开始以为是 prompt 的写法问题,突发奇想去官网测了一下,发现官网的 glm 测试一定是对的,那我就认为是参数问题,temperature 什么的和官网不一致导致的。于是就写了个脚本测各种参数下的情况,结果发现都不对
    (正确答案是 21day )


    然后我把脚本的 baseurl 改成官方 api 接口,脚本居然全对了


    这是何意味呢??

    脚本在这,可以自行测测
    https://pastebin.com/g68ma5ER
    10 条回复    2026-04-12 22:31:30 +08:00
    kiffer
        1
    kiffer  
       1 天前
    霍,这个有意思
    cherryas
        2
    cherryas  
       1 天前 via Android
    起码疯狂量化是肯定的
    colorfulee
        3
    colorfulee  
       1 天前
    bigmodel 我怎么手机号码登录获取验证码的时候一直系统失败,联系客服。搭楼问下有遇到相同问题的么?何解。。。
    superkkk
        4
    superkkk  
       1 天前 via iPhone
    原精度推理太亏了,给你卖 token 的很可能是用 fp8 量化或者更离谱的量化跑的。现在 ai 算力价格都疯了一样,只能掺劣质 token 进去
    heimoshuiyu
        5
    heimoshuiyu  
       1 天前
    首先 coding 接口 glm-5 会被自动路由到 glm-5.1 ,而 API 的不会。
    其次,我测试了 API 接口和 coding plan 上的 glm-5.1 ,各种答案都有,考虑到你关闭了思考,输出随机性很大,我倾向于认为这是请求打到了不同集群导致+glm-5.1 本身的随机结果
    heimoshuiyu
        6
    heimoshuiyu  
       1 天前
    哈基流动可以输出一致的答案,但在 test 3 中随机性仍很大
    NewYear
        7
    NewYear  
       20 小时 46 分钟前
    多少钱标准的套餐啊

    是不是贵一点的套餐会好点 0 0
    aklllw
        8
    aklllw  
       20 小时 41 分钟前
    哇我还一直想买一个官方的,以为比第三方部署的要好
    Mr54
        9
    Mr54  
       16 小时 28 分钟前
    下午降智严重,早上就还好点
    shirakawatyu
        10
    shirakawatyu  
       8 小时 56 分钟前
    难怪我看知乎上测的 GLM 强的一批,自己用 Coding Plan 就是一坨
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1147 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 23:27 · PVG 07:27 · LAX 16:27 · JFK 19:27
    ♥ Do have faith in what you're doing.