需求多样,更灵活计费模式亦在不断探索。国内大模型厂商为提升客单价在按量计费的基础上持续创新,推出灵活计费模式。百度文心一言 4.0推出了Tokens资源包收费形式,最高 10.2万元可购买 10亿 Tokens,优惠单价低至0.102元/千 Tokens,适合需求量大的 B端开发者用户。还有的实施限速分级计费模式,如文心一言 4.0中用户可根据所需 TPM和 RPM速率需求购买相应数量的 TPM配额(按月付),且在突增峰值流量时购买额外的 TPM配额包(按小时付),灵活满足用户的使用速率需求。Moonshot 则根据累计充值金额分级限速,满足不同用户需求的同时,预计提升客单价。