竞争加剧+成本下降 Token迎降价潮

  ◎记者 罗茂林

竞争加剧+成本下降 Token迎降价潮-第1张图片

  今年以来一路走高的Token(词元)价格迎来反转 。进入6月 ,全球多家大模型厂商开始重新调整Token价格,包括OpenAI在内,多家大厂先后被曝将下调Token价格 ,以回应企业用户对AI成本暴涨的不满。

  然而,相较此前声势浩大的推广潮,此次Token价格下调更像是行业新一轮残酷竞赛的序幕。多位市场人士分析称 ,随着OpenAI及Anthropic等一批头部AI厂商陆续推进IPO,市场对AI公司的估值模型正在调整,能否用更低成本持续获取更多用户 ,成为每家公司必须面对的考验 。

  竞争加剧 Token迎降价潮

  进入6月 ,Token价格开始逆势下跌。日前,头部AI公司OpenAI被曝将于6月启动新一轮调价,计划大幅下调Token计费标准。对于此次降价 ,外界认为将是一场面向对标竞品Anthropic的行动,目的在于争夺企业级客户 。因此,不少业内人士预计 ,Anthropic或将跟进降价。

  事实上,不仅是国际AI巨头,本月初国产大模型DeepSeek正式执行V4系列模型调价 ,将Token价格下调至原标价的1/4。按照官方公告,DeepSeek-V4-Flash的输入缓存命中价格是每百万Token 0.02元;V4-Pro每百万价格为0.025元 。

  “这成本几乎比生产对应Token所需要的电费还便宜 。 ”一位资深AI创业者告诉上海证券报记者,作为比较 ,在今年4月前,Open AI最新模型每百万Token的综合成本是30美元,“前者价格相当于后者的百分之一 ,是量级的差别了”。

  紧随其后 ,小米宣布MiMo-V2.5系列大模型完成调价,部分版本降幅高达99%,同时取消按上下文窗口分段计价的规则 ,并且Token Plan用量直接提升到原来的5倍至8倍,这意味着其每百万Token成本基本看齐DeepSeek。

  6月16日,字节跳动旗下火山引擎上线Seedance 2.0 mini视频生成模型 ,其图生视频定价为每千Token 0.023元,视频生视频定价为每千Token 0.014元,这一定价较Seedance 2.0明显降低 。此外 ,近期腾讯云也发布公告,大模型服务平台TokenHub将于6月15日起下调MiniMax-M3模型价格,推理输入、推理输出及缓存命中费用均下调50%。

  有意思的是 ,今年4月,小米MiMo团队负责人罗福莉曾公开反对打价格战。她认为,低价卖Token并开发第三方框架的行为 ,看似吸引用户 ,最终会损害用户体验 。

  不过,也有技术工程师告诉记者,此轮Token价格的下调与罗福莉的观点并不矛盾:“她强调的是之前模型本身性能不足 ,不顾成本消耗Token的行为,但现在通过模型和上下文压缩等技术,Token的效率有所提升。”

  价格大考来临 行业洗牌加速

  从某种意义上讲 ,此轮降价更像是行业即将面临的一场商业大考。多位业内人士表示,随着越来越多AI公司步入资本市场,用户规模 、实际效益等关键数据的分量越来越重 。

  “今年以来最明显的变化就是 ,企业端对于AI的真实需求在变多,它构成了真实的商业订单。 ”北京某AI大模型独角兽公司公共事务负责人对记者表示,尤其是今年以来Cloud Code崛起 ,大模型“编程能力”被越来越多企业看到,催生了这一轮Token用量的暴增。

  以Open AI披露的数据为例,该公司最大的Token消耗者每月使用量约为1000亿Token ,而在6年前 ,这一数据仅为10万 。然而,在企业真实需求增长的同时,Token价格高企的问题日益凸显。据报道 ,不少美国互联网巨头在近几个月纷纷收紧了对Token使用的预算限制。

  记者注意到,不少国内头部互联网公司对Token使用的态度也开始转向:从限制用量到对Token使用仅提供部分报销,显然高昂的成本让不少大公司都有些吃不消 。

  “模型竞赛基本到了头部决胜阶段 ,资本需要看到增长,这里面很重要的就是企业端用户规模 。”上海某券商计算机首席分析师告诉记者。另一位某头部互联网公司AI负责人对记者坦言,竞争走到这一步 ,性能之争基本结束,性价比将成为重点。

  但有意思的是,对不少头部公司而言 ,这场降价并非突如其来,相反更像一场预言的兑现 。多位技术人士告诉记者,当前影响Token价格的因素无外乎两个:模型本身技术能力、硬件侧成本控制。眼下 ,这两个方面都在迅速突破。

  在技术侧 ,对稀疏注意力等技术的持续优化,正在让Token消耗不断降低 。以DeepSeek为例,此次最新模型公布的技术突破中就包括压缩稀疏注意力机制(CSA)和高压缩注意力机制(HCA) ,这两者都能大幅优化Token在单次任务中的使用。

  记者注意到,包括月之暗面KiMi、小米MiMo在内,近期多款国内大模型披露的产品创新性论文中均有类似技术。

  在硬件侧 ,按照业内共识,Token在硬件端最终的变数取决于两方面:芯片成本和电力成本 。随着国家“东数西算 ”工程的持续推进,在不少绿电能源丰富的节点城市 ,电价和机房租用的成本都在大幅下降。以内蒙古乌兰察布为例,记者调研发现,包括华为 、阿里、快手等国内厂商均在加快布局。

  某算力中心当地运营负责人透露 ,由于厂商与算力中心的服务合约中电费占据大头,且多为长年合同,随着电价以及综合服务成本的快速下降 ,厂商Token生产的实际成本明显回落 。此外 ,多位算力中心人士对记者表示,今年以来国产芯片产能逐步提升,其价格也在回落 ,带动Token成本进一步下降。

  但显然,并非所有的大模型公司都能撑住此轮的价格冲击。有AI行业资深观察人士直言,部分企业实际上是在被动降价 。

标签:

相关推荐

  • 临港算力、海博思创共推算电协同:将建立算力与电力联合运营机制

    临港算力、海博思创共推算电协同:将建立算力与电力联合运营机制

      7月2日,国内储能系统集成龙头海博思创(688411.SH)和中国电信(601728.SH/00728.HK)全资控股子公司临港算力同步发布最新消息,双方在上海举行战略合作签约仪式,未来将以“资源共享、协同运营”为原则,建立算力与电力联合运营机制,共同打造面向特定城市的算电协同多场景示范项目。  海博思创和临港算力均表示,本次战略合作立足产业发展大势,一...

    2026/07/04
  • 疫情涉及地区地图最新版/疫情地区查询最新

    疫情涉及地区地图最新版/疫情地区查询最新

    高德地图的疫情管控地图怎么看〖壹〗、进入图层选项:在高德地图主界面上方,找到并点击图层按钮(通常显示为叠加的方块图标)。选取疫情管控地图:在图层选项列表中,找到疫情管控地图功能入口,点击后系统会自动加载并切换至疫情地图模式。查看标注信息:地图界面会以颜色标注、图标标记或文字提示等形式,显示疫情风险区域、管控措施(如封控区、管控区)及周边交通状况。〖贰〗、点...

  • 明起,坐飞机要便宜了!

    明起,坐飞机要便宜了!

      中国国航等航空公司7月3日发布公告显示,自7月5日0时起销售的中国内地航线客票,燃油附加费将下调。  下调后的具体标准为:  800公里(含)以下航线每航段50元  800公里以上航线每航段100元  婴儿旅客免收燃油附加费  儿童、革命伤残军人、因公致残人民警察客票燃油附加费减半收取  据悉,对比现行燃油附加费标准,800公里(含)以下航线将...

    2026/07/04
  • 甘肃疫情分布在哪些地区/甘肃疫情区域

    甘肃疫情分布在哪些地区/甘肃疫情区域

    甘肃省兰州市疫情感染及防控最新消息兰州市新增确诊病例3例,新增无症状感染者339例;截至11月12日,现有中高风险区65个,并发布口罩佩戴规范要求。疫情感染情况新增确诊病例:2022年11月11日0至24时,兰州市新增本土确诊病例3例,均分布在城关区,且全部由无症状感染者转归为确诊病例。根据甘肃卫健委的报告,兰州市在某一时间段内新增了大量的无症状感染者。兰...

  • 【大同5号限号,大同限号吗】

    【大同5号限号,大同限号吗】

    大同明天限号几号几和几〖壹〗、限行时间2022年11月21日06时00分起,全天限行区域、范围大同市平城区:全域道路在微信公众号【车主指南】回复【大同限行】,查看限行地图,更直观!限行规定疫情防控期间,所有车辆实行单双号限行,单日限双号,双日限单号(尾数为0和英文字母的按双号出行)。〖贰〗、大同限行规定:所有车辆实行单双号限行,单日限双号,双日...

    2026/07/04
  • 宇树科技陈立:机器人没有大面积应用,主要原因是具身智能大模型不成熟

    宇树科技陈立:机器人没有大面积应用,主要原因是具身智能大模型不成熟

    专题:2026亚布力论坛创新年会  7月4日消息,亚布力中国企业家论坛第十二届创新年会7月3日-4日在上海召开。宇树科技股份有限公司联合创始人陈立表示,近来机器人其实没有大面积应用,主要原因还是具身智能大模型没有成熟。  他认为,未来2-5年,首先是需要有一个统一的端到端的机器人大模型,这是最重要的。第二是,还有更低成本更高寿命的硬件以及超大批量规模生...

    2026/07/04
  • 各地区疫情专项资金(疫情防控专项资金)

    各地区疫情专项资金(疫情防控专项资金)

    19家银行领取专项再贷款!央行强化疫情防控资金支持〖壹〗、家银行领取专项再贷款,是央行针对疫情防控重点保障企业资金需求采取的专项支持措施,旨在通过低成本资金精准投向抗疫相关企业,确保其生产运营及物资供应稳定。具体内容如下:发放背景与紧急安排在疫情防控关键阶段,央行通过专项再贷款为重点企业提供低成本资金支持。〖贰〗、家领取专项再贷款的银行包括9家全国性银行...

  • 【今天中牟限号限几呀,中牟今天限号是几和几】

    【今天中牟限号限几呀,中牟今天限号是几和几】

    焦作中牟限号时间表及规定,避免违反交通法规限行时间工作日限行:星期一到星期五的早上7时至19时(也有说法为7时30分至19时30分,或7时至21时,但最新及普遍执行的时间为7时至19时),法定节假日和公休日不限行。限行区域S225(原S223)以西、G107(原万三公路)以东、郑汴物流通道以南、万洪路以北所有道路(以上均不含本路)。中牟限号区域为S22...

  • 疫情哪些地区放开了管控/当前疫情哪些地方管控

    疫情哪些地区放开了管控/当前疫情哪些地方管控

    疫情放开后,多久回到正常?疫情放开后,多数经济体大致需要3-4个月时间回到相对正常状态,但具体时长受医疗准备、死亡率情况、居民认知等多种因素影响而存在差异。具体分析如下:海外部分经济体情况我国香港地区:今年3月宣布暂缓全民强制核酸检测,疫情自2月上旬大幅攀升,5月中旬回落至相对低位,持续约3个多月。疫情放开后,实体门店恢复正常的时间因地区和具体情况而异,...

  • 【安阳限号限邯郸车吗,安阳限号限邯郸车吗今天】

    【安阳限号限邯郸车吗,安阳限号限邯郸车吗今天】

    安阳限号吗安阳2025年近来不限号。近日,有网友在网络上散布并传播关于“安阳将开始实施尾号限行措施”的消息,这一消息引发了部分市民的关注和担忧。然而,安阳市生态环境局已针对此类谣言发布了严正声明。声明中明确强调,所谓“安阳将实施尾号限行”的消息均为假消息,市民切勿轻信和传播此类不实信息。尾号限行:安阳市的机动车限行是按照机动车车牌尾号来执行的。具体限行规则...

返回顶部