谭待进一步解释说,豆包大模型平均每天处理1200亿Tokens文本、生成3000万张图片,这里有不同的负载,可以把不同任务混合在一起,互相错峰,通过智能调度把它们的利用率都跑得很高,就能极大地提升资源利用率,实现整体成本的优化。
另外以字节内部业务为例,飞书的主要流量高峰在工作时间,抖音在下班后休闲时间的流量更高,这些不同业务的大模型推理,也能根据业务特点错峰使用,就可以降低成本。
对于“大模型开始价格战”的说法,谭待认为,大模型市场仍在发展初期,远远没到激烈竞争的阶段。“池塘有多大,鱼就有多大,现在整个池塘还在培养的过程。”
GIGANT5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎总裁谭待在接受媒体采访时,谈到了大模型的定价策略。
豆包大模型的超低价格引发行业震动。据悉,豆包主力模型的推理输入价格只有0.0008元/千Tokens,比行业便宜99.3%。对此,谭待坦言,“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这条路。”
其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样的底层算力用得更好,推理成本就会大大降低。
671.66MB
查看736.86MB
查看58.1MB
查看218.92MB
查看664.15MB
查看853.36MB
查看985.40MB
查看185.21MB
查看930.14MB
查看679.24MB
查看500.71MB
查看468.21MB
查看833.68MB
查看978.42MB
查看548.94MB
查看582.48MB
查看506.25MB
查看103.33MB
查看904.72MB
查看786.77MB
查看909.15MB
查看690.51MB
查看559.49MB
查看775.61MB
查看129.13MB
查看169.82MB
查看774.10MB
查看197.24MB
查看615.73MB
查看568.84MB
查看784.33MB
查看901.42MB
查看521.94MB
查看124.75MB
查看999.15MB
查看207.12MB
查看574.17MB
查看260.49MB
查看931.12MB
查看106.36MB
查看397.51MB
查看304.97MB
查看819.30MB
查看104.39MB
查看294.10MB
查看667.92MB
查看470.34MB
查看340.33MB
查看594.99MB
查看487.16MB
查看960.71MB
查看964.69MB
查看486.54MB
查看725.37MB
查看953.16MB
查看545.74MB
查看815.17MB
查看834.41MB
查看434.58MB
查看778.17MB
查看869.75MB
查看404.62MB
查看698.89MB
查看148.59MB
查看323.39MB
查看930.66MB
查看732.62MB
查看551.79MB
查看116.45MB
查看413.26MB
查看169.51MB
查看231.29MB
查看675.19MB
查看429.31MB
查看210.80MB
查看363.91MB
查看283.90MB
查看851.24MB
查看674.68MB
查看979.97MB
查看291.43MB
查看101.21MB
查看438.20MB
查看624.31MB
查看585.64MB
查看950.83MB
查看842.25MB
查看149.11MB
查看828.18MB
查看885.12MB
查看694.23MB
查看535.95MB
查看142.13MB
查看596.84MB
查看381.54MB
查看990.54MB
查看608.50MB
查看541.69MB
查看328.96MB
查看105.48MB
查看475.81MB
查看208.52MB
查看789.54MB
查看506.84MB
查看
124 延吉mm
湖北一官员凌晨接上级电话未赴现场在家睡觉 被免职🤜
2025-06-30 06:09:00 推荐
368 188****2889
安徽医卫系统又双叒掀反腐风暴 5个月落马16人🤦
2025-06-28 16:59:23 不推荐
153 152****3075
吕秀莲“要切腹自杀”:不忍台湾在民进党执政下沦亡🤳
2025-06-29 08:07:22 推荐
64 停靠超级坦克
崔永元“一抽屉合同”杀伤力爆表:100多亿瞬间就没了🤶
2025-06-30 03:58:18 推荐