https://www.volcengine.com/docs/84313/1254447
高性能
内置多种火山引擎内部自研索引算法,支持内部多个百亿库,百亿级向量检索规模,检索性能在5ms内。
实时性
支持向量数据实时写入、实时更新,支持实时索引。
稳定高效
存算分离架构,单数据多场景,节约计算资源,提高在线稳定性,保证高可用性。
多场景最佳实践
50+内部业务,多个百亿级别库检索实践,内部多个大模型场景的落地实践,例如抖音、头条、懂车帝、剪映、番茄小说、飞书、搜索、风控、广告等。
RPM(Requests Per Minute,每分钟请求数) TPM(Tokens Per Minute,每分钟 token 数量)
说明
每张图 2k token 大改
60 张 RPM
1 QPS