关于多模态模型推理启用prefix cache #2823

zhuchen1109 · 2024-11-27T02:48:51Z

zhuchen1109
Nov 27, 2024

我使用internvl-8b模型，因为我的prompt system会很长，我想开启来做推理加速，现在开启prefix cache会有些问题，因为图片token只是padding，很大概率被match住，我想问下，如果我修改代码来保证image部分不被match，是不是prefix cache对于我这个任务来说是有效的？

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于多模态模型推理启用prefix cache #2823

{{title}}

Replies: 0 comments

Select a reply

关于多模态模型推理启用prefix cache #2823

zhuchen1109 Nov 27, 2024

Replies: 0 comments

zhuchen1109
Nov 27, 2024