[NS :
最近使用hermes对话太长之后后续回复响应的会离谱的慢,更吃token,具体表现如下第一个是9点54分测试,直到10点12分才响应,第二个是11点06分测试的到11点24分才有回复(别问为啥不强制打断,我试过了,在tgbot中没有用,只能通过服务器终端强制停止,那时电脑没在身边,只能眼巴巴的看着它猛猛的花额度)就
sakura-s] 问一下关于hermes,上下文压缩有啥建议吗最近使用hermes对话太长之后后续回复响应的会离谱的慢,更吃token,具体表现如下第一个是9点54分测试,直到10点12分才响应,第二个是11点06分测试的到11点24分才有回复(别问为啥不强制打断,我试过了,在tgbot中没有用,只能通过服务器终端强制停止,那时电脑没在身边,只能眼巴巴的看着它猛猛的花额度)就