CVE-2025-46722
vLLM has a Weakness in MultiModalHasher Image Hashing Implementation
Em resumo
O sistema de hash de imagens do vLLM não inclui as dimensões da imagem ao criar os hashes, então duas imagens de tamanhos diferentes com os mesmos pixels podem ser confundidas. Isso causa erros de cache e possível vazamento de dados.
Detalhe técnico
O MultiModalHasher em vllm/multimodal/hasher.py utiliza apenas PIL.Image.tobytes() para geração de hash, omitindo metadados como largura, altura e modo de cor, permitindo colisões de hash entre imagens de dimensões diferentes. Isso resulta em buscas incorretas em cache (CWE-1288: Weak Hashing), potencialmente levando a acesso não autorizado a saídas de modelo em cache ou vazamento de dados (CWE-1023: Comparison Using Wrong Factors).
Resumo gerado e traduzido por IA a partir da descrição oficial.
vLLM is an inference and serving engine for large language models (LLMs). In versions starting from 0.7.0 to before 0.9.0, in the file vllm/multimodal/hasher.py, the MultiModalHasher class has a security and data integrity issue in its image hashing method. Currently, it serializes PIL.Image.Image objects using only obj.tobytes(), which returns only the raw pixel data, without including metadata such as the image’s shape (width, height, mode). As a result, two images of different sizes (e.g., 30x100 and 100x30) with the same pixel byte sequence could generate the same hash value. This may lead to hash collisions, incorrect cache hits, and even data leakage or security risks. This issue has been patched in version 0.9.0.
CVSS:3.1/AV:N/AC:H/PR:L/UI:N/S:U/C:L/I:N/A:L
Produtos afetados
vllm-project · vllmQuer saber se a sua infraestrutura está exposta a isto?
Falar com a TrueHacking →