Comments Page - NVLM: Open Frontier-Class Multimodal LLMs

e1gen-v 2 hours ago
Has anyone figured out how to do “visual” chunking for rag? I’m curious how this would be used in place of an OCR service.
rkwz a day ago
HuggingFace link: https://huggingface.co/nvidia/NVLM-D-72B