LLemebench

A Flexible Framework for Accelerating LLMs Benchmarking for its Multimodal capabilities

LLMeBench is a flexible benchmarking framework for evaluating large language models, including multimodal capabilities. It supports faster, more systematic assessment of model behavior across tasks, languages, and modalities.