LLM evaluation

CHAT