helm-liang-2022

Holistic evaluation framework for language models measuring accuracy, calibration, robustness, and fairness

Uncategorized

Share this skill

Skills use the open SKILL.md standard — the same file works across all platforms.

Install all 551 skills as a plugin

claude plugin marketplace add curiositech/windags-skills claude plugin install windags-skills

Claude activates helm-liang-2022 automatically when your task matches its description.