home/categories/academic/muratcankoylan-agent-skills-for-context-engineering-skills-advanced-evaluation-skill-md

academicresearch

advanced-evaluation

Name: advanced-evaluation
Author: muratcankoylan

This skill should be used when the user asks to "implement LLM-as-judge", "compare model outputs", "create evaluation rubrics", "mitigate evaluation bias", or mentions direct scoring, pairwise comparison, position bias, evaluation pipelines, or automated quality assessment.

View Source academic

maintainer

muratcankoylan

Updated 3/18/2026

Stars

14945

Forks

1173

quick start

Installation and usage

Installation

$ install --globalskills.sh

Usage

Once installed, you can use this skill by running the following command in your terminal:

skills use advanced-evaluation