Skip to main content

Sarfaraz.ioAbout Publication Certifications

Paper Crux
Java
KCNA

GitHub LinkedIn

One doc tagged with "pairwise"

8.3 LLM-as-Judge Evaluation

Rubric design, pairwise comparison, and calibration for LLM-as-judge evaluation.

Publication

Papers
Paper I: AI Report Generation
Certifications

Resources

Paper Crux
Java
KCNA
Blog

Connect

About
Contact
Email
LinkedIn
GitHub

© 2026 Mohammed Sarfaraz. Built with Docusaurus.