Skip to main content

Sarfaraz.ioAbout Publication Certifications

Paper Crux
Java
KCNA

GitHub LinkedIn

One doc tagged with "inter-rater"

8.4 Human Evaluation Design

Annotation guidelines, inter-rater reliability, and stratified sampling for LLM eval.

Publication

Papers
Paper I: AI Report Generation
Certifications

Resources

Paper Crux
Java
KCNA
Blog

Connect

About
Contact
Email
LinkedIn
GitHub

© 2026 Mohammed Sarfaraz. Built with Docusaurus.