Suprinita Ghatak - AI Data Annotator and LLM Evaluator

Key Skills

Software

Telus

Playment

OneForma

Labelbox

CrowdSource

Appen

Top Subject Matter

Artificial Intelligence & Machine Learning

Natural Language Processing (NLP)

Generative AI (LLMs) - Data Annotation & AI Training Data

Top Data Types

Text

Image

Video

Top Task Types

Evaluation/Rating

Question Answering

Text Summarization

Transcription

Prompt + Response Writing (SFT)

Data Collection

Computer Programming/Coding

Text Generation

Object Detection

Cuboid

Fine-tuning

Freelancer Overview

AI-focused professional with hands-on experience in data annotation, LLM evaluation, and AI training data workflows, specializing in text, audio, and multilingual datasets. Proven ability to evaluate AI-generated outputs for accuracy, relevance, safety, and linguistic quality, including tasks such as prompt-response analysis, hallucination detection, and content moderation. Experienced in TTS evaluation, ASR validation, and linguistic QA (LQA), ensuring high-quality datasets for NLP and speech-based AI systems. Bringing a strong analytical foundation from a Master’s degree in Electronics, combined with practical experience in AI testing, translation, and transcription, I consistently deliver high-accuracy annotations with strict adherence to guidelines and deadlines. Multilingual in English, Bengali, and Hindi, with a keen eye for detail and quality, I am well-equipped to contribute effectively to AI model training, evaluation, and data pipeline optimization.

ExpertEnglishBengaliHindi

Labeling Experience

Multilingual AI Data Annotation & LLM Evaluation

TextQuestion Answering

Contributed to AI training data projects involving annotation, evaluation, and quality assurance of text and speech datasets used to train and improve machine learning models. Worked extensively on LLM (Large Language Model) evaluation, assessing AI-generated responses for accuracy, relevance, coherence, and safety. Performed prompt-response analysis and rating, ensuring outputs followed instructions and maintained logical consistency. Identified and flagged issues such as hallucinations, bias, and unsafe or low-quality content, supporting AI model alignment and responsible AI practices. Handled multilingual datasets (English, Bengali, Hindi), including text annotation, transcription, and linguistic validation. Conducted TTS (Text-to-Speech) evaluations focusing on pronunciation, fluency, and naturalness, as well as ASR (Automatic Speech Recognition) validation for transcription accuracy and speaker consistency. Maintained strict adherence to annotation guidelines, consistently delivering high-quality, accurate, and reliable outputs within deadlines. Collaborated on large-scale data pipelines, contributing to the development and improvement of NLP, conversational AI, and speech-based AI systems.

2022 - Present

Education

P

Pune University

Masters, Electronics

Masters

2008 - 2012

Work History

F

Freelancer

AI Data Annotator

Mumbai

2022 - Present