Opérateur de donnée
Le projet consistait en l’annotation et la préparation de données d’entraînement pour des modèles d’intelligence artificielle, couvrant plusieurs types de contenus : texte (NLP), images, audio et vidéos. Les tâches réalisées incluaient la classification de données textuelles, la segmentation et le balisage d’images, le suivi d’objets sur vidéo, ainsi que la transcription et l’annotation audio, y compris la transcription phonétique. Le projet portait sur le traitement de grands volumes de données, nécessitant une gestion rigoureuse des flux, le nettoyage, la vérification, l’organisation et la validation des données avant livraison. Les annotations ont été réalisées à l’aide d’outils spécialisés tels que CVAT, Labelbox, Doccano, BRAT, Prodigy, Audacity et Praat, en respectant les formats standards COCO et PASCAL VOC. Des mesures de contrôle qualité strictes ont été appliquées tout au long du projet, incluant la définition de règles d’annotation cohérentes, des revues régulières