Dans le cadre du développement de nos activités en Ile-De-France, nous recrutons un(e) Data Scientist H/F.
Lieu
Paris / Ile-De-France
Type de contrat
CDI / Freelance / Portage salarial
Date de publication
01 juillet 2024
Secteur
Sécurité Numérique
Prendre en main le code de la dernière release
Récupérer les nouvelles données mises à disposition
Concevoir une arborescence afin stocker les données reçues
Trier les données déjà annotées et, agréger les fichiers d’annotation correspondants dans un seul fichier
Identifier les données non-annotées par site, pertinentes pour l’étude
Envoyer ces dernières à des annotateurs à l’étranger avec les spécifications d’annotation
Vérifier si les annotations sont correctes, demander une correction sinon, puis les intégrer à la base de données
Faire des statistiques des données disponibles tout le temps
Corriger/actualiser le code d’entraînement
Identifier les données utilisables pour créer un régresseur de la position du conducteur (et passager le cas échéant) à l’avant du véhicule (quels sites, quelle proportion)
Identifier les données à utiliser pour le classifieur d’infractions
Définir les données du training et validation tout en créant les crops à utiliser pour l’apprentissage des 2 modèles
Tester plusieurs architectures avec différentes métriques, losses
Sélectionner le meilleur modèle à l’aide des sorties de tensorboard (loss, taux de vrais positifs et taux de vrais négatifs)
Définir une méthode d évaluation conjointe du régresseur et le classifieur, les comparer (matrice de confusion, courbe ROC, precision/recall)
Identifier les données sur lesquelles les modèles performent bien ou peinent à trouver la vérité terrain
Livrer les modèles aux équipes d’intégration, commit le code sur le SVN
Rédiger un compte-rendu du travail effectué (avec les statistiques, les changements effectués, les modèles, la méthode d’évaluation et les performances des modèles anciens et les actuels)
Recommander les seuils à utilise
Vous êtes diplômé(e) d’un bac+5
Vous possédez une expérience professionnelle réussie de minimum 5 ans dans le domaine de l’informatique, de la science des données ou tout autre domaine connexe (hors stage et alternance)
Vous avez de l’expérience dans les technologies cloud-natives et dans l’industrialisation des modèles
Vous savez développer dans différents langages liés aux données et au cloud (Scala et Python)
Vous avez une connaissance sur les outils tels que Tensorflow, Pythorch, Keras, Pandas et Numpy
Vous êtes un(e) passionné(e), orienté(e) résultats commerciaux et vous aimez travailler dans un cadre
Vous maîtrisez la langue française et anglaise
Postuler à cette offre en nous envoyant votre CV.
Contactez-nous !
chela@chela.fr
01.56.86.18.10
Contactez-nous !
chela@chela.fr
01.56.86.18.10
30 rue de la Varenne
94100 Saint-Maur des Fossés
7 porte de Neuilly
93160 Noisy-le-Grand