Description du poste
Métier
DATA – DATA SCIENTIST
Intitulé du poste
STAGIAIRE DATA SCIENTIST – Speech Analytics et NLP F/H
Contrat
Stage
Durée du contrat
6 Mois
Finalité du poste
Le produit Speech Analytics permet de traiter au fil de l’eau les conversations sur nos différents centres d’appel. Une pipeline d’acquisition et de traitement est en place et est adossé au système d’information de l’entreprise (connaissance client, actes de gestions). Cette pipeline alimente différents algo prédictifs (évaluation de la satisfaction, gestion des réclamations, risque de résiliation, etc.).
Le but de ce stage est de développer un nouveau système de classification des conversations qui permettrait d’évaluer la vulnérabilité des entreprises dans notre portefeuille et d’enrichir un produit data déjà existant.
Missions
Au sein du département Data Science et IA, vous rejoignez l’équipe produit Speech Analytics Data Scientists et d’un Product manager. Votre mission se décompose en trois volets : exploration, analyse et modélisation
Exploration et Analyse des données audios :
Vous devrez assurer le maintien de la cohérence des données de conversations audios et participer à l’entreprise de refactorisation des méthodes de traitement de la parole. Vous interviendrez notamment sur l’établissement de lexiques à l’aide de traitement de données de transcriptions et de modèles de reconnaissance de la parole. Vous développerez des métriques de la qualité des données et des métadonnées audios.
Techniques / Technologies : procédés d’analyse de la qualité de la parole modèles de systèmes de reconnaissances simples (types mots clés sur des flux audios), modèles de paroles (type HTK ou Sphinx), modèle de détection de mots clés sur l’audio.
Exploration et Analyse des données temporelles et textuelles :
Vous participerez activement au développement de modèles de prédiction (a minima régression linéaire, séries temporelles, …) pour l’analyse des flux d’appels. Vous interviendrez également sur le traitement des langues à partir du texte pour la génération automatique de résumés (état de l’art, prototypage, implémentation).
Techniques / Technologies : méthodes de machine Learning sur tout type de données (indices numériques, textuelles etc…), des implémentations déjà réalisées dans le cadre des études seront fortement appréciées. Systèmes et processus d’exploitation des données textuelles pour la classification, l’appairage ou le groupement en population (connaissances préalable utiles).
Modélisation et aide à la structuration des données :
Vous appuierez le développement de graphes de connaissances (incl. analyse et visualisation de données en graphe pour aider l’émergence de nouvelles dynamiques clients ou interne. Vous pourrez également sur les évolutions de la pipeline (refactorisation, automatisation, monitoring, etc.) ou la MAJ de certains modèles pour améliorer la robustesse, la performance ou la maintenabilité des produits.
Techniques / Technologies : ingénierie des connaissances, méthodes d’analyses de graphes, traitement de données textuelles en masse, bibliothèques de traitement automatique des langues.
Profil recherché
Vous préparez un bac+5 (ingénieur, master) en vision par ordinateur, machine learning, traitement du signal ou mathématiques appliquées. Vous avez une connaissance minimale de frameworks du domaine (Scikit-Learn, TensorFlow, PyTorch, Keras, …).
Vous êtes en capacité de développer de nouvelles solutions en s’inspirant de méthodes existantes ou d’imaginer de nouveaux algorithmes adaptés.
Vous développez vos propres scripts en autonomie (idéalement Python). Nous utilisons Dataiku pour le prototypage et la mise en production des premières versions des produits. Nous travaillons en mode agile.
Vous êtes créatif et vous souhaitez travailler sur un des défis du moment en machine learning. Vous êtes curieux, vous avez envie d’apprendre. Vous avez du plaisir à utiliser des algos pour tester vos idées. Vous n’avez pas peur d’essayer et vous êtes toujours à la recherche du bon équilibre entre rigueur et exploration.
Vous êtes autonome et vous pensez que la partie est plus belle quand on joue avec les autres
Localisation du poste
Localisation du poste
Ile-de-France, Paris (75)
Ville
Paris 13ème
Description du poste
Métier
DATA – DATA SCIENTIST
Intitulé du poste
STAGIAIRE DATA SCIENTIST – Speech Analytics et NLP F/H
Contrat
Stage
Durée du contrat
6 Mois
Finalité du poste
Le produit Speech Analytics permet de traiter au fil de l’eau les conversations sur nos différents centres d’appel. Une pipeline d’acquisition et de traitement est en place et est adossé au système d’information de l’entreprise (connaissance client, actes de gestions). Cette pipeline alimente différents algo prédictifs (évaluation de la satisfaction, gestion des réclamations, risque de résiliation, etc.).
Le but de ce stage est de développer un nouveau système de classification des conversations qui permettrait d’évaluer la vulnérabilité des entreprises dans notre portefeuille et d’enrichir un produit data déjà existant.
Missions
Au sein du département Data Science et IA, vous rejoignez l’équipe produit Speech Analytics Data Scientists et d’un Product manager. Votre mission se décompose en trois volets : exploration, analyse et modélisation
Exploration et Analyse des données audios :
Vous devrez assurer le maintien de la cohérence des données de conversations audios et participer à l’entreprise de refactorisation des méthodes de traitement de la parole. Vous interviendrez notamment sur l’établissement de lexiques à l’aide de traitement de données de transcriptions et de modèles de reconnaissance de la parole. Vous développerez des métriques de la qualité des données et des métadonnées audios.
Techniques / Technologies : procédés d’analyse de la qualité de la parole modèles de systèmes de reconnaissances simples (types mots clés sur des flux audios), modèles de paroles (type HTK ou Sphinx), modèle de détection de mots clés sur l’audio.
Exploration et Analyse des données temporelles et textuelles :
Vous participerez activement au développement de modèles de prédiction (a minima régression linéaire, séries temporelles, …) pour l’analyse des flux d’appels. Vous interviendrez également sur le traitement des langues à partir du texte pour la génération automatique de résumés (état de l’art, prototypage, implémentation).
Techniques / Technologies : méthodes de machine Learning sur tout type de données (indices numériques, textuelles etc…), des implémentations déjà réalisées dans le cadre des études seront fortement appréciées. Systèmes et processus d’exploitation des données textuelles pour la classification, l’appairage ou le groupement en population (connaissances préalable utiles).
Modélisation et aide à la structuration des données :
Vous appuierez le développement de graphes de connaissances (incl. analyse et visualisation de données en graphe pour aider l’émergence de nouvelles dynamiques clients ou interne. Vous pourrez également sur les évolutions de la pipeline (refactorisation, automatisation, monitoring, etc.) ou la MAJ de certains modèles pour améliorer la robustesse, la performance ou la maintenabilité des produits.
Techniques / Technologies : ingénierie des connaissances, méthodes d’analyses de graphes, traitement de données textuelles en masse, bibliothèques de traitement automatique des langues.
Profil recherché
Vous préparez un bac+5 (ingénieur, master) en vision par ordinateur, machine learning, traitement du signal ou mathématiques appliquées. Vous avez une connaissance minimale de frameworks du domaine (Scikit-Learn, TensorFlow, PyTorch, Keras, …).
Vous êtes en capacité de développer de nouvelles solutions en s’inspirant de méthodes existantes ou d’imaginer de nouveaux algorithmes adaptés.
Vous développez vos propres scripts en autonomie (idéalement Python). Nous utilisons Dataiku pour le prototypage et la mise en production des premières versions des produits. Nous travaillons en mode agile.
Vous êtes créatif et vous souhaitez travailler sur un des défis du moment en machine learning. Vous êtes curieux, vous avez envie d’apprendre. Vous avez du plaisir à utiliser des algos pour tester vos idées. Vous n’avez pas peur d’essayer et vous êtes toujours à la recherche du bon équilibre entre rigueur et exploration.
Vous êtes autonome et vous pensez que la partie est plus belle quand on joue avec les autres
Localisation du poste
Localisation du poste
Ile-de-France, Paris (75)
Ville
Paris 13ème
Calabrio is looking for a highly skilled and experienced Software Engineer NLP/ML to perform a key role in our digital...
Apply For This JobThe era of pervasive AI has arrived. In this era, organizations will use generative AI to unlock hidden value in...
Apply For This JobAre you excited about working at the forefront of applied research in an industry setting? Thomson Reuters Labs in Toronto...
Apply For This JobJob Description At Verint, we believe customer engagement is at the core of global brands. Our mission is to help...
Apply For This JobEine Aufgabe, die herausfordert Du verantwortest die kaufmännischen Prozesse, die Compliance sowie die Architektur unserer Advanced-Analytics-Plattform in der Rolle des...
Apply For This JobWer wir sind Wir bei WPS Management gehören zu den Spitzenreitern im internationalen Markt für e-Procurement-Lösungen und haben eine zukunftsorientierte...
Apply For This Job