Description du poste
Métier
DATA – DATA SCIENTIST
Intitulé du poste
STAGIAIRE DATA SCIENTIST – Speech Analytics et NLP F/H
Contrat
Stage
Durée du contrat
6 Mois
Finalité du poste
Le produit Speech Analytics permet de traiter au fil de l’eau les conversations sur nos différents centres d’appel. Une pipeline d’acquisition et de traitement est en place et est adossé au système d’information de l’entreprise (connaissance client, actes de gestions). Cette pipeline alimente différents algo prédictifs (évaluation de la satisfaction, gestion des réclamations, risque de résiliation, etc.).
Le but de ce stage est de développer un nouveau système de classification des conversations qui permettrait d’évaluer la vulnérabilité des entreprises dans notre portefeuille et d’enrichir un produit data déjà existant.
Missions
Au sein du département Data Science et IA, vous rejoignez l’équipe produit Speech Analytics Data Scientists et d’un Product manager. Votre mission se décompose en trois volets : exploration, analyse et modélisation
Exploration et Analyse des données audios :
Vous devrez assurer le maintien de la cohérence des données de conversations audios et participer à l’entreprise de refactorisation des méthodes de traitement de la parole. Vous interviendrez notamment sur l’établissement de lexiques à l’aide de traitement de données de transcriptions et de modèles de reconnaissance de la parole. Vous développerez des métriques de la qualité des données et des métadonnées audios.
Techniques / Technologies : procédés d’analyse de la qualité de la parole modèles de systèmes de reconnaissances simples (types mots clés sur des flux audios), modèles de paroles (type HTK ou Sphinx), modèle de détection de mots clés sur l’audio.
Exploration et Analyse des données temporelles et textuelles :
Vous participerez activement au développement de modèles de prédiction (a minima régression linéaire, séries temporelles, …) pour l’analyse des flux d’appels. Vous interviendrez également sur le traitement des langues à partir du texte pour la génération automatique de résumés (état de l’art, prototypage, implémentation).
Techniques / Technologies : méthodes de machine Learning sur tout type de données (indices numériques, textuelles etc…), des implémentations déjà réalisées dans le cadre des études seront fortement appréciées. Systèmes et processus d’exploitation des données textuelles pour la classification, l’appairage ou le groupement en population (connaissances préalable utiles).
Modélisation et aide à la structuration des données :
Vous appuierez le développement de graphes de connaissances (incl. analyse et visualisation de données en graphe pour aider l’émergence de nouvelles dynamiques clients ou interne. Vous pourrez également sur les évolutions de la pipeline (refactorisation, automatisation, monitoring, etc.) ou la MAJ de certains modèles pour améliorer la robustesse, la performance ou la maintenabilité des produits.
Techniques / Technologies : ingénierie des connaissances, méthodes d’analyses de graphes, traitement de données textuelles en masse, bibliothèques de traitement automatique des langues.
Profil recherché
Vous préparez un bac+5 (ingénieur, master) en vision par ordinateur, machine learning, traitement du signal ou mathématiques appliquées. Vous avez une connaissance minimale de frameworks du domaine (Scikit-Learn, TensorFlow, PyTorch, Keras, …).
Vous êtes en capacité de développer de nouvelles solutions en s’inspirant de méthodes existantes ou d’imaginer de nouveaux algorithmes adaptés.
Vous développez vos propres scripts en autonomie (idéalement Python). Nous utilisons Dataiku pour le prototypage et la mise en production des premières versions des produits. Nous travaillons en mode agile.
Vous êtes créatif et vous souhaitez travailler sur un des défis du moment en machine learning. Vous êtes curieux, vous avez envie d’apprendre. Vous avez du plaisir à utiliser des algos pour tester vos idées. Vous n’avez pas peur d’essayer et vous êtes toujours à la recherche du bon équilibre entre rigueur et exploration.
Vous êtes autonome et vous pensez que la partie est plus belle quand on joue avec les autres
Localisation du poste
Localisation du poste
Ile-de-France, Paris (75)
Ville
Paris 13ème
Description du poste
Métier
DATA – DATA SCIENTIST
Intitulé du poste
STAGIAIRE DATA SCIENTIST – Speech Analytics et NLP F/H
Contrat
Stage
Durée du contrat
6 Mois
Finalité du poste
Le produit Speech Analytics permet de traiter au fil de l’eau les conversations sur nos différents centres d’appel. Une pipeline d’acquisition et de traitement est en place et est adossé au système d’information de l’entreprise (connaissance client, actes de gestions). Cette pipeline alimente différents algo prédictifs (évaluation de la satisfaction, gestion des réclamations, risque de résiliation, etc.).
Le but de ce stage est de développer un nouveau système de classification des conversations qui permettrait d’évaluer la vulnérabilité des entreprises dans notre portefeuille et d’enrichir un produit data déjà existant.
Missions
Au sein du département Data Science et IA, vous rejoignez l’équipe produit Speech Analytics Data Scientists et d’un Product manager. Votre mission se décompose en trois volets : exploration, analyse et modélisation
Exploration et Analyse des données audios :
Vous devrez assurer le maintien de la cohérence des données de conversations audios et participer à l’entreprise de refactorisation des méthodes de traitement de la parole. Vous interviendrez notamment sur l’établissement de lexiques à l’aide de traitement de données de transcriptions et de modèles de reconnaissance de la parole. Vous développerez des métriques de la qualité des données et des métadonnées audios.
Techniques / Technologies : procédés d’analyse de la qualité de la parole modèles de systèmes de reconnaissances simples (types mots clés sur des flux audios), modèles de paroles (type HTK ou Sphinx), modèle de détection de mots clés sur l’audio.
Exploration et Analyse des données temporelles et textuelles :
Vous participerez activement au développement de modèles de prédiction (a minima régression linéaire, séries temporelles, …) pour l’analyse des flux d’appels. Vous interviendrez également sur le traitement des langues à partir du texte pour la génération automatique de résumés (état de l’art, prototypage, implémentation).
Techniques / Technologies : méthodes de machine Learning sur tout type de données (indices numériques, textuelles etc…), des implémentations déjà réalisées dans le cadre des études seront fortement appréciées. Systèmes et processus d’exploitation des données textuelles pour la classification, l’appairage ou le groupement en population (connaissances préalable utiles).
Modélisation et aide à la structuration des données :
Vous appuierez le développement de graphes de connaissances (incl. analyse et visualisation de données en graphe pour aider l’émergence de nouvelles dynamiques clients ou interne. Vous pourrez également sur les évolutions de la pipeline (refactorisation, automatisation, monitoring, etc.) ou la MAJ de certains modèles pour améliorer la robustesse, la performance ou la maintenabilité des produits.
Techniques / Technologies : ingénierie des connaissances, méthodes d’analyses de graphes, traitement de données textuelles en masse, bibliothèques de traitement automatique des langues.
Profil recherché
Vous préparez un bac+5 (ingénieur, master) en vision par ordinateur, machine learning, traitement du signal ou mathématiques appliquées. Vous avez une connaissance minimale de frameworks du domaine (Scikit-Learn, TensorFlow, PyTorch, Keras, …).
Vous êtes en capacité de développer de nouvelles solutions en s’inspirant de méthodes existantes ou d’imaginer de nouveaux algorithmes adaptés.
Vous développez vos propres scripts en autonomie (idéalement Python). Nous utilisons Dataiku pour le prototypage et la mise en production des premières versions des produits. Nous travaillons en mode agile.
Vous êtes créatif et vous souhaitez travailler sur un des défis du moment en machine learning. Vous êtes curieux, vous avez envie d’apprendre. Vous avez du plaisir à utiliser des algos pour tester vos idées. Vous n’avez pas peur d’essayer et vous êtes toujours à la recherche du bon équilibre entre rigueur et exploration.
Vous êtes autonome et vous pensez que la partie est plus belle quand on joue avec les autres
Localisation du poste
Localisation du poste
Ile-de-France, Paris (75)
Ville
Paris 13ème
Job Description: Jesteśmy firmą technologiczną.Realizujemy projekty. Budujemy zespoły. Zapewniamy specjalistów do projektów.Za pomocą technologii wspieramy wzrost biznesowy naszych Klientów oraz...
Apply For This JobJob Description: Hey! Are you ready to unleash your genius and make an impact like never before? Here is your opportunity! We’re...
Apply For This JobJob Description: CV Submission until 05.03.2024 Service delivery: The services shall be performed remotely in Near-site location allowing to reach...
Apply For This JobCompany Overview: GigaSpaces is developing a pioneering eRAG (Enterprise Retrieval Augmented Generation), a technology that aims to enable LLMs to...
Apply For This JobNLP Engineer – Data Insights System Deep Learning Models Remote – UK & EU Up to €75k Seeking an NLP...
Apply For This JobJob Description: Jesteśmy firmą technologiczną.Realizujemy projekty. Budujemy zespoły. Zapewniamy specjalistów do projektów.Za pomocą technologii wspieramy wzrost biznesowy naszych Klientów oraz...
Apply For This Job