Recherche par mots clefs: La region souhaitée: Secteur d'Activité:






Détail de l'offre: Leverage Data Patrimony


  • Société: Dassault Systemes
  • Secteur d'Activité: Informatique, Electronique et Télécom
  • Région du poste: France: Ile de France
  • Type de poste: Leverage Data Patrimony
  • Contrat: Sans Précision
  • Formation:
  • Lieu de travail: Paris
  • Date d'embauche: NC
  • Salaire: N/A
  • Référence: NC


Description du Poste:

Team Introduction and Overview : Le stage se déroulera dans l’équipe Data Science qui s’intéresse aux problématiques liées aux environnements de dimension massive mixant le réel et le virtuel et générant des quantités de données complexes nécessitant l’automatisation de leur traitement et de leur analyse afin d’en extraire une connaissance et des modèles à forte valeur ajoutée.Grace aux solutions de stockage de données « cloud », nous constatons une prolifération de contenus numériques hétérogènes. Afin de naviguer dans ces contenus, iI devient nécessaire de développer des technologies d’analyse automatique.  Les techniques basées sur l’apprentissage statistique (Deep Learning en particulier) sont très efficaces pour analyser des données complexes. Malheureusement, ces techniques nécessitent de grandes quantités de données annotées. Cette annotation est très couteuse et nécessite beaucoup de travail manuel. De plus, plusieurs niveaux d’annotations sont nécessaires selon la complexité des données. Les annotateurs doivent avoir une grande expertise pluridisciplinaire. L’annotation semi-supervisée est l’une des pistes privilégiées dans la recherche.  Cette technique se base sur la collecte manuelle d'annotations localisées et d’outils automatiques de propagation de ces annotations vers les données non labélisées.  De plus, la collecte d’annotations localisées nécessite l’étude de techniques efficaces pour la visualisation de données massives. Role and Purpose : Le but de ce stage est de développer un prototype d’environnement d’annotation de données intégrant la visualisation des données (basée sur des techniques de réduction de dimension telles que la PCA ou le t-SNE), la collecte d’annotations locales et des algorithmes de type apprentissage semi-supervisé inductif et transductifs scalables (Anchor based) afin de propager les annotations manuelles à de grandes quantités de données.  Le Stagiaire devra dans un premier temps établir une recherche bibliographique sur le domaine et développer un prototype adapté aux données de Dassault Systèmes. Sous la supervision de l’encadrant, le stagiaire devra déterminer les outils de propagation à intégrer dans le prototype et les implémenter. Enfin, la qualité des annotations sera évaluée sur des données synthétiques et réelles. Technical Competencies needed : Etudiant(e) en cursus universitaire ou en Ecole d’ingénieurs préparant un diplôme de niveau Bac+5, ou un Mastère spécialiséSpécialité(s)/ Option(s) souhaitée(s) : Informatique, Apprentissage Statistique, Mathématiques AppliquéestPratique de la programmation Web et du PythontConnaissances en C++ souhaitéestDes bases en apprentissages statistique seront fortement appréciéestBonne maitrise de l’anglais à l’oral et à l’écrit pour la rédaction de documentation Personal Competencies needed : Vous êtes curieux et motivé. Rigoureux et assidu dans votre travail. Vous avez un bon niveau d’anglais.Stage Conventionné rémunéré de 6 mois


Postuler à cette offre d'emploi:















  annuler