W1siziisimnvbxbpbgvkx3rozw1lx2fzc2v0cy9gecbjbm5vdmf0aw9uig5ldy9qcgcvymfubmvylwrlzmf1bhquanbnil1d

Expert en mégadonnées - Senior Data Scientist

Expert en mégadonnées - Senior Data Scientist

  • Location

    Montreal

  • Sector:

    Developer/Programmer

  • Job Type:

    Contract

  • Contact:

    Ibrahim Diarra

  • Job Reference:

    3737

  • Published:

    6 months ago

  • Expiry date:

    2019-03-25

  • Start Date:

    2019-04-02

Expert en mégadonnées
 
*English version will follow*

Département
:
Centre d'excellence en Intelligence Artificielle (AI CoE)
 
Mission :
 
Notre client recherche un ingénieur de données senior compétent, expérimenté et motivé. En tant qu’ingénieur de données, vous travaillerez au Centre d’excellence d’IA (AI CoE). En outre, vous jouerez un rôle central dans la mise en œuvre des initiatives de données et d’analyse les plus urgentes pour les applications mobiles clientes.
 
La majeure partie du travail consisterait à créer, gérer et optimiser des pipelines de données, puis à les transférer efficacement en production pour les consommateurs de données clés, d'analyse et d'intelligence artificielle (tels que les analystes de données, les scientifiques de données ou toute autre personne nécessitant un haut degré de confiance en les données pour les cas d'utilisation de données, d'analyse et d'IA).
 
Vous devez garantir la conformité aux exigences de gouvernance et de gestion des données lors de la création, de l'amélioration et de la mise en service de ces pipelines de données intégrés et réutilisables. Cela permettrait un accès plus rapide aux données, une réutilisation intégrée des données et un temps de résolution des solutions considérablement amélioré pour les initiatives du client en matière de données, d’analyse et d’IA.
 
Responsabilités :
  • Comprendre les sources de données et les pipelines de processus,
  • Catalogage et documentation de nouvelles sources de données,
  • Obtenir un accès à diverses bases de données et autres systèmes sources tels que HDFS, SQL, NoSQL ou des bases de données graphiques
  • Application de techniques d'analyse statistique et de visualisation à diverses données, telles que la classification hiérarchique, l'incorporation stochastique du voisin à distribution T (t-SNE), l'analyse en composantes principales (ACP)
  • Générer des hypothèses sur les mécanismes sous-jacents du processus métier
  • Tester des hypothèses en utilisant diverses méthodes quantitatives
  • Mise en réseau avec des experts du domaine métier et des chefs de produits pour mieux comprendre la mécanique métier qui a généré les données
  • Application de diverses techniques d'analyse ML / DL et avancées pour effectuer des tâches de classification ou de prévision
  • Test des modèles ML / DL, tels que la validation croisée, le test A / B, le biais et l'équité
  • Collaboration avec DevOps et ingénieurs de données pour évaluer et implémenter les options de déploiement de l'IA
  • Collaboration dans les pratiques de gouvernance et de gestion des données
Exigences :
  • Une maîtrise en informatique, statistique, mathématiques ou dans un domaine connexe (un doctorat est un plus)
  • Plus de 5 ans d'expérience dans l'industrie en tant que Data Scientist
  • Expérience avec l'apprentissage machine, l'apprentissage en profondeur et l'apprentissage par renforcement
  • Expérience de l'ingestion, du traitement et de la visualisation de Big Data
  • Expérience de travail dans les banques et les institutions financières (expérience en FinTech est un plus)
  • 5+ années d'expérience avec le langage de programmation Python
  • 2 ans d'expérience avec le langage de programmation Scala
  • Au moins trois ans d'expérience dans la production de données évolutive Data Science
  • 3 ans et plus d'expérience avec Scikit-Learn, Pandas, Matplotlib, Numpy, Scipy et XGBoost
  • Expérience avec Keras, Tensorflow et Pytorch pour un apprentissage en profondeur
  • Expérience avec Apache Spark (la connaissance de Databricks est un atout)
  • Expérience avec les bases de données NoSQL (MongoDB ou CosmosDB)
  • Expérience des processus agiles et des meilleures pratiques de génie logiciel
Considéré comme un plus :
  • Expérience avec Apache Kafka pour la diffusion d'événements (un atout)
  • Connaissance des bases de données Graphiques (JanusGraph, Apache TinkerPop et Gremlin)
  • Expérience avec Docker et Kubernetes
  • Expérience avec DataOps et AIOps
Senior Data Scientist
 
Department:
AI Center Of Excellence (AI CoE)
 
Mandate:
Our client is looking for a bright, knowledgeable and motivated Senior Data Scientist experienced with Big Data, Machine Learning and Deep Learning.
 
As a Senior Data Scientist, you will be working at the AI Center of Excellence (AI CoE). You will contribute to enterprise-wide best practices, processes and platforms for the client’s AI strategy. Also, you will play a pivotal role in delivering mobile applications that leverage AI to help achieve key business objectives.
 
The bulk of the work will be in problem analysis, data ingestion, exploration and preparation, statistical hypothesis testing, feature engineering, modelling, storytelling with data, operationalization and performance tuning.
 
Responsibilities:
  • Understanding data sources and process pipelines,
  • Cataloging and documenting new data sources,
  • Acquiring access to various databases, and other source systems such as HDFS, SQL, NoSQL or graph databases
  • Applying statistical analysis and visualization techniques to various data, such as hierarchical clustering, T-distributed Stochastic Neighbor Embedding (t-SNE), principal components analysis (PCA)
  • Generating hypotheses about the underlying mechanics of the business process
  • Testing hypotheses using various quantitative methods
  • Networking with business domain experts and product managers to better understand the business mechanics that generated the data
  • Applying various ML/DL and advanced analytics techniques to perform classification or prediction tasks
  • Testing of ML/DL models, such as cross-validation, A/B testing, bias and fairness
  • Collaboration with DevOps, and data engineers to evaluate and implement AI deployment options
  • Collaboration in Data Governance and Data Management practices
Requirements:
  • A master's degree in Computer Science, Statistics, Mathematics or related fields (A Ph.D. degree is a plus)
  • 5+ years of industry experience as a Data Scientist
  • Experience with Machine Learning, Deep Learning and Reinforcement Learning
  • Experience with Big Data ingestion, processing and visualization
  • Experience of working in banks and financial institutions (FinTech experience is a plus)
  • 5+ years of experience with Python programming language
  • 2+ years of experience with Scala programming language
  • 3+ years of experience with scalable production grade Data Science
  • 3+ years of experience with Scikit-Learn, Pandas, Matplotlib, Numpy, Scipy, and XGBoost
  • Experience with Keras, Tensorflow and Pytorch for Deep Learning
  • Experience with Apache Spark (Databricks knowledge is a plus)
  • Experience with NoSQL databases (MongoDB or CosmosDB)
  • Experience with Agile processes and Software Engineering best practices
Considered as a plus:
  • Experience with Apache Kafka for Event Streaming (is a plus)
  • Knowledge of Graph databases (JanusGraph, Apache TinkerPop and Gremlin)
  • Experience with Docker, and Kubernetes
  • Experience with DataOps, and AIOps