Présentation

Je suis Baruch AMOUSSOU-DJANGBAN, diplômé de Telecom ParisTech, je me suis spécialisé dans la Data Science et sur les nouvelles technologies liées au Big Data.

Expériences

Consultant Big Data & Data Scientist

BPCE - Banque populaire & Caisse d'Epargne
Depuis septembre 2016
Missions effectuées
  • Mise en place et monitoring de clusters Big Data : Distribution hortonworks (Environnement de POC, de DEV et de PROD)
    - Gestion de la sécurité des environnements: Ranger, Knox, Kerberos
  • Intégration des données dans le cluster
  • Développement d'applications R-Shiny
  • Mise en place d'algorithmes
  • Outils & Progiciels : Script Bash, Python, Spark, Hadoop, R, RShiny

Consultant Big Data & Data Scientist

Groupe OnePoint
Depuis février 2016
Missions effectuées
  • Conception d'une application web pour visualiser en temps réel la prédiction de la consommation en gaz de grands industriels et de la facturation associée
  • Conception d'une application web de visualisation en temps réel du flux de voyageurs à l’aéroport de Montréal
  • Mise en place et administration d’un cluster big data (hortonworks)
  • Développement d'une application web pour l'analyse de tweets
  • Développement d’une application RH Analytics
  • Outils & Progiciels : Python, R, RShiny, Script Bash, Scala, Pyspark, Hive, MongoDb, Elasticsearch, D3Js, HTML, Dataiku, Tableau
  • Algorithmes utilisés : Random Forest, XgBoost, Perceptron multicouche, Réseau de neurones récurrents, Latent Semantic Analysis (LSA), Latent Dirichlet Allocation (LDA), Topic Modeling

Data Scientist

Societe Generale Corporate and Investment Banking
Juillet 2015 à janvier 2016
Missions effectuées
  • Développement d’un algorithme d’intelligence artificielle pour la détection de fraude
  • Outils & Progiciels : Python, Script Bash, Hadoop
  • Algorithmes utilisés : SVM One Class, Isolation Forest, Multivariate normal distribution, kernel Smoothing, Regression Logistique, Random Forest

Data Scientist pour la voiture connectée

PSA Peugeot Citroen
Décembre 2014 à juin 2015
Missions effectuées
  • Développement d’algorithmes liés à la maintenance prédictive
  • Outils & Progiciels : Python, R, Ibm biginsights
  • Algorithmes utilisés : Regression logistique, Arbre de decision, Random Forest, Adaboost

Data Analyst

PSA Peugeot Citroën
Mars 2014 à août 2014
Missions effectuées
  • Analyse des comportements de mobilité des français.
    - Construction d’indicateurs pertinents de mobilités à partir de données d'enquête
    - Développement d’un outil excel permettant le calcul automatique de ces indicateurs
    - Mise en place de segmentation
    - Mise en place d'un modèle prédictif
  • Outils & Progiciels : SAS, SPAD, R
  • Algorithmes utilisés : Régression logistique, Analyse discriminante linéaire

Assistant chercheur en économétrie

Université Lille1 - Laboratoire CLERSE
Janvier 2013 à mars 2013
Missions effectuées
  • Analyse quantitatif du fédéralisme budgétaire aux Etats-Unis.

    - Etude des différents mécanismes d’ajustement aux chocs macroéconomiques asymétriques
    - Évaluation de l’impact d’une action de la Banque fédérale sur la croissance des Etats touchés par un choc spécifique sur la production.
  • Outils & Progiciels : SAS

Compétences

  • Machine Learning : SVM, Random Forest, Adaboost, XgBoost, SVM One Class, Isolation Forest
  • Deep Learning : perceptron multicouche, Réseau de neurones récurrents
  • Traitement automatique du langage Naturel: Latent Semantic Analysis (LSA), Latent Dirichlet Allocation (LDA), Topic Modeling
  • Modélisation de séries temporelles
  • Analyse exploratoire, estimation et tests d'hypothèses
  • Programmation: Python, R, Scala, Hive, Java, SAS, Git, Script Bash
  • Logiciels d'analyse de données : Dataiku, RapidMiner, SPSS, SAS, SPAD, Weka
  • Développement web : D3Js, JavaScript, HTML, CSS, Bootstrap
  • Data Lake : Hortonworks, MapR, Cloudera
  • Bases de données relationnelles : Oracle, MySQL, Postgresql
  • Bases de données distribuées : MongoDb, Cassandra, Elasticsearch, Neo4j
  • Logiciels pour la visualisation : Tableau Software, Processing
  • Services Cloud : Cloud Amazon (AWS), Microsoft Azure, Google Plateforme
  • Anglais : Professional competence

Formations

Description de la formation

Certification IBM SPSS Statistics Level 1 v2
Certification Spark Developer

Description de la formation

Deux projets très interessant que j'ai réalisés:

Projet 1: Conception d’un système d’alerte Tsunami pour le Japon suite à un tremblement de terre
-Gestion de 100 Giga de données sur la population du Japon
- Mise en place d’un cluster Cassandra/Spark et MongoDB dans le Cloud Amazon
- Développement d’un algorithme d’envoi de SMS aux individus présents dans la zone de sinistre et réalisation d’un outil de visualisation de la zone de sinistre

Projet 2: Mise en place d’un système de recommandation de film

Modules, options, contenu des cours
  • Programmation : Python, Spark, Java
  • Sécurité des systèmes d'information
  • Machine Learning
  • Data Visualisation
  • Réseau de neurone
  • Hadoop-MapReduce
  • Base de données
  • Web Scrapping

Master 1 & 2 Econométrie appliquée

Université des Sciences et Technologies de Lille (Lille I)
Septembre 2012 à 2014
Modules, options, contenu des cours
  • Statistique-Mathématique
  • Econométrie des séries temporelles
  • SAS
  • Economie

Loisirs

  • Natation, Course à pied
  • Rotaract Club Paris