+228 92 03 35 31
Avez-vous des questions ?
+228 92 03 35 31
Avez-vous des questions ?
Mar 22, 2024 .

Les fondamentaux de l’IA

Suite au cours d’introduction à l’IA, nous verrons dans ce cours comment initier un projet d’IA et constituer une équipe. Nous allons également approfondir un peu la prise en main de l’IA et comment l’utiliser pour résoudre des problèmes dans le secteur public.

01
Vous souvenez vous de la définition de l'IA ?

C'était simple !

L’intelligence Artificielle est l’ensemble des théories et des techniques mises en œuvre en vue de capables de simuler l’intelligence humaine.

02
Les bases de l'Intelligence Artificielle

01 - BIG DATA
Qu'est-ce que c'est ?

BIG DATA
Définition: Les big data ou mégadonnées désignent l’ensemble des données
numériques produites par l’utilisation des nouvelles technologies à des fins
personnelles ou professionnelles. Cela recoupe les données d’entreprise
(courriels, documents, bases de données, historiques de processeurs métiers…)
aussi bien que des données issues de capteurs, des contenus publiés sur le web
(images, vidéos, sons, textes), des transactions de commerce électronique, des
échanges sur les réseaux sociaux, des données transmises par les objets
connectés (étiquettes électroniques, compteurs intelligents, smartphones…), des
données géolocalisées, etc.

Capture

COMMENT FONCTIONNE LE BIG DATA?

Le big data permet de relever un immense défi technologique : stocker une
grande quantité de données provenant de différents canaux sur un immense disque dur, facilement accessibles depuis les quatre coins de la planète. Des données stockées en lieu sûr et récupérables à tout moment en cas d’incident quelconque. Pour y parvenir, les fichiers sont découpés en plusieurs fragments nommés « chunks ». Ces fragments sont ensuite répartis sur plusieurs ordinateurs, et il existe différentes façons de les reconstituer. Une panne survient ? Une autre machine vient prendre le relais en empruntant un autre chemin. Ainsi, les différentes pièces du puzzle restent disponibles en permanence, et peuvent être assemblées d’une façon ou d’une autre.

02 -MACHINE LEARNING
Qu'est-ce que c'est ?

MACHINE LEARNING
Définition: Le Machine Learning est une technologie d’intelligence artificielle
permettant aux ordinateurs d’apprendre sans avoir été programmés
explicitement à cet effet. Pour apprendre et se développer, les ordinateurs ont
toutefois besoin de données à analyser et sur lesquelles s’entraîner.

Capture

SYSTÈME DE RECOMMANDATION

Systeme de filtrage de
l’information visant à
présenter les élémentsqui
sont susceptibles d’intéresser l’utilisateur.

APPRENTISSAGE SUPERVISÉ

On l’utilise pour faire des
prédictions à partir de
données existantes, on parle de input/output.

APPRENTISSAGE NON SUPERVISÉ

Ici on ne dispose que de
données d’entrée (X) et pas de variables de sortie
correspondantes.

Pourquoi utiliser le machine learning?

1 – Pour résoudre des problèmes pour lesquels les solutions existantes nécessitent de nombreux ajustements ou longues listes de règles : un algorithme d’apprentissage automatique peut souvent simplifier code et fonctionnent mieux que l’approche traditionnelle.

2 – Environnements fluctuants : un système de Machine Learning peut s’adapter à de nouvelles données.

3 – Obtenir des informations sur des problèmes complexes et de grandes quantités de données.

03
Comment identifier des occasions d’appliquer l’IA à des problèmes des organisations du secteur public

COMMENT L'UTILISER ?

L’IA peut résoudre beaucoup de problèmes. Mais ce n’est pas dans n’importe
quelle situation qu’il faut appliquer l’IA pour résoudre un problème donné.
Il y a d’abord plusieurs étapes à suivre, que nous verrons plus tard.

Capture

Cas pratique

Supposons qu’une institution étatique souhaite améliorer l’accès à l’eau potable
de certaines collectivités locales.
Ce problème peut être résolu sans appliquer l’IA, mais imaginez que vous vouliez
rendre cette tâche automatique, c’est-à-dire que la tâche puisse être exécutée
sans intervention humaine en fonction de l’évolution des données chaque année.

1 - Encadrer le problème

Il s’agit ici de bien comprendre le problème et de déterminer ce que l’on attend de notre modèle de prédiction. Ici, nous voulons connaître les domaines où il est nécessaire d’améliorer ou de fournir de l’eau potable. Pour se faire il est important d’établir au un Pipeline (Une séquence de composants de traitement de données est appelée pipeline de données.
Les pipelines sont très courants dans les systèmes d’apprentissage automatique, car il y a beaucoup de données à manipuler et de nombreuses transformations de données à appliquer).

Pipeline

Capture

2 - La Collecte des données

N’oubliez pas que les algorithmes de ML ont besoin de la quantité maximale de
données pour fonctionner. Les données peuvent être collectées sous différents
formats.
Ensuite, vous devez avoir accès en temps réel à ces données pour travailler.
Dans notre cas on peut supposer que dans le cadre du projet une plateforme a
été mise en place sur laquelle les données sont stockées. Ces données sont
collectées directement sur le terrain par des agents formés dans ce cadre.
Ex: http://dataportals.org/ , http://archive.ics.uci.edu/ml/

3 - Découvrez et visualisez les données pour obtenir des informations

La partie à ne pas négliger. Il faut maintenant que l’equipe en charge du projet
(des data scientist) analyse les données. Durant la collecte des données on leur
assigne des marqueurs (ex: position géographique, distance de la nape
phréatique, taux de choléra dans la zone, le débit de l’eau, le nombre d’habitants,
nombre de personnes par foyer, etc…)
La science des données passe par la visualisation des données pour découvrir
les relations qu’elles dégagent entre elles.

Capture

4 - Préparer les données pour l'apprentissage automatique Algorithmes

 Le but ici est de nettoyer les données qui seront utilisées pour entraîner notre
algorithme. Pour ce faire, nous combinons parfois certaines valeurs pour créer
des relations entre elles.
Mise à l’échelle des données et intervention du pipeline.

5 - Sélectionner et entraîner un modèle

 C’est la dernière étape. Ici nous allons grâce aux relations que nous avons pu
détecter suite à la visualisation des données, sélectionnées un modèle de
prédiction équivalent.
Dans notre cas nous pouvons grâce au cluster constater que les localités où il y
a un taux élevé de personnes atteintes de choléra, il y a un manque d’eau
potable. Et aussi de découvrir une relation entre l’accès à l’eau potable selon la
position géographique et l’éloignement de la nappe phréatique.
Le premier modèle n’est pas toujours le bon, c’est sur la base du résultat des
calculs de précision des modèles que nous sélectionnons le meilleur.

Leave a comment

Your email address will not be published. Required fields are marked *

Cart (0 items)

Tech Atelier – explorez,  apprenez, et innovez ! »

Contact Info

Lun - Ven : 8:00 -16:00
+228 92 03 35 31
contact@justeinnover.com

Adresse Officiel

Lomé-Togo