Lorsque l’on étudie les systèmes, on apprend qu’il existe trois composantes qui les définissent

  • Une composante régulière
  • Une composante intégrative
  • Une composante différenciative

On peut alors définir un niveau de maturité des systèmes selon qu’ils mettent en œuvre uniquement la composante régulière, ou bien la régulière et l’intégrative ou bien les trois.

La composante régulière : les systèmes de niveau 1

Les systèmes de niveau 1 n’incluent que la dimension régulière. Les règles sont prises en charge par programmation (systèmes de gestion) ou via des moteurs de règles ou des arbres de décision. Ils incluent la majorité des bots.

Par exemple si l’on veut équiper une ville de lignes de métro, la composante régulière sera la première à laquelle on pensera, bien évidemment. Plus la ville est étendue, plus il y a de voyageurs, plus il faudra de métros sur les lignes et plus il faudra de lignes. Le concepteur du système d’automatisation le dimensionnera surement en fonction de données évaluées ou mesurées lors d’enquêtes et de simulations en appliquant des règles de gestion.

A ce stade il faut donc penser à vérifier nos 4 biais :

  • Quelle est l’incertitude sur les données reçues ? qui a répondu ? comment a-t-on interrogé ? a quelle date s’est déroulée l’enquête ? sans parler des lobbyistes ….
  • Quelle est la représentativité de mon modèle ? est-il simplement copié d’une autre ville sans réelle adaptation ?
  •  Quels peuvent etre les réactions des habitants lors de l’ouverture des lignes ? il y aura forcément modification de leur comportement, dans quel sens ? quels sont les effets induits sur le développement ou la régression de certains quartiers de la ville ?
  • Existe-t-il des situations singulières non prises en compte ? les personnes handicapées, les enfants, les personnes portant des talons ? etc…

Nous obtenons ainsi un automate de niveau 1, bâtit sur des données relevées à une date particulière et reproduisant un modèle de desserte calqué sur une autre ville.

Le système régulier de niveau 1 conduit à établir un horaire de passage des métros identique sur tout un semestre par exemple. Bien sur la fréquence est plus grande aux heures de pointe en semaine, elle est allégée le week-end dans certains quartiers etc.

La composante intégrative : les systèmes de niveau 2

Pour mieux gérer le trafic sur nos lignes de métro, on peut équiper en plus notre système d’une IA intégrative et le passer au niveau 2.

Les techniques de Machine Learning et de Deep Learning sont des techniques fortement intégratives car elles cherchent les éléments fédérateurs entre les cas donnés en exemple. Elles remplacent les cas par des valeurs moyennes dans leur catégorie et de fait éliminent les singularités et les signaux faibles.

Il existe à ce jour pléthore d’algorithmes de Machine Learning disponibles en open-source ou dans le cloud. Il est alors aisé de produire un modèle qui se base sur les relevés de trafic des années précédentes pour prédire le trafic jour après jour l’année suivante. Un apprentissage supervisé, ou un réseau bayésien si certaines données sont absentes, feront l’affaire. Nous obtiendrons ainsi un système d’IA capable de prédire le trafic disposant d’une composante régulière et d’une composante intégrative, un système de niveau de maturité égal à 2.

Ce qui ne nous empêche pas de verifier une fois de plus nos 4 biais :

  • Les données que j’utilise pour entrainer mon modèle sont elles représentatives ?
  • Quelle est leur niveau de précision ?
  • Comment réagissent les usagers ? quel est l’impact du trafic sur leurs comportements ? utilisent-ils plus ou moins le métro que l’année dernière ?
  • Existe-t-il des situations singulières non prises en compte ?

La composante différenciative : les systèmes de niveau 3

Le système de niveau 2 est un système idyllique. Il fonctionne bien quand tout fonctionne bien. Or si l’on interroge les exploitants de lignes de métro des grandes métropoles ils avouent que chaque jour il y a une quinzaine d’incidents ou d’imprévus qui perturbent de façon significative le trafic. Ce peut être une fuite d’eau, une panne électrique, un accident de voyageur, un vol, un malaise, une descente de police, un match annulé, etc… Et dans ces situations, le système de niveau 2 ne peut pas réagir car il ne dispose pas de données similaires, en raison de la singularité de la situation.

Il est impératif de recueillir les signaux faibles, de les détecter, de les comprendre pour anticiper les situations à venir et etre en mesure d’y répondre. Ces signaux peuvent nous alerter quelques minutes ou quelques heures avant que l’effet de la singularité se fasse sentir. Il est possible de renforcer une ligne sur laquelle reporter une partie du trafic ou au contraire d’en alléger une autre en redéployant le personnel différemment sur la ligne, etc. mais pour cela il est nécessaire de concevoir son IA avec une dimension différenciative adaptée.

Dans certains cas la dimension différenciative est bien plus volumineuse que les deux autres. Dans d’autres cas elle peut être simplement ignorée sans qu’il y ait de conséquence. Tout dépend des problématiques à résoudre. Avec une composante différenciative, nous obtenons un système d’IA de niveau de maturité égal à 3, un système abouti.

Pourquoi la composante différenciative est-elle très souvent négligée ?

Lorsque l’on travaille la dimension intégrative, on agit dans un certain confort. Il existe nombre d’algorithmes sur le marché qu’il suffit d’assembler et d’expérimenter. Parfois les datascientists ne savent pas comment fonctionnent réellement ces algorithmes ce qui ne les empêche pas de les utiliser et de conduire des expérimentations, puis, de proche en proche, de converger vers une solution.

De plus, les techniques intégratives sont simplificatrices. Mathématiquement une intégrale est toujours plus stable que la fonction initiale, en éliminant les singularités on simplifie les traitements.

Travailler la dimension différenciative c’est renouer avec les équations différentielles. Il faut explorer plusieurs axes de dérivation, les fonctions ne sont pas toujours dérivables, on tombe sur des discontinuités et des espaces non euclidiens. C’est un monde intellectuellement plus contraignant. C’est aussi pourquoi il existe peu d’algorithmes développés et moins d’expériences dans l’univers de l’IA.

Pourtant ces techniques existent dans d’autres domaines. Par exemple lorsqu’un ingénieur doit calculer un pont, il utilise des simulateurs qui exploitent largement des équations différentielles, des variétés, etc. Ces ingénieurs mécaniciens répondent quotidiennement à nos 4 biais :

  • Les données que j’utilise pour construire et simuler mon modèle sont-elles représentatives ?
  • Quelle est leur niveau de précision ?
  • Comment réagiront les usagers du pont ?
  • Existe-t-il des situations singulières non prises en compte ?

Alors pourquoi est-ce si difficile de le faire appliquer dans l’univers de l’IA ?

Jean Pierre MALLE