Les données numériques, carburant de l'IA.

Les intelligences artificielles sont de plus en plus présentes dans nos utilisations du numérique. Elles apparaissent pour les entreprises comme une méthode de différenciation permettant une amélioration de la qualité des services qu’elles proposent. Pour les utilisateurs, en revanche, leur utilité et la pertinence des résultats sont parfois discutables.

Pour mieux comprendre cette divergence de point de vue, il faut expliquer comment fonctionne une intelligence artificielle et par quels processus il est possible d’en améliorer ses résultats.

La course aux données, carburant de l’IA

Les principes fondamentaux de l’intelligence artificielle trouvent leurs origines dans les années 1970 et 1980. L’engouement récent pour sa mise en application est en partie dû à l’augmentation de la puissance des ordinateurs, permettant des temps de calcul plus courts et des coûts plus faibles. Il est aussi dû à l’apparition de larges bases de données, indispensables à la création d’une intelligence artificielle performante.

Le fonctionnement d’une intelligence artificielle peut se résumer à la création d’une représentation mathématique à partir de données. Ce modèle est ensuite utilisé pour réaliser des reconnaissances ou des prédictions. Sa performance dépend donc de la méthode employée pour créer le modèle mais aussi du volume et de la qualité des données utilisées.

Par exemple, pour créer une reconnaissance faciale, Facebook a pu se baser sur l’identification d’individus, sur les millions de photos publiées par ses utilisateurs.

Un autre exemple est celui de Google, qui utilise les identifications de passages piétons et autres panneaux routiers, réalisées par les internautes avec son service reCAPTCHA.

Google perfectionne son IA en s’appuyant sur les identifications des internautes.

L’analogie de données comme étant le nouvel or noir prend alors tout son sens, puisqu’elles sont effectivement utilisées comme carburant des intelligences artificielles.

Lorsqu’elles manquent de données, les intelligences artificielles peuvent parfois être décevantes. Toutefois, en rendant accessible une intelligence artificielle imparfaite, une entreprise peut récupérer les données créées par les utilisateurs. Par exemple, une entreprise proposant un assistant vocal peut améliorer progressivement la reconnaissance vocale en analysant manuellement les enregistrements récupérés.

Les problématiques de cette accumulation

Cette accumulation de données, bien que cruciale pour la création d’intelligences artificielles, pose certains problèmes.

Premièrement, une problématique d’atteinte à la vie privée. En créant des intelligences artificielles toujours plus diverses, les entreprises accumulent des données toujours plus intimes. Par exemple, le nouveau bracelet Amazon Halo, enregistre chacune des paroles de ses utilisateurs et leur propose une analyse de leurs intonations et émotions. L’application mobile associée au bracelet permet aussi la détermination du taux de graisse à partir d’une photo de l’utilisateur en sous-vêtements, donnée que l’on préférerait voir, seulement, entre les mains de nos médecins. En remontant les données personnelles à des fins d’analyse par leurs employés, les entreprises exposent l’intimité de leur utilisateurs.

Dans le cas de l’affichage de publicités ciblées aux utilisateurs, les entreprises créent, grâce à une intelligence artificielle, des profils de personnalités d’une précision sans précédent. Entre de mauvaises mains, ces profils peuvent porter préjudice aux utilisateurs.

Il est raisonnable de penser que la récolte et le stockage de certaines données, ainsi que la création de profils, puissent être réglementés, voir interdits.

Deuxièmement, la concurrence devient de plus en plus difficile puisque l’entreprise ayant la capacité de récolte de données la plus importante est l’entreprise ayant le plus grand nombre d’utilisateurs. C’est donc pour elle un cercle vertueux lui permettant d’améliorer plus rapidement la qualité de son intelligence artificielle et de maintenir sa position dominante grâce aux données générées par les utilisateurs. Pour la concurrence, c’est une barrière à l’entrée infranchissable.

Pour débloquer cette situation et permettre une plus grande concurrence et innovation, on pourrait imaginer que les données générées par les utilisateurs soient considérées comme des biens communs. Elles seraient alors publiques et utilisables par tout le monde. Certaines données, ne pouvant être rendues publiques telles quelles, devraient forcement être anonymisées selon des protocoles publics et validés.

Une autre solution est de contribuer bénévolement à certaines initiatives telle que Mozilla voice, afin de créer des bases de données publiques accessibles à tous.

Un mot sur FLAP

FLAP aide les professionnels et les particuliers à reprendre le contrôle de leurs données. Écoute, conseils, mise en place et suivi, FLAP vous accompagne dans vos besoins numériques en administrant, pour vous, des services professionnels et éthiques tels que Nextcloud pour le partage de fichiers, Matrix et Element pour la messagerie instantanée, et Jitsi pour la visioconférence. N'hésitez à vous rendre sur notre site , notre page tarifaire ou à nous contacter pour plus d'informations !