Data streams through a businessman

Quand est-ce que suffisamment de données sont suffisantes pour l’IA et la prise de décision ?

Le problème et la promesse de l’intelligence artificielle (IA), ce sont les gens. Cela a toujours été vrai, quels que soient nos espoirs (et nos craintes) de voir des seigneurs robotiques prendre le relais. En IA et en science des données en général, l’astuce consiste à mélanger le meilleur des humains et des machines. Depuis un certain temps, les pom-pom girls de l’industrie de l’IA ont tendance à mettre l’accent sur le côté machine de l’équation. Mais comme la santé du printemps La scientifique des données Elena Dyachkova laisse entendreles données (et les machines qui les sous-tendent) ne sont utiles que si les personnes qui les interprètent sont intelligentes.

Décompressons ça.

Données imparfaites, bonnes décisions

Dyachkova répondait à un commentaire de Sarah Catanzaro, associée générale chez Amplify Partners et ancienne responsable des données chez Mattermark. Discuter de l’utilité des données imparfaites et de l’analyse dans la prise de décision, catanzaro dit“Je pense que la communauté des données passe souvent à côté de la valeur des rapports et des analyses qui [are] imparfait mais directionnellement correct. Puis elle continue à argumenter, « De nombreuses décisions ne nécessitent pas d’informations de haute précision ; nous ne devrions pas avoir peur du rapide et du sale dans de nombreux contextes.

C’est un excellent rappel que nous n’avons pas besoin de données parfaites pour éclairer une décision. C’est zonte. Gary Marcus, scientifique et fondateur de Geometric Intelligence, une société d’apprentissage automatique acquise par Uber en 2016, insiste sur le fait que la clé pour apprécier l’IA et ses sous-ensembles d’apprentissage automatique et d’apprentissage en profondeur consiste à reconnaître que ces outils de reconnaissance de formes sont à leur meilleur “lorsque tout le reste est disponible”. ce dont nous avons besoin est grossier. des résultats prêts là où les enjeux sont faibles et des résultats parfaits en option. Malgré cette vérité, dans notre quête d’applications plus puissantes alimentées par l’IA, nous continuons à rechercher de plus en plus de données, dans l’espoir que, avec suffisamment de données, les modèles d’apprentissage automatique nous donneront en quelque sorte des résultats meilleurs que “prêts à l’emploi”. .

Malheureusement! Cela ne fonctionne tout simplement pas de cette façon dans le monde réel. Bien que plus de données puissent être utiles, pour de nombreuses applications, nous n’avons pas besoin de plus de données. Au lieu de cela, nous avons besoin de personnes mieux équipées pour comprendre les données dont nous disposons déjà.

Comme le note Dyachkova, “L’analyse des produits est à 80 % rapide et sale. Mais la capacité de juger quand rapide et sale est approprié nécessite une bonne compréhension des statistiques. C’est compris? Vincent Dowling, data scientist chez Indeed.com, rend le propos encore plus clair: “Une grande partie de la valeur d’être un analyste/scientifique expérimenté consiste à déterminer le degré de rigueur nécessaire pour prendre une décision.”

Les deux parlent de la façon de prendre des décisions, et dans les deux cas, l’expérience des personnes qui analysent les données est plus importante que les données elles-mêmes. Les machines ne pourront jamais compenser le manque de connaissances des personnes qui les font fonctionner. En tant qu’éditorialiste de Le gardien postes, “La promesse de l’IA est qu’elle dotera les machines de la capacité de détecter des modèles dans les données et de prendre des décisions plus rapidement et mieux que les humains. Que se passe-t-il s’ils prennent de pires décisions plus rapidement ? »

C’est une possibilité très réelle si les gens renoncent à la propriété, pensant que les données et les machines parleront d’une manière ou d’une autre d’elles-mêmes.

Moins de données, plus de connaissances

Mettre les gens en charge n’est pas si facile à réaliser dans la pratique. En tant que vice-président de la recherche chez Gartner Manjunath Bhat suggère, l’IA est influencée par l’apport humain, y compris les données que nous choisissons pour alimenter les machines. Les résultats de nos algorithmes, à leur tour, influencent les données avec lesquelles nous prenons des décisions. « Les gens consomment des faits sous forme de données. Cependant, les données peuvent être modifiées, transformées et changées – tout cela dans le but de faciliter leur consommation. Nous n’avons donc pas d’autre choix que de vivre dans les limites d’une vision du monde hautement contextualisée.

Pour un projet d’apprentissage automatique réussi, soutient le scientifique appliqué d’Amazon Eugene Yan, “Vous avez besoin de données. Vous avez besoin d’un pipeline robuste pour prendre en charge vos flux de données. Et surtout, vous avez besoin d’étiquettes de haute qualité. Mais il n’y a aucun moyen d’étiqueter correctement ces données sans des personnes expérimentées. Pour bien l’étiqueter, vous devez comprendre les données.

Cela remonte à un point par Svetlana Sicular, analyste chez Gartner il y a dix ans : les entreprises regorgent de personnes qui comprennent les nuances de leur activité. Ils sont les mieux placés pour découvrir les bons types de questions à poser sur les données de l’entreprise. Ce qui leur manque peut-être, c’est la compréhension supplémentaire des statistiques que souligne Dyachkova – la capacité de savoir quand des résultats «assez bons» sont en fait assez bons.

Bien sûr, c’est pourquoi la science des données est difficile. Dans chaque enquête sur les principaux obstacles à l’adoption de l’IA/ML, le “talent” est toujours en tête de liste. Nous pensons parfois que cela est dû à un manque de talents en science des données, mais nous devrions peut-être nous inquiéter du manque de compréhension de base des statistiques, des mathématiques et des affaires d’une entreprise.

Copyright © 2022 IDG Communications, Inc.

Leave a Comment

Your email address will not be published.