Travailler dans la science des donnes, un job ingrat ? C’est du moins ce que pense l’analyste des donnes et blogueur, connu sous le pseudonyme de ryxcommar


La science des données combine les mathématiques et les statistiques, la programmation experte, l’analyse avancée, l’intelligence artificielle (IA) et l’apprentissage automatique avec une science spécifique pour découvrir des informations opérationnelles cachées dans les données d’une organisation. Il peut être utilisé pour guider la prise de décision et la planification stratégique. Parallèlement à cette description, certains critiques aiment à dire que la science des données est inutile ou inutile. L’analyste ryxcommar a déclaré : “La principale raison pour laquelle je me suis détourné de la science des données était que je pensais que le travail n’était pas important, à bien des égards.

Voici quelques raisons données par ryxcommar :

  • Le service est subordonné à la politique de la technologie, du produit et du bureau, ce qui signifie que le service est souvent aussi bon que le maillon le plus faible de cette chaîne ;
  • personne ne sait ou ne se soucie de la différence entre un bon et un mauvais travail d’ingénierie de données. En d’autres termes, vous pouvez être absolument incroyable dans votre travail ou vous êtes incroyable et ceux qui ont presque le même look de toute façon ;
  • le travail a souvent très peu de valeur pour l’entreprise (compensant souvent l’inefficacité de la chaîne de contrôle).

La société d’analyse prédictive Pecan AI publiée le mois dernier, sur la base d’enquêtes menées par Wakefield Research, a révélé que quatre spécialistes du marketing sur cinq déclarent avoir des difficultés à prendre des décisions basées sur les données, malgré toutes les données sur les clients dont ils disposent. Une enquête auprès de 250 personnes a révélé que 84 % d’entre eux ont déclaré que leur capacité à prédire le comportement des clients était une conjecture. La technologie des données ne répondra pas aux besoins des spécialistes du marketing.

Tout le monde n’est pas d’accord avec ryxcommar. La croissance rapide des sources de données et par la suite des données a fait de la science des données l’un des domaines à la croissance la plus rapide dans toutes les industries. La vie de la science des données comprend de nombreux rôles, outils et techniques, permettant aux analystes de recueillir des informations exploitables. En général, un projet de science des données passe par les phases suivantes :

Collecte de données: Le cycle de vie commence par la collecte de données, qu’il s’agisse de données brutes ou non structurées provenant de toutes les sources pertinentes, en utilisant diverses méthodes. Ces méthodes peuvent inclure la saisie manuelle, l’exploration Web et la diffusion en temps réel de données à partir de systèmes et d’appareils. Les sources de données peuvent inclure des données structurées, telles que les données client, ainsi que des données non structurées telles que les fichiers journaux, les vidéos, l’audio, les images, l’Internet des objets (IoT), les médias sociaux, etc.

Lire Aussi :  Test Stimulateur clitoridien Biird Namii : charme, douceur et timidité

Stockage et traitement des données : Étant donné que les données peuvent avoir différents formats et structures, les organisations doivent envisager différents systèmes de stockage en fonction du type de données qu’elles collectent. Les équipes de gouvernance des données aident à établir des normes concernant le stockage et l’organisation des données, ce qui facilite le flux de travail autour des modèles d’analyse, d’apprentissage automatique et d’apprentissage en profondeur.

Cette étape implique la manipulation, l’extraction, la transformation et l’intégration de données à l’aide de fonctions ETL (sortie, transformation, chargement) ou d’autres technologies d’intégration de données. Cette préparation des données est importante pour améliorer la qualité des données avant qu’elles ne soient chargées dans un entrepôt de données, un lac de données ou un autre stockage.

L’analyse des données: Les analystes de données analysent les données d’enquête pour examiner les anomalies, les modèles, les plages et les distributions de valeurs dans les données. La découverte de l’analyse des données aide à développer des hypothèses pour les tests a/b. Il aide également les analystes à déterminer la pertinence des données à utiliser dans les efforts de modélisation pour l’analyse prédictive, l’apprentissage automatique et/ou l’apprentissage en profondeur. Sur la base de la précision du modèle, les organisations peuvent s’appuyer sur ces informations pour prendre des décisions commerciales, ce qui leur permet d’être plus évolutives.

Entrer en contact: enfin, les informations sont présentées sous forme de rapports et d’autres visualisations de données qui permettent aux analystes commerciaux et autres décideurs de comprendre plus facilement les informations – et leur impact sur l’entreprise. Un langage de programmation de science des données tel que R ou Python avec des composants pour créer des visualisations ; les data scientists peuvent également utiliser des outils de visualisation spécialisés.

Science des données et intelligence économique

Il peut être facile de confondre les termes « data scientist » et « business intelligence » (BI) car ils se rapportent tous les deux aux données d’une organisation et à l’analyse de ces données, mais leur objectif est différent. La Business Intelligence (BI) est généralement un terme générique désignant la technologie qui permet la préparation, l’exploration, la gestion et la visualisation des données.

Lire Aussi :  UNE BONNE CONSCIENCE DEVANT DIEU - Quoi de neuf?

Les outils et processus de Business Intelligence permettent aux utilisateurs finaux d’identifier des informations exploitables à partir de données brutes, facilitant ainsi la prise de décision basée sur les données au sein d’équipes de plusieurs secteurs.

Alors que les outils de science des données prolifèrent, l’intelligence d’affaires se concentre davantage sur les données du passé et les informations fournies par les outils d’intelligence d’affaires sont de nature plus descriptive. Il utilise les données pour comprendre ce qui s’est passé avant de pouvoir définir un plan d’action. La BI évolue vers des données statiques (immuables) toujours structurées. Si un data scientist utilise des données descriptives, il les utilise souvent pour déterminer des variables prédictives, qui sont utilisées pour catégoriser les données ou faire des prédictions.

La science des données et la BI ne s’excluent pas mutuellement – les entreprises intelligentes utilisent les deux pour comprendre pleinement leurs données et en tirer de la valeur.

Science des données et scientifique des données

La science des données ou la science des données est considérée comme une discipline, tandis que les scientifiques des données sont des praticiens de ce domaine. Un data scientist collecte, traite, analyse et parle de big data, autrement dit big data, dans le but d’améliorer la performance d’une entreprise. Les scientifiques des données ne sont pas directement responsables de tous les processus impliqués dans le cycle de vie de la science des données. Par exemple, les pipelines de données sont souvent gérés par des ingénieurs de données, mais un data scientist peut faire des recommandations sur les données utiles ou nécessaires.

Alors que les scientifiques des données peuvent créer des modèles d’apprentissage automatique, la mise à l’échelle de ces efforts à plus grande échelle nécessite davantage de compétences en génie logiciel pour optimiser un système afin qu’il fonctionne plus rapidement. Par conséquent, il est courant qu’un scientifique des données s’associe à des ingénieurs en apprentissage automatique pour mettre à l’échelle des modèles d’apprentissage automatique.

Les responsabilités d’un scientifique des données peuvent souvent chevaucher celles d’un analyste de données, en particulier en ce qui concerne l’analyse des données de recherche et la visualisation des données. Cependant, l’ensemble de compétences d’un scientifique des données est généralement plus large que celui de l’analyste de données moyen. En revanche, un scientifique des données utilise des langages de programmation courants, tels que R et Python, pour effectuer davantage d’analyses statistiques et de visualisation de données.

Lire Aussi :  La capsule Orion a amerri dans l’océan Pacifique après son voyage autour de la Lune

Pour accomplir ces tâches, les scientifiques des données doivent avoir des compétences en informatique et en sciences pures qui vont au-delà de l’analyste commercial ou de l’analyste de données typique.

Cependant, ryxcommar pense que le data scientist moyen s’intéresse à la programmation et à la technologie en général. Les quelques personnes qui sont, même à distance, douées pour la programmation ne sont souvent pas douées pour la technologie, dans le sens où elles ont tendance à proposer des solutions techniques, à avoir un sentiment d’anxiété et à vouloir perdre du temps à construire leur propre plate-forme.

Pour Ryxcommar, le faible niveau de data science dans la programmation induit deux sentiments :

  • Frustré par le peu d’autorité sur les décisions en matière de code et d’infrastructure. Travailler avec la science des données sans avoir le contrôle de l’infrastructure est futile. ;
  • Il y a un besoin général dans l’industrie pour des personnes qui sont bonnes à la fois en science des données et en programmation pour exploiter les données d’entreprise.

De plus en plus d’entreprises obtiennent de grands ensembles de données qu’elles souhaitent rechercher, mais elles ne disposent pas de l’infrastructure nécessaire pour faire quoi que ce soit avec ces données. Ils les acceptent simplement. Ils ne les acceptent qu’en raison du processus qui les oblige à le faire.

Selon certains développeurs, la question de la science des données ne se pose pas dans les entreprises technologiques, surtout les plus petites. Des compétences en SQL, R et Tableau peuvent aider à obtenir des données à partir de SQL, créer des modèles prédictifs dans R et exporter des prédictions directement vers des tables SQL.

Source: ryxcommar

Et vous?

Que pensez-vous de la critique de l’exposition sur le blog ryxcommar ? Est-ce utile?

Que pensez-vous de la data science et du métier de data scientist ? Utile ou pas selon vous ?

La science des données fonctionne-t-elle dans votre entreprise ? Quel est votre parcours ?

Pensez-vous que nous pouvons nous passer des data scientists dans les entreprises technologiques ? Ou en avons-nous davantage besoin ?

Voir également:

DataSpell : Lancement de la version 2022.2 de l’IDE JetBrains Data Science, avec recherche intégrée pour Jupyter Notebook, prise en charge WSL, etc.

Pourquoi la science des données ne répond-elle pas aux besoins des marketeurs ? 84 % disent que leur capacité à prédire le comportement des clients est une conjecture

L’évolution des données favorise une augmentation des revenus : la variation est significativement affectée jusqu’à 3,2 fois plus, selon Heap

Source

Leave a Reply

Your email address will not be published.

Articles Liés

Back to top button