Une liste organisée des meilleurs articles de l’année sur le monde des données
Comme ça, on est fin 2022 ! Et quelle montagne russe cela a été avec des changements majeurs et des incertitudes dans tous les secteurs. (Surtout pour les utilisateurs de l’utility Fowl…)
Beaucoup de choses se sont passées dans le monde de la pile de données moderne cette année. Nous avons parlé de titres de postepensé à dire adieu la science des donnéesdébattu équipes de données centralisées ou intégrées et regroupement vs dégroupagea lancé des discussions importantes comme la écart de rémunération methodet bien plus.
Que vous fassiez partie de cette communauté ou que vous débutiez avec les données, il peut être difficile de tout suivre. Ainsi, poursuivant notre custom de l’année dernière, nous partageons les meilleurs blogs de 2022 ainsi que quelques lectures de suivi pour vous faire réfléchir. Bonne lecture!
PS Point out spéciale à tous ceux qui ont partagé leurs expériences, apprentissages, factors de vue et observations en matière de données cette année ! Il est maintenant temps d’avoir des conversations plus ouvertes sur ce que nous voulons pour l’avenir des données, et nous sommes très reconnaissants envers tous les praticiens des données qui donnent de leur temps pour partager des idées, susciter des débats et faire avancer notre industrie.
Sur les données en tant que produit
Produit de données dans des environnements changeants : repenser et mettre à jour les investissements par Eric Weber
Les dernières années ont été pleines de « voici ce que nous devons faire ensuite » ou « une fois que nous avons cette équipe, nous pouvons le faire ». Nous planifions remark nous soutiendrions plus de personnes et de domaines de l’entreprise avec plus d’investissement, mais nous ne pensons pas à ce que nous ferions si nous devions réduire le assist. Je comprends. Ce n’est pas très confortable. Mais tout comme la planification de la relève pour les gens, nous devons avoir un plan pour ce que nous ferions dans des conditions difficiles. Dans certains cas, vous pouvez abandonner la prise en cost de personnages particuliers sur un produit. Dans d’autres, vous pouvez abandonner complètement la prise en cost d’un produit. Il n’est pas facile de dire quelle est la « bonne réponse ». Mais passer du temps à réfléchir à votre réponse est essential.
Plus de lecture de suivi:
Travailler avec des données
Devrions-nous être reconnaissants pour la pile de données moderne ? par Benn Stancil
C’est le paradoxe que nous devons résoudre. Pourquoi la technologie des données a-t-elle tellement progressé que la valeur fournie par une équipe de données ? Tous ces nouveaux outils font-ils vraiment mal, en nous faisant perdre de vue les problèmes les plus importants (par exemple, les données dans Salesforce) au revenue de nouvelles choses brillantes qui n’ont pas vraiment d’significance (par exemple, les données dans nos vingt- cinquième utility SaaS) ? Le expertise de l’industrie n’a-t-il pas rattrapé la capacité de ses outils, et faut-il juste s’armer de persistence ? Le problème est-il plus fondamental ? Je ne suis pas sûr. Mais si notre moi de 2032 veut être aussi reconnaissant pour les années 2020 que nous devrions l’être pour les années 2010, ce sont les prochaines questions auxquelles nous devons répondre.
Plus de lecture de suivi:
Sur les contrats de données
La montée des contrats de données par Chad Sanderson
Les contrats de données sont des accords de kind API entre les ingénieurs logiciels qui possèdent des providers et les consommateurs de données qui comprennent le fonctionnement de l’entreprise afin de générer des données en temps réel bien modélisées, de haute qualité et fiables.
Au lieu que les équipes de données acceptent passivement des vidages de données provenant de systèmes de manufacturing qui n’ont jamais été conçus à des fins d’analyse ou d’apprentissage automatique, les consommateurs de données peuvent concevoir des contrats qui reflètent la nature sémantique du monde composé d’entités, d’événements, d’attributs et des relations entre chaque objet.
Cette abstraction permet aux ingénieurs logiciels de dissocier leurs bases de données/providers des exigences analytiques et basées sur ML. Les ingénieurs n’ont plus à se soucier de provoquer des incidents de rupture de manufacturing lors de la modification de leurs bases de données, et les équipes de données peuvent se concentrer sur la description des données dont elles ont besoin au lieu d’essayer d’assembler le monde rétroactivement by way of SQL.
Plus de lecture de suivi:
Sur la structure et la path d’une équipe de données
Faire passer des équipes de données réactives à influentes par Emily Thompson
Les équipes de données ont tendance à être un groupe assez décousu, et souvent par défaut, retroussent leurs manches et construisent ce dont elles ont besoin pour se débloquer. Mais il y a là une opportunité de commencer à influencer les feuilles de route sur autre équipes. Plutôt que de combler les lacunes technologiques elles-mêmes avec des options de contournement désordonnées, la charte de mon équipe prévoyait également qu’elle fasse des recommandations methods aux équipes dont nous dépendions.
Parce que l’équipe des données devait maintenant conduire la dialog de manière proactive, elle a pris le temps de travailler avec des partenaires et de proposer des options interfonctionnelles. Le travail de base a été considéré comme faisant partie de l’arriéré du travail « générateur d’influence », qui a conduit à des objectifs trimestriels spécifiques, et les progrès ont été suivis comme toutes les autres initiatives appartenant à l’équipe des données.
Plus de lecture de suivi:
PRIME: Nous avons discuté avec quatre incroyables leaders des données — Stephen Bailey (Ingénieur Knowledge chez Whatnot), Erica Louie (Responsable Knowledge chez dbt labs) et Taylor Murphy (Responsable Knowledge chez Meltano), et Gordon Wong (Fondateur de Wong Choice Intelligence ; anciennement Senior Chief of Enterprise Intelligence chez Hubspot) — à propos de ce qu’il faut pour réussir au cours de vos 365 premiers jours en tant que chief des données. Téléchargez le livre électronique Secrets and techniques of a Fashionable Knowledge Chief ici.
Sur les métriques, les catalogues de données, les métadonnées actives, and so forth.
Piles de données axées sur les personnes par Ilan Man
Le problème est que vos events prenantes, tout en vous donnant le pouce levé tout le temps et en affirmant qu’elles aimeraient un moyen plus easy de découvrir des données, n’utilisent plus les outils que vous avez minutieusement recherchés et mis en œuvre. Ils tombent dans leurs vieilles habitudes et vous voyez inévitablement une métrique mal définie sur une diapositive Powerpoint quelque half.
Nous devons nous assurer que les events prenantes adoptent les outils de données comme elles le devraient. Lire de la documentation et suivre une formation ne suffit pas. Nous devons renforcer la bonne hygiène des outils de données. J’ai vu de nombreuses personnes commencer dans un outil de BI, et quelques mois plus tard, elles sont de retour dans Excel, faisant pivoter un CSV et le collant dans une présentation. Il devrait toujours y avoir de la place pour les options créatives et la sérendipité, mais l’équipe Knowledge doit garder un œil sur la façon dont les events prenantes utilisent les outils qu’elles mettent en œuvre. Les modèles de données et les outils de BI doivent s’adapter aux évolutions de l’entreprise.
Plus de lecture de suivi:
Choix bonus
Vous en voulez encore plus ? Voici quelques articles supplémentaires pour vous permettre de lire et de réfléchir tout au lengthy de la nouvelle année :
Cet article a également été publié sur Moyen.
Picture d’en-tête : Aaron Fardeau sur Unsplash