Installer et débuter avec Master Data Services

Master Data Services (MDS) est un outil permettant de gérer les données maitres (wikipedia).

L’outil est inclus dans SQL Server et peut être installé en quelques clics :

http://jeffprom.com/2013/03/22/installing-master-data-services-in-sql-server-2012/

 Il ne faut pas oublier les Web Application Requirements pour Master Data Services listé dans :

https://technet.microsoft.com/en-us/library/ee633744%28v=sql.110%29.aspx

L’installation se fait donc en 2 étapes : configuration web et initialisation de la base de données.

MDS

Une fois installé, voici 2 vidéos pour débuter :

  • Une session des TechEd New Zealand 2012 intitulée Introduction to Microsoft SQL Server 2012 Master Data Services and Data Quality Services (EN)

https://channel9.msdn.com/Events/TechEd/NewZealand/TechEd-New-Zealand-2012/DBI303/player

  • Mise en place d’un modèle de référentiel avec MDS (Intégré à Sql server) (FR).

Changement de datacenter / DC Move

Bonjour,

Depuis mon arrivée chez mon nouveau client, je suis intervenu sur de nombreux sujets comme le développement de datamarts ou la rédaction de spécifications. Ce sont des sujets assez courants dans le domaine du décisionnel.

Il y a quelques semaine, je suis intervenu sur un projet de changement de datacenter pour les serveurs de la BI. Il ne s’agissait pas du déplacement physique des machines mais logique. L’objectif était donc de gérer l’ensemble du processus de déplacement coté données et applications. La partie matérielle et OS était assurée par une équipe infrastructure.

Voici quelques problématiques que nous avons rencontré (la liste n’est pas exhaustive) :
– Continuité : Puis je me permettre de perdre une journée de données ?
– Volumétrie : Comment réaliser le transfert des données entre les 2 sites ?
– Bande passante : Quel serait le meilleur moment pour faire un transfert par le réseau ?
– Compatibilité : Est ce que la nouvelle architecture est la même que l’ancienne ?
– Migration : Est ce que les versions des outils sont les mêmes ?
– Droits : Que se passe t’il si mes droits sont réduis ?
– Accès développeur : Puis je continuer à travailler sur le serveur ou faut il prévoir des outils en local ?
– Accès aux sources : Est ce que toutes les données sources de mon système BI sont toujours accessibles avec les mêmes URL ?
– Accès à la restitution : Les utilisateurs pourront ils accéder aux rapports, aux cubes de la même manière ?
– Suivi de la vie des développements : Que faire des vieux développements inutilisés ? Comment les identifier ?

D’une manière plus générale, je pense qu’il faut gérer un changement de datacenter comme un projet à part entière et plus encore lorsque des éléments vont évoluer (version logiciels ou architectures techniques par exemple). La rédaction d’un document décrivant le processus/plan d’action permet d’anticiper les problèmes qui vont être rencontrés, d’anticiper les éventuelles demandes (droits et accès) ou encore de réfléchir aux mécanismes de roll back.

Dans le cas de mon client, nous avons eu l’opportunité d’effectuer sur plusieurs semaines un « parallel run » entre les anciens serveurs et les nouveaux serveurs. Ainsi, nous avons pu réaliser de nombreuses comparaisons :
– Volumes de données identiques,
– Sources accessibles,
– Performances similaires ou mieux.
– …
Ce procédé nous a permit de conclure avec certitude que les vieux serveurs pouvaient être décommissionés sans risque.

Et vous, avez vous rencontré d’autres problématiques lors de vos changements de serveur ? Comment les avez vous résolu ?

A bientôt,

Guillaume

2010 – Certification Talend TOS

Bonjour,

Un rapide article pour vous informer que j’ai obtenu une certification Talend le 26 février 2010.



Le programme de certification Talend précise :

Cette certification est remise aux individus qui réussissent un test online de compréhension abordant tous les usages de Talend Open Studio.

Les clients faisant confiance à un intégrateur pour implémenter la solution ou cherchant à recruter quelqu’un peuvent être assurés que les consultants sont experts dans la technologie.

La certification Talend leur fournit ce niveau de qualification.

En anglais :

Certification is awarded to individuals who successfully complete a comprehensive online test covering all aspects of the use of Talend Open Studio.

Clients trusting a systems integrator to implement a solution or seeking to hire an individual want to be reassured that the consultants are indeed experts in the technology.

Talend certification gives them this level of assurance.

Et voici le lien 😉

A bientôt,

Guillaume

PowerPivot au Techdays

Bonjour,

Difficile de parler d’exclusivité lorsqu’on est allé au Techdays. Cette rencontre annuelle des clients/des développeurs/des curieux, des présentes et des prochaines technologies de Microsoft a attiré plus de 10 000 personnes le 8, 9 et 10 février à Paris. Étant donné mon intérêt pour la BI, je ne vous parlerai pas de Sharepoint, Exchange ou Visual Studio… Par contre, j’ai bien l’intention de vous parler de Powerpivot qui a été présenté à l’occasion de 4 conférences !

Logo PowerPivot
PowerPivot

Powerpivot est une extension (tout comme l’addin Datamining pour Excel) qui permet de créer des cubes à partir des données que l’on veut, directement dans Excel. Vous connaissez les pivot tables dans Excel ? Leur défaut est notamment qu’on ne peut utiliser qu’une seule source de données. Avec Powerpivot, il est possible de créer des pivot tables avec toutes les sources de données souhaitées simultanément : Base relationnelle, Cube, txt, csv ou d’un point de vue plus fonctionnel : Application métier, Données opérationnelles, Données du décisionnel, Données du Web.

Ce sont clairement les directions métiers qui sont ciblées avec comme principal argument pour l’IT le fait que les fichiers pourront être administrés sur Sharepoint 2010. Du coup, on retrouve les arguments qui font le succès de QlikView sans le problème de l’administration :
– Possibilité d’agréger simplement des sources hétérogènes
– Haute capacité à manipuler de gros volume de données (dizaines voire centaines de millions de ligne)
– Simplicité d’installation et d’utilisation
– Rapidité de prise en main
– Portabilité
Et le petit plus spécifique à Excel :
– Familiarité / Intuitivité

Du coup, j’ai cherché quelques défauts :
– La gestion de la qualité de données (L’utilisateur peut court-circuiter toute la phase d’alimentation (nettoyage, test, qualification des données))
– Le coût de SQL Server 2008 R2 et de Excel 2010 sur les postes « développeurs »
– Le coût du SharePoint pour permettre la visualisation, le partage et l’administration des multiples cube dans Excel par l’IT
– La non-interopérabilité avec les versions précédentes d’Excel (même en consultation ???)

Et quelques usages intéressants :
– Data profiling pour faire un qualification des données avant de commencer un projet
– L’usage nomade pour des commerciaux

Et vous, vous voyez d’autres défauts ou d’autres usages ? Que pensez vous de cet outil ? Allez vous l’utiliser ?

Si vous voulez plus d’informations sur Powerpivot, vous pouvez :
– Voir une démonstration en vidéo
– Voir les conférences des techdays (pas encore disponible)

A bientôt,

Guillaume

2005 – Stage de 3 mois chez MAAF Assurances

Bonjour,

Voici le premier billet basé sur une expérience professionnelle passée. Vous trouverez dans cet article le cadre de la mission, une explication du projet puis quelques informations sur sa réalisation.

Dans le cadre du DUT STID (Statistique et Traitement Informatique des Données) à Niort (79), j’ai effectué un stage chez MAAF Assurances (Mutuelle d’Assurance Artisanale de France) du 28 mars au 3 juin 2005. La MAAF est un prestataire de services d’assurances et d’épargnes.

J’ai été accueilli dans le service Informatique Décisionnelle et plus précisément dans l’entité Infrastructure, Expertise et Débugg dirigée par Alain Thurpeau. Le thème de mon stage faisait suite à un besoin exprimé au cours d’atelier de concertation entre les maîtrises d’ouvrage et les chefs de projet de différents services.

Dans le cadre de qualification, un environnement est utilisé par différents outils testés par différents services. Les testeurs utilisent la meme base de données. Les données peuvent etre amenées à etre modifiées soit pour correspondre au test (exemple : on met une valeur aberrante), soit par les programmes. Les données ne sont pas réservés pour les tests de chaque programme et 2 programmes peuvent donc utiliser les mêmes données ce qui est source d’erreurs.

Mon projet a consisté à concevoir une base de données Access afin d’assurer la réservation de liste. En terme de gestion de projet, j’ai réalisé le Cahier des Charges Utilisateurs qui aurait normalement du être rédigée par les MOA. Afin de bien réaliser cette tache, j’ai rencontré les différents acteurs avec un questionnaire et une maquette du futur programme. Ensuite, je me suis appuyé sur des spécifications pour développer le gestionnaire en VBA.

Le gestionnaire a été testé puis présenté officiellement à tous les utilisateurs.

Cette première expérience dans le monde informatique a été très enrichissante. Elle m’a permis d’acquérir des connaissances (Chaîne du décisionnel, Processus de gestion de projet…), des compétences (Développement VBA…) et du savoir-être (Communication, Compréhension d’expression de besoin…)

A bientôt,

Guillaume