Serveur d'impression

Services d'apprentissage machine SQL Server 2017 avec R – Serveur d’impression

Le 4 juillet 2019 - 5 minutes de lecture

Page 1 sur 3

Auteur: Tomaz Kastrun et Julie Koesmarno
Éditeur: Packt Publishing
Pages: 338
ISBN: 978-1787283572
Impression: 1787283577
Kindle: B077Z9PV4F
Audience: DBA et Data Scientists
Note: 3.0
Reviewer: Ian Stirk

Ce livre, avec le sous-titre Exploration de données, modélisation et analyses avancées, a pour objectif de vous initier à l’utilisation de R avec SQL Server. Comment se porte-t-il?

R est un outil populaire d’apprentissage automatique et d’analyse statistique. Il est donc logique d’enquêter sur l’incorporation récente de R dans SQL Server. Ce livre couvre l'ensemble de l'utilisation du cycle de vie du logiciel R avec SQL Server (installation, développement, déploiement, maintenance, etc.), en fournissant des exemples concrets. Il s'adresse principalement aux professionnels des données, aux administrateurs de base de données et aux scientifiques des données. Cela suppose que vous avez peu ou pas d'expérience de R et que vous ne comprenez que très peu SQL Server.

Ce livre est principalement consacré à SQL Server 2017, mais il s’applique en grande partie à SQL Server 2016. De même, une grande partie des informations de base s’applique à Python, autre langage d’apprentissage automatique, de SQL Server 2017.

Vous trouverez ci-dessous une exploration chapitre par chapitre des sujets abordés.

Chapitre 1 Introduction à R et SQL Server

Le livre s'ouvre sur un aperçu de l'utilisation de R avant SQL Server 2016. Utilisé à partir des années 1980, R avait l'avantage d'être open source, facile à installer, extensible et peu concurrencé par un autre logiciel statistique gratuit.

Alors que Microsoft fournissait des fonctionnalités statistiques et prédictives avec SQL Server Analysis Services (SSAS), il existait un besoin de fonctionnalités supplémentaires. Diverses solutions de contournement visant à appliquer la fonctionnalité R aux données SQL Server ont été essayées, produisant des résultats utiles, mais présentant généralement des limitations (sécurité, mémoire, performances, par exemple). La tendance de Microsoft à devenir plus conviviale pour l’open source inclut l’incorporation de R dans SQL Server 2016 (et Power BI). L'importance d'avoir la possibilité d'accéder à une source de données partagée unique et son impact corollaire sur les performances et la prise de décision commerciale sont également notés.

Le chapitre se termine par une discussion utile sur la manière dont R peut être utilisé par les administrateurs de base de données, par exemple, au lieu de simplement surveiller la situation actuelle, R peut être utilisé pour faire des prédictions (par exemple, la planification des capacités).

Ce chapitre est bien écrit, facile à lire, avec des discussions informatives, une bonne circulation entre les sujets et des liens utiles pour des informations complémentaires. Ces traits s'appliquent généralement à l'ensemble du livre.

Chapitre 2 Présentation de Microsoft Machine Learning Server et SQL Server

L'intégration de R dans les services informatiques a mis en évidence divers obstacles, notamment: le manque de connaissances, une architecture complexe et des travailleurs cloisonnés – chacun d'entre eux est discuté avec leurs solutions potentielles. Il y a une brève discussion sur la manière dont Microsoft adopte le langage R. Il est à noter que la fonctionnalité R de base est incluse dans toutes les éditions de SQL Server 2017, mais que les fonctionnalités avancées (par exemple, le parallélisme complet) ne sont disponibles que dans l'édition Enterprise.

Ensuite, les différents types d’offre Microsoft R sont brièvement examinés. De la communauté Microsoft R Open au serveur Microsoft Machine Learning. Ce dernier peut traiter d’importants ensembles de données en parallèle, répartis sur divers nœuds, sur diverses plates-formes (Windows, Hadoop, etc.). Les modifications apportées aux noms des différentes offres R dans SQL Server 2017, en Services d'apprentissage machine, ont été notées. Cette modification a été effectuée afin que Python puisse être inclus sous le parapluie Services d'apprentissage machine.

Les différents produits de la plate-forme R de Microsoft sont brièvement examinés, à savoir:

  • Microsoft R Open (MRO) – gratuit, rétrocompatible, lié à la mémoire

  • Microsoft R Client – comme MRO mais inclut le parallélisme et le multi-threading

  • Serveur R Microsoft Machine Learning – Serveur autonome pour le traitement R intensif

  • Services R Learning Microsoft SQL Server Machine – intégrés à la base de données. Ce sera le focus de ce livre

  • Outils R pour Visual Studio (RTVS) – éditeur R pour Visual Studio

Le chapitre se termine par une analyse architecturale de la manière dont divers composants (IDE, SQL Server et moteur R) communiquent lors de l'exécution d'une requête R à partir de SQL Server. Vous trouverez un bref aperçu de certaines des limitations de R (performances, mémoire, sécurité, par exemple) et de la manière dont le package de RevoScaleR et les rôles de base de données de Microsoft peuvent y remédier.

Ce chapitre donne un aperçu utile des différents produits R, mais ils auraient pu être introduits plus clairement. Un code est introduit, qui utilise 'sp_execute_external_script' avant d'indiquer que le paramètre de base de données 'scripts externes activés' doit être activé – cela est décrit au chapitre 3. Le code est introduit sans explication, c'est-à-dire qu'il suppose que vous connaissez déjà R – qui est en contradiction avec l'introduction qui stipule «Ce livre est destiné aux analystes de données… peu ou pas expérimentés en R…»

Commentaires

Laisser un commentaire

Votre commentaire sera révisé par les administrateurs si besoin.