Scala Programming for Big Data Analytics

Get Started With Big Data Analytics Using Apache Spark

de

Éditeur :

Apress


Paru le : 2019-07-05



eBook Téléchargement , DRM LCP 🛈 DRM Adobe 🛈
Lecture en ligne (streaming)
36,47

Téléchargement immédiat
Dès validation de votre commande
Ajouter à ma liste d'envies
Image Louise Reader présentation

Louise Reader

Lisez ce titre sur l'application Louise Reader.

Description



Apprenez les concepts clés du langage et les techniques de programmation de Scala dans le contexte de l'analyse de données volumineuses et d'Apache Spark. Le livre commence par vous présenter Scala et établit une solide compréhension contextuelle de la raison pour laquelle vous devriez apprendre ce langage, comment il se situe par rapport à Java, et comment Scala est lié à Apache Spark pour l'analyse de grandes données. Ensuite, vous configurerez l'environnement Scala prêt à examiner vos premiers programmes Scala. Viennent ensuite des sections sur les principes fondamentaux de Scala, y compris les variables mutables/immutables, le système de hiérarchie des types, les expressions de flux de contrôle et les blocs de code.


L'auteur discute longuement des fonctions et met en évidence un certain nombre de concepts associés tels que la programmation fonctionnelle et les fonctions anonymes. Le livre approfondit ensuite le puissant système de collections de Scala car de nombreuses API d'Apache Spark ressemblent fortement aux collections Scala.


En cours de route, vous verrez le cycle de développement d'un programme Scala. Il s'agit de compiler et de construire des programmes à l'aide du Scala Build Tool (SBT), l'outil standard de l'industrie. En conclusion, Scala Programming for Big Data Analytics montre comment vous pouvez utiliser les concepts pour écrire des programmes qui s'exécutent sur le framework Apache Spark. Ces programmes fourniront un calcul distribué et parallèle, ce qui est essentiel pour l'analyse de grandes quantités de données.

Ce que vous apprendrez

Voir les principes fondamentaux de Scala en tant que langage de programmation polyvalent
Comprendre la programmation fonctionnelle et les constructions de programmation orientées objet dans Scala
Utiliser les collections et fonctions Scala
Développer, empaqueter et exécuter des applications Apache Spark pour l'analyse de données volumineuses
A qui s'adresse ce livre ?

Scientifiques des données, analystes de données et ingénieurs de données qui ont l'intention d'utiliser Apache Spark pour des analyses à grande échelle.

Pages
306 pages
Collection
n.c
Parution
2019-07-05
Marque
Apress
EAN papier
9781484248096
EAN PDF
9781484248102

Informations sur l'ebook
Nombre pages copiables
3
Nombre pages imprimables
30
Taille du fichier
8991 Ko
Prix
36,47 €
EAN EPUB
9781484248102

Informations sur l'ebook
Nombre pages copiables
3
Nombre pages imprimables
30
Taille du fichier
7322 Ko
Prix
36,47 €

Irfan Elahi is a senior consultant in Deloitte Australia specializing in big data and machine learning. His primary focus lies in using big data and machine learning to support business growth with multifaceted and strong ties to the telecommunications, energy, retail and media industries. He has worked on a number of projects in Australia to design, prototype, develop, and deploy production-grade big data solutions in Amazon Web Services (AWS) and Azure to support a number of use-cases ranging from enterprise data warehousing, ETL offloading, analytics, batch processing and stream processing while employing leading commercial Hadoop solutions such as Cloudera and Hortonworks. He has worked closely with clients’ systems and software engineering teams using DevOps to enhance the continuous integration and continuous deployment (CICD) processes and manage a Hadoop cluster’s operations and security.

In addition to his technology competencies, Irfan has recently presented at the DataWorks Summit in Sydney on the subject of in-memory big data technologies and in a number of meetups all around the world. He also remains involved delivering knowledge-transfer sessions, training and workshops about big data and machine learning, both within his firm and at clients. He also has launched Udemy courses on Apache Spark for big data analytics and R programming for data science with more than 18,000 students from 145 countries enrolled.

Suggestions personnalisées