
Local, instructorled live Apache Spark training courses demonstrate through handson practice how Spark fits into the Big Data ecosystem, and how to use Spark for data analysis
Apache Spark training is available as "onsite live training" or "remote live training" Onsite live training can be carried out locally on customer premises in Norge or in NobleProg corporate training centers in Norge Remote live training is carried out by way of an interactive, remote desktop
NobleProg Your Local Training Provider.
Machine Translated
Testimonials
Richard er veldig rolig og metodisk, med en analytisk innsikt - nøyaktig egenskapene som trengs for å presentere denne typen kurs
Kieran Mac Kenna
Kurs: Spark for Developers
Machine Translated
Mulige scenarier og saker
zhaopeng liu - Fmr
Kurs: Spark for Developers
Machine Translated
Saksanalyse
国栋 张
Kurs: Spark for Developers
Machine Translated
Alle deler av økten
Eric Han - Fmr
Kurs: Spark for Developers
Machine Translated
Vi vet at vi vet mye mer om hele miljøet
John Kidd
Kurs: Spark for Developers
Machine Translated
Treneren gjorde klassen interessant og underholdende som hjelper ganske mye med treninger hele dagen
Ryan Speelman
Kurs: Spark for Developers
Machine Translated
Jeg synes at treneren hadde en utmerket stil med å kombinere humor og historier i det virkelige liv for å gjøre emnene for hånden veldig tilgjengelige. Jeg vil anbefale denne professoren på det sterkeste i fremtiden.
Kurs: Spark for Developers
Machine Translated
Ernesto gjorde en god jobb med å forklare konsepter på høyt nivå med å bruke Spark og det er forskjellige moduler.
Michael Nemerouf
Kurs: Spark for Developers
Machine Translated
Dette er en av de beste praktiske oppgavene med programmeringskurs jeg noensinne har tatt.
Laura Kahn
Kurs: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
Dette er en av de beste kvalitetstreningene jeg noensinne har tatt i løpet av min 13 år lange karriere. Fortsett den gode jobben!
Kurs: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
Richard var veldig villig til å avvise når vi ønsket å stille semi-relaterte spørsmål om ting som ikke er på pensum. Forklaringene var klare, og han var foran med advarsler i alle råd han ga oss.
ARM Limited
Kurs: Spark for Developers
Machine Translated
VM jeg likte veldig godt Læreren var veldig kunnskapsrik med hensyn til temaet så vel som andre emner, han var veldig hyggelig og vennlig. Jeg likte anlegget i Dubai.
Safar Alqahtani - Elm Information Security
Kurs: Big Data Analytics in Health
Machine Translated
øve oppgaver
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Kurs: Python and Spark for Big Data (PySpark)
Machine Translated
Ajay var veldig vennlig, hjelpsom og kunnskapsrik om temaet han diskuterte.
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
Kurs: Spark for Developers
Machine Translated
Laboratoriet øvelser. Bruke teorien fra første dag i påfølgende dager.
Dell
Kurs: A Practical Introduction to Stream Processing
Machine Translated
Læreren har tilpasset opplæringsprogrammet til våre nåværende behov.
EduBroker Sp. z o.o.
Kurs: Python and Spark for Big Data (PySpark)
Machine Translated
Å gjøre lignende øvelser på forskjellige måter hjelper virkelig å forstå hva hver komponent ( Hadoop / Spark, frittstående / klynge) kan gjøre på egen hånd og sammen. Det ga meg ideer om hvordan jeg skulle teste applikasjonen min på min lokale maskin når jeg utvikler vs når den er distribuert på en klynge.
Thomas Carcaud - IT Frankfurt GmbH
Kurs: Spark for Developers
Machine Translated
Jeg synes at treneren hadde en utmerket stil med å kombinere humor og historier i det virkelige liv for å gjøre emnene for hånden veldig tilgjengelige. Jeg vil anbefale denne professoren på det sterkeste i fremtiden.
Kurs: Spark for Developers
Machine Translated
Dette er en av de beste kvalitetstreningene jeg noensinne har tatt i løpet av min 13 år lange karriere. Fortsett den gode jobben!
Kurs: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
Spark Underkategorier
Apache Spark Kursplaner
In this instructor-led, live training, participants will learn how to use Alluxio to bridge different computation frameworks with storage systems and efficiently manage multi-petabyte scale data as they step through the creation of an application with Alluxio.
By the end of this training, participants will be able to:
- Develop an application with Alluxio
- Connect big data systems and applications while preserving one namespace
- Efficiently extract value from big data in any storage format
- Improve workload performance
- Deploy and manage Alluxio standalone or clustered
Audience
- Data scientist
- Developer
- System administrator
Format of the course
- Part lecture, part discussion, exercises and heavy hands-on practice
Helseindustrien har enorme mengder komplekse heterogene medisinske og kliniske data. Å bruke big data-analyse av helsedata gir et stort potensial i å oppnå innsikt for å forbedre leveransen av helsetjenester. Imidlertid gir enorme datasett store utfordringer i analyser og praktiske applikasjoner i et klinisk miljø.
I denne instruktørledede liveopplæringen (ekstern) vil deltakerne lære å utføre big data-analyse innen helse når de går gjennom en serie praktiske live-lab-øvelser.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Installer og konfigurer verktøy for analyse av big data som Hadoop MapReduce og Spark
- Forstå egenskapene til medisinsk data
- Bruk big data-teknikker for å håndtere medisinske data
- Studer store datasystemer og algoritmer i sammenheng med helseprogrammer
Publikum
- Utviklere
- Dataforskere
Kursets format
- Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse.
Merk
- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
In this instructor-led, live training, participants will learn about the technology offerings and implementation approaches for processing graph data. The aim is to identify real-world objects, their characteristics and relationships, then model these relationships and process them as data using a Graph Computing (also known as Graph Analytics) approach. We start with a broad overview and narrow in on specific tools as we step through a series of case studies, hands-on exercises and live deployments.
By the end of this training, participants will be able to:
- Understand how graph data is persisted and traversed.
- Select the best framework for a given task (from graph databases to batch processing frameworks.)
- Implement Hadoop, Spark, GraphX and Pregel to carry out graph computing across many machines in parallel.
- View real-world big data problems in terms of graphs, processes and traversals.
Format of the course
- Part lecture, part discussion, exercises and heavy hands-on practice
Denne instruktørledede, live trening (på stedet eller ekstern) introduserer Hortonworks Data Platform (HDP) og leder deltakerne gjennom distribusjonen av Spark + Hadoop løsningen.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Bruk Hortonworks for å pålitelig kjøre Hadoop i stor skala.
- Forene Hadoop sikkerhets-, styrings- og operasjonsevner med Sparks agile analytiske arbeidsflyter.
- Bruk Hortonworks til å undersøke, validere, sertifisere og støtte hver av komponentene i et Spark-prosjekt.
- Behandle forskjellige typer data, inkludert strukturert, ustrukturert, i bevegelse og hvile.
Kursets format
- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.
Alternativer for tilpasning av kurset
- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
I denne instruktørledede, liveopplæringen (på stedet eller fjernkontrollen) vil deltakerne lære å sette opp og integrere forskjellige Stream Processing rammer med eksisterende store datalagringssystemer og relaterte programvareapplikasjoner og mikroservices.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Installer og konfigurer forskjellige Streaming Stream Processing rammer, for eksempel Spark Streaming og Kafka Streaming.
- Forstå og velg de mest passende rammene for jobben.
- Behandle data kontinuerlig, samtidig og på en post-for-post måte.
- Integrer Stream Processing med eksisterende databaser, datavarehus, datasjøer, etc.
- Integrer det mest passende strømbehandlingsbiblioteket med bedriftsapplikasjoner og mikroservices.
Publikum
- Utviklere
- Programvarearkitekter
Kursets format
- Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse
Merknader
- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
Denne instruktørledede liveopplæringen introduserer konsepter og tilnærminger for implementering av geospacial analytics og leder deltakerne gjennom opprettelsen av en prediktiv analyseapplikasjon ved bruk av Magellan on Spark.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Spørsmål, analyser og bli med geospatiale datasett på en effektiv måte
- Implementere geospatiale data i forretningsintelligens og prediktive analyseprogrammer
- Bruk romlig kontekst for å utvide mulighetene til mobile enheter, sensorer, logger og wearables
Kursets format
- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.
Alternativer for tilpasning av kurset
- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
This instructor-led, live training (online or onsite) is aimed at developers who wish to carry out big data analysis using Apache Spark in their .NET applications.
By the end of this training, participants will be able to:
- Install and configure Apache Spark.
- Understand how .NET implements Spark APIs so that they can be accessed from a .NET application.
- Develop data processing applications using C# or F#, capable of handling data sets whose size is measured in terabytes and pedabytes.
- Develop machine learning features for a .NET application using Apache Spark capabilities.
- Carry out exploratory analysis using SQL queries on big data sets.
Format of the Course
- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
This instructor-led, live training (online or onsite) is aimed at data scientists who wish to use the SMACK stack to build data processing platforms for big data solutions.
By the end of this training, participants will be able to:
- Implement a data pipeline architecture for processing big data.
- Develop a cluster infrastructure with Apache Mesos and Docker.
- Analyze data with Spark and Scala.
- Manage unstructured data with Apache Cassandra.
Format of the Course
- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
This instructor-led, live training (online or onsite) is aimed at engineers who wish to deploy Apache Spark system for processing very large amounts of data.
By the end of this training, participants will be able to:
- Install and configure Apache Spark.
- Understand the difference between Apache Spark and Hadoop MapReduce and when to use which.
- Quickly read in and analyze very large data sets.
- Integrate Apache Spark with other machine learning tools.
Format of the Course
- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.
Course Customization Options
- To request a customized training for this course, please contact us to arrange.
PUBLIKUM:
Data Engineer, DevOps , Data Scientist
Dette kurset vil introdusere Apache Spark . Studentene skal lære hvordan Spark passer inn i Big Data økosystemet, og hvordan de kan bruke Spark til dataanalyse. Emnet dekker Spark shell for interaktiv dataanalyse, Spark internals, Spark APIer, Spark SQL , Spark streaming, og maskinlæring og grafX.
Audiens:
Utviklere / dataanalytikere
I denne instruktørledede liveopplæringen vil deltakerne lære hvordan de bruker Python og Spark sammen for å analysere big data når de jobber med praktiske øvelser.
Ved slutten av denne opplæringen vil deltakerne kunne:
- Lær hvordan du bruker Spark med Python til å analysere Big Data .
- Arbeidet med øvelser som etterligner omstendighetene i den virkelige verden.
- Bruk forskjellige verktøy og teknikker for big data-analyse ved bruk av PySpark .
Kursets format
- Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse
Denne instruktørledede liveopplæringen (på stedet eller fjernkontrollen) er rettet mot programvareingeniører som ønsker å streame big data med Spark Streaming og Scala .
Ved slutten av denne opplæringen vil deltakerne kunne:
- Lag Spark-applikasjoner med programmeringsspråket Scala .
- Bruk gniststrømming for å behandle kontinuerlige datastrømmer.
- Behandle strømmer av sanntidsdata med Spark Streaming.
Kursets format
- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.
Alternativer for tilpasning av kurset
- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
- for å utføre SQL spørsmål.
- å lese data fra en eksisterende Hive installasjon.
I denne instruktørledede, liveopplæringen (på stedet eller fjernkontrollen) vil deltakerne lære å analysere ulike typer datasett ved å bruke Spark SQL .
Ved slutten av denne opplæringen vil deltakerne kunne:
- Installer og konfigurer Spark SQL .
- Utfør dataanalyse ved å bruke Spark SQL .
- Forespørselsdatasett i forskjellige formater.
- Visualiser data og spørreresultater.
Kursets format
- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.
Alternativer for tilpasning av kurset
- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
Den deler seg i to pakker:
-
spark.mllib inneholder den originale API-en som er bygget på toppen av RDD-er.
-
spark.ml gir API på høyere nivå bygget oppå DataFrames for konstruksjon av ML-rørledninger.
Publikum
Dette kurset er rettet mot ingeniører og utviklere som søker å bruke et innebygd maskinbibliotek for Apache Spark