Apache Spark Training Courses

Apache Spark Training Courses

Local, instructorled live Apache Spark training courses demonstrate through handson practice how Spark fits into the Big Data ecosystem, and how to use Spark for data analysis

Apache Spark training is available as "onsite live training" or "remote live training" Onsite live training can be carried out locally on customer premises in Norge or in NobleProg corporate training centers in Norge Remote live training is carried out by way of an interactive, remote desktop

NobleProg Your Local Training Provider.

Machine Translated

Testimonials

★★★★★
★★★★★

Spark Subcategories

Apache Spark Kursplaner

Tittel
Varighet
Oversikt
Tittel
Varighet
Oversikt
21 timer
Oversikt
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
7 timer
Oversikt
Alluxio is an open-source virtual distributed storage system that unifies disparate storage systems and enables applications to interact with data at memory speed. It is used by companies such as Intel, Baidu and Alibaba.

In this instructor-led, live training, participants will learn how to use Alluxio to bridge different computation frameworks with storage systems and efficiently manage multi-petabyte scale data as they step through the creation of an application with Alluxio.

By the end of this training, participants will be able to:

- Develop an application with Alluxio
- Connect big data systems and applications while preserving one namespace
- Efficiently extract value from big data in any storage format
- Improve workload performance
- Deploy and manage Alluxio standalone or clustered

Audience

- Data scientist
- Developer
- System administrator

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
21 timer
Oversikt
Big data analytics innebærer prosessen med å undersøke store mengder varierte datasett for å avdekke korrelasjoner, skjulte mønstre og annen nyttig innsikt.

Helseindustrien har enorme mengder komplekse heterogene medisinske og kliniske data. Å bruke big data-analyse av helsedata gir et stort potensial i å oppnå innsikt for å forbedre leveransen av helsetjenester. Imidlertid gir enorme datasett store utfordringer i analyser og praktiske applikasjoner i et klinisk miljø.

I denne instruktørledede liveopplæringen (ekstern) vil deltakerne lære å utføre big data-analyse innen helse når de går gjennom en serie praktiske live-lab-øvelser.

Ved slutten av denne opplæringen vil deltakerne kunne:

- Installer og konfigurer verktøy for analyse av big data som Hadoop MapReduce og Spark
- Forstå egenskapene til medisinsk data
- Bruk big data-teknikker for å håndtere medisinske data
- Studer store datasystemer og algoritmer i sammenheng med helseprogrammer

Publikum

- Utviklere
- Dataforskere

Kursets format

- Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse.

Merk

- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
28 timer
Oversikt
Many real world problems can be described in terms of graphs. For example, the Web graph, the social network graph, the train network graph and the language graph. These graphs tend to be extremely large; processing them requires a specialized set of tools and processes -- these tools and processes can be referred to as Graph Computing (also known as Graph Analytics).

In this instructor-led, live training, participants will learn about the technology offerings and implementation approaches for processing graph data. The aim is to identify real-world objects, their characteristics and relationships, then model these relationships and process them as data using a Graph Computing (also known as Graph Analytics) approach. We start with a broad overview and narrow in on specific tools as we step through a series of case studies, hands-on exercises and live deployments.

By the end of this training, participants will be able to:

- Understand how graph data is persisted and traversed.
- Select the best framework for a given task (from graph databases to batch processing frameworks.)
- Implement Hadoop, Spark, GraphX and Pregel to carry out graph computing across many machines in parallel.
- View real-world big data problems in terms of graphs, processes and traversals.

Format of the course

- Part lecture, part discussion, exercises and heavy hands-on practice
21 timer
Oversikt
Hortonworks Data Platform (HDP) er en åpen kildekode-støtteplattform for Apache Hadoop som gir et stabilt grunnlag for å utvikle big data-løsninger på Apache Hadoop økosystemet.

Denne instruktørledede, live trening (på stedet eller ekstern) introduserer Hortonworks Data Platform (HDP) og leder deltakerne gjennom distribusjonen av Spark + Hadoop løsningen.

Ved slutten av denne opplæringen vil deltakerne kunne:

- Bruk Hortonworks for å pålitelig kjøre Hadoop i stor skala.
- Forene Hadoop sikkerhets-, styrings- og operasjonsevner med Sparks agile analytiske arbeidsflyter.
- Bruk Hortonworks til å undersøke, validere, sertifisere og støtte hver av komponentene i et Spark-prosjekt.
- Behandle forskjellige typer data, inkludert strukturert, ustrukturert, i bevegelse og hvile.

Kursets format

- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.

Alternativer for tilpasning av kurset

- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
21 timer
Oversikt
Stream Processing refererer til sanntidsbehandling av "data in motion", det vil si å utføre beregninger på data når de mottas. Slike data blir lest som kontinuerlige strømmer fra datakilder som sensorhendelser, brukeraktivitet på nettstedet, finansielle handler, kredittkortveksler, Stream Processing , etc. Stream Processing kan lese store mengder innkommende data og gi verdifull innsikt nesten øyeblikkelig.

I denne instruktørledede, liveopplæringen (på stedet eller fjernkontrollen) vil deltakerne lære å sette opp og integrere forskjellige Stream Processing rammer med eksisterende store datalagringssystemer og relaterte programvareapplikasjoner og mikroservices.

Ved slutten av denne opplæringen vil deltakerne kunne:

- Installer og konfigurer forskjellige Streaming Stream Processing rammer, for eksempel Spark Streaming og Kafka Streaming.
- Forstå og velg de mest passende rammene for jobben.
- Behandle data kontinuerlig, samtidig og på en post-for-post måte.
- Integrer Stream Processing med eksisterende databaser, datavarehus, datasjøer, etc.
- Integrer det mest passende strømbehandlingsbiblioteket med bedriftsapplikasjoner og mikroservices.

Publikum

- Utviklere
- Programvarearkitekter

Kursets format

- Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse

Merknader

- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
14 timer
Oversikt
Magellan er en open source distribuert utførelsesmotor for geospatial analytics på big data. Implementert på toppen av Apache Spark , utvider den Spark SQL og gir en relasjonell abstraksjon for geospatial analyse.

Denne instruktørledede liveopplæringen introduserer konsepter og tilnærminger for implementering av geospacial analytics og leder deltakerne gjennom opprettelsen av en prediktiv analyseapplikasjon ved bruk av Magellan on Spark.

Ved slutten av denne opplæringen vil deltakerne kunne:

- Spørsmål, analyser og bli med geospatiale datasett på en effektiv måte
- Implementere geospatiale data i forretningsintelligens og prediktive analyseprogrammer
- Bruk romlig kontekst for å utvide mulighetene til mobile enheter, sensorer, logger og wearables

Kursets format

- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.

Alternativer for tilpasning av kurset

- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
21 timer
Oversikt
Apache Spark læringskurve øker sakte i begynnelsen, det krever mye krefter for å komme tilbake. Dette kurset tar sikte på å hoppe gjennom den første tøffe delen. Etter å ha tatt dette kurset vil deltakerne forstå det grunnleggende om Apache Spark , de vil tydelig differensiere RDD fra DataFrame, de vil lære Python og Scala API, de vil forstå eksekutører og oppgaver, etc. I tillegg til å følge beste praksis fokuserer dette kurset sterkt på skyutplassering, Databricks og AWS. Studentene vil også forstå forskjellene mellom AWS EMR og AWS Glue, en av de siste gnisttjenestene til AWS.

PUBLIKUM:

Data Engineer, DevOps , Data Scientist
21 timer
Oversikt
OBJEKTIV:

Dette kurset vil introdusere Apache Spark . Studentene skal lære hvordan Spark passer inn i Big Data økosystemet, og hvordan de kan bruke Spark til dataanalyse. Emnet dekker Spark shell for interaktiv dataanalyse, Spark internals, Spark APIer, Spark SQL , Spark streaming, og maskinlæring og grafX.

Audiens:

Utviklere / dataanalytikere
21 timer
Oversikt
Python er et programmeringsspråk på høyt nivå kjent for sin klare syntaks og kodelesbarhet. Spark er en databehandlingsmotor som brukes til spørring, analyse og transformering av big data. PySpark lar brukere grensesnitt Spark med Python .

I denne instruktørledede liveopplæringen vil deltakerne lære hvordan de bruker Python og Spark sammen for å analysere big data når de jobber med praktiske øvelser.

Ved slutten av denne opplæringen vil deltakerne kunne:

- Lær hvordan du bruker Spark med Python til å analysere Big Data .
- Arbeidet med øvelser som etterligner omstendighetene i den virkelige verden.
- Bruk forskjellige verktøy og teknikker for big data-analyse ved bruk av PySpark .

Kursets format

- Delforelesning, deldiskusjon, øvelser og tung praktisk øvelse
7 timer
Oversikt
Spark SQL er Apache Spark modul for arbeid med strukturerte og ustrukturerte data. Spark SQL gir informasjon om strukturen til dataene samt beregningen som blir utført. Denne informasjonen kan brukes til å utføre optimaliseringer. To vanlige bruksområder for Spark SQL er:
- for å utføre SQL spørsmål.
- å lese data fra en eksisterende Hive installasjon.

I denne instruktørledede, liveopplæringen (på stedet eller fjernkontrollen) vil deltakerne lære å analysere ulike typer datasett ved å bruke Spark SQL .

Ved slutten av denne opplæringen vil deltakerne kunne:

- Installer og konfigurer Spark SQL .
- Utfør dataanalyse ved å bruke Spark SQL .
- Forespørselsdatasett i forskjellige formater.
- Visualiser data og spørreresultater.

Kursets format

- Interaktiv forelesning og diskusjon.
- Masse øvelser og trening.
- Praktisk implementering i et live-lab-miljø.

Alternativer for tilpasning av kurset

- For å be om en tilpasset opplæring for dette kurset, vennligst kontakt oss for å avtale.
35 timer
Oversikt
MLlib er Sparks maskinlæringsbibliotek. Målet er å gjøre praktisk maskinlæring skalerbar og enkel. Den består av vanlige læringsalgoritmer og verktøy, inkludert klassifisering, regresjon, klynger, samarbeidende filtrering, dimensjonalitetsreduksjon, samt primitiver på lavere nivå og optimaliseringsgrensesnitt på rørledningen.

Den deler seg i to pakker:

-

spark.mllib inneholder den originale API-en som er bygget på toppen av RDD-er.

-

spark.ml gir API på høyere nivå bygget oppå DataFrames for konstruksjon av ML-rørledninger.

Publikum

Dette kurset er rettet mot ingeniører og utviklere som søker å bruke et innebygd maskinbibliotek for Apache Spark
Helg Spark kurs, kveld Apache Spark trening, Spark boot camp, Apache Spark instruktørledet, Helg Apache Spark trening, Kveld Spark kurs, Apache Spark coaching, Apache Spark instruktør, Apache Spark trener, Apache Spark kurs, Spark klasser, Spark on-site, Spark private kurs, Apache Spark tomannshånd trening

Course Discounts

Course Discounts Newsletter

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

Some of our clients

is growing fast!

We are looking to expand our presence in Norway!

As a Business Development Manager you will:

  • expand business in Norway
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!