sparksql
7 timer (vanligvis 1 dag inkuldert pauser)
Audience
Spark SQL er Apache Spark modul for arbeid med strukturerte og ustrukturerte data. Spark SQL gir informasjon om strukturen til dataene samt beregningen som blir utført. Denne informasjonen kan brukes til å utføre optimaliseringer. To vanlige bruksområder for Spark SQL er:
- for å utføre SQL spørsmål.
- å lese data fra en eksisterende Hive installasjon.
I denne instruktørledede, liveopplæringen (på stedet eller fjernkontrollen) vil deltakerne lære å analysere ulike typer datasett ved å bruke Spark SQL .
Ved slutten av denne opplæringen vil deltakerne kunne:
Kursets format
Alternativer for tilpasning av kurset
Machine Translated
Introduction
Overview of Data Access Approaches (Hive, databases, etc.)
Overview of Spark Features and Architecture
Installing and Configuring Spark
Understanding Dataframes in Spark
Defining Tables and Importing Datasets
Querying Data Frames using SQL
Carrying out Aggregations, JOINs and Nested Queries
Uploading and Accessing Data
Querying Different Types of Data
Querying Data Lakes with SQL
Troubleshooting
Summary and Conclusion
We are looking to expand our presence in Norway!
If you are interested in running a high-tech, high-quality training and consulting business.
Apply now!















.jpg)









.jpg)





















