Delta Lake zdobywa ostatnio coraz większa popularność. Słychać o nim na konferencjach na całym świecie. W tym artykule przyjrzymy się jakie problemy rozwiązuje.Spis treścihide1Co to Delta Lake?2Jupyter + Delta Lake3Przygotowanie danych4Bez Delta Lake5Z Delta LakeHistoria i podróże w czasieZarządzanie schematemVacuumDelta Lake APIDeleteUpdateMergeStreaming Sink6Co jest pod maską?7RepoCo to Delta Lake? Delta Lake to nakładka na Apache Spark. Pełni rolę warstwy persystencji i gwarantuje ACID na HDFS, S3, A...
Strona głównaBazy danych i XML
Bazy danych i XML 1922 dni, 22 godziny, 58 minut temu 52 pokaż kod licznika zwiń
Podobne artykuły:
- Big Data - Jak zacząć? - Wiadro Danych
- Obliczanie prędkości w Apache Spark - GPS komunikacji miejskiej - Wiadro Danych
- Półtora miliarda haseł w Spark - część 1 - czyszczenie - Wiadro Danych
- Koalas, czyli PySpark w przebraniu Numpy - Wiadro Danych
- Półtora miliarda haseł w Spark – część 2 – formaty danych - Wiadro Danych
- Czy słonie pływają? Kilka słów o Data Lake - Wiadro Danych
- Dlaczego Elasticsearch kłamie? Jak działa Elasticsearch? - Wiadro Danych
- Półtora miliarda haseł w Spark – część 3 – partycjonowanie danych - Wiadro Danych
- Apache Spark - 2 Kroki do Lepszej Utylizacji Zasobów - Wiadro Danych
- Visualizing GraphFrames in Apache Zeppelin - mSzymczyk Blog
- Problem małych plików w HDFS - Wiadro Danych