Gdzie jest Json? Porównanie CSV, JSON, Parquet i ORC.
Bazy danych i XML 2414 dni, 15 godzin, 57 minut temu 41 źrodło rozwiń
W skrócie: Apache Spark + HDInsight na Azure. Zajmiemy się prostym, ale pokaźnym zbiorem maili i haseł z różnych wycieków danych. W tym przykładzie będę używał DataFrames w Spark 2.0.


