Как показать полное содержимое столбца в фрейме данных Spark?


Я использую spark-csv для загрузки данных в фрейм данных. Я хочу сделать простой запрос и отобразить содержание:

val df = sqlContext.read.format("com.databricks.spark.csv").option("header", "true").load("my.csv")
df.registerTempTable("tasks")
results = sqlContext.sql("select col from tasks");
results.show()

col кажется усеченным:

scala> results.show();
+--------------------+
|                 col|
+--------------------+
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-06 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:21:...|
|2015-11-16 07:21:...|
|2015-11-16 07:21:...|
+--------------------+

Как мне показать полное содержимое столбца?

10 96

10 ответов:

results.show(20, False) не будет усекать. Проверьте источник

Если вы ставите только результаты.show (False) не будет усекать результат

другие решения хороши. Если это ваши цели:

  1. нет усечения колонн,
  2. без потери строк
  3. быстрое и
  4. эффективное

эти две строки полезны ...

    df.persist
    df.show(df.count, false) // in Scala or 'False' in Python

при сохранении, 2 действия исполнителя, подсчет и показать, быстрее и эффективнее при использовании persist или cache для поддержания промежуточной базовой структуры фрейма данных в исполнителях. Подробнее о сохранять и кэшировать.

results.show(20, False) или results.show(20, false) в зависимости от того, используете ли вы его на Java/Scala/Python

ниже код поможет просмотреть все строки без усечения в каждом столбце

df.show(df.count(), False)

попробуйте эту команду :

df.show(df.count())

results.show(false) покажет вам полное содержимое столбца.

показать метод по умолчанию ограничение до 20, и добавление числа перед false появится несколько строк.

результаты.show (20, false) сделал трюк для меня в scala

попробуйте это: пеленгатор.шоу (некоторые нет) будет работать, но df.шоу(ДФ.count ()) не будет работать df.count дает тип вывода long, который не принимается df.показать() как он принимает целочисленный тип.

внутри Databricks вы можете визуализировать таблицы данных в табличном формате. С помощью команды:

display(results)

Это будет выглядеть как

enter image description here