Как показать полное содержимое столбца в фрейме данных Spark?
Я использую spark-csv для загрузки данных в фрейм данных. Я хочу сделать простой запрос и отобразить содержание:
val df = sqlContext.read.format("com.databricks.spark.csv").option("header", "true").load("my.csv")
df.registerTempTable("tasks")
results = sqlContext.sql("select col from tasks");
results.show()
col кажется усеченным:
scala> results.show();
+--------------------+
| col|
+--------------------+
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-06 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:21:...|
|2015-11-16 07:21:...|
|2015-11-16 07:21:...|
+--------------------+
Как мне показать полное содержимое столбца?
10 ответов:
results.show(20, False)
не будет усекать. Проверьте источник
другие решения хороши. Если это ваши цели:
- нет усечения колонн,
- без потери строк
- быстрое и
- эффективное
эти две строки полезны ...
df.persist df.show(df.count, false) // in Scala or 'False' in Python
при сохранении, 2 действия исполнителя, подсчет и показать, быстрее и эффективнее при использовании
persist
илиcache
для поддержания промежуточной базовой структуры фрейма данных в исполнителях. Подробнее о сохранять и кэшировать.
results.show(20, False)
илиresults.show(20, false)
в зависимости от того, используете ли вы его на Java/Scala/Python
results.show(false)
покажет вам полное содержимое столбца.показать метод по умолчанию ограничение до 20, и добавление числа перед
false
появится несколько строк.
попробуйте это: пеленгатор.шоу (некоторые нет) будет работать, но df.шоу(ДФ.count ()) не будет работать df.count дает тип вывода long, который не принимается df.показать() как он принимает целочисленный тип.
внутри Databricks вы можете визуализировать таблицы данных в табличном формате. С помощью команды:
display(results)
Это будет выглядеть как