Каковы различия между пандами и NumPy+SciPy в Python? [закрытый]


Они оба, кажется,чрезвычайно аналогично, и мне любопытно, какой пакет будет более полезен для анализа финансовых данных.

3 161

3 ответа:

действительно, pandas предоставляет инструменты обработки данных высокого уровня, построенные поверх NumPy. NumPy сам по себе является довольно низкоуровневым инструментом и будет очень похож на использование MATLAB. панды, с другой стороны, обеспечивают богатую функциональность временных рядов, выравнивание данных, NA-дружественную статистику, методы groupby, merge и join и множество других удобств. Он стал очень популярным в последние годы в финансовых приложениях. У меня будет глава, посвященная анализу финансовых данных с помощью Pandas в моей будущей книги.

Numpy требуется панд (и практически все числовые инструменты для Python). Составляющей не является строго обязательным для панд, но в списке "параметры зависимости". Я бы не сказал, что панды-это альтернатива Numpy и/или Scipy. Скорее, это дополнительный инструмент, который предоставляет более удобный способ работы с числовыми и табличными данными в Python. Вы можете использовать структуры данных pandas, но свободно использовать функции Numpy и Scipy для управления ими.

панды предлагают отличный способ манипулировать таблицами, как вы можете сделать биннинг легко (биннинг фрейма данных в панд в Python) и расчета статистики. Другая вещь, которая отлично подходит в pandas, - это класс Panel, который вы можете объединить в ряд слоев с разными свойствами и объединить его с помощью функции groupby.