Как я могу разделить набор данных из csv-файла для обучения и тестирования?
Я использую Python, и мне нужно разделить мой .csv импортировал данные в двух частях, обучающий и тестовый набор, например 70% обучение и 30% тест.
Я постоянно получаю различные ошибки, такие как 'list' object is not callable
и так далее.
Спасибо
Правка:
Код является базовым, я просто ищу, чтобы разделить набор данных.
from csv import reader
with open('C:/Dataset.csv', 'r') as f:
data = list(reader(f)) #Imports the CSV
data[0:1] ( data )
TypeError: 'list' object is not callable
3 ответа:
Вы можете использовать
pandas
:import pandas as pd import numpy as np df = pd.read_csv('C:/Dataset.csv') df['split'] = np.random.randn(df.shape[0], 1) msk = np.random.rand(len(df)) <= 0.7 train = df[msk] test = df[~msk]