Общедоступные наборы данных для "практики" на


Недавно я получил задание в своем классе программирования Java проанализировать (как мне кажется, очень маленький) набор данных. Я действительно наслаждался назначением и использованием "токенизатора" и т. д., который был новой концепцией для меня. Набор данных, с которым мы работали, был довольно скучным, так как он содержал только даты.

То, что я ищу, это:
Открытые наборы данных (XML, txt или аналогичные) для практического анализа на

Это может быть что угодно на самом деле (предпочтительно довольно просто), так как я главным образом, пытаясь распечатать статистику, шаблоны и графики.

3 2

3 ответа:

Попробуйте StackOverflow дамп данных.

UC Irvine Machine Learning Repository является отличным ресурсом для такого рода вещей.

В дополнение к дампу необработанных данных, упомянутому nos, см. его компаньон, Stack Exchange Data Explorer. Там вы можете запустить SQL-запрос и загрузить результирующий набор. (Полезно, если вы ищете что-то меньшее, чем все.)