Общедоступные наборы данных для "практики" на
Недавно я получил задание в своем классе программирования Java проанализировать (как мне кажется, очень маленький) набор данных. Я действительно наслаждался назначением и использованием "токенизатора" и т. д., который был новой концепцией для меня. Набор данных, с которым мы работали, был довольно скучным, так как он содержал только даты.
То, что я ищу, это:
Открытые наборы данных (XML, txt или аналогичные) для практического анализа на
Это может быть что угодно на самом деле (предпочтительно довольно просто), так как я главным образом, пытаясь распечатать статистику, шаблоны и графики.
3 ответа:
Попробуйте StackOverflow дамп данных.
UC Irvine Machine Learning Repository является отличным ресурсом для такого рода вещей.
В дополнение к дампу необработанных данных, упомянутому nos, см. его компаньон, Stack Exchange Data Explorer. Там вы можете запустить SQL-запрос и загрузить результирующий набор. (Полезно, если вы ищете что-то меньшее, чем все.)