بارگیری یک مجموعه داده نمونه

کتابخانه scikit-learn به همراه چند دیتاست استاندارد ارائه شده است، به عنوان مثال: مجموعه داده iris و اعداد برای طبقه بندی و مجموعه داده دیتابت برای رگرسیون.

در ادامه ما مفسر پایتون را با استفاده از shell اجرا می‌کنیم، و سپس مجموعه داده های iris و اعداد را بارگیری می‌کنیم. قرارداد ما این است که علامت <<< نشان دهنده مفسر پایتون در shell است.

$ python
>>> from sklearn import datasets
>>> iris = datasets.load_iris()
>>> digits = datasets.load_digits()

یک دیتاست شبیه به یک شی دیکشنری است که تمام داده ها و متا داده های مربوط به داده را در خود نگه می‌دارد. این داده ها در data. ذخیره می‌شوند، که یک آرایه n_samples, n_features است. در مسائل با نظارت یک یا چند متغیر پاسخ در target. ذخیره می‌شود.

جرئیات بیشتر در مورد مجموعه داده های مختلف را می‌توان در یک بخش اختصاصی پیدا کرد.