Неозначени подаци: разумевање њиховог значаја и изазова у машинском учењу
Неозначено се односи на нешто што нема ознаку или назив. У контексту машинског учења, неозначени подаци су подаци који нису класификовани или означени одређеном категоријом или класом. Ова врста података је такође позната као „ненадзирани“ подаци, јер немају надзор или упутства од стране људског оператера.ӕӕ Насупрот томе, означени подаци су подаци који су ручно класификовани или означени одређеном категоријом или класом. Ова врста података се користи за обуку модела машинског учења и неопходна је за учење под надзором.ӕӕПримери неозначених података укључују:ӕӕ1. Слике без икаквог текста или ознака на њима.ӕ2. Аудио снимци без икаквих транскрипата или ознака.ӕ3. Очитавања сензора са уређаја без икаквог контекста или интерпретације.ӕ4. Објаве на друштвеним мрежама без икакве категоризације или ознака.ӕӕ Неозначени подаци могу бити изазовни за рад, јер не постоје јасне смернице како их анализирати или тумачити. Међутим, недавни напредак у машинском учењу омогућио је извлачење увида и значења из неозначених података коришћењем техника као што су груписање, откривање аномалија и смањење димензионалности.



