Формација, Средње образовање и школе
Најближи сусед метод: пример рада
Најближи метод сусед је најлакши показатељ класификатор који се заснива на процени сличности различитих објеката.
Анализирали објекат припада класи којој припадају предмете узорка обуке. Хајде да сазнамо који је најближи сусед. Покушајте да разумеју компликована ствар, примере различитих техника.
хипотеза метход
Најближи метод сусед може се сматрати као најчешћи алгоритма који се користи за класификацију. Објецт подвргнути класификацију припада класи и_и, коме је најближи предмет учења к_и узорак.
Специфичност метода комшије
к најближем начин суседа може да побољша тачност класификације. Анализирано објекат припада истој класи као и већи део својих суседа, то јест, к близини се објекти од анализираног узорка к_и. У решавању проблема са две класе броја суседа ће бити чудно да се избегне ситуацију двосмислености, да ли ће исти број суседа припадају различитим класама.
Техника суспендованих суседа
Постгрескл-анализирали начин тсвецтор најближи суседи се користи када је број одељења најмање три, а не можете користити непаран број. Међутим, појављује се нејасноћа, чак иу овим случајевима. Затим, комшија и-ти добија в_и тежину, што смањује са суседне чин и. Односи се на класу објекта, који ће имати максималну укупну тежину међу блиских суседа.
Хипотеза о компактности
У срцу свих наведених метода је хипотеза компактности. То указује на везу између мера сличности објеката и њихово припадају истој класи. У овој ситуацији, граница између различитих типова је једноставан облик, и створити класе објеката у простору компактних мобилних области. Под таквим областима у математичке анализе узети да значи затвореном ограниченом скупу. Ова хипотеза се не односи на свакодневне перцепције речи.
Основна формула
Размотримо више најближи сусед. Ако предложени тренинг тип узорка "објекат-одговор» к ^ М = \ {(к_1, и_1), \ дотс, (к_м, и_м) \}; ако мноштво објеката који дефинишу раздаљину фунцтион \ рхо (к, к '), које је представљено у облику адекватног модела сличности предмета повећањем вредности функције смањује сличности између објеката к, к'.
За било који објекат, у ће изградити узорак тренинг објекте к_и са повећањем растојања то у:
\ Рхо (у, к_ {1; у}) \ Лек \ рхо (у, к_ {2; у}) \ екв \ цдотс \ Лек \ рхо (у, к_ {м; у}),
где к_ {и; У} карактерише узорак учења објекат, који је и-ти комшија извор простор У. Такво нотација и коришћење да одговори и-тх суседа: и_ {и; У}. Као резултат тога, сматрамо да сваки предмет У изазива Ренумерисање сопствени узорак.
Одређивање броја к сусједа
Најближи сусед метод када је к = 1 је у стању да дају погрешне класификације, не само на објектима-емисија, али и за друге класе које су у близини.
Уколико узмемо к = м, алгоритам ће бити стабилна и да ће изроде у константној вредности. Зато је поузданост је важно да се избегне екстремним индекси к.
У пракси, јер оптимални Индекс к користи критеријум клизним контролу.
пројекције емисије
Објекти студије су углавном неједнако, али међу њима има и оних који имају карактеристике класе и се називају стандардима. У близини субјекта на идеалном моделу високе вероватноће припадају овој класи.
Како резултативен метод најближих суседа? Пример може да се види на основу периферних и не-информативних категорије објеката. Претпоставља се густу окружењу објекта осталих представника ове класе. Када их уклонити из класификације узорковања квалитета неће патити.
Уђите у одређеном броју узорака може рафала буке који су "на терену" у класи. Уклањање суштински позитиван утицај на квалитет класификације.
Ако је узорак узет из унинформативе и елиминисати објеката буке, можете рачунати на неколико позитивних резултата у исто време.
Први метод интерполација најближег суседа класификација омогућава да се побољша квалитет, смањити количину сачуваних података, смањити време класификације, који се троши на избору наредних стандарда.
Употреба ултра-великим узорцима
Најближи метод комшија је заснован на реалном складиштење објеката учења. Да бисте направили управо узорке великих користећи технички проблем. Циљ није само да спаси значајну количину информација, али и у минималном износу од вријеме имали времена да пронађе било који објекат у К међу најближим сусједима.
Да се изборе са овим задатком, користе се две методе:
- разредити сампле Преко објеката пражњења нон-података;
- ефикасна употреба посебна структура података и кодови за инстант потрази за најближих суседа.
Правила метода селекције
Наведена класификација је узети у обзир. Најближи метод комшија се користи у решавању практичних проблема, који је познат унапред на даљину функција \ рхо (к, х '). У описују објектима бројчане вектори користити Еуклидов метрику. Овај избор нема посебну оправдање, али подразумева мерење свих знакова "у истој скали." Ако овај фактор се не узима у обзир, онда је показатељ да доминирају функцију која највише нумеричке вредности.
Ако постоји знатна количина функција, израчунавање удаљености као збир одступања на специфичне симптоме појави озбиљан проблем димензију.
У средњој димензионални простор удаљени једни од других ће сви објекти. На крају крајева, сваки узорак ће бити поред објекта која се проучава к комшије. изабран мали број информативних могућности да елиминише овај проблем. Алгоритми за израчунавање процене граде на основу различитих скупова знакова, као и за сваког појединца граде своју близину функцију.
закључак
Математички прорачуни често укључују употребу различитих техника које имају своје посебне карактеристике, предности и недостатке. Гледано најближи метод сусед може да реши доста озбиљан проблем, због карактеристика математичких објеката. Експериментални концепт, заснован на анализиране методом се активно користи у вештачкој интелигенцији.
У експертских система потребно је не само да се класификују објекте, али и показати кориснику објашњење класификације у питању. У овом поступку, објашњење за ову појаву су изражене у вези са предметом одређене класе као и његов локацију у односу на узорак се користи. Правни стручњаци индустрија, геолози, лекари, да ово "преседан" логику активно га користе у свом истраживању.
Да би се анализира начин био најпоузданији, ефикасна, дајући жељене резултате, морате да минимални фигуру к, а такође избегавати емисије међу анализираних предмета. Зато је употреба стандарда и метода селекције, као и оптимизација метрика.
Similar articles
Trending Now