MuodostusToisen asteen koulutus ja koulujen

Lähimmän naapurin menetelmä: esimerkki työn

lähin naapuri on helpoin metrinen luokittelija, joka perustuu arviointiin samankaltaisuutta eri esineitä.

Analysoidaan esine kuuluu luokkaan, joihin ne kuuluvat aiheista koulutusta näytteen. Olkaamme selville mikä on lähin naapuri. Yrittää ymmärtää monimutkainen asia, esimerkkejä erilaisista tekniikoista.

hypoteesi menetelmä

lähimmän naapurin menetelmää voidaan pitää yleisin käytetty algoritmi luokitteluun. Objekti käynnissä luokitus kuuluu luokkaan y_i, johon lähin kohde oppimisen x_i näyte.

Menetelmien spesifisyys naapurit

k lähimmän naapurin menetelmä voi parantaa tarkkuutta luokituksen. Analysoidaan esine kuuluu samaan luokkaan kuin pääosa sen naapureita, eli k lähellä sitä vastustaa analysoitavan näytteen x_i. Ongelmien ratkaisussa kaksi luokkaa määrä naapurit pariton välttää tilanteen epäselvyys, jos sama määrä naapurit kuuluvat eri luokkiin.

Tekniikka keskeytetty naapurit

Postgresql-analysoitu menetelmällä tsvector naapurit käytetään, kun luokkien määrä on vähintään kolme, eikä sitä voi käyttää pariton. Mutta epäselvyyttä syntyy myös näissä tapauksissa. Sitten i: nnen naapuri saa w_i paino, mikä pienentää naapurin listalla i. Se viittaa luokan objekti, joka tulee olla yhteensä enintään paino joukossa lähellä naapureita.

Ajatusta tiiviyttä

Ytimessä kaikki edellä mainitut menetelmät on hypoteesi tiiviyttä. Siinä ehdotetaan yhteys toimenpide samankaltaisuuden esineitä ja ne kuuluvat samaan luokkaan. Tässä tilanteessa raja erityyppisten on yksinkertainen muoto, ja luoda luokkia esineitä avaruudessa kompakti mobiili alueella. Tällaisissa tiloissa matemaattisen analyysin tarkoittamaan suljettu rajoitettu joukko. Tätä hypoteesia ei liity jokapäiväiseen käsitys sanan.

Peruskaava

Tarkastellaan enemmän naapuriin. Jos ehdotettu koulutus näytteen tyyppi "objekti-vaste» X ^ m = \ {(x_1, y_1), \ pisteitä, (x_m, y_m) \}; jos useita esineitä määrittämään etäisyys toiminto \ rho (x, x '), joka on esitetty muodossa, riittävän mallin samankaltaisuuden esineitä lisäämällä funktion arvo pienenee samankaltaisuuden objektien x, x'.

Ratkaisuja kohde, u rakentaa koulutus näyte esineitä x_i kasvaessa etäisyydet U:

\ Rho (u, x_ {1, u}) \ leq \ rho (u, x_ {2, u}) \ leq \ cdots \ leq \ rho (u, x_ {m, u}),

jossa x_ {i; u} luonnehtii esine oppimisen näyte, joka on i: nnen naapuri lähteen olion u. Kuten merkintä ja käyttö vastata i-th naapuri: y_ {i; u}. Tämän seurauksena, huomaamme, että jokin esine u provosoi numerointia oman näytteen.

Määritys lukumäärä k naapurit

lähimmän naapurin menetelmä kun k = 1 pystyy antamaan virheellisen luokittelun paitsi esineitä-päästöjä, mutta myös muita luokkia, jotka ovat lähellä.

Jos otamme k = m, algoritmi, olevan yhtä stabiileja ja muuttua vakioarvo. Siksi luotettavuus on tärkeää välttää äärimmäiset indeksit k.

Käytännössä, koska optimaalinen indeksiä k kriteeri liukuva ohjaus.

seulonnat päästöt

Tutkimuksen kohteena ovat pitkälti eriarvoista, mutta joukossa on niitä, jotka ovat luonteeltaan luokan ja kutsutaan standardeja. Klo läheisyys kohteena ideaalimallin sen suurella todennäköisyydellä kuuluvat tähän luokkaan.

Miten rezultativen menetelmä naapurit? Esimerkkinä voidaan nähdä perusteella reuna ja ei-informatiivinen esineluokat. Oletetaan tiheä ympäristössä esineen muiden tämän luokan edustajina. Kun poistaa ne luokittelu näytteenoton laatu ei kärsi.

Päästä tietty määrä näytteitä voidaan melun murtuu, jotka ovat "päällä" luokan. Poistetaan olennaisen myönteinen vaikutus laatuun luokitusta.

Jos näyte otetaan-informatiivinen ja poistaa melu esineitä, voit luottaa muutaman myönteisiä tuloksia samaan aikaan.

Ensimmäinen interpolointi menetelmä naapuriin luokittelu mahdollistaa laadun parantamiseen, vähentää tallennettujen tietojen, vähentää aikaa Luokituksen joka kuluu valintaa seuraavan standardeja.

Käytön erittäin suuri näytteitä

lähimmän naapurin menetelmä perustuu todelliseen varastoinnista oppisisältöjen. Luoda erittäin laajoja näytteitä tekninen ongelma. Tarkoituksena ei ole vain säästää huomattavan määrän tietoa, mutta myös vähintään yhtä kauan on aikaa löytää mitään esinettä uk joukossa lähimmät naapurit.

Jotta tästä tehtävästä, on käytetty kahta menetelmää:

  • ohennettu näyte kautta se myöntää ei-tieto-objekteja;
  • tehokkaan käytön erityisiä tietorakenteen ja koodien instant etsimään naapurit.

Säännöt valintamenetelmien

Edellä esitetyn luokittelun pidettiin. Lähimmän naapurin menetelmää käytetään käytännön ongelmien ratkaisuun, joka on etukäteen tiedossa etäisyyden funktio \ rho (x, x '). Kuvaamaan esineitä numeerista vektoreita käyttää Euklidisen metriikan. Tämä valinta ei ole erityisiä syitä, mutta Mitataan kaikki merkit "samassa mittakaavassa." Jos tämä tekijä ei ole otettu huomioon, niin -tieto hallitsevia ominaisuus, jolla on suurin numeerisia arvoja.

Jos on huomattava määrä toimintoja, lasketaan etäisyys summana poikkeamien erityisistä oireet näkyvät vakava ongelma ulottuvuus.

Korkeissa ulotteinen avaruus kaukana toisistaan kaikki objektit. Loppujen lopuksi kaikki näytteet on vieressä esineen tutkitaan k naapureita. valitaan pieni joukko informatiivinen ominaisuuksia tämän ongelman poistamiseksi. Algoritmeja arviolaskelmia rakentaa pohjalta erilaista merkkejä, ja kunkin yksittäisen rakentaa Etälukuversio.

johtopäätös

Matemaattisia laskelmia liittyy usein käyttämällä erilaisia tekniikoita, joilla on omat ominaispiirteet, edut ja haitat. Katsottuna lähimmän naapurin menetelmä voi ratkaista melko vakava ongelma, koska ominaisuuksien matemaattisia esineitä. Kokeellinen käsite, joka perustuu analysoidun menetelmää käytetään aktiivisesti tekoälyä.

Vuonna asiantuntija järjestelmissä on tarpeen varsinkin luokitella esineitä, mutta myös näyttää käyttäjälle selvitys kyseinen luokittelu. Tässä menetelmässä, selitys tämän ilmiön on ilmaistu suhteessa kohteeseen tietyn luokan sekä sen sijainti suhteessa käytetyn näytteen. Oikeudellinen teollisuuden asiantuntijat, geologit, lääkärit, ota tämä "ennakkotapaus" logiikkaa käyttävät palvelua aktiivisesti näiden tutkimukseen.

Jotta voidaan analysoida menetelmä oli kaikkein luotettavin, tehokas, antaa toivottuja tuloksia, sinun täytyy ottaa vähintään kuva K, mutta myös välttää päästöt keskuudessa analysoitiin esineitä. Siksi standardien käyttö sekä valintamenetelmä sekä optimoinnin mittareita.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 fi.atomiyme.com. Theme powered by WordPress.