Sumea K-tarkoittaa klusterointia Mahoutissa



Tämä blogi antaa johdannon Fuzzy K-Means -ryhmittymiseen Apache Mahoutissa.

Fuzzy K-Means on täsmälleen sama algoritmi kuin K-tarkoittaa, mikä on suosittu yksinkertainen klusterointitekniikka. Ainoa ero on, että sen sijaan, että piste osoitettaisiin vain yhdelle klusterille, sillä voi olla jonkinlainen sumeus tai päällekkäisyys kahden tai useamman klusterin välillä. Seuraavassa on keskeisiä kohtia, jotka kuvaavat sumeaja K-keinoja:





  • Toisin kuin K-Means, joka etsii kovaa klusteria, jossa kukin pisteistä kuuluu yhteen klusteriin, Fuzzy K-Means etsii pehmeämpiä klustereita päällekkäin.
  • Yksi pehmeän klusterin piste voi kuulua useampaan kuin yhteen klusteriin, jolla on tietty affiniteettiarvo kuhunkin pisteeseen.
  • Affiniteetti on verrannollinen kyseisen pisteen etäisyyteen ryppysentroidista.
  • Samoin kuin K-Means, Fuzzy K-Means toimii kohteissa, joille on määritetty etäisyysmitta ja joita voidaan edustaa n- ulotteinen vektoritila.

Fuzzy K-Means MapPienennä virtausta

MapReduce-K-Meansin ja Fuzzy K-Means -virtojen välillä ei ole paljon eroja. Molempien toteutus Mahoutissa on samanlainen.

lajittelu taulukko c ++ laskeva

Seuraavat ovat olennaiset parametrit Fuzzy K-Means -sovelluksen toteuttamiseksi:



  • Tarvitset vektoritietojoukon syötettä varten.
  • Alkuperäisten k-klustereiden kylvämiseksi on oltava RandomSeedGenerator.
  • Etäisyysmittaa varten vaaditaan SquaredEuclideanDistanceMeasure.
  • Suuri konvergenssikynnysarvo, kuten –cd 1.0, jos on käytetty etäisyysmittauksen neliöarvoa
  • MaxIterations-arvon oletusarvo on -x 10.
  • Normalisointikerroin tai sumutekijä, jonka arvo on suurempi kuin -m 1,0

Onko sinulla kysymys meille? Mainitse ne kommenttiosassa ja palaamme sinuun.

kuinka lajitella taulukko nousevassa järjestyksessä c ++

Aiheeseen liittyvät julkaisut



mvc-arkkitehtuuri java-esimerkissä

Ohjattu oppiminen Apache Mahoutissa