• siniflandirma, kumeleme..
  • (bkz: mirroring)
  • öbekleme.
    sınıflandırmak ile aynı şey değildir.
    bir uzayda çeşitli attributelere sahip tanımlı bir çok nokta olsun. bunların yapay zeka ile kümelenmesi işlemi clusteringdir.

    sınıflandırma yani classification ise bu uzayda çeşitli noktalar * ve bunların hangi sınıftan olduğu verilir. data noktalarının yoğunluğuna göre uzayı çeşitli bölgelere ayırıp bundan sonra o bölgedeki datalar hakkında tahmin yapma gücü üretmeleri de sınıflandırma yani classificationdır.
  • unsupervised learning problemlerinin cozumlerinden biri. non-linear basis vektorleri uzarindaki islemlerle yapilan non-linear clustering uzantilari linear clusteringe gore (ornegin fisher's linear discriminant vs kernel non-linear discriminant) cok zayif ve yetersiz kalmaktadir.
  • (bkz: cluster)
  • bir clustering aracı olarak (bkz: zımba)
  • genel kabul görmüş şekliyle 3 çeşide ayrılabilirler.
    1-partitioning
    2-hierarchical
    3-density-based

    partitioning tekniklerine girdi olarak datanızı ve istediğiniz öbek sayısını girersiniz. algoritma da datanızı verdiğiniz öbek sayısında data topluluğunu böler, bunu yaparken de squared error gibi bir fonk'u minimize etmeye çalışır. k-means, k-medoids en bilindik örnekleridir.

    hierarchical teknikler bireyden topluluğa (bottom-up, agnes) ya da topluluktan bireye (top-down, diana) olarak ikiye ayrılır. bireyden topluluğa teknikte her data noktanız birer öbek olarak başlar. en yakınlar bir öbek olarak toparlanılır, tek bir dev öbek elde edilene kadar devam edilir.
    bu tür tekniklerde bir durma kriterine ihtiyacınız vardır. bu "yeterince yakın değilse bu 2 öbeği birleştirme" olabileceği gibi "öbek sayısı k'dan fazla olamaz" da olabilir.

    density-based teknikler data noktalarımızın uzaydaki yoğunlaşmalarına bakarak onları biraraya toplar. k-means'de hiç bir öbeğe ait olamayacağı çok net olarak açık noktaları illa bir öbeğe dahil edilmekteyken dbscan gibi bir density-based metodda bu noise data noktacıkları hiç bir öbeğe dahil edilmez.

    bu 3 çeşit dışında çok kullanımına denk gelmediğim grid-based metodlar da vardır. ayrıca kırma adını verebileceğimiz metodlar da vardır. bunlar yukarıdaki 3 çeşidin en az 2 tanesinden bir şeyler ödünç almışlardır. chameleon bu hybrid clustering tekniklerine iyi bir örnektir.
  • bir cesit yazım teknigidir.bu teknikte yapmanız gereken aklınıza gelen bir konuyu bos bir kagıda yazarak bunu cember icine alın.daha sonra bu konu ile ilgili aklınıza gelen diger alt fikirleri ok cıkartıp bir alt kume olusturup gruplara ayırın.mesela ben ekmek hakkında birseyler yazıcam.bunu bir bos kagıdın ortasına yazdım ve cember icine aldım.sonra ekmek ne ise yarar , nasıl kokar , insan icin yararları nedir gibi aklınıza ekmek ile ilgili gelen tum seyleri ekmek kumesinin etrafına ok cıkartarak sınıflandırın .bu sayede yazacagınız yazı ile ilgili aklınızda ne yazacagınıza dair birseyler sekillenmis olucak ve ne yazacagım korkusu olmadan bu yaptıgınız kumeden yararlanıp yazacagınız konuyu dilediginiz gibi yazabilirsiniz. *
hesabın var mı? giriş yap