Sıralama düzeni
İstatistik bilim dalı içinde sıralama düzeni veri dizisinin özel bir şekle dönüştürülmesini kapsar. Bir örneklem veya anakütle içinde bulunan her bir sayısal elemana bir sıralama numarası verilerek öyle bir sıralanır ki bu sıralanma sonucunda herhangi bir iki eleman ele alınırsa iki elemandan hangisinin sıralama düzeninde önde geldiği bilinebilir. Yani sıralama düzeni bir sayı dizisi olup bir örneklem veya anakütledeki her bir elemana bir sıralama numarası verilmesi ile elde edilir. Matematik terimi ile bu işlem nesnelerin tüm ön-sıralanması veya zayıf sıralanması olarak adlandırılır. Bu tüm sıralanma değildir, çünkü iki veya daha çok sayıda değişik elamanın beraber aynı sırada olmalarına imkân sağlanmaktadır. Ayrıca sayısal veriler bir özelliğe göre tüm olarak sıralanmamaktadır; yani veri elemanlarının veri dizisi içindeki yerleri değişmemektedir. Ama sıralama düzeni için her veri elemanına verilen sıra numaraları tüm sıralanma halindedir.Böylece sonradan bu sıra numaraları kullanılarak veri elemanlarını tüm sıralamaya sokmak kolay bir işlem olur. Örneğin, bir jeolojik örneklem elemanları jeoloğun uygun gördüğü kaya parçaları olsun; elaman ağırlığına göre sıra numaraları verilip örneklemdeki gerçek elemanlar hiç gerçekte sıraya sokulmadan, örnek ağırlıkları için sıralama düzen sayıları kullanılarak istatistiksel analizler yapılabilir. Böylece elde bulunan örneklemin kapsadığı, ölçülebilmesi çok karmaşık ve masraflı olabilen bir değişken için incelemeyi kolaylaştırmak mümkün olabilir. Örneklem elemanlarını sıralama düzenine sokan sıra numaraların istatistiksel incelenmesi, parametrik olmayan istatistik alanı kapsamı içine girmekte ve bu tip istatistik analiz de pratikte de önemli bir rol oynamaktadır.
Sıralama düzeni için pratik örnekler
[değiştir | kaynağı değiştir]- Birçok spor yarışmalarına katılan sporcular veya takımlar, o sporu kontrol ve organize eden kurum tarafından sıralama düzenine konulmaktadır:
- Futbol millî takımlarına FIFA Dünya Sıralaması uygulanmaktadır. Gayri resmi olarak ise futbol millî takımların sıralama düzenine konulması Dünya Futbolu ELO Sıralaması ile yapılmaktadır.
- Buz hokeyi millî takımları IIHF Dünya Sıralamasına göre sıralama düzenine konulmaktadır.
- Golf için dünyanın en iyi erkek profesyonel golf oyuncuları Resmi Dünya Golf Sıralamasi adı verilen bir sıralama düzenine konulmaktadır.
- Çeşitli hizmet ve mal satıcılarını veya çeşitli faaliyetleri sıralama düzenine tabi tutarak kullanıcılara bilgi olarak arz eden birçok internet kompüter sitesi bulunmaktadır.[1]
- İnternet arama siteleri kullanıcının arama nedenlerine göre değişik web-sayfalarını değişik sıralama düzenine koyduktan sonra arama sonuçları kullanıcıya özel liste olarak sunmaları artık imkân dahiline girmiştir. Buna örnek için HITS algorithm, PageRank, TrustRank vb maddelerine bakınız.
- Bir örneklem veri dizisi için betimsel istatistik bulmak için de sıralama düzeni gerekebilir. Örneğin dörttebirlik, açıklık, çeyreklik açıklığı vb. ölçüler veri dizisinin sıralanıp sıralama düzeni verilmesini gerektirir. Örnek 1 de verilen örneklem veri dizisi için sıralama düzeni şöyle elde edilir:
Örnek 1:
Bu 14 büyüklükte (n=14) bir örneklem veri dizisidir. Önce veri dizisi en küçükten en büyüğe sıralanıp sıralı veriler bulunur. Sıralı veri değerlerine sıra numaraları verilip sıralama düzeni elde edilmiş olur:
Veri dizisi (n=14) 71 10 23 15 38 77 42 57 59 67 72 75 55 79 Sıralı veri dizisi 10 15 23 38 42 55 57 59 67 71 72 75 77 79 Sıralama düzeni 01 02 03 04 05 06 07 08 09 10 11 12 13 14
Sıralama düzeni kurmak için stratejiler
[değiştir | kaynağı değiştir]Eldei bulunan bir veri serisine her zaman tek bir şekilde sıra düzeni uygulamak mümkün değildir. Buna başlıca neden, bazen iki veya daha çok sayıda veri elemanına sıra düzeninde birlikte olarak aynı sıranın verilmesi gerekmesindedir; buna beraberlik hali adı verilebilir. Örneğin, yarışmalarda veya diğer rekabet oyunlarında iki veya daha çok elemanın sonuçta beraberlik sağlaması olağandır. Bir sırasal ölçekli veri dizisinin içinde aynı değer verilen elemanlar için sıra düzeninde aynı sıra numarası verilmesi gerekir. Bu sıra beraberliği halinde, sıra düzeni kurma esnasında sıra numarası verilmesi için değişik stratejiler uygulamak mümkündür.
Şimdi, beraberlik halinde uygulanacak sıra numarası verme stratejisi açıklanıp isimlendirilecektir. Burada iki şekilde de isimlendirme yapılmaktadır. Birinci şekilde isim işlemi tanımlar. İkinci şekilde isimlendirmede ise sadece ilk 4 sıra numarasına bakılmakta ve birinciye başta 1 olarak sıra numarası verilmekte, ikinci ve üçüncünün beraberlik sağladığı kabul edilip özel sıra numarası verme stratejisi uygulanmakta ve bunlara birincinin arkasında dördüncünün önünde sıra numarası verilmektedir.
Örnek 2
Bir yeni örneklem veri dizisi sıralanmış ve 71'in (3 defa) 75'in (2 defa) tekrarlandığı görülmüştür. Bu halde sıralama düzeni elde etmek için beraberlik için sıralama stratejisi uygulanması gerekmektedir.
Sıralı veri dizisi 67 71 71 71 75 75 79
Standard yarışma sıralaması ("1224" sıralaması)
[değiştir | kaynağı değiştir]Beraberlik halinde "standard yarışma sıralaması" stratejisine göre beraberlik gösteren bütün elemanlara verilen aynı sıra numarası hemen daha önceki sırada olanın sıra numarasını takip eder ve bu beraberliği takip edecek eleman için sıra numarası verilmeden önce bir açıklık tanınır. Kullanılan ikinci isimlendirme şekli bu stratejiyi daha iyi açıklamaktadır. Buna göre A başta, B ve C için beraberlik ve D sonuncu sırada ise; ve sadece 4 elaman incelenirse, verilen sıra numaraları A için 1, B ve C için hemen A'nın sıra numarasını takip ederek her ikisinde de 2 ve D için de bir aralık ile 4 olur; yani sıralama düzeni "1224" şeklindedir. Bundan görülür ki beraberlik gösteren B ve C için verilen aynı sıra numarası (2) hemen bir önceki sıra numarasını takip eder. Bunları takip eden bir sıra numarası boşluğu bulunur; bu boşluk (beraberlik sayısı eksi bire) eşittir. Bunları takip eden elaman için
- beraberlik sıra numarası artı beraberlik sayısı
şeklinde sıra numarası verilir. A, B, C, D sıra düzeni "1224" açıklanırsa Anin sıra numarası '1'; beraber olan iki eleman B ve C için sıra numarası A'yi hemen takip eden '2'; iki tane beraberlik olduğu için sıra numaralarında 1 aralık ve D için i beraberlik sıra numarası (2) artı beraberlik sayısı (2) olarak 4 sıra numarası verilir.
Örnek 3: 1224 uygulaması ile sıralama düzeni
Sıralı veri dizisi 57 59 71 71 71 75 75 79 Sıralama duzeni 01 02 03 03 03 06 06 08
Bu strateji birçok pratikte yarışma için sonuç olarak verilen sıralama düzenine uymaktadır. Ancak bu türlü "1224" sıralama bazı istatistiksel analizler için uygun olmayan bir sonuç ortaya çıkartır. Verilen sıra numaralarının toplamı, formülü bilinen birbirini tekrarsız takip eden sayılar toplamına eşit olmaz ve daha büyük bir toplam değerde olur. Halbuki birbirini tekrarsız takip eden sayılar toplamı baz olarak bazı istatistik analizler için yeni formül çıkarılması için kullanılmıştır; eğer "1224" stratejisi kullanılırsa bu formüller yanlış sonuç çıkartır.
Değiştirilmiş yarışma sıralaması ("1334" sıralaması)
[değiştir | kaynağı değiştir]Bazen yarışmalar için tertip edilen sıralama düzeni beraberlik halinde, beraber olan elemanlara ayni sıra numarası vermekle beraber, bu sıra numarasında önce (daha önceki gibi strateji gibi sonra değil) aralık bırakmaktadır. Böylece her bir elemana verilen sıralama numarası o elemanla beraber olarak veya o elamandan önce sıralama düzenine konulan elamanların sayısına eşit olur. Böylece bu sıralama düzeni stratejisine göre bir yarışmacı ikinci gelmişse tek bir birinci yarışmacıdan hariç diğer yarışmacılar sayısına eşittir; sıralama düzeninde üçüncü ise başta bulunan ilk iki yarışmacı hariç diğer kalan yarışmacı sayısına eşit olur; vb.
İkinci şekil isimlendirme için A'nin B ve C'de önde; B ve C'nin beraber ve D'nin en son sırada olduğu kabul edilir. Bu halde A 1 sıralama numarası alır; B ve C için sıra numaraları 3 olur ve D'nın sıralama numarası 4 olur. Bu halde hiçbir elemana 2 sıra numarası verilmez ve bu bir aralık olarak kalır.
Örnek 4: 1334 uygulaması ile sıralama düzeni
Sıralı veri dizisi 57 59 71 71 71 75 75 79 Sıralama dızeni 01 02 05 05 05 07 07 08
Yoğun sıra numaralı sıralama ("1223" sıralaması)
[değiştir | kaynağı değiştir]Yoğun sıra numaralı sıralama stratejisine göre beraberlik gösteren elemanların hepsine hemen bir önceki sıra numarası artı bir sıra numarası verilir. Bunlardan sonraki eleman için sıra numarası bu beraberlik sıra numarasını hiçbir aralık konulmadan hemen takip eder. Böylece A ön sırada olup 1 sıra numarası alır; B ve C beraberlikle onu takip edip ikisi de ortaklaşa 2 sıra numarası alır; onları takip eden D'ye ise hiç aralık verilmeden 3 sıra numarası verilir.
Örnek 5: 1223 uygulaması ile sıralama düzeni
Sıralı veri dizisi 57 59 71 71 71 75 75 79 Sıralama düzeni 01 02 03 03 03 04 04 05
Devamlı sıra numaralı sıralama ("1234" sıralaması)
[değiştir | kaynağı değiştir]Devamlı sıra numaralı sıralama stratejisinin ana prensibi her elemanın tek bir sıra numarası alması ve sıra numaralarının aralıksız ardı ardına birbirini takip etmesidir. Bu sıralama düzeni stratejisine göre beraberlik gösteren elemanlara aynı sıralama numarası verilmez; beraber olan elamanlara ardı ardına birbirini takip eden sıralama numaraları verilir. Bu beraberlik sıralaması ya sıralamayı yapanın sübjektif seçimine göre; ya şansa göre; ya da tutarlı ikincil bir sıralama kuralına göre yapılır. İkincil bir sıralama kuralı kullanarak beraberlikler içinde birbirini takip eden sıralama numaraları verilmeleri durağan bir sıralama yaratması ve tutarlı olarak tekrarlanabilmesi nedeniyle tercih edilmektedir. En çok gözlemlenen ikincil sıralama kuralı beraberlik gösteren elemanların isimlerinin alfabetik düzenine göre sıralamaya tabi tutulmasıdır.
Bu stratejiye göre sıralamada A başta, B ve C beraber ortada ve D sonda ise; A'ya 1, D'ye 4 ve B ile C için ya şansa ya da belli bir kurala göre birbirini takip eden sıralama numaraları verilir. Eğer ikincil bir kural beraberliklerin alfabetik düzene göre sıralaması ise, sıralama düzeni A:1, B:2, C:3, D:4 olur.
Kompüter veri işlemlerinde "1234" sıralama stratejisine "satır numaralaması" adı verilir.
Örnek 6: 1234 uygulaması ile sıralama düzeni
Sıralı veri dizisi 57 59 71 71 71 75 75 79 Sıralama düzeni 01 02 03 04 05 06 07 08
Ortalama sıra numaralı sıralama ("1 2,5 2,5 4" sıralaması)
[değiştir | kaynağı değiştir]Bu sıralama stratejisine göre beraberlik gösteren elemanlara aynı sıralama numarası verilir. Bu beraberlik için verilen tek sıra numarası beraberlik gösteren elemanların sıralamada ortalamanın değerlerine birlikte uygulanması ile ortaya çıkar. Örneğin beraberlik gösteren elemanlar 3 tane ve 2'nci sırada elamandan sonra iseler, bu üç elamanın hepsine ([3 4 5)/3=) 4 sıralama numarası verilir. Bu sıralama stratejinin bir beklenmedik sonucu, beraberlik sıra numarasının her zaman tam sayı değil bazı hallerde kesirli olması imkânının da bulunmasıdır.
Buna göre A başta, B ve C beraber olarak bunun ardında ve D sonda ise, sıralama düzeninde A'ya 1, D'ye 4 ve beraberlik gösteren B ve C'ye ise ortalama olan ([2 3]/2=) 2,5 sıralama numarası olarak verilir. Böylece bu stratejinin ikinci şekilde isimlendirilmesi (1 2,5 2,5 4) olur. Burada kesirli sıralama numarası kullanılmasına dikkat çekilmelidir.
Örnek 7: 1 2,5 2,5 4 uygulaması ile sıralama düzeni
Sıralı veri dizisi 57 59 71 71 71 75 75 79 Sıralama düzeni 1 2 4 4 4 6,5 6,5 8
Bu strateji, n sayıda veri için kullanılırsa sıralama düzeninde kullanılan sıra numaralarının toplamı, n'ye kadar tam sayıların toplamına (yani 1 2 .. n değerine), eşit olur. Bu bazı hallerde sıralama düzeni için tercih edilen bir özelliktir. Bu nedenle "1 2,5 2.5 3" stratejisi kompüter veri işlemlerinden olan Borda sayımları ve bazı istatistik sınama ve ölçümlerde kullanılması gereken bir sıralama düzenidir .
İstatistikte sıralama düzeni kullanımı
[değiştir | kaynağı değiştir]Parametrik olmayan istatistik alanında uygulanan birçok istatistiksel teknik için veriler sıralama düzeni haline getirildikten sonra kullanılır.
- Şu sınama teknikleri için bir tek değişken için sıralama düzenine koyulmuş olan veri dizisi kullanılır:
- Şu istatistiksel teknikler için iki değişken için sıralama düzenine koyulmuş olan veri dizileri kullanılır:
- Şu istatistiksel teknikler için ikiden çok değişken için sıralama düzenine koyulmuş olan veri dizileri kullanılır:
Değişik teknikler için kullanılan sıralama düzeni stratejisi değişiktir.
Kutuçizim programı içinde sıralama düzeni
[değiştir | kaynağı değiştir]Genel olarak kutuçizim programları, en iyi bilinen Microsoft Excel programının rank fonksiyonu işlemini, ihtiva ederler. Bu fonksiyon kullanarak bir sütun halindeki veri dizisi için sıra düzeni kurulmak istenirse, sonuç sıra düzeni için yarışma sıra düzeni ("1224") stratejisi uygulanır. Diğer sıralama stratejisine uygun sonuçlar için özel program ekleri de hazırlanmıştır.[2]
Dipnotları
[değiştir | kaynağı değiştir]- ^ Bu konuda Avrupa'da en iyi bilinen siteler [1] 12 Haziran 2013 tarihinde Wayback Machine sitesinde arşivlendi. ItsRanked! veya [2] 5 Aralık 2008 tarihinde Wayback Machine sitesinde arşivlendi. Rankrz'dirlar; benzer Amerikan kompüter sitesi [3] 20 Haziran 2013 tarihinde Wayback Machine sitesinde arşivlendi. Rankingfever'dir.
- ^ Örneğin Pottel [4] 10 Mart 2013 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce)
Dışsal kaynaklar
[değiştir | kaynağı değiştir]- Ronen Perry, "The Relative Value of American Law Reviews: A Critical Appraisal of Ranking Methods", [5] (İngilizce)
- [6][ölü/kırık bağlantı] Beş değişik yöntem kullanılarak sıralama düzeni bulunması için bir MATLAB Toolbox yazılımı