Bahiste karar hızı arttı. Ancak acele, hatayı büyütür. İstatistik okuryazarlığı bu yüzden kritiktir. Çünkü veri, gürültüyü saklayabilir. Ben sahada bunu sık görürüm. Grafik parlar ama gerçek zayıftır. Dolayısıyla önce veriyi, sonra hikâyeyi okurum. Böylece duygu geri çekilir. Karar, kanıta yaslanır. Bu tutum kaybı tek başına bitirmez. Yine de hasarı sınırlar ve ritmi korur.

Ayrıca okuryazarlık, ortak dili kurar. Operatör, sağlayıcı ve kullanıcı aynı kelimelerle konuşur. “Ortalama”, “varyans”, “örneklem” gibi kavramlar netleşir. Sonra tartışma kısalır. Çünkü herkes aynı sayfaya bakar. Ben raporu bu yüzden sade yazarım. Cümleler kısa, tanımlar açıktır. Böylece tartışma değil, sonuç ilerler. Bu da uzun vadede en değerli kazançtır.

Temel kavramlar: ortalama, medyan, varyans, örneklem

Ortalama hızlı bir merkezdir. Fakat sapmayı gizleyebilir. Medyan bu boşluğu kapatır. Uç değerlerin etkisini düşürür. Ben ikisini birlikte kullanırım. Eğer ortalama ile medyan çok ayrılırsa, dağılım yamuktur. O gün temkin artar. Çünkü tek skor, tüm resmi anlatmaz. Dolayısıyla merkez ve yayılım birlikte okunmalıdır.

Varyans yayılımı söyler. Yüksek varyans, dalgayı büyütür. Bu durumda nefes gerekir. Örneklem boyutu da belirleyicidir. Küçük örnek, gürültü taşır. Üç maçlık form cazip görünür. Fakat çoğu zaman aldatır. Ben bu hatayı erken kestim. Tabanı sezonla kurdum. Formu küçük bir ağırlıkla ekledim. Böylece trend ve güncel aynı sayfada yürüdü.

Örneklem yanlılığı ve görünmeyenler: survivor bias

Sahada “iyi gidenleri” sık görürsünüz. Kötü gidenler görünmez. Çünkü sesleri kesilir. Buna survivor bias denir. Sadece yaşayan örnekleri okuyunca tablo parıldar. Ancak gerçek bu değildir. Ben bu tuzağı iki soruyla keserim. “Kim görünmüyor ve neden?” “Bu sonuç hangi kaybı saklıyor?” Cevaplar gelince resim dengelenir.

Seçim yanlılığı da benzer bir tuzaktır. Kolay ulaşabildiğiniz veri sizi rahatlatır. Fakat çoğu zaman dardır. Örneğin yalnız “büyük maçlar” incelenir. Küçük maçlar dışarıda kalır. Model abartılı görünür. Ben örneklem çerçevesini baştan yazarım. “Hangi lig, hangi dönem, hangi maç tipi?” Çerçeve netleşince sonuç da güçlenir.

Korelasyon mu, nedensellik mi? Simpson paradoksu

İki değişken birlikte artınca cazibe oluşur. “X olunca Y de artıyor.” Bu cümle kulağa hoş gelir. Fakat nedensellik farklı bir iştir. Arada üçüncü bir değişken olabilir. Veya ters yönlü etki saklanır. Ben korelasyonu tek başına kutsamam. Önce mekanizmayı ararım. Mekanizma yoksa sonuç kırılgandır. Dolayısıyla “neden” bulunmadan büyütme yapmam.

Simpson paradoksu daha da sarsıcıdır. Alt gruplarda doğru olan, toplamda tersine dönebilir. Örneğin ev ve deplasman ayrı ağırlıklar üretir. Toplam tablo farklı konuşur. Ben raporu her zaman iki kez okurum. Önce alt gruplar. Sonra toplam. Eğer çelişki varsa, ağırlık hatası vardır. Bu durumda tek sayfayla karar vermem.

Küçük sayıların tiranlığı: küçük örnek, büyük hikâye

Üç maçlık seriyi zihin abartır. Çünkü hafıza kısa yolları sever. “Üst üste iki korner geldi, üçüncüsü garanti.” Bu cümle hatalıdır. Küçük örnek gürültüyü büyütür. Ben bu “tiranlığı” iki araçla bastırırım. Bir, tabanı geniş tutarım. İki, güven aralığı yazarım. Aralık daralmadan iddialı konuşmam.

Regresyon etkisi de sık görülür. Aşırı iyi günün ardından normal gün gelir. Skor düşer ve moral bozulur. Oysa bu doğaldır. Ben bunu ekibe açık söylerim. “Bugün rekor, yarın normal.” Bu cümle beklentiyi yumuşatır. Strateji de ayakta kalır. Çünkü rastlantıya plan yazılmaz.

Olasılık okur yazarlığı: oran, implied ve marj temizliği

Oran, olasılığın tersidir. 2,00 oran kabaca %50 demektir. Fakat kitap marj ekler. Toplam olasılık %100’ü geçer. Önce bu marj temizlenmelidir. Ben normalize ederim. Sonra kendi olasılığım ile karşılaştırırım. Kendi değeri daha yüksekse pencere açılır. Değilse pas geçerim. Çünkü sürtünme maliyeti gerçektir.

Ayrıca pazar derinliği önemlidir. Derinlik düşükse oran oynar. Bu oynaklık kararı bozar. Ben limitleri buna göre yazarım. Düşük derinlikte birim küçülür. Yüksek derinlikte esner. Dolayısıyla oran okumak yetmez. Pazarın nefesini de dinlemek gerekir. Aksi hâlde tek tık pahalıya patlar.

Model metriklerini doğru okumak: xG, tempo, şut kalitesi

xG, şut kalitesini sayıya döker. Ancak her xG eşit değildir. Model kaynakları ve kalibrasyon farklıdır. Bazısı şutu iyi okur. Bazısı pası zayıf okur. Ben tek kaynağa bağlanmam. İki kaynağı karşılaştırırım. Büyük fark varsa “neden” ararım. Video ile doğrularım. Sonra pazarla eşleştiririm.

Tempo da tuzağa dönüşebilir. Yüksek tempo gol garantisi değildir. Şut kalitesi düşükse skor gelmez. Ayrıca maçın bağlamı değişir. Skor üstünse tempo düşer. Savunma kapanır. Modeli güncellemek gerekir. Ben canlıda iki satır not yazarım. “Tempo var ama kalite düşük.” Bu not kararımı sakinleştirir. Duygu geri çekilir.

Basit modeller ve sınırları: Poisson ve drift

Poisson modeli, skor dağılımını güzel açıklar. Fakat parametreler sabit kalmaz. Kadro, hava ve motivasyon değişir. Parametre “drift” eder. Bu yüzden model haftalık güncelleme ister. Ben λ değerlerini düzenli tazelerim. Lig ortalamasını da yenilerim. Böylece model güncel kalır.

Bağımsızlık varsayımı da her zaman tutmaz. Erken kırmızı kart tüm dengeyi bozar. Derbi psikolojisi tempoyu değiştirir. Ben bu günlere küçük bir ceza uygularım. Değer düşükse pas geçerim. Basit model çoğu gün yeter. Yine de sınır bilinci şarttır. Sınır bilinci, modeli araçta tutar.

Deney tasarımı: A/B mantığı, p-değeri ve pratik yorum

Yeni strateji denerken deney gerekir. A ve B koşulları net yazılmalıdır. Ölçüt tek olmalıdır. “Onay oranı” veya “EV farkı” gibi. Çok ölçüt, kararı bulandırır. Ben denemeyi kısa tutmam. Anlamlı örnek isterim. Sonra p-değerine bakarım. P küçükse fark “anlamlı” olabilir. Ancak büyüklük de önemlidir. Etki küçükse pratik değeri düşer.

Güven aralığı yorumu da şarttır. Aralık genişse belirsizlik yüksektir. Ben kararımı aralığın genişliğine bağlarım. Dar aralık cesaret verir. Geniş aralık sabır ister. Ayrıca çoklu deneme hatasına dikkat ederim. Bir günde on fikir denersek, tesadüf kazanır. Düzeltme veya daha az deneme gerekir. Bu disiplin, yanlış pozitifleri keser.

Kalibrasyon ve güven: olasılıkların gerçek hayata yapışması

Model iyi olabilir. Yine de kalibrasyon bozuk olabilir. %60 dediğiniz olay %60 oranında olmuyorsa sorun vardır. Ben bunu “günlük tahmin defteri” ile test ederim. Her tahmini aralığa koyarım. Sonuçları toplayıp kalibrasyon grafiği yazarım. Eğri 45 dereceye yakınsa güven artar. Değilse ayar gerekir.

Brier skoru ve log loss gibi ölçüler de yardımcı olur. Ancak basit ölçüt yetebilir. “Tahmin edilen yüzde” ile “gerçekleşen yüzde” yan yana yazılır. Fark küçüldükçe model iyileşir. Bu pratik tablo ekip dilini sadeleştirir. Herkes aynı hedefe odaklanır. Sonuç olarak güven, rakamla büyür.

Gösterge seçimi: panoda az ama öz metrik

Pano kalabalık olursa dikkat dağılır. Ben üç başlık seçerim. “Onay oranı, ortalama kayıp serisi, kurtarma süresi.” Bu üçlü çoğu günü anlatır. Fazlası gürültü üretir. Ayrıca metriklerin davranışı etkilediğini bilirim. Ne ölçüyorsanız onu büyütürsünüz. Bu yüzden metrik, amaçla uyumlu olmalıdır.

Kırmızı-yeşil sinyaller de net olmalıdır. Sınır aşıldığında mola tetiklenir. Eşikler yazılıdır. “Üst üste üç kötü sinyal → dur.” Bu sinyal mekanik değildir. Yine de duyguyu frenler. Ben bu basit kuralı çok sevdim. Günler daha sakin aktı. Kararlar daha tutarlı oldu.

Saha notlarım: nerede yanıldım, nasıl düzelttim?

En çok yanıldığım anlarda örneklem küçüktü. Üç maçlık formu büyüttüm. Model şişti ve sonuç düştü. Bu dersi sert aldım. Tabanı genişlettim. Formu düşük ağırlıkla ekledim. Ayrıca tek kaynak xG’ye bağlandım. Kaynak hata verince karar dağıldı. Sonra ikinci kaynağı ekledim. Video ile çapraz kontrol yaptım. Hata yarı yarıya azaldı.

Canlı pazarda da acele ettim. Oran güzel görünüyordu. Fakat pazar derinliği zayıftı. Fiyat oynadı ve plan bozuldu. Bunun üzerine “derinlik filtresi” yazdım. Düşük derinlikte birimi kıstım. Net sonuç aldım. Küçük kurallar, büyük zararı kesti. Bu da motivasyonu diri tuttu.

Eylem planı: bugün başlayın, küçük ama net adımlar

Önce sözlük oluşturun. Ortalama, medyan, varyans ve örneklem için kısa tanımlar yazın. Sonra bir “yanlılık kartı” hazırlayın. Survivor, seçim ve doğrulama yanlılığı orada dursun. Her karar öncesi karta bakın. Bu küçük ritüel büyük fayda verir. Çünkü zihin, kısa yolları sever.

Ardından pano kurun. Üç metrik yeter: onay oranı, kayıp serisi, kurtarma süresi. Haftada bir kalibrasyon notu alın. Kendi % tahminlerinizi gruplayın. Gerçekleşeni yazın. Farkı görün ve ayar yapın. Son olarak deney akışı açın. Tek değişkenli minik test seçin. Taban büyüklüğünü dürüst yazın. Sonuç gelmezse pas geçin. Çünkü pas, kötü denemeden ucuzdur.

Sonuç: veri konuşsun, duygu eşlik etsin

Bahis istatistiği okuryazarlığı bir beceri değil, bir disiplin. Veri konuştuğunda duygu yerini bulur. Ben yıllardır aynı sırayı izlerim. Önce tanım, sonra örneklem, ardından önyargı kontrolü. Sonra basit model ve sınırları. En sonda karar ve kayıt. Bu akış hatayı ucuzlatır. Ayrıca uzun vadeyi mümkün kılar.

Siz de bugün küçük başlayın. Bir maçı seçin ve sözlüğünüzle okuyun. Yanlılık kartına bakın. Oranı normalize edin. Kendi olasılığınızı yazın. Sonra pazar derinliğini kontrol edin. Eğer fark netse küçük birim deneyin. Değilse geçin. Yarın yeniden bakın. Disiplin, şansı daha adil bir zemine taşır. İstatistik de nihayet sizin tarafınızda çalışır.