Haberler

Yandex, Yambda Veri Setiyle 5 Milyara Yakın Müzik Etkileşimini Kullanıcılarla Paylaştı

Yandex, müzik öneri sistemleri alanında önemli bir adım attı. Yandex Music üzerinden toplanan 4.79 milyar etkileşimden oluşan yeni açık veri seti “Yambda” araştırmacıların erişimine sunuldu. Yambda, kullanıcıların müzik dinleme alışkanlıklarını anonim şekilde barındırıyor. Veri seti, öneri algoritmalarını geliştirmek isteyenler için büyük bir kaynak oluşturuyor.

10 Aylık Etkileşim Verisi Araştırmacılara Açıldı

Yandex, Yambda veri setini 10 aylık bir sürede topladı. Veri setinde kullanıcıların müzik dinleme, beğenme ve reddetme gibi davranışları yer alıyor. Etkileşimler, zaman damgalarıyla birlikte açık ve örtülü geri bildirimler olarak sınıflandırıldı. Her etkileşimin doğal mı yoksa öneri mi olduğu da işaretlendi.

Yambda veri seti, öneri sistemleri üzerine çalışan araştırmacılar için üç farklı boyutta sunuldu: 50 milyon, 500 milyon ve 4.79 milyar etkileşim. Apache Parquet formatında hazırlanan dosyalar, Spark ve Pandas gibi analiz araçlarıyla uyumlu çalışıyor. Zamanı koruyan Global Temporal Split yöntemi ile veri bütünlüğü korunuyor. Bu sayede sistemler, gerçek dünya koşullarına daha yakın senaryolarla test edilebiliyor.

Araştırmacılar, Yambda sayesinde yalnızca algoritma testleri değil aynı zamanda kullanıcı davranışı analizleri de yapabilecek. Müzik dinleme eğilimlerini anlamaya yönelik çalışmalarda kullanılabilecek bu veri seti, öneri sistemleri alanında önemli bir boşluğu dolduruyor.

İlgili Makaleler

Bir yanıt yazın

Başa dön tuşu