Takipçilerimiz “Aktüer Dünyası”nda yer alan yazılarımızdan GLM’nin (generalized lineer model, genelleştirilmiş doğrusal model) ne olduğunu, hangi amaç için kullanıldığını incelemiş ve fikir sahibi olma imkanı bulmuşlardır. Fiyatlandırmada GLM, iki değişkeni modellemek için kullanılır: İlki hasar şiddeti, ikincisi ise hasar frekansı. Elbette GLM’nin aktüeryal alanda kullanımı bu kadar değildir. Sınırı sizin neleri analiz etmek istediğinize ilişkin kurduğunuz hayallerdir…
Fiyatlamada modellenen değişkenler, sürekli değişkenlerdir. Peki bağımlı değişken, kategorik bir değişken, bir başka ifade ile söz ile ifade edilen bir değişken modellenebilir mi?
Örneğin;
Cinsiyet: Kadın, Erkek
Poliçe yenileme mi?: Evet, Hayır
Muafiyet var mı?: Evet, Hayır
Bu değişkenleri ikili (binary) olarak gösterebiliriz: Poliçe yenileme ise “1” değilse “0” gibi. Gelelim analiz kısmına. Değişkeni analiz ederken değişkenin verimizde en çok görülen kısmı bazımız (base) olacaktır. Eğer elimizdeki veride erkek sürücüler kadınlardan çok ise cinsiyet sorusunda erkekler baz değişkenimizi oluşturacaktır. Eğer poliçenin yenileme/yeni iş modelini kurmak istiyor isek ve elimizdeki veride yenileme poliçeler çok ise bazımız yenileme-evet olacaktır. Yaptığımız alınan baza göre diğer değişkenin risk ölçümünü yapmaktan başka bir şey değildir.
İkili değişkenlerin analizinde en çok tercih edilen yaklaşım lojistik regresyondur (logistic regression). Kısa bir şekilde özetlemeye çalışalım. Lojistik regresyonda bağımlı değişken “y”, “p” olasılığı ile Bernoulli dağılmına sahiptir. “p” olasılığı ise belirlediğiniz risk faktörleri (x) ile modellenmektedir.
Modeli kuralım;
P(y=1|x)=p=1/[1+exp(-xβ)]=exp(xβ)/1+exp(xβ)
olacaktır.
Yukarıdaki ilişkinin tersi alındığında GLM modellemesine uygun bir hale gelecektir. Biliyorsunuz GLM’de önemli olan fonksiyonu doğrusal modele uygun hale getirmektir. Şöyle ki;
xβ=ln(p/(1-p))=logit(p)
Lojistik regresyon yorumlaması ve uygulaması kolay olması nedeni ile aktüeryal modellemelerde sıklıkla kullanılan bir yaklaşımdır, sadece sigorta da değil finans, tıp ve sosyal bilimlerde de kullanımı yaygındır.
Örneğin kasko poliçesi olan kişilerin hangilerine sağlık poliçesi satabilirsiniz? Günümüzde çapraz satış oldukça önemlidir birçok şirket bu konuda danışmanlık almaktadır. Siz de potansiyel müşterilerinizi belirlemek istiyorsanız o zaman bağımlı değişkeniniz kasko poliçesi olanlardan hangilerinin sağlık poliçesi olup (1) hangilerinin olmadığıdır (0) sonrasında yapmanız gereken bağımsız değişkenlerinizi belirlemek (örneğin medeni hal, cinsiyet, yaş, çocuk sahibi olup olmadığı, ili vb.), modelinizi kurmak, uygunluğunu ve güvenilirliğini test etmek ve sonuçlarını kullanmaktır.
R programında “glm”, “mlogit” paketlerini bu analizlerde kullanabileceğinizi belirtmek isteriz…
Unutmayalım…
“Yaratmanın başlangıcıdır düş gücü… Dilediğinizi düşler, düşlediğinizi amaçlar, amaçladığınızı yaratırsınız sonunda.” Bernard Shaw
Yazar: MockingActuaries
Tartışma
Henüz yorum yapılmamış.