R Programlama Dili: Sınırsız Bir Keşif Dünyası
R programı, veri analizinde amatör veya profesyonel işlem gerçekleştirebilecek ileri düzey bir programlama dili. Ayrıca bize sınırsız bir bir dünya sunuyor! Enlem ve boylam verilerini görselleştirmeyle ilgili harika bir deneyim anlatacağım bugün size!
“R” temel olarak istatistik çalışmaları ve veri analizi için geliştirilmiş halka açık bir GNU/Linux projesi. “Peki GNU/Linux projesi nedir?” diye soracak olursanız; GNU, ilkesi özgür yazılım olan bir işletim sistemidir, GNU paketlerinden ve üçüncü kişiler tarafından yayımlanan açık yazılımlardan oluşur. GNU’nun geliştirilmesi, kullanıcının farklı kaynaklardan yararlanma özgürlüğünü ihlal eden yazılımlar olmadan bir programın kullanılmasını sağlıyor. Böylece herhangi bir kullanıcı programı çalıştırmak, değiştirmek ve geliştirmekte özgür olabiliyor.
Tüm kullanıcılar için R’ın en önemli avantajları, öncelikle ücretsiz olması, büyük hacimli verileri işleme kapasitesi ve değişen ihtiyaçlara geliştirmelerle hızlı cevap vermesi olarak sayılabilir. Akademide aktif bir kullanıcı ve geliştirici topluluğu olduğundan, veri işlemeyle alakalı tüm uygulamalar için R paketleri güncelleniyor, zenginleşiyor. Ortalama alma, regresyon, korelasyon gibi basit istatistik hesaplarından, çok aşamalı modelleme ve yapay zeka alanındaki uygulamalara kadar uzanan geniş bir alanda gelişmiş R paketleri herkesin kullanımına açık ve ücretsiz bahsettiğim gibi. Programdaki en zor kısım verilerin önce SPSS veya Excel ile girişinin yapılması ve daha sonra veri işlenmesi için R’a aktarılması olabilir.
En güncel R sürümünü kullandığınız işletim sistemini destekleyecek şekilde bu adresten ya da buradan indirebilirsiniz. Bu linklerden R’ın kurulum dosyasını indirecek ve kısaca ileri tuşlarına basarak programı kuracaksanız. Bilgisayarınıza Zoom veya Skype kurmak kadar kolay!
R programını kurduktan sonra RStudio adı verilen arayüz ile program açabilirsiniz. RStudio programını da buradan indirip bilgisayarınıza kurabilirsiniz. Bu ara yüzün de ücretsiz olduğunu söylememe gerek yok sanırım 🙂 RStudio’yu da kurduktan sonra çalışmaya rahatlıkla başlayabilirsiniz. Çünkü unutmayın R programının kullanım sıklığı günden güne artıyor. En basit örnekle, 2014 yılında 2.925 R paketi mevcutken 2016 yılı sonunda paket sayısı 10.000’e ulaşmış. Ne kadar çok paket, o kadar çok kullanım alanı demek!
Bahsettiğim gibi R data analizinden,istatistiksel modellemelere,grafikler çizmeden, dokümanlar oluşturmaya sunum hazırlamadan ve simülasyon üretmeye çok farklı alanlarda kullanılıyor. R, sıklıkla istatistikçiler tarafından kullanılsa da, mühendisler, ekonomistler ve sosyal bilimlerde karmaşık modellerle çalışan araştırmacıların en yakın dostu olabiliyor. Çünkü R evrensel bir dil ve çoğu zaman yeni metodlar R ile sunuluyor.Ayrıca özel şirketlerin iş geliştirme departmanları tarafından kullanılan bir programlama dili olduğunu söylemek yanlış olmaz.
Peki tüm bunları neden anlatıyorum? R kullanmayı öğrendiğim (henüz finaller bitmedi çok da emin konuşmak istemiyorum :)) derste öğrendiklerimle yaşadığım şehrin cadde ve sokak haritasını çizebildim. Tabii ek kaynaklardan faydalandım, ama öğrendiklerim olmasa bu haritaları asla çizemezdim.
R gerçekten çok kullanışlı bir program ve yapabileceklerinin sınırı yok. Veri analizi alanında görselleştirmenin öneminin giderek arttığı bu zamanlarda, trendlere bağlı olarak konumsal verinin kullanımı da önem kazandı. Özellikle demografik konuların, şehir planlamasının, işsizlik oranlarının, göç oranlarının grafiksel sunumu konumsal dataların en sık kullanıldığı yerler olarak biliniyor.
Yaptığım çalışmada caddeleri, sokakları ve diğer coğrafi özellikleri kullanarak harika şehir haritalarının nasıl yapılacağını öğrendim. Bu çalışmada osmdata paketini kullandım. joshuamccrain.com/ ve ggplot2tutor.com/ bu alanda destek aldığım iki mükemmel öğretici diyebilirim.
Yeni hedefim çizdiğim haritalardan birini hediye olarak vermek, büyük bir poster formatında basılmış ve çerçevelenmiş şekle getirmek. Rahatlıkla söyleyebilirim ki biraz R çalıştıktan sonra siz de kendi haritalarınızı oluşturup özelleştirebilirsiniz.Bunun için Udemy’de çok güzel eğitimler var.
joshuamccrain.com/ ile bu osmdata paketinin işlevselliğinin nasıl genişletileceğini, nehirler ve demiryolları gibi ek coğrafi özelliklerin nasıl ekleneceğini ve diğer coğrafi verilerin nasıl üst üste getirileceğini öğrendim. Çalışmam hala geliştirilmeye açık. Birçok yeni özellik eklenebilir, estetik olarak geliştirilebilir. İsteyenler mesaj atarsa RStudio’daki kodları gönderebilirim seve seve. Yazı boyunca tüm gördüğünüz şehir haritalarını da ben çizdim, gururla söyleyebilirim 😊
Kapak Fotoğrafı: Unsplash/@glenncarstenspeters
İlginizi çekebilir: Canan Keleş’ten Hizmet Olarak Yazılım, SaaS Nedir?
Canan veri bilimi ve analiz alanlarında kullanılan diller; Python, R, Scala, Julia gibi dillerdir genellikle. Bu dillerden R gerçekten veri analiz, matematik, istatislik ve Ekonometri alanında en fazla kullanılan programlama dilidir. Lakin R öğrenerek yapacakların, Python öğrenerek yapacaklarından az olmakla birlikte R ın dünya üzerinde kazandırımı rakamsal olarak Python dan daha fazladır. Öğrenmeli miyiz dersen tabi ki öğrenmeliyiz, lakin fanatik olmamakta fayda var derim, bir zamanlar Pythondan eser yokken şimdi meşhur olup gitti 🙂, yarın hangi dil çıkacağını kestirmek zor, önemli olan mantığı anlamak bana kalırsa 🙂 . Peki R mı öğrensek , Python mı derseniz de Şadi Evren Şeker in güzel bir videosu var bu konuda en azından size yol haritası çizer (https://www.youtube.com/watch?v=8gjLyqaAAPI). Yazı bence güzel kaleme alınmış özellikle de bir bayanın yazılım konusunda içerik üretmesi beni baya umutlandırdı 🙂
Yazılım alanında o kadar çok kadın var ki çalışan, benimki üniversitede bir yüksek lisans dersi sadece. Fanatik değil öğrenci olduğumu samimiyetle söyleyebilirim.
Canan Hanım yok değil muhakkak var, olmalı da bence ,sözüm size de değil, veri analizinde Python dan geçilmez R dan geçilmez denilir ondan böyle bir tabirde bulunmak istedim, diller geçicidir , bugün Python revançta yarın başka bir dil, önemli olan ise dilin syntax ini algılama ve öğrenmeyi öğrenebilmektedir. Dil fanatikliği ülkemizde çok çok fazla 🙂 R içinde barındırdığı matematiksel ifadeler ve fonksiyonlar nedeni ile veri biliminde , ekonometride önem arz eden diller arasında iken farklı bir alanda siz R dan yararlanamazsınız mesela. Ondan seçilecek dillerden çok onu ne kadar sürede öğrenebilir ve de ne kadar çok program üretebilirsiniz ona bakmakta fayda var. Bir arkadaşım Delphi kullanıyor, Delphi artık yaşamıyor neredeyse ama mobil masaüstü web de yazdıklarını gördüğünüzde şaşıyorsunuz ondan dilden çok kısa zamanda öğrenmek öncelikli olmalı, ve de diller arasında çalışabilmek bence en önemlisi, artık dilleri kendi aralarında entegre kullanmak da mümkün kılınmışken 🙂 , derslerinizde başarılar