DataDA

 Veri madenciliği (data mining)

Big data analiz yöntemleri arasında en önemli ve en temel yöntemlerden birisi veri madenciliğidir. Araştırmamızda da en sık kullanılan teknik olduğu için sadece veri madenciliğine yer vereceğiz. 

Veri madenciliği, İngilizce-Türkçe Ansiklopedik Bilişim Sözlüğü’nde ‘Doğal Dillerin Semantik yapısına dayanarak elektronik metin belgeleri içinde saklı kalmış ilintileri, örüntüleri, stratejik bilgileri, modelleri vb. bulup ortaya çıkarmayı amaçlayan araştırma tekniği’ olarak tanımlanmaktadır. 

Metin içerisinde saklı kalmış bilgiyi ortaya çıkarmak, keşfetmek olarak tanımlanmaktadır. Büyük hacimli veriler (big data) içerisindeki anlamlı, kullanışlı bilgi ve ilişkilerin bilgisayar, yapay zeka ve istatistik gibi disiplinler kullanılarak ortaya çıkarılmasında kullanılan bir yöntemler topluluğudur.

Büyük veri içerisindeki çeşitli örgü ve eğilimleri keşfetmek için matematiksel algoritmalar yoluyla karmaşık analizler uygulanmaktadır. Veri madenciliği süreci CRISP-DM (Cross Industry Standard Process Model for Data Mining) adlı verilen uluslararası veri madenciliği standardına göre yapılır. Bu süreç altı (6) aşamadan oluşur: İşin anlaşılması, verinin anlaşılması, verinin hazırlanması, modellemek, değerlendirmek ve konuşlandırmak/uygulamak.

Veri madenciliği bankacılık, bilim ve mühendislik, biyoloji, borsa, endüstri, genetik, istihbarat, kriminoloji, pazarlama, perakendecilik, sağlık, sigortacılık, telekomünikasyon vb. birçok alanda başarılı bir şekilde uygulanmaktadır.