Veri Gölleri (Data Lake) ve Veri Ambarları (Data Warehouse)
Veri Gölleri (Data Lake) ve Veri Ambarları (Data Warehouse)
Büyük veri mimarisinde verilerin nerede ve hangi yapıda saklanacağı kararı hayati önem taşır. Bu noktada iki temel saklama mimarisi öne çıkar: Veri Ambarları (Data Warehouse) ve Veri Gölleri (Data Lake). Veri Ambarları, yapılandırılmış (structured) ve belirli bir şemaya (schema-on-write) uyan verilerin, iş analitiği ve raporlama amacıyla düzenli bir şekilde saklandığı sistemlerdir. Veriler ambarlara yüklenmeden önce temizlenir, dönüştürülür ve yapılandırılır. SQL tabanlı analizler ve geçmiş eğilim raporları için mükemmeldir. Veri Gölleri ise ham, işlenmemiş ve her türlü çeşitteki (yapılandırılmış veri tabanları, yarı yapılandırılmış loglar, yapılandırılmamış videolar ve metinler) verilerin, orijinal formatlarında devasa miktarlarda saklandığı depolama alanlarıdır. Veri göllerinde şema, veri okunurken (schema-on-read) tanımlanır. Veri ambarları geçmiş analizler ve standart yönetici raporları için ideal bir ortam sunarken, veri gölleri ise veri bilimcilerinin derinlemesine veri madenciliği ve yapay zekâ modelleri geliştirmesi için ham veri kaynağı sağlar.
Ekosistem Bilgisi
Veri Gölleri (Data Lake) ve Veri Ambarları (Data Warehouse)
Ekosistem Türü
Büyük Veri
Şehir
Çevrimiçi
Benzer Ekosistem Üyeleri
Aynı kategoride yer alan diğer kuruluşlar