2019/09/18

Machine Learning-1(Regression)

*Linear Regression
*Multiple Linear Regression
*Polynomial Linear Regression
Linear Regression
1.Supervised modeldir.
2.Line fit edilen metota linear regression denilir.
3.Matamatiksel fomülü y=b0+b1*x olarak belirtilir. b0= constant(sabit deger), b1=coeff(kat sayı)
4.Amaç min MSE(mean squared error) elde etmektir.
5.Sklearn'de machine learning algoritmaları mevcuttur.

2019/07/26

Hortonworks Cluster Kurulumu ve Ambari Arayüzü

Bu yazımda sizler Hortonworks Cluster Kurulumu, servislerin deploy edilmesi ve Ambari Arayüzü kurulumundan adım adım bahsedeceğim. Öncelikli olarak kaç sunucu ve bu sunucuların özellikleri ne kadar bu sorular üzerine anlatmaya başlayayım. Kurulumların hepsi kendi local VMware sunucum üzerinde kısıtlı kaynaklarla test edilmiştir.

Tüm bu işlemler için 5 adet Centos 7 işletim istemi kurdum. Sunucu özellikleri;

  • master1 : 4GB ram 40 GB disk
  • master2:  4GB ram 40 GB disk
  • worker1: 2GB ram 40 GB disk
  • worker2: 2GB ram 40 GB disk
  • worker3: 2GB ram 40 GB disk

2019/03/20

Hortonworks ve Cloudera Kurulumları


Big Data dünyasının iki büyük platformunun Internet of Anything(IoT) olarak adlandırdığımız ve buralardan gelen verilerin Apache Hadoop yazılımı üzerine kurulu olan platformlardır.

Bu iki platformunda yönetimsel olarak işlerimizi kolaylaştırmak için bizlere arayüz desteği sunar.

  • Hortonworks için Ambari Arayüzü
  • Cloudera için Hue Arayüzü
Bu iki platformun da kurulumları aslında oldukça basit ve bizler için kolay kullanım olabilmesi adına paket haline getirilmiştir. Şimdi sırasıyla bu işlemleri inceleyelim;

2019/02/27

Oracle Flashback Data Archive

Bu yazımda Oracle Flashback data archive konusundan uygulamalı bir şekilde bahsetmeye çalışacağım. Konu hakkında kısa bir bilgi vererek hemen uygulama kısmına geçelim.

Flashback Data Archive istenilen kritik olduğu düşünülen tablolar üzerinde DML işlemlerimizi tablespace üzerinde tutulmasını sağlayan bir teknolojidir. Bu şekilde DML işlemlerini tespit etme , düzeltme ve raporlama şansımız vardır.


Yukarıda da bahsettiğim gibi bu işlemler için öncelikle bir tane tablespace oluşturuyoruz.

SQL> create tablespace fda_tablespace datafile '/u01/app/oracle/oradata/orcl/fda_datafile.dbf' size 1024M autoextend on next 100M maxsize 10000M;


2019/02/13

Oracle DBSAT ile Veritabanında Güvenlik İncelemesi

Bu yazımda Oracle Güvenlik taraması yapan bir tool'undan bahsetmek istiyorum. Oracle DBSAT açılımına bakacak olursak Oracle Database Security Assessment Tool(DBSAT) adlandırılır.

Bu tool veritabanında güvenlik politikalarını inceler ve bizlere bir repor sunar. Sunulan bu rapor incelendiğinde veritabanının güvenlik geliştirmesinde yardımcı olur. Bize sunacağı önerileri uygulayabiliriz.

DBSAT ile güvenlik açıklarını kaldırabilir ve bunları raporlayabiliriz.




2018/06/20

Oracle Business Intelligence 12.2.1.4.0 Kurulumu-OEL 6.5

Merhaba bu yazımda sizlere Oracle Business Intelligence 12.2.1.4.0 kurulumunu anlatmaya çalışacağım. Bu kurulum için bazı gereksinimlere ihtiyaç duyulmaktadır. Bunlar sırasıyla;



  • Oracle Enterprise Linux 6.5 üzerine kurulum gerçekleştirdik.
  • Java 1.8.171 versiyonunu kullandım.
Bununla alakalı dosyayı aşağıdaki link'den temin edebilirsiniz.


  • Daha sonra Fusion Middleware Infrastructure Installer dosyasını indirip. Kurulum gerçekleştirdim. Bunun ile alakalı dosyayı da aşağıdaki link'den temin edebilirsiniz.

2018/05/08

Hadoop Mimarisi,HDFS,MapReduce ve Yarn Kavramı

Hadoop Mimarisi


    Hadoop java programlama dili ile yazılmış açık kaynak kodlu bir kütüphanedir.Büyük veriyi hızlı işleme ve paralel işlemek için ortaya çıkmıştır. Çok büyük boyutlarda data tutulur.

    Hadoop denilince 2 bileşenden oluşmaktadır. Bunlardan;

  1. Dağıtık Depolama : Örneğin Bozulan bir datanode'daki veriler NameNode sorarak üzerindeki verileri diğer node'a dağıtarak veri kaybını önler.
  2. Dağıtık İşlem.