Apa itu Big Data ? | Pengertian, Manfaat, Cara Kerja dan Contohny

 

Apa itu Big Data ?

                        
          Apa Itu Big Data? - Docotel Official Blog


Big data adalah sekumpulan data kompleks yang memiliki volume atau jumlah sangat besar yang terus berkembang dan bertambah setiap waktu. Data yang dihasilkan dari aktivitas internet dapat digunakan untuk untuk tujuan pribadi maupun bisnis. Selain iitu Big data juga disebut dengan istilah yang menggambarkan volume besar data – baik terstruktur maupun tidak terstruktur – yang membanjiri bisnis sehari-hari.

Sejarah Perkembangan Big Data

                    Mengenal peranan big data dan right data bagi bisnis 

di awal 2000-an ketika analis industri Doug Laney mengartikulasikan definisi big data yang sekarang-mainstream sebagai tiga V.
Big data menjadi sangat populer ketika Roger Mougalas dari OReally Media menggunakan istilah ini untuk merujuk pada sekumpulan data yang volumenya sangat besar dan tidak dapat diolah dengan metode dan teknologi pengolahan data tradisional. Di tahun yang sama, lahirlah Hadoop, teknologi pengolahan data yang mampu mengolah sejumlah data yang sangat besar.

Ada lima langkah utama untuk mengambil alih “struktur data” besar ini yang mencakup data tradisional dan terstruktur bersama dengan data tidak terstruktur dan terstruktur:

Tetapkan strategi big data.

Identifikasi sumber big data.

Akses, kelola, dan simpan data.

Istilah penting Big Data

                   
            

Big Data Analytic

Adalah penggunaan teknik analitik tingkat lanjut terhadap kumpulan data yang besar dan beragam yang mencakup data terstruktur, semi terstruktur dan tidak terstruktur yang diambil dari berbagai sumber dan berbagai ukuran dari terabyte hingga zettabyte.

Algoritma

Dalam dunia ilmu komputer, algoritma adalah prosedur perhitungan atau formula matematika atau statistical yang digunakan untuk pemrosesan analisis data.

Data Lake

Adalah sistem penyimpanan data yang disimpan dalam formula aslinya berupa gumpalan objek atau file. Data lake dapat mencakup data terstruktur dari database relasional (baris dan kolom), semi-terstruktur (CSV, log, XML, JSON), tidak terstruktur (email, dokumen, PDF) dan data biner (gambar, audio, video).

Data Warehouse

Adalah gudang data (DW atau DWH),sebuah sistem yang digunakan untuk pelaporan dan analisis data, dan dianggap sebagai komponen inti dari intelijen bisnis.

Data Mining 

Proses menemukan anomali, pola, dan korelasi dalam kumpulan data besar untuk memprediksi hasil dengan proses yang melibatkan metode di persimpangan pembelajaran mesin, statistik, dan sistem basis data.

Data Scientist

Sebutan untuk orang yang mengatur, mengumpulkan dan menganalisis kumpulan besar data terstruktur dan tidak terstruktur gunamembuat rencana yang dapat ditindaklanjuti untuk perusahaan dan organisasi lain.

Machine Learning

adalah mesin teknologi yang mampu menangkap data dan melakukan pembelajaran serta menciptakan suatu sistem atau algoritma.

In-Memory Computing

In-Memory Computing adalah menggunakan jenis perangkat lunak middleware yang memungkinkan seseorang untuk menyimpan data dalam RAM, di sekumpulan komputer, dan memprosesnya secara paralel.

Karakteristik Big Data

                       BIG DATA – MTI

1. Volume

Karakteristik utama dari big data adalah jumlah atau ukuran data yang memiliki kapasitas besar. Contohnya Instagram yang menyimpan 69,23% data personal lebih dari satu miliar pengguna di seluruh dunia.

2. Variety

Memiliki variasi sumber dan data yang disebut dengan variety. Variasinya dapat berupa data terstruktur, tidak terstruktur dan semi terstruktur. Adapun sumber data berasal dari media sosial. Contohnya data teks percakapan, gambar, dan video.

3. Velocity

Velocity mengacu pada karakteristik big data yang memiliki kecepatan dalam mengumpulkan dan mengolah data untuk menghasilkan informasi. Kecepatan transfer data juga sangat berpengaruh dalam proses pengiriman data yang bersumber dari, log aplikasi, jaringan, dan situs media sosial, sensor, perangkat seluler, dll. Big data memiliki kecepatan yang memungkinkan untuk dapat diterima secara langsung (real-time). Contohnya adalah data percakapan media sosial yang memiliki kecepatan dalam pengirimannya.

4. Veracity

Veracity mengacu pada tingkat kebenaran dan keakuratan aset data dan informasi dalam big data. Data yang telah dikumpulkan dari berbagai sumber dapat menyebabkan permasalahan pada kualitas informasi. Jika tidak diperbaiki melalui proses pembersihan, data yang buruk menyebabkan kesalahan analisis dan pengambilan keputusan yang dapat merusak nilai inisiatif analisis bisnis.

5. Value

Value adalah nilai atau aliran data yang tidak teratur dan konsisten dalam beberapa kondisi dan periode. Hal tersebut dapat terjadi ketika terdapat lonjakan data yang besar sehingga, akan memproses data dengan resource memori yang lebih besar. Nilai data yang besar dapat berasal dari penemuan wawasan dan pengenalan pola yang efektif, dan manfaat bisnis lainnya yang jelas dan terukur.

6. Variability

Variabilitas mengacu pada bagaimana kumpulan data dalam banyak format yang berbeda dapat dicari, dikelola, dan dianalisis oleh perusahaan. Contohnya pengelolaan data untuk mencari analisis sentimen atau teks,


Comments

Popular posts from this blog

3 Contoh Flowchart Percabangan beserta programnya

Looping Adalah Algoritma Perulangan: Berikut Contohnya

Mengenal KOTLIN