Sudah siap untuk meresap ke dunia penyimpanan data raksasa Google? Mari kita selami bagaimana sang raksasa teknologi ini, meskipun dikenal dengan inovasi, ternyata masih punya cinta mendalam pada hard disk drive (HDD) alias "si piringan besi" yang berputar itu.
Peran Penting HDD dalam Ekosistem Google
Google, perusahaan yang kita gunakan untuk mencari informasi, menonton video, dan mengirim surel, ternyata memiliki gudang data yang luar biasa besar. Sebagian besar dari data ini, mengejutkan atau tidak, masih disimpan di HDD. Mereka memang mengakui bahwa sebagian besar pusat data mereka masih mengandalkan "spinning rust," sebutan populer untuk HDD, karena alasan efisiensi biaya yang signifikan.
Namun, jangan salah sangka, Google tidak ketinggalan zaman. Mereka terus berupaya untuk memaksimalkan kinerja penyimpanan mereka. Lewat platform penyimpanan "Colossus," Google dapat beroperasi dengan sangat cepat dan efisien. Sistem tersebut menjadi tulang punggung YouTube, Gmail, layanan penyimpanan awan Google, dan aplikasi lainnya.
Google baru-baru ini membagikan wawasan tentang bagaimana mereka berhasil mengoptimalkan kinerja penyimpanan data mereka, meskipun masih bergantung pada HDD. Memang, jumlah data yang mereka kelola sangat masif: beberapa exabyte penyimpanan yang tersebar di sejumlah besar pusat data di seluruh dunia. Dua filesystem Google bahkan memiliki lebih dari 10 exabyte penyimpanan masing-masing, angka yang benar-benar membuat mata berbinar.
Sistem Colossus Google memang bergerak cepat. Output baca mencapai lebih dari 50 TB/s dan output tulis mencapai 25 TB/s secara teratur. Malah, untuk pusat data paling sibuk, mencapai lebih dari 600 juta IOPS (Input/Output Operations Per Second), gabungan dari baca dan tulis. Kinerja luar biasa ini menjadi bukti betapa canggihnya sistem yang dikembangkan Google.
Mengenal Sistem Colossus dan "L4"
Google pertama kali berbagi informasi publik tentang Colossus pada tahun 2021. Mereka mengungkapkan bahwa sistem tersebut memanfaatkan campuran penyimpanan flash dan disk. Data yang paling sering diakses ditempatkan pada solid-state disk (SSD) untuk efisiensi dan latency lebih rendah.
Perusahaan ini memiliki strategi cerdas: memindahkan data yang sering diakses dari HDD ke SSD. Seiring waktu, harga SSD terus menurun, membuatnya semakin menonjol di pusat data Google. Namun, biaya keseluruhan masih tetap lebih mahal daripada menggabungkan SSD dan HDD.
Tantangannya adalah menempatkan data yang paling sering digunakan atau memerlukan latency terendah di SSD, sambil menyimpan sebagian besar data di HDD. Untuk itu, Google menggunakan sistem caching otomatis, disebut L4, yang dikembangkan secara internal. Sistem ini menentukan data mana yang paling cocok untuk disimpan di SSD.
H2: Bagaimana L4 Bekerja: Otomatis dalam Penyelamatan
L4 dapat dibilang sebagai "otak" di balik manajemen penyimpanan Google. Sistem ini secara dinamis memilih data yang paling relevan untuk disimpan di SSD. Saat aplikasi membutuhkan data, pertama-tama akan mencari informasi di index server L4 untuk memeriksa apakah data tersebut sudah ada di cache.
Jika data ada di cache, aplikasi akan mengambilnya langsung dari SSD. Jika tidak, L4 akan membacanya dari HDD dan memindahkannya ke server yang menggunakan SSD. Luar biasa, bukan?
Pengembang di Google secara berkelanjutan mematangkan L4. Tim mereka menggunakan algoritma machine learning (ML) untuk memutuskan kebijakan mana yang akan diterapkan. Keputusan ini sangat tergantung, misalnya, pada: apakah data perlu dimasukkan ke dalam cache L4 segera setelah ditulis, setelah dibaca pertama kali, atau hanya setelah dibaca kedua kalinya dalam waktu singkat.
H2: Efisiensi yang Terbukti, Tantangan yang Tersisa
Teknologi caching L4 terbukti sangat efektif untuk aplikasi yang sering membaca data yang sama. Hal ini telah berhasil meningkatkan IOPS dan kinerja secara keseluruhan. Meski begitu, ada sedikit "kerikil" dalam sistem ini. Google masih menulis data baru langsung ke HDD.
Ada juga kelas data penting lain di mana caching L4 tidak memberikan efisiensi yang diharapkan. Ini termasuk data yang ditulis, dibaca, dan dihapus dengan cepat. Contohnya: hasil perantara untuk pemrosesan batch besar, log transaksi database, dan file lain yang sering mengalami penambahan data.
H2: Kecerdasan Buatan (AI): Solusi Modern untuk Penempatan Data
Inilah letak keunggulan Google: mereka menciptakan sistem untuk mengotomatiskan penempatan data. Saat aplikasi membuat file baru, ia berbagi informasi seperti tipe file atau metadata kolom basis data tertentu. L4 menggunakan informasi ini untuk mengkategorikan file dan mengamati pola input/output (I/O) dari setiap kategori dari waktu ke waktu.
Meskipun masih terus mengembangkan sistemnya, Google telah melakukan pekerjaan signifikan dalam mengoptimalkan kinerja dan efisiensi manajemen data. Melalui simulasi online berdasarkan pola I/O, L4 memilih kebijakan penempatan yang paling sesuai. Misalnya, "tempatkan di SSD selama satu jam", "tempatkan di SSD selama dua jam", atau bahkan "jangan tempatkan di SSD".
Proses ini juga berguna untuk memprediksi pilihan penempatan L4 jika kapasitas SSD bertambah atau berkurang. Google dapat memprediksi seberapa banyak I/O yang dapat dialihkan dari HDD dengan kapasitas SSD yang berbeda. Informasi ini menjadi dasar untuk pengadaan hardware SSD baru dan merencanakan pergeseran kapasitas SSD berdasarkan aplikasi, untuk memaksimalkan efisiensi.
H2: Pelajaran dari Google: Menggunakan HDD Secara Efisien
Anda mungkin bertanya-tanya, kenapa Google masih bertahan dengan HDD? Jawabannya sederhana: biaya. HDD menawarkan biaya yang lebih rendah per gigabyte dibandingkan SSD. Namun, Google menemukan kelemahan. HDD tidak cocok untuk beberapa jenis beban kerja.
Hal ini mengarah pada kebutuhan pendekatan campuran. Dengan penempatan otomatis yang cerdas dan kebijakan caching yang efektif, Google berhasil meminimalkan dampak bottleneck HDD sambil memanfaatkan keuntungan biaya yang mereka tawarkan. Mereka menggunakan kecerdasan buatan untuk mengoptimalkan proses.
Ini adalah cerita tentang bagaimana Google menyeimbangkan biaya dan kinerja. Dengan menggunakan teknologi canggih, Google dapat mengelola data dalam skala exabyte secara efisien.
Kesimpulan: Masa Depan Penyimpanan Data
Singkatnya, Google telah menunjukkan bahwa HDD masih memiliki peran penting dalam era penyimpanan data modern. Dengan pendekatan cerdas, otomatisasi, dan penggunaan machine learning, perusahaan mampu memaksimalkan efisiensi penggunaan HDD. Pelajaran yang dapat kita ambil adalah bahwa kombinasi dari HDD dan SSD, dengan teknologi yang tepat, dapat menawarkan solusi penyimpanan yang efektif dan hemat biaya. Jangan ragu untuk mengikuti perkembangan di dunia penyimpanan data, siapa tahu Anda bisa terinspirasi!