Data deduplication nedir ve çeşitleri nelerdir?

Her geçen gün kurumların dataları hızlı bir şekilde artmaya devam etmektedir ve buna paralel olarak depolama alanlarına ihtiyaç daha fazla olmaktadır. Bu sorun beraberinde maliyetlerin hızla artmasına neden olmaktadır.

Data Deduplication (tekilleştirme) ise tekrar eden datanın ortadan kaldırılmasına anlamına gelmektedir. Aşağıdaki örnekte de görüldüğü üzere tekrar eden data blokları elimine edilerek datanın disk ünitesinde çok daha az yer kaplaması sağlanmıştır.

 

Tekilleştirme dosya ve blok seviyesinde yapılabilmektedir.

Dosya seviyesinde tekilleştirmede örneğin farklı kullanıcıların oluşturmuş olduğu aynı dosyaların tek örneği disk ünitesinde tutularak yapılmaktadır.

Blok seviyesinde tekilleştirmede ise data bloklara ayrılarak disk ünitesinde tutulur ve bu bloklardan tekrar edenler tespit edilerek tekilleştirme işlemi gerçekleştirilir. Blok seviyesinde tekilleştirme, dosya seviyesinde tekilleştirmeye göre daha çok disk alanı elde etmenizi sağlar. Bu sebeple kurumsal yapılarda genellikle bu yöntem tercih edilir.

Data tekilleştirme inline deduplication ve post processing olmak üzere iki şekilde yapılır.

Inline deduplication: Veriler diske yazılmadan önce tekilleştirilir. Dolayısıyla ihtiyaç duyulan disk alanı daha az olacaktır. Aynı zamanda disk ünitesine yapılan I/O daha az olacaktır. Bu anlamdan bu yöntemin daha etkin ve ekonomik olduğu söylenebilir.

Post processing : Veriler diske yazıldıktan sonra tekilleştirme işlemi yapılır. Dolayısıyla ihtiyaç duyulan disk alanı daha fazla olacaktır.

Bir cevap yazın