Home Komputer Alat klasifikasi data: Apa yang mereka lakukan dan siapa yang membuatnya

Alat klasifikasi data: Apa yang mereka lakukan dan siapa yang membuatnya

0
Alat klasifikasi data: Apa yang mereka lakukan dan siapa yang membuatnya


Klasifikasi data merupakan prasyarat penting untuk perlindungan data, keamanan dan kepatuhan. Perusahaan perlu mengetahui di mana data mereka dan jenis data yang mereka miliki.

Organisasi juga perlu mengklasifikasikan data untuk memastikannya tingkat perlindungan yang tepat dan apakah disimpan pada jenis penyimpanan yang paling sesuai dalam hal biaya dan waktu akses.

Pengecekan klasifikasi data untuk informasi pengenal pribadi (PII). Itu juga dapat mengklasifikasikan kekayaan intelektual atau informasi keuangan dan strategi yang sensitif. Selain itu, klasifikasi data akan memberikan informasi dasar seperti format data, kapan terakhir diakses, kontrol akses, dll. Terakhir, klasifikasi data sering kali menjadi bagian dari pekerjaan analitik berskala besar, seperti di data lake.

“Gagasan skema klasifikasi adalah untuk dapat memenuhi syarat sensitivitas atau pentingnya data bagi suatu organisasi,” kata David Adams, konsultan keamanan GRC di Prism Infosec. “Menerapkan klasifikasi data yang bermakna memungkinkan organisasi untuk dapat memahami data sensitifnya dan menerapkan kontrol yang sesuai.”

Klasifikasi data dan pengelolaan data

Semakin banyak, organisasi telah berinvestasi dalam alat khusus untuk mengklasifikasikan set data saat diserap, serta untuk memindai data yang disimpan untuk informasi sensitif dan untuk membuat katalog data dan glosarium bisnis. Ini, pada gilirannya, membantu keamanan, manajemen data, dan kualitas data. Pendekatan berbasis alat ini menggantikan skrip khusus yang sering diandalkan oleh perusahaan penemuan data.

Pemasok juga telah beralih ke sistem berbasis bahasa alami untuk mempermudah pengelolaan data bagi non-spesialis, dan ke otomatisasi melalui pembelajaran mesin dan kecerdasan buatan (AI). Hal ini sebagai tanggapan atas meningkatnya volume data yang perlu diproses oleh organisasi, dan pertumbuhannya data tidak terstruktur.

Tapi itu juga merupakan respons terhadap tekanan kepatuhan. Sistem otomatis kurang rentan terhadap kesalahan manusia, dan dapat sangat berharga dalam melacak kumpulan data yang salah diklasifikasikan atau tidak dilindungi secara memadai.

Gartner menunjukkan bahwa klasifikasi data manual rumit dan rentan terhadap inkonsistensi. Dan pertumbuhan volume data, di samping penggunaan data tidak terstruktur yang lebih besar, membuat hampir tidak mungkin untuk melakukan tugas secara manual.

Tetapi klasifikasi data sangat penting untuk strategi TI, tata kelola dan kepatuhan, dan juga untuk toleransi risiko bisnis. Jika sebuah organisasi tidak memiliki catatan data yang akurat, ia tidak akan memiliki pandangan yang akurat tentang risikonya. Hal ini dapat membuat sumber data penting tidak terlindungi atau, seperti yang diperingatkan Gartner, dapat mengakibatkan “klasifikasi berlebihan” data dan beban yang tidak perlu bagi organisasi.

Alat atau platform?

Alat klasifikasi data hadir sebagai produk mandiri – biasanya katalogisasi data –, atau sebagai bagian dari perangkat kualitas data atau manajemen data yang lebih luas. Selain itu, mereka dapat menjadi bagian dari intelijen bisnis (BI) atau aplikasi perangkat lunak perusahaan.

Beberapa pemasok, termasuk Microsoft dan SAP, menyediakan klasifikasi data sebagai layanan. Selain itu, ada kecenderungan penawaran “tanpa server” dari pemasok lain yang menghilangkan kebutuhan pengguna untuk mengonfigurasi infrastruktur TI. Ini sangat berguna untuk beban kerja berbasis cloud, tetapi tidak terbatas pada beban kerja tersebut

Sebagian besar pemasok mengklaim setidaknya beberapa kemampuan pembelajaran mesin (ML) atau AI untuk mengotomatiskan proses klasifikasi data. Beberapa juga menyediakan klasifikasi data sebagai bagian dari perangkat kualitas data yang lebih luas.

Pembulatan alat

Penyedia alat klasifikasi data meliputi pemasok analitik bisnis, perusahaan database dan infrastruktur, pemasok perangkat lunak aplikasi, penyedia cloud, dan spesialis ceruk. Ada juga beberapa opsi sumber terbuka.

Tidak mengherankan, IBM, Microsoft, Oracle, dan SAP semuanya hadir di pasar.

IBM

Katalog Pengetahuan Watson IBM bekerja dengan Katalog Tata Kelola Informasi InfoSphere vendor untuk penemuan dan tata kelola data. Ini memiliki lebih dari 30 konektor ke aplikasi lain, menggunakan glosarium bisnis umum, dan dirancang untuk menggunakan AI dan ML.

Microsoft

Katalog Data Purview Microsoft juga menggunakan katalog data perusahaan, dan merupakan bagian dari layanan tata kelola data, kepatuhan, dan manajemen risiko Purview yang ditawarkan Microsoft melalui platform cloud Azure-nya.

GETAH

SAP menawarkan klasifikasi dokumen sebagai layanan melalui operasi cloud-nya atau sebagai bagian dari layanan bisnis AI-nya. Ini juga memiliki layanan Rekomendasi Atribut Data bertenaga AI untuk mengklasifikasikan data master secara otomatis.

Peramal

Oracle menawarkan Katalog Data Infrastruktur Cloud untuk menyediakan layanan cloud manajemen metadata guna membangun inventarisasi aset dan glosarium bisnis. Ini termasuk teknologi AI serta kemampuan penemuan.

Informatika

Pemasok manajemen data Informatica menawarkan alat Katalog Data Perusahaan. Ini adalah alat berbasis ML yang dapat memindai data dan mengklasifikasikannya di penyimpanan lokal dan cloud. Ini juga berfungsi dengan alat BI dan katalog metadata pihak ketiga.

Qlik

Perusahaan Analytics dan BI Qlik telah membangun alat klasifikasi datanya dalam beberapa tahun terakhir, termasuk melalui akuisisi Mimbar yang menambahkan persiapan data, kualitas dan alat manajemen. Bagian katalogisasi data dari platform Integrasi Data Qlik bertujuan untuk bekerja sama dengan BI dan alat analitiknya, tetapi juga dapat bertukar data dengan aplikasi dan katalog lain.

Tablo

Tableau mengambil pendekatan serupa, menempatkan alat Katalognya di rangkaian manajemen datanya. Ini adalah add-on untuk platform analitiknya. Alat tersebut menyerap informasi dari kumpulan data Tableau ke dalam katalognya, dan menawarkan antarmuka pemrograman aplikasi (API) yang dapat memasukkan data dari aplikasi lain.

Google

Katalog Data Cloud Google, terlepas dari namanya, adalah layanan penemuan data terkelola yang bekerja di penyimpanan data cloud dan lokal. Ini terintegrasi dengan manajemen akses dan identitas Google serta alat pencegahan kehilangan data, dan “tanpa server” sehingga pengguna tidak perlu mengonfigurasi infrastruktur.

Layanan Web Amazon

AWS menyediakan katalog datanya melalui Glue, layanan ETL (ekstrak, transformasi, dan muat) terkelola. Glue Data Catalog berfungsi di berbagai layanan AWS, termasuk AWS Lake Formation, serta dengan gudang data Apache Hive open source.

Ataccama

Ataccama One adalah platform manajemen dan tata kelola data pemasok, dan fitur di Magic Quadrant Gartner untuk solusi kualitas data. Modul Data Catalog-nya mengotomatiskan penemuan data dan deteksi perubahan serta bekerja dengan database, data lake, dan sistem file. Penekanan pemasok adalah pada peningkatan kualitas data.

Collibra

Collibra juga dinilai oleh Gartner dalam Magic Quadrant-nya, dan merupakan platform cloud intelijen data yang berbasis di sekitar katalog data berbasis ML. Katalog data memiliki integrasi bawaan dengan aplikasi bisnis, BI, dan penyimpanan data. Ia mengklaim pengguna dapat mencari penyimpanan data menggunakan alat tersebut, tanpa perlu mempelajari SQL.

DataHub dan Atlas Apache

DataHub berasal dari LinkedIn sebagai alat pencarian dan penemuan metadata, dan menjadi sumber terbuka pada tahun 2020. Namun mungkin alat sumber terbuka yang paling banyak didukung adalah Apache Atlas, yang menawarkan katalog data, manajemen metadata, dan tata kelola data.

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Solverwp- WordPress Theme and Plugin