Veri Türleri, Sınıflandırma ve Büyük Veri

Dijital Sağlık (Öğrenme Platformu)

Dijital çağda herkes veriden söz ediyor. Ancak kritik gerçek şudur: Her veri aynı değildir.

Veri türleri; veriyi üretenler, veriyi kullananlar, yöneticiler ve yazılım uzmanları arasında farklı şekillerde sınıflandırılabilir. Aynı veri, istatistikte başka, programlamada başka, iş dünyasında başka şekilde adlandırılabilir. Bu farklılıkların bilinmesi, özellikle iş insanlarının yazılım geliştiricilere ihtiyaçlarını doğru anlatabilmesi açısından kritik öneme sahiptir. Aksi halde doğru veri bile yanlış sistemlere dönüşebilir.

Tüm alanlarda veri türlerini doğru anlamak, yalnız veriyi tanımak için değil; doğru analiz yöntemini seçmek için de gereklidir.

Veri türleri dört ana bakış açısıyla birlikte değerlendirilmelidir: İçeriğine göre, kullanım amacına göre, yapılandırılma durumuna göre ve erişim durumuna göre.

İçeriğine göre; nicel (kantitatif) ve nitel (kalitatif) veri olarak ikiye ayrılır. Nicel veri ölçülebilir ve sayılarla ifade edilir; kesikli ve sürekli veri gibi alt türleri vardır. Nitel veri ise tanımlayıcıdır; nominal (sırasız) ve ordinal (sıralı) olarak sınıflandırılır. Bu ayrım önemlidir çünkü her veri türü farklı analiz yaklaşımı gerektirir.

Kullanım amacına göre; ana veri, referans veri, işlem verisi, analitik veri ve meta veri olarak sınıflandırılır. Ana veri temel kayıtları içerirken, işlem verisi günlük faaliyetleri yansıtır. Analitik veri karar üretmek için kullanılır. Ancak burada özellikle iki veri türü öne çıkar: referans veri ve meta veri.

Referans veri, sistemin ortak dilidir. Test kodları, tanı sınıfları ve terminolojiler bu gruba girer. Eğer referans veri standardize edilmemişse aynı veri farklı şekillerde kaydedilir, kurumlar arası veri paylaşımı zorlaşır ve analizler güvenilirliğini kaybeder. Bu nedenle temel ilke nettir:
Herkes aynı dili konuşmalıdır. Yoksa makine de anlamaz.

Meta veri ise verinin kendisi hakkında bilgi verir; yani “verinin verisidir.” Bir laboratuvar sonucunun sadece değeri değil, hangi cihazla, hangi yöntemle, hangi birimle, ne zaman ve kim tarafından üretildiği de bilinmelidir. Bu bilgiler olmadan veri karşılaştırılamaz, izlenemez ve güvenilemez. Bu nedenle: Meta veri, verinin kimliği ve kalite güvencesidir.

Günümüzde sağlık sistemlerinde yalnız veri değil, sektör düzeyinde meta veri ve referans veri sözlüklerinin oluşturulması zorunlu hale gelmiştir. LOINC, SNOMED ve UCUM gibi standartlar bu ihtiyacın bir sonucudur. Çünkü açık bir gerçek vardır: Meta veri olmadan veri kördür.

Yapılandırılma durumuna göre veriler; yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış olarak sınıflandırılır. Laboratuvar sonuçları yapılandırılmış veri iken, HL7 ve FHIR gibi mesajlaşma yapıları yarı yapılandırılmış veri örnekleridir. Metinler, görüntüler ve ses kayıtları ise yapılandırılmamış veridir. En büyük veri potansiyeli bu son grupta olmasına karşın, işlenmesi en zor olan da yine bu gruptur. Bu nedenle: Yapılandırılmamış veri, yapılandırılmadan değer üretmez.

Erişim ve kullanım durumuna göre; kamuya açık, iç veri, gizli veri, sınırlandırılmış veri, özel/kritik veri ve düzenleyici veri olarak sınıflandırılır. Özellikle sağlıkta veri güvenliği hayati öneme sahiptir ve temel ilke şudur: Veriye erişim, ihtiyaç ve yetki ile sınırlı olmalıdır.

Tüm bu sınıflandırmaların ötesinde günümüzde “büyük veri” kavramı öne çıkmaktadır. Büyük veri tek bir veri türü değildir hem nicel hem nitel hem yapılandırılmış hem yapılandırılmamış verileri kapsayan geniş bir veri ekosistemidir. Sağlıkta yapay zekâ, risk analizi ve klinik karar destek sistemleri bu yapı üzerine kurulmaktadır.

Ancak burada kritik bir uyarı yapılmalıdır: Büyük veri, büyük değer anlamına gelmez. Eğer veri kalitesiz, eksik veya yanlış süreçlerde üretilmişse, en gelişmiş sistemler bile yanlış sonuçlar üretir.

Sonuç olarak veri türlerini bilmek bir başlangıçtır; ancak yeterli değildir. Asıl sorulması gerekenler şunlardır: Bu veri hangi türde? Hangi amaçla kullanılacak? Referans veri ile tanımlı mı? Meta verisi tam mı? Güvenilir mi ve karara dönüşebilir mi?

Unutmayalım: Her veri değerli değildir. Doğru türde, standartlaştırılmış ve güvenilir veri değerlidir.

Her alanda olduğu gibi dijital sağlıkta gerçek başarı; veriyi toplamakla değil, veriyi doğru sınıflandırmak, standartlaştırmak ve güvenilir hale getirerek karara dönüştürmekle mümkündür.

---------------

Prof. Dr. Diler Aslan, Tıbbi Biyokimya, laboratuvar ve laboratuvar verileri yönetimi alanında uzun yıllar akademik ve uygulamalı çalışmalar yürütmüştür. Dijital sağlık, veri yönetimi ve kalite sistemleri konularında danışmanlık ve eğitim faaliyetlerine devam etmektedir. Sağlıkta veri kalitesi ve verilerin doğru kullanımı üzerine çalışmalarını sürdürmektedir.