Yapay Zekâ 101
Yapılandırılmış Veri vs Yapılandırılmamış Veri

Yapılandırılmamış veri önceden tanımlanmış bir şekilde organize edilmeyen veya belirli bir veri modeli içermeyen veridir. Buna karşılık, yapılandırılmış veri veri noktaları arasındaki açık, tanımlanabilir ilişkileri olan ve önceden tanımlanmış bir modeli içeren veridir. Yapılandırılmış ve yapılandırılmamış veri arasındaki fark hakkında kısa cevap buysa da, iki tür verinin arasındaki farklara daha yakından bakalım.
Yapılandırılmış Veri Nedir?
Bilgisayar biliminde, veri yapıları, verilerin depolanması ve organize edilmesi için belirli yolları ifade eder. Farklı veri yapıları, veri noktaları arasındaki farklı ilişkileri içerir, ancak veri aynı zamanda yapılandırılmamış olabilir. Verinin yapılandırılmış olduğu anlamına gelen nedir? Bu tanımı daha net yapmak için, verilerin yapılandırılmasının çeşitli yollarına bir göz atalım.
Yapılandırılmış veri genellikle Excel dosyaları veya SQL veritabanları gibi tablolarda tutulur. Bu durumlarda, verilerin satırları ve sütunları farklı değişkenleri veya özellikleri tutar ve veri satırları ve sütunlarının kesişim noktalarına bakarak veri noktaları arasındaki ilişki thường anlaşılabilir. Yapılandırılmış veri, ilişkisel bir veritabanına kolayca uyabilir ve yapılandırılmış bir veri kümesindeki farklı özelliklere örnek olarak adlar, adresler, tarihler, hava durumu istatistikleri, kredi kartı numaraları vb. verilebilir. Yapılandırılmış verinin genellikle metin verileri olmasına rağmen, görseller ve sesleri de yapılandırılmış veri olarak depolamak mümkündür.
Yapılandırılmış verinin ortak kaynakları arasında sensörlerden toplanan veriler, web günlükleri, ağ verileri ve perakende veya e-ticaret verileri bulunur. Yapılandırılmış veri ayrıca, insanlar tarafından bilgisayarlar ve diğer cihazlardan toplanan verileri elektronik tablolar veya veritabanlarına doldurarak da oluşturulabilir. Örneğin, çevrimiçi formlar aracılığıyla toplanan veriler genellikle hemen bir veri yapısına aktarılır.
Yapılandırılmış veri, uzun bir geçmişe sahip olarak ilişkisel veritabanları ve SQL’de depolanmıştır. Bu depolama yöntemleri, bu formatlarda okuma ve yazma kolaylığı nedeniyle popülerdir ve çoğu platform ve dil bu veri formatlarını yorumlayabilir.
Makine öğrenimi bağlamında, yapılandırılmış veri, verinin içindeki kalıplar daha açık olduğundan, bir makine öğrenimi sistemini eğitmek daha kolaydır. Belirli özellikler bir makine öğrenimi sınıflandırıcıya beslenebilir ve bu seçilen özelliklere dayanarak diğer veri örneklerini etiketlemek için kullanılabilir. Buna karşılık, yapılandırılmamış veri üzerinde bir makine öğrenimi sistemini eğitmek daha zordur ve nedenleri açıklanacaktır.
Yapılandırılmamış Veri Nedir?
Yapılandırılmamış veri, önceden tanımlanmış bir veri modeline veya yapıya göre organize edilmeyen veridir. Yapılandırılmamış veri genellikle nitel veri olarak adlandırılır çünkü geleneksel yöntemlerle yapılandırılmış veri için kullanılan yöntemlerle analiz edilemez veya işlenemez.
Yapılandırılmamış verinin veri noktaları arasındaki tanımlanmış ilişkileri olmadığından, ilişkisel veritabanlarında organize edilemez. Buna karşılık, yapılandırılmamış verinin depolandığı yöntem genellikle NoSQL veritabanı veya ilişkisiz bir veritabanıdır. Veritabanının yapısı konusunda endişe yoksa, bir veri göleti veya büyük bir yapılandırılmamış veri havuzu, NoSQL veritabanı yerine verilerin depolanması için kullanılabilir.
Yapılandırılmamış veri analiz etmesi zordur ve yapılandırılmamış veriden anlam çıkarmak thường bireysel veri parçalarını incelemek ve potansiyel özellikleri belirlemek ve sonra bu özelliklerin veri havuzundaki diğer veri parçalarında是否 ortaya çıkıp çıkmadığını görmek anlamına gelir.
Tüm verilerin büyük çoğunluğu yapılandırılmamış formattadır ve yapılandırılmamış verilerin tüm verilerin yaklaşık %80’ini oluşturduğu tahmin edilmektedir. Veri madenciliği teknikleri, veriyi yapılandırmaya yardımcı olmak için kullanılabilir.
Makine öğrenimi açısından, belirli teknikler yapılandırılmamış veriyi düzenleyerek yapılandırılmış veriye dönüştürebilir. Yapılandırılmamış veriyi yapılandırılmış veriye dönüştürmek için popüler bir araç, oto-encoder olarak adlandırılan bir sistemdir.












