Connect with us

لماذا تقرر جودة البيانات نجاح أو فشل الذكاء الاصطناعي في الشركات

قادة الفكر

لماذا تقرر جودة البيانات نجاح أو فشل الذكاء الاصطناعي في الشركات

mm

منذ ظهور OpenAI لتشات جبت في أواخر عام 2022، هرعت كل شركة للاستفادة من الذكاء الاصطناعي بسرعة أكبر. ويباع الآن لأجهزة Nvidia أكثر من أي وقت مضى، بينما تواصل الشركات المصنعة للنماذج الكبيرة مثل OpenAI وAnthropic بناء نماذج أكبر وأكثر تعقيدًا.

然而، حتى مع أكثر النماذج تقدمًا والميزانيات الأكبر، لا يزال العديد من مشاريع الذكاء الاصطناعي تفتقر إلى النجاح. لقد رأينا حدوث ذلك عبر مختلف الصناعات من الرعاية الصحية إلى النقل والمالية وغيرها. السبب ليس بعيد المدى: الذكاء الاصطناعي جيد فقط مثل البيانات التي يتم تدريبه عليها والبيانات التي يتلقاها في الوقت الفعلي. عندما تكون هذه البيانات مخطئة أو متأخرة أو غير كاملة، لا يمكن لأي نموذج تقديم نتائج متسقة أو موثوقة.

وهذا هو المشكل الكبير الذي تواجهه العديد من الشركات اليوم. يستثمرون بكثافة في أدوات الذكاء الاصطناعي، بينما تظل أنظمتهم البيانية متفرقة وغير موثوقة. النتيجة هي وهم التقدم. بينما تنتج النماذج إجابات مثيرة للإعجاب، غالبًا ما تكون العوامل التي تؤدي إلى هذه الإجابات مبنية على أسس ضعيفة. العائق الحقيقي لنجاح الذكاء الاصطناعي ليس أداء النموذج. إنه جودة البيانات.

ما يعني البيانات الجيدة حقًا

البيانات عالية الجودة ليست فقط عن دقة. إنها تعني المعلومات التي هي حديثة و كاملة و ذات صلة بالمشكلة المحددة. تخيل عميلًا يحاول إلغاء طلب على موقع تجارة إلكترونية. يحتاج النظام إلى التحقق من تفاصيل الطلب، وحالة الشحن، وسجل الدفع. إذا كانت أي من هذه النقاط البيانية تعيش في أنظمة مختلفة لا تتحدث مع بعضها البعض، سيفشل مساعد الذكاء الاصطناعي في تقديم إجابة مفيدة.

البيانات الجيدة تربط هذه النقاط على الفور. تسمح للذكاء الاصطناعي برؤية صورة كاملة بدلاً من شظايا منها. البيانات السيئة، من ناحية أخرى، تجبر النموذج على التخمين. وعندما يبدأ الذكاء الاصطناعي في التخمين، يرتكب أخطاء تكلفتها أموال وتضر الثقة. تُظهر الأمثلة الحديثة مدى خطورة هذه الافتراضات.

نظام الدردشة الذكي لمدينة نيويورك قدم نصائح غير قانونية لأنها استندت إلى معلومات قانونية قديمة أو غير كاملة. نظام خدمة العملاء التابع لشركة إير كندا قدم مطالبات استرداد كاذبة بسبب نقص السياق من سياسة الشركة. حتى أنظمة التوظيف الكبيرة قامت بتصفية المرشحين بشكل خاطئ بسبب بيانات متحيزة أو مخطئة، كما هو موضح في اتفاقية تسوية الذكاء الاصطناعي الأولى لشركة إي إي أو سي. هذه الأخطاء ليست فنية فقط. إنها سمعة ومالية، وتنبع من أنظمة ذكاء اصطناعي تم تدريبها على بيانات غير موثوقة.

تؤكد دراسات الصناعة على حجم هذه القضية. تقارير جارتنر أن 80 في المائة من مشاريع الذكاء الاصطناعي تفشل في التوسع بسبب سوء جودة البيانات وحوكمتها. وبالمثل، وجد استطلاع استطلاع لمعهد إم آي تي سلوان للإدارة أن مشاكل البيانات، وليس الخوارزميات، هي السبب الرئيسي لفشل مشاريع الذكاء الاصطناعي في الشركات.

الثقافة تهم كما تهم الرمز

تحسين جودة البيانات ليس شيئًا يمكن إصلاحه bằng أداة أو أمر واحد. يتطلب تغييرًا ثقافيًا. هذا هو السبب في أن قادة الأعمال يجب أن يعاملوا البيانات كمنظومة حية تحتاج إلى الرعاية والمساءلة. هذا ليس مجرد إعلان عن “جعل البيانات أفضل” – هذا ليس كافياً. يجب على كل جزء من المنظمة فهم كيف تتحرك المعلومات، ومن يملكها، وماذا يحدث عندما تتغير.

لقد رأينا كيف يلعب هذا في الأنظمة في العالم الحقيقي. تعتمد العديد من تطبيقات الذكاء الاصطناعي على تحديثات البيانات الليلية. إذا كانت قاعدة البيانات الخاصة بك تُحدث مرة واحدة في اليوم، فإن معرفة النموذج دائمًا ما ت落خلف الواقع. في البيئات السريعة، يمكن أن يعني هذا التأخير رؤى قديمة و قرارات سيئة. يجب على الشركات إعادة التفكير في تدفق البيانات كله من كيفية جمع المعلومات إلى كيفية تسليمها إلى النموذج.

يمكن أن يوفر القيام بذلك بفعالية وقتًا وكلفة هائلة. عندما يتم تصميم أنابيب البيانات بدقة وغرض، يمكن لأنظمة الذكاء الاصطناعي التعلم والعمل على أحدث وأهم المعلومات. عندما لا يتم ذلك، تقضي الفرق أكثر وقتًا في تنظيف البيانات منها في استخدامها.

يُشير الخبراء في إدارة البيانات غالبًا إلى أن المفتاح لجودة البيانات القوية هو حلقة ملاحظية بين الأشخاص والعمليات والمنصات. بدون هذه الحلقة، تصبح المعلومات قديمة و تفقد النماذج الاتصال مع الظروف في العالم الحقيقي – مشكلة يطلق عليها أحيانًا انجراف البيانات.

التوازن بين السرعة والسلامة

غالبًا ما يكون هناك توتر بين الحركة السريعة والحفاظ على الدقة. تريد العديد من المنظمات نتائج فورية من استثماراتها في الذكاء الاصطناعي، ولكن العجلة يمكن أن تؤدي إلى مشاكل أكبر لاحقًا. يجب أن يكون الهدف هو مرونة البيانات مع السلامة. بعبارة أخرى، بناء أنظمة يمكنها التحرك بسرعة دون فقدان الدقة.

بهذا الصدد، يجب على كل شركة تحديد مسارات واضحة لتدفق البيانات من مصدرها إلى النموذج في الوقت الفعلي. كما أنه يساعد في تحديد ما نوع المعلومات المسموح بها وما يجب أن يبقى خارجها. يجب ألا تصل البيانات الحساسة أو الخاصة إلى النموذج، حتى لو كان للمستخدم حق الوصول إليها تقنيًا. حماية هذه الحدود تبني الثقة وتحافظ على أنظمة الذكاء الاصطناعي من تسريب أو إساءة استخدام المعلومات.

كما يصبح الذكاء الاصطناعي أكثر استقلالية، سيظل الإشراف البشري حاسمًا. يجب ألا يكون للنموذج السيطرة الكاملة على الإجراءات التجارية. بالتأكيد، لا ينبغي له أن يتخذ أي قرارات. بدلاً من ذلك، يجب أن يقدم طلبات. وأهم من ذلك، يجب على البشر دائمًا مراجعة وموافقة إجراءاته للتأكد من أنها تتماشى مع سياسة الشركة والتنظيم.

بناء الجودة من الأساس

حفظ جودة البيانات على نطاق واسع ليس مجرد مسألة تنظيف الأخطاء. يبدأ مع الهندسة المعمارية. يجب عليك تحديد مكان وجود البيانات الموثوقة الأكثر موثوقية، ثم تصميم نظام يجمعها معًا في موقع موثوق واحد. من هناك، يمكنك تتبع البيانات التي يستخدمها النموذج ومن أين أتت.

هذا النهج يمنع الارتباك ويحافظ على نظام شفاف. كما يساعد الفرق على تصحيح الأخطاء بشكل أسرع عندما ي发生 شيء خاطئ. عندما تعرف بالضبط ما البيانات التي غذت إجابة النموذج، يمكنك التحقق من الأخطاء وتصحيحها قبل انتشارها.

سي thuộc مستقبل الذكاء الاصطناعي في الشركات إلى الشركات التي تدمج الجودة في بنيتها التحتية افتراضيًا. نتوقع أن نرى المزيد من أنظمة الذكاء الاصطناعي الجاهزة التي تتعامل مع كل من التفكير والتكامل البيانات في حزمة واحدة. يمكن أن تجعل هذه “أجهزة الذكاء الاصطناعي” من السهل على المنظمات نشر أنظمة ذكية دون فقدان السيطرة على بياناتها.

تتنبأ التحليلات بأن المنظمات القادرة على توحيد وحوكمة بياناتها بفعالية ستشهد تبنيًا أسرع و عائد استثمار أعلى من مشاريع الذكاء الاصطناعي. يشرح تقرير عن جاهزية البيانات أن هذه القدرة تفصل بين الشركات التي تبتكر باستمرار وتلك التي تتوقف بعد تجارب أولية. غالبًا ما يعود الفرق إلى ما إذا كانت أنظمتهم الذكاء الاصطناعي مبنية على معلومات متسقة ومنظمة جيدًا.

النقطة الأساسية

جودة البيانات قد لا تظهر مثيرة للغاية مقارنة بالتقدم في تصميم النموذج، ولكنها القوة الصامتة التي تقرر نجاح أو فشل الذكاء الاصطناعي. بدون بيانات نظيفة و حديثة و متسقة، ستتعثر حتى الأنظمة الأكثر ذكاءً. معها، حتى مشاريع الذكاء الاصطناعي المتواضعة يمكن أن تخلق قيمة دائمة.

يجب على كل قائد يستثمر في الذكاء الاصطناعي أن يسأل سؤالاً بسيطاً: هل نثق بالبيانات التي تدفع قراراتنا؟ من ما رأيناه، الشركات التي يمكنها الإجابة بثقة “نعم” هي تلك التي تقود سباق الذكاء الاصطناعي بالفعل.

Oren Eini هو المؤسس والرئيس التنفيذي لشركة RavenDB، وهو قاعدة بيانات وثائق متعدد النماذج NoSQL موثوق بها من قبل المطورين والشركات في جميع أنحاء العالم. بالإضافة إلى كونه القوة الدافعة وراء نمو وتوسع قاعدة بيانات RavenDB، Oren هو مدون حاسم ويتحدث بانتظام في الفعاليات الصناعية حول العالم.