نقترح عليك "صندوق الصور للأطفال"، وهو نظام تفاعلي يستخدم تقنية التعرّف المتعدّد الوسائط لتحسين تفاعلات الأسرة والتعليم في مرحلة الطفولة المبكرة. يتضمّن هذا الجهاز عنصرَين رئيسيَّين: كاميرا مستندة إلى الذكاء الاصطناعي تتيح للأطفال التقاط صور للأشياء أو لحظات عائلية، وصندوق صور يتيح التعلّم التفاعلي في المنزل. يمكن للوالدَين التقاط صور لأدوات منزلية يستخدمها نموذج الرؤية والّغة (VLM) لإنشاء محتوى تعليمي مخصّص. يستخدم النظام "سلسلة من الأفكار" للانتقال من طلبات البحث البسيطة إلى التفسيرات المعقدة. عندما يلتقط الأطفال صورًا للعناصر المسجّلة، يتعرّف النظام عليها ويصفها. تؤدي العناصر غير المسجّلة إلى عرض أوصاف ينشئها نموذج Gemini 1.5. تؤدي طريقة التقاط الصور البسيطة هذه إلى إنشاء محتوى شامل من الأسئلة والأجوبة، ما يعزّز الفضول والفهم. أظهرت تجربة في روضة أطفال دولية أنّ الأطفال يتذكرون% 70 من 100 عنصر مسجّل. تلتقط كاميرا الذكاء الاصطناعي لحظات العائلة، ويقدّم "صندوق الصور" محتوى تفاعليًا غنيًا عندما يعرض الأطفال الصور المطبوعة. يُعدّ هذا النظام توسيعًا لأعمال HCI السابقة من خلال استخدام نموذج Gemini لتوفير محتوى تفاعلي أكثر ثراءً. وتُجري دراسات حالية تأكيدًا على فعاليتها في تحسين التفاعلات العائلية.
مصمَّم بالاستناد إلى
Android
الفريق
من
Photobox for Kids
من
الولايات المتحدة
[[["يسهُل فهم المحتوى.","easyToUnderstand","thumb-up"],["ساعَدني المحتوى في حلّ مشكلتي.","solvedMyProblem","thumb-up"],["غير ذلك","otherUp","thumb-up"]],[["لا يحتوي على المعلومات التي أحتاج إليها.","missingTheInformationINeed","thumb-down"],["الخطوات معقدة للغاية / كثيرة جدًا.","tooComplicatedTooManySteps","thumb-down"],["المحتوى قديم.","outOfDate","thumb-down"],["ثمة مشكلة في الترجمة.","translationIssue","thumb-down"],["مشكلة في العيّنات / التعليمات البرمجية","samplesCodeIssue","thumb-down"],["غير ذلك","otherDown","thumb-down"]],[],[],[],null,["# Photobox for Kids\n\n[More Apps](/competition/vote) \n\nPhotobox for Kids\n=================\n\nEnhancing family interactions for Kids utilizing Gemini. \nVote \nVoted!\nWhat it does\n\nWe propose \"Photobox for Kids,\" an interactive system using multi-modal recognition to enhance family interactions and early childhood education. It has two main components: an AI Camera for children to capture objects or family moments, and a Photobox for interactive learning at home. Parents can capture household items, which a Vision-Language Model (VLM) uses to generate tailored educational content. The system employs a 'Chain of Thought' to progress from simple queries to complex explanations. When children capture registered items, the system identifies and describes them. Unregistered items trigger descriptions generated by the Gemini 1.5 model. This simple photo capture method generates extensive Q\\&A content, promoting curiosity and understanding. A pilot in an international kindergarten showed children recalling 70% of 100 registered objects. The AI Camera captures family moments, and the Photobox provides rich interactive content when children present the printed photos. This system extends previous HCI work by using the Gemini model for richer interactive content. Ongoing studies are validating its effectiveness in enhancing family interactions. \nBuilt with\n\n- Android \nTeam \nBy\n\nPhotobox for Kids \nFrom\n\nUnited States \n[](/competition/vote)"]]