1
در توان پردازش خام، یک مدل زبانی بزرگ از نظر محاسباتی میتواند کودکان نوپا را پشت سر بگذارد. اما وقتی تیمی از پژوهشگران محاسبهای انجام دادند، با شکاف حیرتانگیزی مواجه شدند: اگر انسانها با همان سرعتی که مدلهای زبانی مانند ChatGPT زبان یاد میگرفتند، یادگیری زبان برایشان ۹۲٬۰۰۰ سال طول میکشید.
این اختلاف چشمگیر، معمایی دیرینه را برجسته میکند. کودکان تنها با چند سال تجربهی روزمره، گفتار و دستور زبان را بهخوبی فرا میگیرند، در حالی که هوش مصنوعی پیشرفته با میلیاردها کلمه آموزش میبیند اما هنوز در درک ظرایف ابتدایی زبان دچار مشکل است.
تحقیقی جدید از مؤسسه ماکس پلانک در روانزبانشناسی، اکنون جامعترین توضیح را برای این تفاوت ارائه کرده است.
مزیت پنهان یادگیری کودکان
یادگیری به کمک تعامل، نه فقط داده
تحقیقی به رهبری روانشناس رشد، کارولین رولند و همکارانش در مرکز LuCiD انگلستان، نشان میدهد که مزیت اصلی کودکان، نه در مقدار دادهای است که دریافت میکنند، بلکه در شیوهای است که با این دادهها تعامل برقرار میکنند.
کودکان از یک سیستم یادگیری فعال، مجسم، و عمیقاً اجتماعی بهره میبرند که میتواند الگویی برای نسل بعدی هوش مصنوعی نیز باشد.
کودکان چگونه الهامبخش پژوهش میشوند؟
در دهه گذشته ابزارهای متعددی توسعه یافتهاند – مانند ردیابهای چشمی نصبشده روی سر، میکروفونهای پوشیدنی و تحلیلگرهای صحنه با بینایی ماشینی – که به دانشمندان اجازه میدهند لحظهبهلحظه دنیای کودکان را ثبت کنند.
امروزه، مجموعه دادههای متداول شامل تمام چیزهایی است که یک کودک دو ساله در یک بعدازظهر عادی میبیند، میشنود، لمس میکند یا بر زبان میآورد.
اما آنطور که رولند و همکارانش استدلال میکنند، آنچه تا کنون مفقود بوده، نظریهای یکپارچه دربارهی چگونگی ترجمهی این جریانهای چندحسی به واژگان و دستور زبان است.
چگونه حواس بر گفتار تأثیر میگذارند؟
اصل نخست: ادغام چندحسی
برخلاف چتباتهایی که فقط متون را پردازش میکنند، نوزادان زبان را در بستری غنی از تصاویر، صداها، مزهها، بوها و بافتها میآموزند.
برای مثال، یک قاشق موز لهشده با رنگ، بو، شکل، دما و برچسب زبانی ارائهشده توسط مراقب همراه است.
با گذشت زمان، این سرنخهای همزمان و مرتبط، به نوزادان در رمزگشایی از زبان کمک میکند – کاری که یک یادگیرنده صرفاً متنی را گیج میکند.
بدنهای فعال، ذهنهای پویا
اصل دوم: تجسم (Embodiment)
بدن کودکان دائماً در حال حرکت است – غلت زدن، خزیدن، اشاره کردن، گذاشتن اشیا در دهان.
هر حرکت، جریان دادههای ورودی را تغییر میدهد و ارتباطات تازهای میان واژهها و تجربههای فیزیکی ایجاد میکند؛ مانند تداعی واژهی «فنجان» با حس لبهی پلاستیکی.
این نوع فعالیتهای «حلقه بسته» به کودکان اجازه میدهد فرضیههایشان را همانجا امتحان کنند و حرکت را به بخشی از فرایند یادگیری تبدیل کنند.
نقش مهم اجتماع در یادگیری زبان
اصل سوم: غوطهوری اجتماعی
مراقبان بهطور غریزی گفتار خود را با توجه به واکنش کودک تغییر میدهند؛ واژهها را تکرار میکنند، لحن را اغراقآمیز میسازند یا موضوع را تغییر میدهند.
در حالی که سیستمهای هوش مصنوعی از پایگاههای دادهای ثابت میآموزند، کودکان برنامه آموزشی پویا، شخصیسازیشده و طراحیشده توسط ذهنهای انسانی دریافت میکنند – ذهنهایی که طی میلیونها سال برای آموزش تکامل یافتهاند.
کنجکاوی، سوخت یادگیری کودکان
اصل چهارم: انعطافپذیری افزایشی
مغز کودک بسیار منعطف است، به سرعت سازماندهی میشود و اتصالات عصبی را بر اساس تجربه تقویت یا حذف میکند.
این ویژگی به کودکان اجازه میدهد تا بهتدریج اولویتهای یادگیری خود را تغییر دهند – ابتدا صداها، سپس واژگان و در نهایت دستور زبان – بیآنکه نیاز باشد دانستههای قبلی را کنار بگذارند.
اصل پنجم: انگیزه و کنجکاوی
شاید مهمترین نکته این باشد که کودکان واقعاً میخواهند جهان اطراف خود را درک کنند. آنها فعالانه دنبال چیزهای جدید میگردند، برای فهم موضوعات سؤال میپرسند و هنگام موفقیت، شادی و اشتیاق نشان میدهند. این پویایی، یادگیری زبان را برای ساعتها بدون آموزش مستقیم ممکن میسازد.
به گفته رولند:
«سیستمهای هوش مصنوعی دادهها را پردازش میکنند… اما کودکان واقعاً آن را زندگی میکنند. یادگیری آنها مجسم، تعاملی و در زمینهای عمیقاً اجتماعی و حسی ریشهدار است.»
کودکان چه چیزی به هوش مصنوعی میآموزند؟
نویسندگان این پژوهش معتقدند این بینشها میتوانند استراتژی طراحی مدلهای یادگیری ماشین را متحول کنند. در حال حاضر، مدلهای زبانی بزرگ صرفاً ترابایتهایی از متن نوشتاری را پردازش میکنند – در حالی که کودکان تا سن مدرسه بهندرت با متون نوشتاری مواجه میشوند.
برای کاهش شکاف عملکردی، مهندسان ممکن است به رباتهایی با ورودیهای چندحسی، قابلیت حرکت و بازخورد اجتماعی در لحظه نیاز داشته باشند – بهعبارتی، یک «کودکی شبیهسازیشده» برای یادگیرندههای سیلیکونی.
رولند میگوید:
«پژوهشگران هوش مصنوعی میتوانند چیزهای زیادی از نوزادان یاد بگیرند. اگر میخواهیم ماشینها زبان را بهخوبی انسانها یاد بگیرند، شاید لازم باشد طراحی آنها را از ابتدا بازنگری کنیم.»
کمک به شکوفایی دوباره زبانها
فراتر از فناوری، این چارچوب میتواند بر یادگیری زبان دوم در بزرگسالان، زبانشناسی تکاملی و شیوههای آموزشی نیز تأثیر بگذارد.
برای مثال، نتایج پژوهش نشان میدهد کلاسهای تعاملی و غوطهورانه احتمالاً بهتر از روشهای حفظی و تکراری عمل میکنند، و اینکه زبانهای در معرض خطر را میتوان با بازسازی کامل زمینههای حسی برای کودکان احیا کرد.
نوزادان شبیهسازیشده در آزمایشگاه
گروه تحقیقاتی رولند در حال آزمایش این مدل با استفاده از دادههای طولی از خانوادههای چندزبانه است. در همین حال، دانشمندان علوم اعصاب شناختی نیز قصد دارند با تصویربرداری مغزی، چگونگی شکلگیری مدارهای زبانی از طریق حلقههای حسی–حرکتی را بررسی کنند.
در جبهه هوش مصنوعی نیز، چندین آزمایشگاه روی عوامل مجسم (embodied agents) کار میکنند که در محیطهای مجازی مانند مهدکودک حرکت میکنند، اشیاء را دستکاری میکنند و کلمات را با تجربه مرتبط میسازند.
اینکه آیا این «نوزادان مصنوعی» میتوانند فاصله ۹۲٬۰۰۰ ساله را جبران کنند یا نه، هنوز مشخص نیست. اما آنچه مسلم است اینکه کوچکترین زبانآموزان بشر هنوز رازهایی را در اختیار دارند که حتی بزرگترین شبکههای عصبی هنوز نتوانستهاند آن را کشف کنند.
منبع: این مطالعه در مجله Trends in Cognitive Sciences منتشر شده است.
source