در توان پردازش خام، یک مدل زبانی بزرگ از نظر محاسباتی می‌تواند کودکان نوپا را پشت سر بگذارد. اما وقتی تیمی از پژوهشگران محاسبه‌ای انجام دادند، با شکاف حیرت‌انگیزی مواجه شدند: اگر انسان‌ها با همان سرعتی که مدل‌های زبانی مانند ChatGPT زبان یاد می‌گرفتند، یادگیری زبان برایشان ۹۲٬۰۰۰ سال طول می‌کشید.

این اختلاف چشمگیر، معمایی دیرینه را برجسته می‌کند. کودکان تنها با چند سال تجربه‌ی روزمره، گفتار و دستور زبان را به‌خوبی فرا می‌گیرند، در حالی که هوش مصنوعی پیشرفته با میلیاردها کلمه آموزش می‌بیند اما هنوز در درک ظرایف ابتدایی زبان دچار مشکل است.

تحقیقی جدید از مؤسسه ماکس پلانک در روان‌زبان‌شناسی، اکنون جامع‌ترین توضیح را برای این تفاوت ارائه کرده است.

‌مزیت پنهان یادگیری کودکان

یادگیری به کمک تعامل، نه فقط داده

تحقیقی به رهبری روان‌شناس رشد، کارولین رولند و همکارانش در مرکز LuCiD انگلستان، نشان می‌دهد که مزیت اصلی کودکان، نه در مقدار داده‌ای است که دریافت می‌کنند، بلکه در شیوه‌ای است که با این داده‌ها تعامل برقرار می‌کنند.

کودکان از یک سیستم یادگیری فعال، مجسم، و عمیقاً اجتماعی بهره می‌برند که می‌تواند الگویی برای نسل بعدی هوش مصنوعی نیز باشد.

‌کودکان چگونه الهام‌بخش پژوهش می‌شوند؟

در دهه گذشته ابزارهای متعددی توسعه یافته‌اند – مانند ردیاب‌های چشمی نصب‌شده روی سر، میکروفون‌های پوشیدنی و تحلیل‌گرهای صحنه با بینایی ماشینی – که به دانشمندان اجازه می‌دهند لحظه‌به‌لحظه دنیای کودکان را ثبت کنند.

امروزه، مجموعه داده‌های متداول شامل تمام چیزهایی است که یک کودک دو ساله در یک بعدازظهر عادی می‌بیند، می‌شنود، لمس می‌کند یا بر زبان می‌آورد.

اما آن‌طور که رولند و همکارانش استدلال می‌کنند، آنچه تا کنون مفقود بوده، نظریه‌ای یکپارچه درباره‌ی چگونگی ترجمه‌ی این جریان‌های چندحسی به واژگان و دستور زبان است.

‌چگونه حواس بر گفتار تأثیر می‌گذارند؟

اصل نخست: ادغام چندحسی

برخلاف چت‌بات‌هایی که فقط متون را پردازش می‌کنند، نوزادان زبان را در بستری غنی از تصاویر، صداها، مزه‌ها، بوها و بافت‌ها می‌آموزند.

برای مثال، یک قاشق موز له‌شده با رنگ، بو، شکل، دما و برچسب زبانی ارائه‌شده توسط مراقب همراه است.

با گذشت زمان، این سرنخ‌های هم‌زمان و مرتبط، به نوزادان در رمزگشایی از زبان کمک می‌کند – کاری که یک یادگیرنده صرفاً متنی را گیج می‌کند.

‌بدن‌های فعال، ذهن‌های پویا

اصل دوم: تجسم (Embodiment)

بدن کودکان دائماً در حال حرکت است – غلت زدن، خزیدن، اشاره کردن، گذاشتن اشیا در دهان.

هر حرکت، جریان داده‌های ورودی را تغییر می‌دهد و ارتباطات تازه‌ای میان واژه‌ها و تجربه‌های فیزیکی ایجاد می‌کند؛ مانند تداعی واژه‌ی «فنجان» با حس لبه‌ی پلاستیکی.

این نوع فعالیت‌های «حلقه بسته» به کودکان اجازه می‌دهد فرضیه‌هایشان را همان‌جا امتحان کنند و حرکت را به بخشی از فرایند یادگیری تبدیل کنند.

‌نقش مهم اجتماع در یادگیری زبان

اصل سوم: غوطه‌وری اجتماعی

مراقبان به‌طور غریزی گفتار خود را با توجه به واکنش کودک تغییر می‌دهند؛ واژه‌ها را تکرار می‌کنند، لحن را اغراق‌آمیز می‌سازند یا موضوع را تغییر می‌دهند.

در حالی که سیستم‌های هوش مصنوعی از پایگاه‌های داده‌ای ثابت می‌آموزند، کودکان برنامه آموزشی پویا، شخصی‌سازی‌شده و طراحی‌شده توسط ذهن‌های انسانی دریافت می‌کنند – ذهن‌هایی که طی میلیون‌ها سال برای آموزش تکامل یافته‌اند.

‌کنجکاوی، سوخت یادگیری کودکان

اصل چهارم: انعطاف‌پذیری افزایشی

مغز کودک بسیار منعطف است، به سرعت سازمان‌دهی می‌شود و اتصالات عصبی را بر اساس تجربه تقویت یا حذف می‌کند.

این ویژگی به کودکان اجازه می‌دهد تا به‌تدریج اولویت‌های یادگیری خود را تغییر دهند – ابتدا صداها، سپس واژگان و در نهایت دستور زبان – بی‌آنکه نیاز باشد دانسته‌های قبلی را کنار بگذارند.

اصل پنجم: انگیزه و کنجکاوی

شاید مهم‌ترین نکته این باشد که کودکان واقعاً می‌خواهند جهان اطراف خود را درک کنند. آن‌ها فعالانه دنبال چیزهای جدید می‌گردند، برای فهم موضوعات سؤال می‌پرسند و هنگام موفقیت، شادی و اشتیاق نشان می‌دهند. این پویایی، یادگیری زبان را برای ساعت‌ها بدون آموزش مستقیم ممکن می‌سازد.

به گفته رولند:
«سیستم‌های هوش مصنوعی داده‌ها را پردازش می‌کنند… اما کودکان واقعاً آن را زندگی می‌کنند. یادگیری آن‌ها مجسم، تعاملی و در زمینه‌ای عمیقاً اجتماعی و حسی ریشه‌دار است.»

‌کودکان چه چیزی به هوش مصنوعی می‌آموزند؟

نویسندگان این پژوهش معتقدند این بینش‌ها می‌توانند استراتژی طراحی مدل‌های یادگیری ماشین را متحول کنند. در حال حاضر، مدل‌های زبانی بزرگ صرفاً ترابایت‌هایی از متن نوشتاری را پردازش می‌کنند – در حالی که کودکان تا سن مدرسه به‌ندرت با متون نوشتاری مواجه می‌شوند.

برای کاهش شکاف عملکردی، مهندسان ممکن است به ربات‌هایی با ورودی‌های چندحسی، قابلیت حرکت و بازخورد اجتماعی در لحظه نیاز داشته باشند – به‌عبارتی، یک «کودکی شبیه‌سازی‌شده» برای یادگیرنده‌های سیلیکونی.

رولند می‌گوید:
«پژوهشگران هوش مصنوعی می‌توانند چیزهای زیادی از نوزادان یاد بگیرند. اگر می‌خواهیم ماشین‌ها زبان را به‌خوبی انسان‌ها یاد بگیرند، شاید لازم باشد طراحی آن‌ها را از ابتدا بازنگری کنیم.»

‌کمک به شکوفایی دوباره زبان‌ها

فراتر از فناوری، این چارچوب می‌تواند بر یادگیری زبان دوم در بزرگسالان، زبان‌شناسی تکاملی و شیوه‌های آموزشی نیز تأثیر بگذارد.

برای مثال، نتایج پژوهش نشان می‌دهد کلاس‌های تعاملی و غوطه‌ورانه احتمالاً بهتر از روش‌های حفظی و تکراری عمل می‌کنند، و اینکه زبان‌های در معرض خطر را می‌توان با بازسازی کامل زمینه‌های حسی برای کودکان احیا کرد.

‌نوزادان شبیه‌سازی‌شده در آزمایشگاه

گروه تحقیقاتی رولند در حال آزمایش این مدل با استفاده از داده‌های طولی از خانواده‌های چندزبانه است. در همین حال، دانشمندان علوم اعصاب شناختی نیز قصد دارند با تصویربرداری مغزی، چگونگی شکل‌گیری مدارهای زبانی از طریق حلقه‌های حسی–حرکتی را بررسی کنند.

در جبهه هوش مصنوعی نیز، چندین آزمایشگاه روی عوامل مجسم (embodied agents) کار می‌کنند که در محیط‌های مجازی مانند مهدکودک حرکت می‌کنند، اشیاء را دست‌کاری می‌کنند و کلمات را با تجربه مرتبط می‌سازند.

اینکه آیا این «نوزادان مصنوعی» می‌توانند فاصله ۹۲٬۰۰۰ ساله را جبران کنند یا نه، هنوز مشخص نیست. اما آنچه مسلم است این‌که کوچک‌ترین زبان‌آموزان بشر هنوز رازهایی را در اختیار دارند که حتی بزرگ‌ترین شبکه‌های عصبی هنوز نتوانسته‌اند آن را کشف کنند.

منبع: این مطالعه در مجله Trends in Cognitive Sciences منتشر شده است.

source

توسط expressjs.ir