اعتماد کردن به آنچه در اینترنت واقعی است یا نیست، سخت‌تر از همیشه شده است. با فراگیر شدن هوش مصنوعی، مرز میان صدای واقعی و مصنوعی هم کم‌کم کم‌رنگ‌تر شده است. خوشبختانه نشانه‌هایی مشخص وجود دارد که می‌توانند همه چیز را برایتان روشن کنند. در ادامه به مواردی می‌پردازیم که به شما کمک می‌کنند تا صدای تولید شده توسط هوش مصنوعی را تشخیص بدهید.

۶. نبود وقفه‌های طبیعی در گفتار

در برخی موارد، نداشتن مکث‌های طبیعی در صدا می‌تواند نشان دهد که با یک محتوای صوتی یا تصویری تولید شده توسط هوش مصنوعی روبه‌رو هستید. مدل‌های جدیدتر و پیشرفته‌تر معمولاً این مشکل را ندارند، اما نسخه‌های اولیه یا ارزان‌تر هوش مصنوعی در این زمینه ضعیف‌تر عمل می‌کنند.

مثلاً در پادکست‌هایی که با هوش مصنوعی تولید شده‌اند، صداها گرچه شبیه انسان به نظر می‌رسند و حتی صدای تنفس هم دارند، اما هیچ‌کدام از گوینده‌ها در جای مناسب مکث نمی‌کنند. حتی گاهی جمله‌ها ناتمام باقی می‌مانند و گوینده دیگر صحبت را ادامه می‌دهد.

البته، نبود وقفه طبیعی ممکن است حاصل ویرایش بد فایل صوتی باشد، اما در بسیاری موارد مربوط به مدل‌های قدیمی‌تر هوش مصنوعی است. اگر با محتوایی روبه‌رو شدید که در سال ۲۰۲۳ یا قبل‌تر منتشر شده، حتماً این نکته را در نظر داشته باشید.

۵. وجود ایرادات یا باگ‌های صوتی تصادفی

فناوری صوتی هوش مصنوعی پیشرفت زیادی کرده، اما هنوز بی‌نقص نیست. اگر با دقت گوش دهید، ممکن است متوجه ایراداتی مثل تغییرات ناگهانی در صدا یا تلفظ اشتباه شوید. این مسئله در محتوای چندزبانه بیشتر خود را نشان می‌دهد. برای مثال، در یک ویدیو تولیدشده با هوش مصنوعی، کلمه اسپانیایی «gracias» به‌درستی تلفظ نشده است. در سایر ویدیوها نیز اگر گوینده با لهجه‌ای غیر بومی صحبت کند، اشکالات آوایی بیشتری دیده می‌شود. در مدل‌های پیشرفته‌تر این نقص‌ها کمتر دیده می‌شوند، اما همچنان در ابزارهایی با توسعه کمتر، این باگ‌ها رایج‌اند.

۴. ناسازگاری در حالت پخش سریع

پخش محتوای صوتی با سرعتی بالاتر از حالت عادی، نه‌تنها به فهم سریع‌تر کمک می‌کند، بلکه می‌تواند به شما کمک کند تا بفهمید صدا واقعی است یا تولیدشده با هوش مصنوعی. اگر صدای تولیدشده با هوش مصنوعی را روی سرعت ۱.۲۵ یا بیشتر گوش دهید، معمولاً حالتی ربات ‌مانند پیدا می‌کند و حتی گاهی شبیه یک شوخی یا تقلید صوتی به نظر می‌رسد. این مسئله در موسیقی‌های تولیدشده با هوش مصنوعی نیز دیده می‌شود. حتی اگر صدای تولیدشده دقیقاً شبیه خودتان باشد، باز هم نمی‌تواند به اندازه صدای واقعی‌تان طبیعی و متنوع باشد.

۳. نبود صدای نفس کشیدن

علاوه بر فقدان وقفه‌های طبیعی، یکی دیگر از نشانه‌های احتمالی صدای مصنوعی، نبود صدای تنفس است؛ به‌ویژه در پادکست‌ها یا ویدیوها. حتی اگر فایل صوتی خیلی حرفه‌ای ویرایش شده باشد، اگر واقعاً صدای انسانی باشد، احتمالاً صدای نفس‌کشیدن‌ها هم شنیده می‌شود. در مقابل، در صدای تولیدشده با هوش مصنوعی، نه صدای نفس کشیدن شنیده می‌شود و نه مثلاً صدای آه کشیدن یا تردید هنگام صحبت.

با وجود پیشرفت هوش مصنوعی در تقلید تعاملات انسانی، هنوز هم این صداها بی‌روح به نظر می‌رسند. اگر برای مدتی طولانی به محتوای صوتی تولید شده با هوش مصنوعی گوش دهید، این مسئله بیشتر برایتان ملموس می‌شود. این یکی از دلایلی است که باعث شده پادکست‌های هوش مصنوعی بحث‌برانگیز باشند و احتمالاً تا مدت‌ها همین‌طور باقی بمانند.

۲. صدای بیش از حد احساسی

در حالی که هوش مصنوعی حالا می‌تواند صداهایی شبیه انسان تولید کند، هنوز در بازنمایی طیف وسیع احساسات انسانی چندان موفق نیست. انتقاد رایج این بوده که صداهای هوش مصنوعی اغلب ربات‌وار هستند، اما گاهی عکس این قضیه هم صادق است.

در بسیاری از موارد، صداها بیش از حد احساسی‌اند، مثلاً میزان هیجان در گفتار به‌قدری اغراق‌آمیز است که حالت غیرطبیعی پیدا می‌کند. حتی وقتی داستان ساده‌ای تعریف می‌شود، گوینده طوری آن را با شور و اشتیاق بیان می‌کند که حتی یک انسان پرشور هم آن‌طور حرف نمی‌زند. اگر احساس کردید که صدای فردی واقعی به نظر نمی‌رسد، احتمال دارد یا گوینده صداقت ندارد، یا صدا توسط هوش مصنوعی تولید شده است.

۱. حس درونی‌تان می‌گوید که صدا مصنوعی است

حس درونی ما در طول زمان برای نجات بقای انسان تکامل یافته و گرچه در دنیای امروز گفته می‌شود نباید فقط به حس درونی تکیه کرد، اما معمولاً همین حس درست می‌گوید. اگر چند بار به یک صدا گوش کردید و تردید دارید که واقعی است یا نه، احتمال زیادی دارد که احساستان درست باشد. هرچه بیشتر با محتوای تولید شده با هوش مصنوعی مواجه شوید، مثلاً یک هفته فقط موسیقی هوش مصنوعی گوش کنید، بیشتر با این تفاوت‌ها آشنا می‌شوید و شهودتان قوی‌تر می‌شود.

سخن پایانی

تشخیص صدای هوش مصنوعی کار دشواری است، اما روش‌هایی برای شناسایی آن وجود دارد: مقایسه با گفتار طبیعی انسان‌ها، بررسی ایرادات صوتی یا توجه به حس درونی. گاهی وقت‌ها بهترین راه‌حل، اعتماد به همان حس درونی است.

منبع makeuseof

source

توسط expressjs.ir