شیائومی از هوش مصنوعی جدید خود برای ربات‌ها و خودروهای خودران رونمایی کرد

شیائومی به‌عنوان نقطه عطفی در توسعه اکوسیستم هوشمند خود و جامعه پژوهشی، رسماً مدل بزرگ‌مقیاس MiMo-Embodied خود را که متن‌باز است منتشر کرد. با افزایش هوش تجسم‌یافته در خانه و پذیرش گسترده‌تر رانندگی خودران، شیائومی اکنون قصد دارد بر چالشی دیرینه غلبه کند: توسعه قابلیت‌های شناختی و سازگاری بین ربات‌های داخلی و وسایل نقلیه خارجی. شیائومی با استفاده از MiMo-Embodied، مدل بنیادی یکپارچه‌ای معرفی کرده که قابلیت‌های رانندگی خودران، هوش تجسم‌یافته و هوش مصنوعی عمومی را در یک چارچوب واحد پیش می‌برد.

چه چیزی MiMo-Embodied را مهم می‌کند؟

به گفته‌ شیائومی، MiMo-Embodied اولین مدل بنیادی تجسم‌یافته در صنعت است که شکاف بین رانندگی خودران و هوش تجسم‌یافته را پر می‌کند. این مدل، تفسیر وظایف، ادراک و تصمیم‌گیری را در هر دو سناریوی خانگی و حمل‌ونقل تلفیق کرده و پایه علمی محکمی برای سیستم‌های هوش مصنوعی آینده در حوزه‌های مختلف ایجاد می‌کند. این اقدام، گسترش جاه‌طلبی‌های شیائومی فراتر از الکترونیک مصرفی به سمت رباتیک پیشرفته و اتوماسیون بزرگ‌مقیاس را نشان می‌دهد.

مشخصات فنی مدل جدید

مدل MiMo-Embodied طراحی معماری خرید بک لینک عمیقی دارد تا از شناخت چندسناریویی پشتیبانی کند. این مدل بر هماهنگی وظایف تجسم‌یافته، شامل استدلال فضایی و برنامه‌ریزی کارها تمرکز دارد. این رویکرد یکپارچه، شیائومی را قادر می‌سازد از هوش عمودی تخصصی به سمت همکاری هوشمند مقیاس‌پذیر و میان‌حوزه‌ای حرکت کند.

سه ویژگی کلیدی این فناوری

پوشش قابلیت‌های گسترده میان‌حوزه‌ای

این مدل به‌طور همزمان از سه وظیفه حیاتی در حوزه هوش تجسم‌یافته، شامل استدلال امکانات، برنامه‌ریزی وظایف و درک فضایی، و سه وظیفه اصلی رانندگی خودران، شامل ادراک محیط، پیش‌بینی وضعیت و برنامه‌ریزی رانندگی پشتیبانی می‌کند. این قابلیت‌ها در کنار هم، هوش کامل را در محیط‌های خانگی، رباتیک داخلی و ترافیک واقعی ایجاد می‌کنند.

شیائومی از هوش مصنوعی جدید خود برای ربات‌ها و خودروهای خودران رونمایی کرد

هوش تعاملی دوطرفه

شیائومی تأکید کرده که MiMo-Embodied امکان انتقال دانش بین رباتیک داخلی و رانندگی خودران را فراهم می‌کند. در آزمایش سیستم نشان داده شد که بهبود مهارت‌های تصمیم‌گیری در ربات‌های خانگی می‌تواند عملکرد رانندگی در جاده را ارتقا دهد و بالعکس. این تقویت دوطرفه، چارچوب جدیدی برای سیستم‌های هوشمند یکپارچه ایجاد می‌کند.

بهینه‌سازی کامل زنجیره‌ای برای استقرار در دنیای واقعی

برای اطمینان از قابلیت اطمینان در استقرار، شیائومی مسیر آموزشی چندمرحله‌ای طراحی کرده است که شامل یادگیری قابلیت‌ها، بهبود استنتاج زنجیره تفکر (Chain-of-Thought – CoT) و تنظیم دقیق با یادگیری تقویتی (RL) است. این رویکرد، استحکام مدل در محیط‌های واقعی را افزایش می‌دهد و آن را برای سناریوهای پیچیده و پویا مناسب می‌سازد.

عملکرد در ۲۹ بنچمارک

شیائومی ادعا می‌کند MiMo-Embodied در ۲۹ بنچمارک حیاتی از مدل‌های متن‌باز، غیرمتن‌باز و اختصاصی پیشتاز بوده است.

نتایج هوش تجسم‌یافته

مدل در ۱۷ معیار به عملکرد پیشرفته دست یافته و مهارت‌های استثنایی در برنامه‌ریزی وظایف، درک فضایی و پیش‌بینی امکانات نشان داده است.

نتایج رانندگی خودران

MiMo-Embodied در ۱۲ معیار، از ادراک گرفته تا پیش‌بینی وضعیت و برنامه‌ریزی رانندگی، عملکرد برتر داشته و استاندارد جدیدی برای هوش رانندگی چندمرحله‌ای تعیین کرده است.

درک عمومی تصویر-زبان

مدل همچنین توانایی تعمیم پیشرفته در وظایف تصویر-زبان را نشان داده و انعطاف‌پذیری آن را در حوزه‌های گسترده‌تر هوش مصنوعی تأیید می‌کند.

شیائومی مدل را به‌طور کامل در اختیار توسعه‌دهندگان و پژوهشگران قرار داده است. مدل و کدهای MiMo-Embodied توسط شیائومی متن‌باز شده‌اند، که تعهد این شرکت به پژوهش شفاف و همکاری جمعی را تقویت می‌کند. توسعه‌دهندگان می‌توانند مدل را بررسی، تطبیق و توسعه دهند. با معرفی MiMo-Embodied، شیائومی قصد دارد نوآوری در حوزه رباتیک هوشمند، حمل‌ونقل هوشمند و اکوسیستم‌های متصل را سرعت بخشد.