شیائومی بهعنوان نقطه عطفی در توسعه اکوسیستم هوشمند خود و جامعه پژوهشی، رسماً مدل بزرگمقیاس MiMo-Embodied خود را که متنباز است منتشر کرد. با افزایش هوش تجسمیافته در خانه و پذیرش گستردهتر رانندگی خودران، شیائومی اکنون قصد دارد بر چالشی دیرینه غلبه کند: توسعه قابلیتهای شناختی و سازگاری بین رباتهای داخلی و وسایل نقلیه خارجی. شیائومی با استفاده از MiMo-Embodied، مدل بنیادی یکپارچهای معرفی کرده که قابلیتهای رانندگی خودران، هوش تجسمیافته و هوش مصنوعی عمومی را در یک چارچوب واحد پیش میبرد.
چه چیزی MiMo-Embodied را مهم میکند؟
به گفته شیائومی، MiMo-Embodied اولین مدل بنیادی تجسمیافته در صنعت است که شکاف بین رانندگی خودران و هوش تجسمیافته را پر میکند. این مدل، تفسیر وظایف، ادراک و تصمیمگیری را در هر دو سناریوی خانگی و حملونقل تلفیق کرده و پایه علمی محکمی برای سیستمهای هوش مصنوعی آینده در حوزههای مختلف ایجاد میکند. این اقدام، گسترش جاهطلبیهای شیائومی فراتر از الکترونیک مصرفی به سمت رباتیک پیشرفته و اتوماسیون بزرگمقیاس را نشان میدهد.
مشخصات فنی مدل جدید
مدل MiMo-Embodied طراحی معماری خرید بک لینک عمیقی دارد تا از شناخت چندسناریویی پشتیبانی کند. این مدل بر هماهنگی وظایف تجسمیافته، شامل استدلال فضایی و برنامهریزی کارها تمرکز دارد. این رویکرد یکپارچه، شیائومی را قادر میسازد از هوش عمودی تخصصی به سمت همکاری هوشمند مقیاسپذیر و میانحوزهای حرکت کند.
سه ویژگی کلیدی این فناوری
پوشش قابلیتهای گسترده میانحوزهای
این مدل بهطور همزمان از سه وظیفه حیاتی در حوزه هوش تجسمیافته، شامل استدلال امکانات، برنامهریزی وظایف و درک فضایی، و سه وظیفه اصلی رانندگی خودران، شامل ادراک محیط، پیشبینی وضعیت و برنامهریزی رانندگی پشتیبانی میکند. این قابلیتها در کنار هم، هوش کامل را در محیطهای خانگی، رباتیک داخلی و ترافیک واقعی ایجاد میکنند.

هوش تعاملی دوطرفه
شیائومی تأکید کرده که MiMo-Embodied امکان انتقال دانش بین رباتیک داخلی و رانندگی خودران را فراهم میکند. در آزمایش سیستم نشان داده شد که بهبود مهارتهای تصمیمگیری در رباتهای خانگی میتواند عملکرد رانندگی در جاده را ارتقا دهد و بالعکس. این تقویت دوطرفه، چارچوب جدیدی برای سیستمهای هوشمند یکپارچه ایجاد میکند.
بهینهسازی کامل زنجیرهای برای استقرار در دنیای واقعی
برای اطمینان از قابلیت اطمینان در استقرار، شیائومی مسیر آموزشی چندمرحلهای طراحی کرده است که شامل یادگیری قابلیتها، بهبود استنتاج زنجیره تفکر (Chain-of-Thought – CoT) و تنظیم دقیق با یادگیری تقویتی (RL) است. این رویکرد، استحکام مدل در محیطهای واقعی را افزایش میدهد و آن را برای سناریوهای پیچیده و پویا مناسب میسازد.
عملکرد در ۲۹ بنچمارک
شیائومی ادعا میکند MiMo-Embodied در ۲۹ بنچمارک حیاتی از مدلهای متنباز، غیرمتنباز و اختصاصی پیشتاز بوده است.
نتایج هوش تجسمیافته
مدل در ۱۷ معیار به عملکرد پیشرفته دست یافته و مهارتهای استثنایی در برنامهریزی وظایف، درک فضایی و پیشبینی امکانات نشان داده است.
نتایج رانندگی خودران
MiMo-Embodied در ۱۲ معیار، از ادراک گرفته تا پیشبینی وضعیت و برنامهریزی رانندگی، عملکرد برتر داشته و استاندارد جدیدی برای هوش رانندگی چندمرحلهای تعیین کرده است.
درک عمومی تصویر-زبان
مدل همچنین توانایی تعمیم پیشرفته در وظایف تصویر-زبان را نشان داده و انعطافپذیری آن را در حوزههای گستردهتر هوش مصنوعی تأیید میکند.
شیائومی مدل را بهطور کامل در اختیار توسعهدهندگان و پژوهشگران قرار داده است. مدل و کدهای MiMo-Embodied توسط شیائومی متنباز شدهاند، که تعهد این شرکت به پژوهش شفاف و همکاری جمعی را تقویت میکند. توسعهدهندگان میتوانند مدل را بررسی، تطبیق و توسعه دهند. با معرفی MiMo-Embodied، شیائومی قصد دارد نوآوری در حوزه رباتیک هوشمند، حملونقل هوشمند و اکوسیستمهای متصل را سرعت بخشد.