شرکت متا طی روز چهارشنبه از انتشار مدل مبتنی بر هوش مصنوعی خود بهنام Segment Anything Model (SAM) خبر داد. هوش مصنوعی SAM قادر به تشخیص هر نوع از اشیاء موجود در تصاویر و ویدیو است، حتی اگر در طول آموزش با آنها مواجه نشده باشد.
هوش مصنوعی SAM متا یک مدل تقسیمبندی تصویر است که میتواند به درخواستهای متنی یا کلیکهای کاربر برای جداسازی اشیاء خاص در یک تصویر پاسخ دهد. تقسیمبندی تصویر فرآیندی در بینایی کامپیوتری است که شامل تقسیم یک تصویر به بخشها یا مناطق متعدد است تا از این طریق هر شی در ناحیه مورد نظر قرار بگیرد. بهنقل از متا، این فناوری برای درک صفحه وب، برنامههای واقعیت افزوده، ویرایش تصویر و کمک به مطالعه علمی حیوانات یا اشیاء برای ردیابی در ویدیو مفید است.
متا امیدوار است با کاهش نیاز مدل خود به آموزش و یادگیری تخصصی، فرآیند ایجاد مدلهای تقسیمبندی دقیق را بهراحتی پیادهسازی کند. این امر امکان تحقیقات بیشتر در مورد بینایی کامپیوتری را فراهم خواهد کرد.
علاوه بر توسعه هوش مصنوعی SAM، متا مجموعه دادهای موسوم به “SA-۱B” را جمعآوری کرده که شامل ۱۱ میلیون تصویر دارای مجوز از یک شرکت بزرگ در حوزه عکس و ۱.۱ میلیارد ماسک تقسیمبندی شده توسط این مدل است. هوش مصنوعی سم و مجموعه دادههای آن برای اهداف تحقیقاتی تحت مجوز Apache ۲.۰ در دسترس خواهند بود.
ادغام هوش مصنوعی SAM با برنامههای متا
مارک زاکربرگ، مدیرعامل متا همچنین بر اهمیت ادغام این هوش مصنوعی مولد در برنامههای شرکت طی سال جاری تاکید کرد. اگرچه Meta هنوز محصولی تجاری با استفاده از این نوع هوش مصنوعی رونمایی نکرده است، اما پیشتر از فناوری مشابه هوش مصنوعی SAM در فیسبوک و اینستاگرام برای برچسبگذاری عکس، تعدیل محتوا و تعیین پستهای توصیه شده استفاده کرده است.
هوش مصنوعی سم بهدلیل توانایی خود در شناسایی اشیاء موجود در مجموعه دادههای آموزشی و رویکرد نیمهباز آن، یک مدل کاملا قابل توجه است. این نسخه از مدل SA-۱B میتواند مقدمهای برای ایجاد نسل جدید برنامههای بینایی کامپیوتری باشد و کارکردی شبیه به مدل زبان LLaMA متا را داشته باشد که هماکنون الهامبخش پروژههای فرعی است. رونمایی از این مدل در شرایطی رخ داده که رقابت بین شرکتهای بزرگ فناوری برای تسلط بر حوزه هوش مصنوعی بیش از هر زمان دیگری شدیدتر شده است.
۵۸۵۸