قابلیتهای جدید سرویس OpenAI آژور مایکروسافت؛ تبدیل گفتار به کد برنامهنویسی، خلاصهبرداری و تولید متن
اواخر سال گذشته، مایکروسافت از راهاندازی سرویس Azure OpenAI بهعنوان یک محصول کاملاً مدیریتشده و متمرکز بر سازمانها خبر داد که بهگونهای طراحی شده تا دسترسی کسبوکارها به آزمایشگاه هوش مصنوعی OpenAI را با امکان کنترل بیشتر فراهم کند. در ابتدا این سرویس فقط ازطریق دریافت دعوتنامه بهعنوان بخشی از سرویسهای Azure Cognitive دردسترس قرار داشت و امکان بهکارگیری اپلیکیشنهایی نظیر ترجمه و تکمیلکنندهی خودکار متن با استفاده از API سرویس OpenAI در پلتفرم آژور را فراهم میکرد.
حالا، همزمان با رویداد بیلد ۲۰۲۲ مایکروسافت و تجدید نیروی اوپنایآی با انواع نوآوریها، مایکروسافت خبر از توسعهی بیشتر سرویس اوپنایآی آژور میدهد. این سرویس هنوز در حالت پیشنمایش دسترسی محدود بهسر میبرد و بدین ترتیب مصرفکنندگانی که قصد استفاده از آن را دارند باید برای دسترسی به آن مبلغی پرداخت کنند. پیش از این کاربران برای بهرهمندی از سرویس اوپنایآی فقط باید از کاربرانی که دسترسی داشتند، دعوتنامه دریافت میکردند.
اریک بوید، معاون بخش هوش مصنوعی در مایکروسافت در مصاحبه با تککرانچ گفت:
ما قصد داریم شرایط را فراهم کنیم تا کاربران از مرحلهی آزمایشی به مرحله اجرایی این فناوری بهعنوان یکی از بخشهای کلیدی کسبوکارشان دست پیدا کنند.
مدلهای بهینهشده یادگیری ماشینی
مدلها در دنیای آژور مایکروسافت به نتایج بهدستآمده در فرایند یادگیری ماشینی گفته میشوند؛ بنابراین، مدیریت و بهینهسازی آنها بهصورت مستقیم روی نتایج بهکارگیری هوش مصنوعی اثر میگذارد. اکنون، مدلهایی که پشتوانهی سرویس اوپنایآی آژور هستند، مثل GPT-3، توانایی شخصیسازی برای اجرای فرایندهای ترجمه زبان طبیعی به کدنویسی و تولید پاسخ برای سؤالات را دارند.
مقالهی مرتبط:مایکروسافت مجوز انحصاری مدل زبانی GPT-3 را از OpenAI دریافت کرد
مدل GPT-3 از میانهی سال ۲۰۲۰ میلادی (۱۳۹۹ شمسی) ازطریق API اوپنایآی دردسترس قرار گرفت. اما، سرویس اوپنایآی آژور لایههای متناسب با شرکتها را روی مدلهایی اضافه میکند که API آنها را ندارد؛ درنتیجه، این لایهها شامل افزایش ظرفیت مقیاسپذیری، شبکهسازی خصوصی و مدیریت دسترسی میشود.
برای مثال، شرکتها میتوانند با کمک سرویس اوپنایآی آژور مدلهای یادگیری ماشینی را به دلایل انطباق بهتر یا مدیریت مرکزی اندپوینتهای API در محدوده جغرافیایی مشخصی راهاندازی کنند و کلیدهای رمزنگاری تأمینشده توسط کاربر را مورد استفاده قرار دهند. سرویس هوش مصنوعی آژور ظاهراً با اختصاص قبض مجزا برای استفاده از هر مدل، تسویهحساب را برای مشتریان فعلی خود راحتتر میکند.
با وجود اینکه پیش از این مشتریان میتوانستند با استفاده از دادههای خود بهعنوان نمونه، تاحدی تنظیمات دقیقی روی مدلهای اوپنایآی آژور اعمال کنند؛ آقای بوید میگوید مایکروسافت قصد توسعهی بیشتر تنظیمات را دارد. وی ادامه داد:
ما در تلاش هستیم که آرایهی کاملی از مدلها [از اوپنایآی گرفته تا سایر مدلها] آماده کنیم تا شرکتها مجبور نباشند برای دستیابی به بهترین نتایج همهچیز را از صفر شروع کنند.
بهینهسازیها به لطف InstructGPT محقق شده است که عضوی از خانواده مدلهای برپایه GPT-3 بهشمار میرود. این مدل توسعه دادهشده توسط اوپنایآی احتمال تولید متنهای خطادار را به کمترین حالت ممکن میرساند و بیشترین هماهنگی را با نیاز کاربر خواهد داشت. با در نظر گرفتن شیوهی توسعهی سیستمهای هوش مصنوعی، نسخههای پیشین مدلهای توسعهیافته توسط OpenAI، متنهای نامناسب و خطاداری تولید میکردند و برای مثال کلمهای مثل تروریسم را در کنار خاورمیانه قرار میدادند. البته، با اینکه مدل InstructGPT هنوز کامل نیست؛ نتیاج کارآزمایی عملکرد آن در آزمایشگاه اوپنایآی بهاندازهای قانعکننده بوده است که شرکت آن را بهعنوان مدل پیشفرض API برای تولید متون قرار دهد.
مجموعهی جدید دیگری از مدلهای سرویس هوش مصنوعی آژور با نام Embedding Models نیز معرفی شدند که ظاهراً عملکرد خوبی در تشخیص شباهت متون، جستوجوی متون و کدنویسی از خود بهنمایش گذاشتند. شباهت متون یا بهعبارتی Text Similarity فرایندی است که در طی آن هوش مصنوعی میزان شباهت لغوی و معنایی انواع متون را ارزیابی میکند و در جستوجوی متون و کدها اطلاعاتی را براساس معیارهای خاصی درون فایلها پیدا خواهد کرد.
مقالهی مرتبط:سرویس توسعه متن OpenAI برای عرضه تجاری آماده میشود
بوید گفت که یکی از مشتریان سرویس هوش مصنوعی آژور با نام CarMax از مدلهای آژور برای دستهبندی و خلاصهنویسی بررسیهای خودروها در کسبوکار خود استفاده کرده است. خلاصههای بهدستآمده موضوعات محبوب دربارهی بعضی خودروها را مشخص میکند و به سؤالات مشخص پاسخهای معتبر میدهد.
علاوهبراین، شرکت تعاونی تأمین منابع روستایی مستقر در نیوزلند با نام Farmlands با کمک سرویس اوپنایآی ژور نوع تعامل مشتریان خود را ارزیابی و خلاصهبرداری کرده و آنها را در سه دستهی «خنثی»، «منفی» و «مثبت» قرار داده است. از سوی دیگر، شرکت Farmlands در حال آزمایش ربات چت و توضیحات محصول تولیدشده توسط هوش مصنوعی است که هردو آنها توسط اوپنایآی آژور برای فروشگاه اینترنتی فارملندز پشتیبانی میشوند.
سرویس OpenAI آژور مایکروسافت گذشته از ارائهی مدلهای دقیق و جدید اکنون قابلیتی تحت عنوان Codex نیز دراختیار مشتریان خود میگذارد که با کمک آن میتوان خط زبان طبیعی را به کد برنامهنویسی تبدیل کرد. سرویس Codex در تابستان سال ۲۰۲۱ میلادی (۱۴۰۰ شمسی) در API اوپنایآی راهاندازی شد.
سرویس Codex آژور را میتوان در برخی عملهای برنامهنویسی نظیر Transpilation که به موجب آن برنامهنویس قادر است یک کد از یک زبان را به زبان هم سطح دیگری تبدیل کند، استفاده کرد یا آن را برای توضیح کد و بازساخت کد (Code Refactoring) در زبانهای فراگیر مثل پایتون، جاوا اسکریپت، گو، پرل، پیاچپی، روبی، سوئیفت و تایپاسکریپت بهکار گرفت.
بوید ادعا میکند که شاهد نمونههایی بوده است که در آن مشتریان سرویس Codex بهصورت مستقیم با API ماینکرفت صحبت میکنند.
دیگر قابلیت ارائهشده توسط سرویس OpenAI آژور سیستمی است که وظیفه دارد محتوای مستهجن، دارای خشونت، نفرت پراکنی و خودآزاری را فیلتر کند. این سیستم برای شناسایی الگوهای سوءاستفاده و آسیب توسط کاربر یک مدل تلاش میکند و زمانی که موردی پیدا کند، یک تیم اختصاصی از مایکروسافت درخواست میکند تا در همکاری با مشتری خود سوءاستفاده را ردیابی و مسدود کنند. این تیم همچنین، وظیفهی بهروزرسانی فیلترهای محتوا را براساس توهینها و نفرت پراکنیهای جدید، بهعهده خواهد داشت.
براساس گفتههای یکی از سخنگویان مایکروسافت به تککرانچ، سیستم جدید Responsible AI در سرویس اوپنایآی آژور شامل پالایش خودکار محتوا میشود تا محتوای باکیفیتتری به مشتریان ارائه کند. این سیستم در APIهایی که تولید محتوای مضر اهمیت بالایی دارد بهصورت پیشفرض فعال است و کاربر نمیتواند آن را غیرفعال کند. فرایند پالایش محتوای این سیستم با بخش استانداردهای محتوایی مایکروسافت هماهنگی دارد و محتواهای مستهجن، حاوی خشونت، نفرتپراکنی و خودآزاری را مسدود میکند. هرکدام از این فیلترها براساس مدل یادگیری ماشینی مشخصی مدیریت میشود که بهصورت اختصاصی توسعه یافته است.
از سوی دیگر، برای کمک به اطمینان از بهکارگیری سرویس OpenAI Azure برای هدف مورد نظر، سیستم Responsile AI همچنین تولید محتوایی را که حامل اطلاعات نادرست باشد، تشخیص میدهد. این فیلترها براساس اطلاعات Bing Threat Intelligence توسعه یافتند و هشدارهای بهدستآمده برای تحقیقات به تیمی از بازرسان انسانی ارسال میشود.
دسترسی محدود به هوش مصنوعی
براساس گفتهی آقای بوید، سرویس اوپنایآی بازخورد خوبی از خود نشان داده و درحالحاضر ۵۰۰ شرکت از خدمات آن استفاده میکنند؛ اما، در پاسخ به پرسشی دربارهی گسترش دسترسی این سرویس در سطح عمومی تأکید کرد دسترسی اوپنایآی همچنان بهصورت محدود خواهد ماند.
فقط شرکتهایی که اثبات میکنند از مدلها به شیوهای قابل اعتماد و صحیح کمک میگیرند امکان ثبتنام برای استفاده از سرویس را خواهند داشت؛ بنابراین، لازم است طرح پیشنهادی دقیق و جزئی را تشریح و ارائه کنند. مایکروسافت درحال گردآوری دستورالعملهای رابط کاربری، الگوها و تبصره شفافیت برای توضیح محدودیتهای سرویس و اهداف مدنظر و خصوصیات سرویس OpenAI آژور است.
سخنگوی مایکروسافت در این باره گفت:
راهنمای طراحی ما برپایهی HAX Toolkit است؛ اما طوری بهینه شده که برای اپلیکیشنهای مولد هوش مصنوعی راهنمای دقیقتری ارائه کند. همچنین، تبصره شفافیت برای سرویس OpenAI بهزودی منتشر خواهد شد. این تبصره نیز مانند سایر تبصرههای منتشرشده برای سرویسهای Azure Cognitive خواهد بود. تبصرههای شفافیت بخشی از تلاش مضاعف مایکروسافت برای به کار بستن اصول تأییدشدهی استفاده از هوش مصنوعی بهشمار میرود.
مقالهی مرتبط:مایکروسافت آژور چیست و چه قابلیتهایی داردمایکروسافت دو ابزار تحلیلی جدید برپایه پلتفرم آژور منتشر کرد
با نگاه به آینده آقای بوید گفت که مایکروسافت فعالیتهای خود را با هدف توسعه و کشف راههایی برای تجاریسازی فناوریهای آزمایشگاه با اوپنایآی ادامه خواهد داد. مایکروسافت با سرمایهگذاری یک میلیارد دلاری در آزمایشگاه OpenAI در سال ۲۰۲۰ میلادی (۱۳۹۹ شمسی) و مالکیت انحصاری GPT-3، ارتباط خود را با آزمایشگاه نزدیک کرد. علاوهبراین، مایکروسافت یک ابر کامپیوتر هوش مصنوعی در آژور راهاندازی کرد که آزمایشگاه OpenAI از آن برای تبیین مدلهای خود استفاده کرد.
شرکت مایکروسافت همچنین، با ادغام GPT-3 و Codex در چند سرویس خود مثل Power Apps و Copilot قابلیتهای جذابی را دراختیار برنامهنویسان قرار داد.
دیدگاه شما کاربران دربارهی امکان برنامهنویسی با گفتار چیست؟
در جریان رویداد بیلد ۲۰۲۲، مایکروسافت ویژگیهای جدید سرویس Azure Open AI شامل تبدیل گفتار به کد برنامهنویسی، خلاصهبرداری و تولید متن را معرفی کرد.