استفاده از هوش مصنوعی

B هوشهای مصنوعی مدل زبانی
«مدلهای زبانی بزرگ»[1]، نوعی از هوش مصنوعی هستند که بر پایه مدلهای یادگیری ماشین روی حجم انبوهی از دادههای متنی (نظیر کتابها، روزنامهها، مقالات علمی، سایتها و …) آموزش دیدهاند. این گونه هوشهای مصنوعی بر پایه الگوهای زبانی که از روی دادههای مرحله آموزش برای خود ساختهاند، قادر میشوند کلمه بعدی مناسب در هر جمله را از حیث لحن و دستور زبان پیشبینی و انتخاب کرده و از این طریق متنهای شبیه به زبان انسانی تولید کنند. از این رو به آنها «هوش مصنوعی مولد»[2] نیز گفته میشود.
این نوع هوشهای مصنوعی در هر زمینهای که مرتبط با پردازش زبان و متن باشد کاربرد دارند. برای مثال سامانههای تشخیص گفتار و تبدیل صوت به متن و بالعکس از مدلهای زبانی بزرگ استفاده میکنند. همچنین استفاده از این مدلها این قابلیت را دارد که به جای ترجمه کلمه به کلمه، ترجمه به صورت مفهومی و با انتخاب بهترین واژه متناسب با موضوع متن و کلمات قبل و بعد آن صورت گیرد.
کاربرد دیگر هوشهای مدل زبانی، توسعه ابزارهایی است که بتوانند متنهایی نظیر نظرات و پستهای کاربران در شبکههای اجتماعی را پردازش و تحلیل مفهومی کنند. یعنی مثلاً متوجه شوند یک محتوا توسط انسان نوشته شده یا ربات آن را تولید کرده است، علیه یک شخص یا موضوع است یا به نفع آن؟، احساس نویسنده آن درباره موضوع چیست و … .
این ابزارها به صورت گسترده در گزارشهای افکارسنجی و دادهکاوی عواطف و احساسات کاربران درباره موضوعات مختلف سیاسی و فرهنگی مورد استفاده قرار میگیرد.

شکل 43: سامانه «تشخیص موضع متن» شرکت مِتُدیتا[3]
اما یکی از استفادههای پرسروصدای هوشهای مصنوعی مدل زبانی در سالهای اخیر، عمومی شدن «چتبات»[4] مبتنی بر آن است که امکان تولید پاسخ لحظهای و خودکار به سؤالات کاربران و گفتگو با آنها را دارد. شرکتهای مختلفی در حال توسعه چتباتهای خود هستند اما دو نمونه بسیار مطرح آن «چتجیپیتی»[5] از شرکت «اوپن اِی آی»[6] و «جمینای»[7] متعلق به شرکت «گوگل» هستند.[8]
C جمینای
شرکت گوگل نیز در سال 1403/2023 چتبات «جمینای» را – که ابتدا «بارد»[9] نامیده میشد – عرضه کرد. این چتبات مبتنی بر مدل زبانی «لامدا»[10] گوگل با حدود ۲ میلیارد پارامتر توسعه یافته است. نسخه حرفهای این ابزار نیز پولی است اما نسخه رایگان آن از طریق حساب کاربری گوگل قابل استفاده عموم افراد است.[11]

شکل 44: تصویر چتبات جمینای شرکت گوگل[12]
C چتجیپیتی
چتجیپیتی در سال 1401/۲۰۲۲ به صورت عمومی عرضه شد[13] و از پایگاه دادهای با ۱.۷۶ تریلیون پارامتر استفاده میکند. این ابزار در نسخه ۴ خود، به صورت اشتراکی و پولی عرضه میشود. اما نسخه 3.5 آن به صورت رایگان قابل استفاده عموم است.

شکل 45: تصویر محیط چتبات کوپیلوت در مرورگر ادج شرکت مایکروسافت که قابلیت انتخاب سبک مکالمه (خلاقانه، متعادل یا دقیق) را نیز دارد.[14]
B هوشهای مصنوعی پردازش تصویر
پردازش و تحلیل تصاویر نیز یکی از کاربردیترین استفادهها از هوش مصنوعی است. برای مثال توانایی برچسبگذاری محتوای تصویر، شناسایی چهره، تشخیص اشیا داخل تصویر، مشخص کردن سن، جنسیت و حالت عاطفی افراد داخل عکس از جمله این قابلیتهاست که میتواند در زمینههای مختلفی مورد استفاده قرار گیرد.

شکل 46: ابزار تشخیص سن و جنسیت تصویر شرکت آیپا[15]
اما یکی دیگر از انواع هوشهای مصنوعی مولد و کاربردی که در سالهای اخیر توجهات بسیاری را به خود جلب کرده است، ابزارهای تولید تصویر از متن هستند. این گونه از هوشهای مصنوعی نیز عمدتاً بر پایه روشهای یادگیری ماشین، ابتدا حجم زیادی از تصاویر، عکسها و نقاشیها را به عنوان داده ورودی دریافت کردهاند و پس از دستهبندی و برچسبزنی آنها، متناسب با متن که کاربر توصیف کرده است، تصویر مورد درخواست وی را از ترکیب دادههای ورودی با هم تولید میکنند. از نمونه سامانههای ارائهدهنده این خدمات میتوان به موارد زیر اشاره کرد:
C دالئی
«دالئی»[16] محصول شرکت «اوپناِیآی» است که در سال 1399/2021 به عنوان نسل جدیدی از سیستمهای تبدیل متن به تصویر با قابلیتها و ویژگیهای پیشرفته عرضه شد. این ابزار در کنار نسخه حرفهای پولی، به صورت رایگان از طریق موتور جستجوی «بینگ»[17] در مرورگر «ادج» شرکت مایکروسافت نیز قابل استفاده است.[18]

شکل 47: نمونه عکس تولید شده توسط سرویس هوش مصنوعی «دالئی» در موتور جستجوی بینگ[19] برای عبارت «یک مرد در حال تدریس سواد رسانهای در حرم امام رضا»
C میدجرنی
هوش مصنوعی مولد تصویر «میدجرنی»[20] محصول شرکتی به همین نام است که در سال ۱۴۰۰/۲۰۲۱ عرضه عمومی شد. این سرویس البته نسخه رایگان را ندارد، اما نسخه پولی آن قابلیتهای ویژهای دارد که به کمک آن میتوان نقاشیهایی با سبکهای مختلف هنری، یا عکسهایی با کیفیت دوربینهای مختلف عکاسی، و همچنین تصاویری از یک کاراکتر ثابت در حالتهای مختلف تولید کرد که میتواند برای تصویرگری کتاب بسیار کاربردی باشد.[21]

شکل 48: تصاویر مشاهیر ایرانی که یک کاربر به کمک هوش مصنوعی «میدجرنی» آنها را بازسازی کرده است.[22]
[1] Large Language Model (LLM)
[2] Generative artificial intelligence
[3] https://b2n.ir/cogc-metodata
[4] Chatbot
[5] ChatGPT
[6] OpenAi
[7] Gemini
[8]توجه: با توجه به تغییر و تحولات سریع فناوریهای هوش مصنوعی، قابلیتهای معرفی شده از ابزارهای مربوط به آن در صفحات بعدی ممکن است به مرور زمان دچار تفاوت شده باشند.
[9] Bard
[10] LaMDA
[11] به دلیل محدودیتهای تحریمی، استفاده از این ابزار برای کاربران ایرانی از طریق ابزارهای تحریمشکن نظیر 403.online شدنی است.
[12] کادر قرمز داخل تصویر: در آغاز مکالمه هشدار میدهد که مکالمات ممکن است توسط اپراتورهای انسانی مورد بازبینی قرار گیرد و نوشتن مطالبی که تمایل ندارید توسط دیگران دانسته شوند خودداری نمایید.
[13] https://chat.openai.com
[14] https://copilot.microsoft.com
[15] https://aipaa.ir/demo/face-analysis
[16] Dall-E
[17] Bing
[18] تمام تصاویر اول مداخل این دانشنامه به کمک این ابزار تولید شدهاند.
[19] https://bing.com/create
[20] Midjourney
[21] https://www.midjourney.com/home
[22] https://vrgl.ir/9Qt7A