«مدلهای زبانی بزرگ»[1]، نوعی از هوش مصنوعی هستند که بر پایه مدلهای یادگیری ماشین روی حجم انبوهی از دادههای متنی (نظیر کتابها، روزنامهها، مقالات علمی، سایتها و …) آموزش دیدهاند. این گونه هوشهای مصنوعی بر پایه الگوهای زبانی که از روی دادههای مرحله آموزش برای خود ساختهاند، قادر میشوند کلمه بعدی مناسب در هر جمله را از حیث لحن و دستور زبان پیشبینی و انتخاب کرده و از این طریق متنهای شبیه به زبان انسانی تولید کنند. از اینرو به آنها «هوش مصنوعی مولد»[2] نیز گفته میشود.
این نوع هوشهای مصنوعی در هر زمینهای که مرتبط با پردازش زبان و متن باشد کاربرد دارند. برای مثال سامانههای تشخیص گفتار و تبدیل صوت به متن و بالعکس از مدلهای زبانی بزرگ استفاده میکنند. همچنین استفاده از این مدلها این قابلیت را دارد که به جای ترجمه کلمه به کلمه، ترجمه به صورت مفهومی و با انتخاب بهترین واژه متناسب با موضوع متن و کلمات قبل و بعد آن صورت گیرد.
کاربرد دیگر هوشهای مدل زبانی، پردازش و تحلیل مفهومی متنها نظیر نظرات و پستهای کاربران در شبکههای اجتماعی به منظور افکارسنجی و دادهکاوی عواطف و احساسات کاربران درباره موضوعات مختلف سیاسی و فرهنگی است.
اما یکی از استفادههای پرسروصدای هوشهای مصنوعی مدل زبانی در سالهای اخیر، عمومی شدن «چتبات»[4] مبتنی بر آن است که امکان تولید پاسخ لحظهای و خودکار به سوالات کاربران و گفتگو با آنها را دارد. شرکتهای مختلفی در حال توسعه چتباتهای خود هستند اما دو نمونه بسیار مطرح آن «چتجیپیتی»[5] از شرکت «اوپن اِی آی»[6] و «جمینای»[7] متعلق به شرکت «گوگل» هستند.
چتجیپیتی در سال 1401/۲۰۲۲ به صورت عمومی عرضه شد[8] و از پایگاه دادهای با ۱.۷۶ تریلیون پارامتر استفاده میکند. این ابزار در نسخه ۴ خود، به صورت اشتراکی و پولی عرضه میشود. اما نسخه 3.5 آن به صورت رایگان از طریق دستیار «کوپیلوت»[9] مرورگر «ادج»[10] شرکت مایکروسافت قابل استفاده عموم است.
شرکت گوگل نیز در سال 1403/2023 چتبات «جمینای» را – که ابتدا «بارد»[12] نامیده میشد – عرضه کرد. این چتبات مبتنی بر مدل زبانی «لامدا»[13] گوگل با حدود ۲ میلیارد پارامتر توسعه یافته است. نسخه حرفهای این ابزار نیز پولی است اما نسخه رایگان آن از طریق حساب کاربری گوگل قابل استفاده عموم افراد است.
پردازش و تحلیل تصاویر نیز یکی از کاربردیترین استفادهها از هوش مصنوعی است. برای مثال توانایی برچسبگذاری محتوای تصویر، شناسایی چهره، تشخیص اشیاء داخل تصویر، مشخص کردن سن، جنسیت و حالت عاطفی افراد داخل عکس از جمله این قابلیتهاست که میتواند در زمینههای مختلفی مورد استفاده قرار گیرد.
اما یکی دیگر از انواع هوشهای مصنوعی مولد و کاربردی که در سالهای اخیر توجهات بسیاری را به خود جلب کرده است، ابزارهای تولید تصویر از متن هستند. این گونه از هوشهای مصنوعی نیز عمدتاً بر پایه روشهای یادگیری ماشین، ابتدا حجم زیادی از تصاویر، عکسها و نقاشیها را به عنوان داده ورودی دریافت کردهاند و پس از دستهبندی و برچسبزنی آنها، متناسب با متن که کاربر توصیف کرده است، تصویر مورد درخواست وی را از ترکیب دادههای ورودی با هم تولید میکنند. از نمونه سامانههای ارائهدهنده این خدمات میتوان به موارد زیر اشاره کرد:
«دالئی»[15] محصول شرکت «اوپناِیآی» است که در سال 1399/2021 به عنوان نسل جدیدی از سیستمهای تبدیل متن به تصویر با قابلیتها و ویژگیهای پیشرفته عرضه شد. این ابزار در کنار نسخه حرفهای پولی، به صورت رایگان از طریق موتور جستجوی «بینگ»[16] در مرورگر «ادج» شرکت مایکروسافت نیز قابل استفاده است.[17]
هوش مصنوعی مولد تصویر «میدجرنی»[19] محصول شرکتی به همین نام است که در سال ۱۴۰۰/۲۰۲۱ عرضه عمومی شد. این سرویس البته نسخه رایگان را ندارد، اما نسخه پولی آن قابلیتهای ویژهای دارد که به کمک آن میتوان نقاشیهایی با سبکهای مختلف هنری، یا عکسهایی با کیفیت دوربینهای مختلف عکاسی، و همچنین تصاویری از یک کارکتر ثابت در حالتهای مختلف تولید کرد که میتواند برای تصویرگری کتاب بسیار کاربردی باشد.[20]
[1] Large Language Model (LLM)
[2] Generative artificial intelligence
[3] https://cogc.ir/سامانه-تشخیص-موضع-کاربران-در-شبکه-های-ا
[4] Chatbot
[5] ChatGPT
[6] OpenAi
[7] Gemini
[8] https://chat.openai.com
[9] Copilot
[10] Edge
[11] https://copilot.microsoft.com
[12] Bard
[13] LaMDA
[14] https://aipaa.ir/demo/face-analysis
[15] Dall-E
[16] Bing
[17] تمام تصاویر اول مداخل این دانشنامه به کمک این ابزار تولید شدهاند.
[18] https://bing.com/create
[19] Midjourney
[20] https://www.midjourney.com/home
[21] https://vrgl.ir/9Qt7A