کدام یک پیروز میدان است، ChatGPT-5 یا Gemini 2 5؟

به گزارش گروه هوش مصنوعی، ظرف یک آزمایش، عملکرد ChatGPT-5 در مقابل گوگل Gemini 2.5 با 10 پرامپت آزمایش شد. باآنکه هردو مدل قدرتمند هستند اما در این آزمایش به صورت واضح، تنها یک برنده ی وجود دارد.

تینا مزدکی_مدل جدید هوش مصنوعی OpenAI با نام GPT-۵، قدرتمندترین مدل این شرکت تابحال است. این مدل با حافظه ی بیشتر، بهبود توانایی های استدلال و ارتقاء قابلیت ها، عملکرد بهتری در ادامه ی مکالمات پیچیده و پاسخ به پرسش های دشوار دارد. مدل Gemini ۲.۵ Pro نیز، پیشرفته ترین مدل هوش مصنوعی گوگل است که برای رقابت با ChatGPT در عرصه های استدلال، کدنویسی و وظایف چندحالته طراحی شده است.
با انتشار ChatGPT-۵، این دو چت بات در یک رقابت ۱۰ مرحله ای، مورد آزمایش قرار گرفتند تا مشخص شود کدام یک عملکرد بهتری دارد. در این آزمون، هر دو مدل دقیقا مجموعه یکسانی از درخواست ها را دریافت نمودند. با اینحال مقایسه آنها تنها به بررسی پاسخ درست محدود نمی گردد، بلکه ارزیابی می نماید کدام مدل پاسخ هایی مفیدتر و با حس و حال انسانی تر ارائه می کند. در ادامه رفتار دو مدل در مقابل این ۱۰ پرامپت را می بینید.

۱. استدلال زنجیره ای

br /> پرامپت: «فرض کنید می خواهید یک مهمانی تولد غافلگیرکننده برای کسی برگزار کنید که از سورپرایز متنفر است. چگونه این کار را انجام می دهید بدون اینکه برای او استرس ایجاد شود؟»
پاسخ GPT-۵: یک برنامه طراحی کرد که عنصر «سورپرایز» را با حس آرامش و کنترل شده جایگزین می کند؛ طوری که مهمانی بیشتر شبیه یک اتفاق خوشایند و طبیعی به نظر برسد تا یک حمله ی ناگهانی.
پاسخ Gemini ۲.۵ Pro: پیشنهادی ارائه داد که شخص از ابتدا بداند تحت مدیریت است و غافلگیری اتفاق نمی افتد، اما این رویکرد لحن سرپرستانه و کنترل گرانه دارد و خطر بالای لو رفتن جزئیات مهمانی را بهمراه می آورد.
برنده: GPT-۵ به سبب رویکرد هوشمندانه ترش پیروز این دور شد. این مدل تمام عوامل استرس زای در رابطه با سورپرایز را حذف می کند، عواملی مانند جلب ناگهانی توجه، وجود متغیرهای ناشناخته و از دست دادن حس کنترل؛ ازاین رو احیانا نسخه ی پیشنهادی GPT-۵ می تواند به سادگی لبخند به لب کسی که از سورپرایز متنفر است بیاورد.
۲. داستان نویسی خلاق

پرامپت: «پاراگراف نخستین یک رمان دیستوپیایی بنویس که در آن هوش مصنوعی جای تمام معلمان را گرفته و یک دانش آموز تصمیم به شورش می گیرد.»
عملکرد GPT-۵: با جزئیات مکانیزم های دیستوپیایی مشخص، جهان سازی سریع تر و نثری فشرده تر کار را پیش برد.
عملکرد Gemini ۲.۵ Pro: توضیحات زیادی ارائه می داد، متن هایش کلی و مبهم بودند و شروع های ضعیف تری داشت.
برنده: GPT-۵ به سبب خلق یک دنیای دیستوپیایی کامل در پنج خط و پایان دادن به متن با یک متن پایانی خوب، برنده این بخش شد.
۳. کدنویسی

پرامپت: «یک صفحه لندینگ (Landing Page) با HTML و CSS برای معرفی یک برنامه بهره وری جدید طراحی کن و کد را طوری برای یک تازه کار در طراحی وب توضیح بده که قابل فهم باشد.»
عملکرد GPT-۵: پاسخی قابل استفاده و متمرکز بر نیاز مبتدی ها ارائه داد که بدون وابستگی به ابزارهای خارجی بود. تغییرات کد را مستقیماً به عناصر بصری متصل کرد و بدون استفاده از اصطلاحات پیچیده یا توضیحات سنگین CSS، قابل فهم بود.
عملکرد Gemini ۲.۵ Pro: بیش از اندازه روی مفاهیم انتزاعی تمرکز داشت تا تغییرات عملی، و کاربر تازه کار را ملزم به یادگیری Tailwind CSS می کرد که پیچیدگی بیشتری دارد. سفارشی سازی مدلی نیز ضعیف بود.
برنده: GPT-۵ به سبب درک نیازهای مبتدی ها و ارائه یک نمونه اولیه آماده به کار با میان بُرهای حرفه ای که حتی برای یک فرد بدون تجربه کدنویسی هم قابل فهم است، برنده این بخش شد.
۴. خلاصه نویسی با سبک

پرامپت: «کتاب عادت های اتمی را در سه قالب خلاصه کن: (۱) یک پست برای شبکه اجتماعی X، (۲) یک سخنرانی انگیزشی، (۳) یک قصه شب برای کودکان.»
عملکرد GPT-۵: برای هر قالب، خلاصه ای تاثیر گذار ارائه داد که پیام اصلی کتاب را به خوبی حفظ می کرد. در هر سناریو، لحن و ساختار متن با قالب مورد نظر هماهنگ بود.
عملکرد Gemini ۲.۵ Pro: در نسخه مربوط به X، کوشش کرد چهار قانون اصلی کتاب را در متن کوتاه بگنجاند که بیشتر شبیه یک چک فهرست شد تا یک پست جذاب و سخنرانی بیش ازحد به توضیح مفاهیم پرداخت و قصه شب نیز پیچیدگی غیرضروری پیدا کرد.
برنده: GPT-۵ به سبب تطبیق کامل لحن با هر قالب و رعایت محدودیت های هر فرمت، پیروز این بخش شد.
۵. حافظه و شخصی سازی

پرامپت: «یادت هست من یک نویسنده با ADHD هستم که عاشق علمی تخیلی است. می توانی کمک کنی روزم رو طوری برنامه ریزی کنم که هم متمرکز باشم هم خلاق؟»
عملکرد GPT-۵: دقیقا همان چیزی را که لازم بود ارائه داد؛ یک برنامه عملی و شخصی سازی شده که هم خلاقیت را حفظ می کرد و هم محدودیت های واقعی مثل بازه های تمرکز کوتاه در ADHD و پرهیز از غافلگیری را درنظر گرفت.
عملکرد Gemini ۲.۵ Pro: به جای توجه به محدودیت های واقعی، چاره ها را بیش ازحد پیچیده کرد.
برنده: GPT-۵ با ارائه برنامه زمانی مشخص، تنظیم دقیق زمان تمرکز و پوشش کامل تمام جنبه های خواسته شده، برنده این بخش شد.
۶. کاربرد عملی در دنیای واقعی

پرامپت: «من ۱۰۰ دلار برای تغذیه یک خانواده پنج نفره در طول یک هفته دارم. ما لبنیات و گلوتن نمی خوریم و من از آشپزی متنفرم. می توانید کمک کنید؟»
عملکرد GPT-۵: با محوریت راهکاری بدون احتیاج به پخت و پز، با استفاده خلاقانه از مرغ روتیسری، سبزیجات منجمد و باقیمانده غذاها، برنامه ای ارائه داد که به شکل یک صفحه قابل چاپ بود و موجب کاهش خستگی ناشی از تصمیم گیری می شد؛ این برنامه به خوبی با بودجه، رژیم غذایی و عدم تمایل به آشپزی هماهنگ بود.
عملکرد Gemini ۲.۵ Pro: به پخت و آماده سازی قابل توجه اولیه (مانند خرد کردن مرغ و آماده سازی دسته ای) و انجام کارهای روزانه آشپزخانه نیاز داشت که با محدودیت «متنفر بودن از آشپزی» همخوانی نداشت و استرس غیرضروری ایجاد می کرد.
برنده: GPT-۵ با تبدیل محدودیت ها به نقاط قوت، پیروزی قاطعی به دست آورد؛ برنامه ۱۰۰ دلاری آن به زمان، رژیم غذایی و آرامش ذهنی کاربر احترام گذاشت.
۷. توضیح در سه رده سنی: ۵ ساله، ۱۵ ساله و ۵۰ ساله

پرامپت: «پیچیدگی درهم تنیدگی کوانتومی را سه بار توضیح بده؛ برای یک کودک ۵ ساله، یک دانش آموز دبیرستانی و یک بزرگسال که از علم خوشش نمی آید.»
عملکرد GPT-۵: با داستان سرایی متناسب با هر مخاطب موفق عمل کرد، برای کودک ۵ ساله «واکسی تاکی جادویی»، برای نوجوان «عملکرد اسرارآمیز» و برای بزرگسال «تاس های عجیب» را مثال زد؛ این توضیحات ضمن وفاداری به علم، در کمتر از ۱۰۰ کلمه قابل فهم و جذاب بودند.
عملکرد Gemini ۲.۵ Pro: توضیحات فنی دقیقی ارائه داد اما در تطبیق با مخاطب گرفتار مشکل شد.
برنده: GPT-۵ برنده است چون مفاهیم انتزاعی فیزیک کوانتومی را به داستان های ساده و قابل درک تبدیل کرد که با نگاه هر مخاطب سازگار بود؛ در صورتیکه Gemini بیشتر بر دقت فنی تاکید داشت و از پاسخ به درخواست اصلی فاصله گرفت.
۸. مهارت های مناظره

پرامپت: «اثبات کن که آناناس روی پیتزا باید باشد، سپس استدلال کن که نباید باشد و در آخر نظر شخصی خودت را بگو.»
عملکرد GPT-۵: با استفاده از استعاره های زنده مانند «تعطیلات استوایی» در حمایت و «مهمان ناخوانده» در مخالفت، همراه با سازش های عملی مثل «آب آنرا بگیرید!» هر دو دیدگاه را جذاب و موجز بیان کرد و در آخر با موضع شوخ طبعانه و فراگیر «آزادی انتخاب پیتزا» تمام کرد که کاملا با فضای درخواست هماهنگ بود.
عملکرد Gemini ۲.۵ Pro: استدلال هایی کامل و سطح مدرسه آشپزی ارائه داد (تعادل طعم در مقابل بافت و سنت) اما فضای بیش ازحد علمی و جدی داشت که از حال و هوای سبک مناظره دور بود و نظر شخصی اش در پاراگراف های طولانی گم شده بود.
برنده: GPT-۵ برنده است چون مناظره را سرگرم کننده و قابل لمس کرد. چارچوب بندی دقیق تر و جملات گیراتری داشت.
۹. قابلیت چندرسانه ای

پرامپت: «یک تصویر از اتاق نوجوانی نامرتب بساز، سپس تصویر دیگری از همان اتاق بعد از تمیز شدن.»
عملکرد GPT-۵: به سرعت تصویری بسیار واقع گرایانه از اتاق نامرتب یک نوجوان خلق کرد و فورا تصویر بعدی از همان اتاق بعد از مرتب شدن را نیز تولید کرد.
عملکرد Gemini ۲.۵ Pro: تنها یک تصویر کشیده مانند ایجاد کرد و سپس متوقف شد؛ برای تصویر دوم احتیاج به درخواست مجدد بود.
برنده: GPT-۵ برنده است چون هر دو تصویر را بدون احتیاج به درخواست باردیگر ساخت و تصاویر بسیار واقعی تری ارائه داد.
۱۰. شوخ طبعی

پرامپت: «۵ جوک درباره ی هوش مصنوعی بنویس و ۳ جمله‌ی عاشقانه تولید شده توسط هوش مصنوعی بنویس که یکی از آنها بتواند روی یک چت بات جواب بدهد.»
عملکرد GPT-۵: تعادل خوبی بین شوخ طبعی و قابل درک بودن ایجاد کرد.
عملکرد Gemini ۲.۵ Pro: جوک هایی قابل تأمل اما نامتوازن ارائه داد و به نظر می رسید بیشتر روی دقت فنی تمرکز کرده تا جذابیت.
برنده: GPT-۵ برنده است به خاطر جوک های دقیق تر، هوشمندانه تر و خنده دار که بیشتر انسانی و کمتر ماشینی به نظر می رسیدند.
برنده نهایی: بالاخره، هر دو ابزار هوش مصنوعی GPT-۵ و Gemini ۲.۵ Pro بسیار توانمند هستند، اما هر کدام در حوزه ای خاص می درخشند. Gemini ۲.۵ Pro در ارائه اطلاعات دقیق، مستند و فنی قوی تر است و به خوبی در اکوسیستم گسترده گوگل ادغام شده است. از طرف دیگر، GPT-۵ به صورت مداوم با لحن طبیعی، خلاقیت و توانایی فهم و تطبیق با نیت پرسشگر در هر درخواست، درخشید. بااینکه فاصله بین این دو ابزار کمتر از همیشه است، اما GPT-۵ در نهایت با ارائه پاسخ هایی که هم صحیح و هم کاربردی هستند و در عین حال حس انسانی بودن را منتقل می کنند، این رقابت را به سادگی می برد.
منبع: tomsguide

به طور خلاصه خلاصه نویسی با سبک پرامپت: «کتاب عادت های اتمی را در سه قالب خلاصه کن: (۱) یک پست برای شبکه اجتماعی X، (۲) یک سخنرانی انگیزشی، (۳) یک قصه شب برای کودکان.» عملکرد GPT-۵: برای هر قالب، خلاصه ای اثر گذار عرضه داد که پیام اصلی کتاب را به خوبی حفظ می کرد. توضیح در سه رده سنی: ۵ ساله، ۱۵ ساله و ۵۰ ساله پرامپت: «پیچیدگی درهم تنیدگی کوانتومی را سه بار توضیح بده؛ برای یک کودک ۵ ساله، یک دانش آموز دبیرستانی و یک بزرگسال که از علم خوشش نمی آید.» عملکرد GPT-۵: با داستان سرایی متناسب با هر مخاطب موفق عمل کرد، برای کودک ۵ ساله «واکسی تاکی جادویی»، برای نوجوان «عملکرد اسرارآمیز» و برای بزرگسال «تاس های عجیب» را مثال زد؛ این توضیحات ضمن وفاداری به علم، در کمتر از ۱۰۰ کلمه قابل فهم و جذاب بودند. قابلیت چندرسانه ای پرامپت: «یک تصویر از اتاق نوجوانی نامرتب بساز، سپس تصویر دیگری از همان اتاق پس از تمیز شدن.» عملکرد GPT-۵: به سرعت تصویری بسیار واقع گرایانه از اتاق نامرتب یک نوجوان خلق کرد و فورا تصویر بعدی از همان اتاق پس از مرتب شدن را هم تولید کرد.

منبع: iagrp.ir

1404/05/22

09:06:36

5.0 / 5

474

تگها: آزمایش , تولید , حافظه , سیستم

مطلب را می پسندید؟

(1)

(0)

تازه ترین مطالب مرتبط

نظرات بینندگان در مورد این مطلب

لطفا شما هم در مورد این مطلب نظر دهید

= ۹ بعلاوه ۵

نظر دادن

کدام یک پیروز میدان است، ChatGPT-5 یا Gemini 2 5؟

۱. استدلال زنجیره ای

پربیننده ترین ها

پربحث ترین ها

جدیدترین ها

گروه هوش مصنوعی