تُعدّ مجموعة نماذج Gemini متعددة الوسائط لأنّها قادرة على معالجة المعلومات من عدة وسائط، بما في ذلك الصور والفيديوهات والنصوص. يمكنك مثلاً أن ترسل إلى نموذج Gemini صورة لطبق من بسكويت وتطلب منه تحضير وصفة كعكات
طلب | الردّ |
أريد وصفة كعكة هذه. ![]() |
**المكوّنات** - 1 ج (إصبعان) زبدة غير مملحة ناعمة - 3/4 ملاعق صغيرة من السكر المحبَّب - 3/4 درجة من السكر البني، معبّأة - ملعقة صغيرة . مستخلص الفانيليا - بيضتان كبيرتان - 2 ملعقة طحين لجميع الأغراض - ملعقة صغيرة من صودا الخبز - ملعقة صغيرة من الملح ... |
يمكنك التفاعل مع مجموعة نماذج Gemini باستخدام Gemini API المقدَّم من Vertex AI على Google Cloud. بالنسبة إلى التطبيقات للأجهزة الجوّالة وتطبيقات الويب، يمكنك استخدام حِزم تطوير البرامج (SDK) من Vertex AI for Firebase لطلب بيانات من Gemini API والتفاعل مع نماذج Gemini مباشرةً من تطبيقك.
تقدّم هذه الصفحة المعلومات التالية عن نماذج Gemini:
مقارنة عالية المستوى لحالات الاستخدام لنماذج Gemini المختلفة، بما في ذلك أنواع الإدخال المتوافقة
مقارنة لتفاصيل كل نموذج، مثل الحد الأقصى للرموز المميزة للإدخال أو الحد الأقصى لمدة الفيديو.
وصف لطريقة إصدارات نماذج Gemini، وتحديدًا الإصدارات الثابتة والمحدّثة تلقائيًا والمعاينة
هي قوائم بأسماء الطُرز المتاحة لتضمينها في الترميز أثناء الإعداد.
قائمة اللغات المتاحة لنماذج Gemini
الطُرز المتاحة
يمكنك استخدام أي من نماذج Gemini التالية مع Vertex AI for Firebase:
Gemini 1.5 Flash
نموذج متعدد الوسائط يتوافق مع أنواع الإدخال والإخراج 1.5 Pro نفسها (بالإضافة إلى إجمالي عدد الرموز المميّزة)، لكنّ الإصدار 1.5 من Flash تم تصميمه خصيصًا للتطبيقات ذات الأحجام الكبيرة والمنخفضة التكلفة.Gemini 1.5 Pro
نموذج متعدد الوسائط يتيح إضافة ملفات صور وصوت وفيديو وملفات PDF في رسائل نصية أو رسائل نصية كردّ على الطلبات عبر رمز برمجي ويتيح ذلك أيضًا فهم المحتوى على المدى الطويل مع ما يصل إلى مليون رمز مميز.Gemini 1.0 Pro Vision
نموذج متعدد الوسائط مصمَّم للتعامل مع النصوص والصور والفيديوهات عند الردّ على نص أو رمز. لا يمكن استخدامها للمحادثة.Gemini 1.0 Pro
نموذج مصمَّم للتعامل مع مهام اللغة الطبيعية، وإجراء محادثات متعدّدة باستخدام النصوص والرموز، وإنشاء الرموز البرمجية.
الانتقال إلى أسماء الطُرز لتضمينها في الرمز الخاص بك
حالات الاستخدام والإمكانات لكل نموذج
لكل نموذج من نماذج Gemini إمكانات مختلفة لإتاحة حالات استخدام مختلفة. يمكنك الاطّلاع على المزيد من المعلومات في مستندات Google Cloud حول كل من نماذج Gemini.
إدخال وإخراج متوافقان لكل نموذج
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | |
---|---|---|---|---|
أنواع عمليات الإدخال | ||||
Text | ||||
الرمز | ||||
صورة | ||||
ملف PDF | ||||
فيديو (الإطارات فقط) | ||||
فيديو (الإطارات والصوت) | ||||
أجهزة الصوت | ||||
أنواع النتائج | ||||
Text | ||||
الرمز |
لمزيد من المعلومات حول أنواع الملفات المتوافقة، يُرجى الاطّلاع على المتطلبات وملفات الإدخال المتوافقة مع Vertex AI Gemini API.
الإمكانات المتوافقة والميزات العامة لكل نموذج
Gemini 1.5 Flash | Gemini 1.5 Pro | Gemini 1.0 Pro Vision | Gemini 1.0 Pro | ||
---|---|---|---|---|---|
إنشاء النص استنادًا إلى الطلبات النصية فقط | |||||
إنشاء النص استنادًا إلى الطلبات المتعدّدة الوسائط | |||||
ناتج JSON (وضع المخطط المحدود) (سيتوفّر قريبًا في حِزم تطوير البرامج (SDK) الخاصة بالذكاء الاصطناعي من Vertex AI for Firebase) |
|||||
محادثة متعدّدة الأدوار | |||||
استدعاء الدالة | |||||
استدعاء الدوال الأساسية | |||||
استدعاء الدوال المتوازية | |||||
وضع الاتصال عبر الوظائف | |||||
عدد الرموز المميّزة والأحرف القابلة للفوترة | |||||
تعليمات النظام |
معلومات تفصيلية حول كل نموذج
الموقع |
Gemini 1.5 Flash / Gemini 1.5 Pro |
Gemini 1.0 Pro Vision | Gemini 1.0 Pro |
---|---|---|---|
إجمالي الحد الأقصى للرموز المميّزة (الإدخالات والمخرجات المجمّعة) * | مليون رمز مميز | 16,384 رمزًا مميزًا | 32,760 رمزًا مميزًا |
حد الرمز المميّز للمخرجات * | 8,192 رمزًا مميزًا | 2,048 رمزًا مميزًا | 8,192 رمزًا مميزًا |
الحد الأقصى لعدد الصور في كل طلب | 3,000 صورة | 16 صورة | لا ينطبق |
الحد الأقصى لحجم الصورة بترميز base64 | 7 ميغابايت | 7 ميغابايت | لا ينطبق |
الحد الأقصى لحجم ملف PDF | 30 ميغابايت | 30 ميغابايت | لا ينطبق |
الحد الأقصى لعدد ملفات الفيديو لكل طلب | 10 ملفات فيديو | ملف فيديو واحد | لا ينطبق |
الحد الأقصى لمدة الفيديو (الإطارات فقط) | 60 دقيقة من الفيديو | دقيقتان | لا ينطبق |
الحد الأقصى لمدة الفيديو (الإطارات والصوت) | حوالي 45 دقيقة فيديو | لا ينطبق | لا ينطبق |
الحد الأقصى لعدد الملفات الصوتية في كل طلب | ملف صوتي واحد | لا ينطبق | لا ينطبق |
الحد الأقصى لطول الصوت | حوالي 8.4 ساعة من الصوت | لا ينطبق | لا ينطبق |
* في جميع نماذج Gemini، يعادل الرمز المميّز 4 أحرف تقريبًا، أي أنّ الـ 100 رمز مميّز يتراوح بين 60 و80 كلمة إنجليزية. يمكنك تحديد العدد الإجمالي
للرموز المميّزة في طلباتك باستخدام السمة
countTokens
.
يمكنك العثور هنا على معلومات أكثر تفصيلاً حول النماذج وملفات الإدخال:
تعرَّف على الاختلافات بين النماذج المتعددة الوسائط في مستندات Google Cloud.
تعرَّف على أنواع الملفات المتوافقة، وكيفية تحديد نوع MIME وكيفية التأكّد من أنّ ملفاتك وطلباتك المتعددة الوسائط تستوفي المتطلبات واتّبِع أفضل الممارسات في القسم ملفات الإدخال والمتطلبات المتوافقة مع Vertex AI Gemini API
تحديد إصدارات النماذج
تتوفّر نماذج Gemini بإصدارات ثابتة ومعدَّلة تلقائيًا ومعاينة.
تعتبر الإصدارات الثابتة متوفرة للجمهور العام.
- وتتضمّن الإصدارات الثابتة أسماء طُرز مرفقة برقم إصدار محدّد من ثلاثة أرقام، على سبيل المثال
.gemini-1.0-pro-001
- وتتضمّن الإصدارات الثابتة أسماء طُرز مرفقة برقم إصدار محدّد من ثلاثة أرقام، على سبيل المثال
تشير الإصدارات المحدَّثة تلقائيًا إلى أحدث إصدار ثابت من هذا النموذج، وفي حال إطلاق إصدار ثابت جديد، يبدأ الإصدار المحدّث تلقائيًا في الإشارة إلى ذلك الإصدار الثابت الجديد.
- تحتوي الإصدارات التي يتم تعديلها تلقائيًا على أسماء طُرز بدون
ملحقات، على سبيل المثال
.gemini-1.0-pro
- تحتوي الإصدارات التي يتم تعديلها تلقائيًا على أسماء طُرز بدون
ملحقات، على سبيل المثال
تتميز إصدارات المعاينة بإمكانيات جديدة ولا تُعتبر غير ثابتة. يُرجى العِلم أنّ إصدارات المعاينة تشير دائمًا إلى أحدث إصدار من المعاينة من هذا النموذج. في حال طرح إصدار معاينة جديد، سيبدأ تلقائيًا أي إصدار معاينة حالي في الإشارة إلى إصدار المعاينة الجديد.
- تتضمّن إصدارات المعاينة أسماء طُرز ملحقة بالرمز
بالإضافة إلى تاريخ الإصدار الأولي للطراز (-preview
)، على سبيل المثال-MMDD
(تم الإصدار في 9 أبريل 2024).gemini-1.5-pro-preview-0409
- تتضمّن إصدارات المعاينة أسماء طُرز ملحقة بالرمز
يمكنك الاطّلاع على مزيد من المعلومات حول إصدارات نماذج Gemini المتاحة ومراحل نشاطها في مستندات Google Cloud.
أسماء الطُرز المتاحة
أسماء النماذج هي القيم الصريحة التي تدرجها في الرمز البرمجي أثناء إعداد النموذج التوليدي (وهي خطوة مطلوبة لاستدعاء Gemini API). للاطّلاع على أمثلة حول كيفية إعداد لغتك، يُرجى مراجعة دليل البدء.
أسماء نماذج Gemini 1.5 Flash
اسم النموذج | الوصف | مرحلة الإصدار | تاريخ الإصدار الأولي | تاريخ الإيقاف |
---|---|---|---|---|
الإصدارات الثابتة | ||||
gemini-1.5-flash-001 |
أحدث إصدار ثابت من Gemini 1.5 Flash | مدى التوفّر للجمهور العام | 2024-05-24 | ليس قبل تاريخ 24/05/2025 |
الإصدار المحدَّث تلقائيًا | ||||
gemini-1.5-flash |
يشير إلى أحدث إصدار ثابت من 1.5 Flash (حاليًا gemini-1.5-flash-001 |
مدى التوفّر للجمهور العام | 2024-05-24 | --- |
معاينة النُسخ | ||||
gemini-1.5-flash-preview-0514 |
أحدث إصدار من معاينة Gemini 1.5 Flash | الميزات التجريبية المتاحة للجميع | 2024-05-14 | 2024-06-24 |
أسماء طُرز Gemini 1.5 Pro
اسم النموذج | الوصف | مرحلة الإصدار | تاريخ الإصدار الأولي | تاريخ الإيقاف |
---|---|---|---|---|
الإصدارات الثابتة | ||||
gemini-1.5-pro-001 |
أحدث إصدار ثابت من Gemini 1.5 Pro | مدى التوفّر للجمهور العام | 2024-05-24 | ليس قبل تاريخ 24/05/2025 |
الإصدار المحدَّث تلقائيًا | ||||
gemini-1.5-pro |
يشير إلى أحدث إصدار ثابت من 1.5 Pro (حاليًا gemini-1.5-pro-001 |
مدى التوفّر للجمهور العام | 2024-05-24 | --- |
معاينة النُسخ | ||||
gemini-1.5-pro-preview-0514 |
أحدث إصدار معاينة من Gemini 1.5 Pro | الميزات التجريبية المتاحة للجميع | 2024-05-14 | 2024-06-24 |
gemini-1.5-pro-preview-0409 |
يشير إلى gemini-1.5-pro-preview-0514 (وهو أحدث إصدار معاينة) |
الميزات التجريبية المتاحة للجميع | 2024-04-09 | 2024-06-14 |
أسماء نماذج Gemini 1.0 Pro Vision
اسم النموذج | الوصف | مرحلة الإصدار | تاريخ الإصدار الأولي | تاريخ الإيقاف |
---|---|---|---|---|
الإصدارات الثابتة | ||||
gemini-1.0-pro-vision-001 |
أحدث إصدار ثابت من Gemini 1.0 Pro Vision | مدى التوفّر للجمهور العام | 2024-02-15 | قبل 15/02/2025 |
الإصدار المحدَّث تلقائيًا | ||||
gemini-1.0-pro-vision |
يشير إلى أحدث إصدار ثابت من 1.5 Pro Vision (حاليًا gemini-1.5-pro-vision-001 |
مدى التوفّر للجمهور العام | 2024-01-04 | --- |
أسماء طُرز Gemini 1.0 Pro
اسم النموذج | الوصف | مرحلة الإصدار | تاريخ الإصدار الأولي | تاريخ الإيقاف |
---|---|---|---|---|
الإصدارات الثابتة | ||||
gemini-1.0-pro-002 |
أحدث إصدار ثابت من Gemini 1.0 Pro | مدى التوفّر للجمهور العام | 2024-04-09 | ليس قبل تاريخ 2025/4/09 |
gemini-1.0-pro-001 |
إصدار ثابت من Gemini 1.0 Pro | مدى التوفّر للجمهور العام | 2024-02-15 | قبل 15/02/2025 |
الإصدار المحدَّث تلقائيًا | ||||
gemini-1.0-pro |
يشير إلى أحدث إصدار ثابت من 1.0 Pro (حاليًا gemini-1.0-pro-002 |
مدى التوفّر للجمهور العام | 2024-02-15 | --- |
اللغات المُعتمَدة
تتوفّر نماذج Gemini باللغات التالية:
العربية (ar)، البنغالية (bn)، البلغارية (bg)، الصينية المبسطة والتقليدية (zh)، الكرواتية (hr)، التشيكية (cs)، الدانمركية (da)، الهولندية (nl)، الإنجليزية (en)، الإستونية (et)، الفنلندية (fi)، الفرنسية (fr)، الألمانية (de)، اليونانية (el)، العبرية (iw)، الهندية (hi)، الإيطالية (huit)
الخطوات اللاحقة
تجربة إمكانات Gemini API
- إنشاء محادثات متعددة الأدوار (محادثة)
- أنشِئ نصًا من الطلبات النصية فقط.
- يمكنك إنشاء نص باستخدام الطلبات المتعدّدة الوسائط (بما في ذلك النصوص والصور وملفات PDF والفيديوهات والصوت).
- يمكنك استخدام استدعاء الدوال لربط النماذج التوليدية بالأنظمة والمعلومات الخارجية.