متغيرات الطراز
تقدّم Gemini API نماذج مختلفة تم تحسينها لاستخدامات معيّنة الحالات. في ما يلي نظرة عامة مختصرة على خيارات Gemini المتاحة:
صيغة النموذج | الإدخالات | الناتج | محسَّن من أجل |
---|---|---|---|
Gemini 1.5 Pro
gemini-1.5-pro |
الصوت والصور والفيديوهات والنصوص | النص | مهام الاستنتاج المعقدة مثل إنشاء التعليمات البرمجية والنصوص تحرير النصوص وحل المشاكل واستخراج البيانات وإنشائها |
Gemini 1.5 Flash
gemini-1.5-flash |
الصوت والصور والفيديوهات والنصوص | النص | أداء سريع ومتعدّد الاستخدامات في مجموعة متنوّعة من المهام |
Gemini 1.0 Pro
gemini-1.0-pro |
النص | النص | مهام اللغة الطبيعية والمحادثة النصية والرموز البرمجية متعددة الأدوار والرموز البرمجية الجيل |
(متوقّفة نهائيًا) Gemini 1.0 Pro Vision
gemini-pro-vision
|
الصور والفيديوهات والنصوص | النص | المهام المتعلّقة بالمرئيات، مثل إنشاء الصور الأوصاف أو تحديد الكائنات في الصور |
تضمين النص
text-embedding-004 |
النص | تضمينات النص | قياس مدى صلة السلاسل النصي�� |
جودة الهواء
aqa |
النص | النص | توفير إجابات تستند إلى المصدر عن الأسئلة |
يوضّح الجدول التالي سمات نماذج Gemini التالية: شائعة بين جميع متغيرات الطُرز:
السمة | الوصف |
---|---|
بيانات التدريب | والموعد النهائي لطلب Gemini هو تشرين الثاني (نوفمبر) 2023. وستبقى المعلومات عن الأحداث التي تلي هذه الفترة محدودة. |
اللغات المتاحة | الاطّلاع على اللغات المتاحة |
مَعلمات النموذج القابل للضبط |
|
اطّلِع على معلَمات النموذج. من القسم اطّلِع على دليل النماذج التوليدية للحصول على معلومات عن كلّ من هذه المَعلمات.
فلاش الإصدار 1.5 من Gemini
Gemini 1.5 Flash هو نموذج سريع ومتعدد الوسائط متعدد الوسائط للتوسّع مهام متنوعة.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.5-flash |
أنواع البيانات المتوافقة |
مصادر الإدخال الصوت والصور والفيديو والنص الناتج النص |
[*] | حدود الرموز المميزة
الحد الأقصى لإدخال الرموز المميّزة 1,048,576 حد الرمز المميّز للإخراج 8,192 |
مواصفات الصوت/المرئي |
الحد الأقصى لعدد الصور في كل طلب 3,600 الحد الأقصى لمدة الفيديو ساعة واحدة الحد الأقصى لطول الصوت 9.5 ساعات ��قريبًا |
[**] | حدود السعر
|
قدرات |
تعليمات النظام متاح وضع JSON متاح مخطّط JSON غير متاح إعدادات أمان قابلة للتعديل متاح التخزين المؤقت متاح الضبط غير متاح استدعاء الدالة متاح إعداد استدعاء الدالة متاح تنفيذ الرمز متاح |
آخر تحديث | مايو 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro هو نموذج متوسط الحجم متعدد الوسائط تم تحسينه لمجموعة واسعة من المهام الاستنتاجية. 1.5 Pro يمكنه معالجة كميات كبيرة من البيانات مرة واحدة، بما في ذلك ساعتين من الفيديو، و19 ساعة من الصوت، وقواعد رموز مع 60,000 سطر من الرموز أو 2,000 صفحة من النص.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.5-pro |
أنواع البيانات المتوافقة |
مصادر الإدخال الصوت والصور والفيديو والنص الناتج النص |
[*] | حدود الرموز المميزة
الحد الأقصى لإدخال الرموز المميّزة 2,097,152 حد الرمز المميّز للإخراج 8,192 |
مواصفات الصوت/المرئي |
الحد الأقصى لعدد الصور في كل طلب 7,200 الحد الأقصى لمدة الفيديو ساعتان الحد الأقصى لطول الصوت 19 ساعة تقريبًا |
[**] | حدود السعر
|
قدرات |
تعليمات النظام متاح وضع JSON متاح مخطّط JSON متاح إعدادات أمان قابلة للتعديل متاح التخزين المؤقت متاح الضبط غير متاح استدعاء الدالة متاح إعداد استدعاء الدالة متاح تنفيذ الرمز متاح |
آخر تحديث | مايو 2024 |
Gemini 1.0 Pro
Gemini 1.0 Pro هو نموذج لمعالجة اللغات الطبيعية (NLP) يعالج مهام مثل إرسال النصوص المتعدّدة الأدوار ودردشة الرموز وإنشاء التعليمات البرمجية.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-1.0-pro |
أنواع البيانات المتوافقة |
الإدخال النص الناتج النص |
[**] | حدود السعر
|
قدرات |
تعليمات النظام غير متاح وضع JSON غير متاح مخطّط JSON غير متاح إعدادات أمان قابلة للتعديل متاح التخزين المؤقت غير متاح الضبط متاح استدعاء الدالة متاح إعداد استدعاء الدالة غير متاح تنفيذ الرمز غير متاح |
آخر تحديث | شباط (فبراير) 2024 |
(متوقّف نهائيًا) Gemini 1.0 Pro Vision
Gemini 1.0 Pro Vision هو نموذج متعدد الوسائط محسَّن للأداء. التي يمكنها أداء المهام المتعلقة بالمرئيات. على سبيل المثال، يمكن لـ 1.0 Pro Vision وإنشاء أوصاف الصور وتحديد العناصر الموجودة في الصور وتوفير ومعلومات حو�� الأما��ن أو العناصر الموجودة في الصور وغير ذلك.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/gemini-pro-vision |
أنواع البيانات المتوافقة |
مصادر الإدخال الصور والفيديو والنصوص الناتج النص |
[*] | حدود الرموز المميزة
الحد الأقصى لإدخال الرموز المميّزة 12,288 حد الرمز المميّز للإخراج 4,096 |
مواصفات الصوت/المرئي |
الحد الأقصى لمدة الفيديو دقيقتان |
[**] | حدود السعر60 طلبًا في الدقيقة |
قدرات |
تعليمات النظام غير متاح وضع JSON غير متاح مخطّط JSON غير متاح إعدادات أمان قابلة للتعديل متاح التخزين المؤقت غير متاح الضبط غير متاح استدعاء الدالة متاح إعداد استدعاء الدالة غير متاح تنفيذ الرمز غير متاح |
آخر تحديث | كانون الأول (ديسمبر) 2023 |
تضمين النص وتضمينه
تضمين النص
يمكنك استخدام نموذج تضمين النص لإنشاء تضمينات النص في إدخال نص. لمزيد من المعلومات حول نموذج تضمين النص، انتقل إلى مستندات الذكاء الاصطناعي التوليدي على Vertex AI حول تضمينات النص.
تم تحسين نموذج تضمين النص لإنشاء تضمينات بتنسيق 768 وأبعاد النص لما يصل إلى 2048 رمزًا مميزًا. تضمين النص في تجربة أكثر مرونة أحجام التضمين أقل من 768. ��مكنك استخدام التضمينات المرنة لإنشاء أصغر حجم للمخرجات وقد يوفر ذلك تكاليف الحوسبة والتخزين مع فقدان طفيف في الأداء.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز |
Gemini API
|
أنواع البيانات المتوافقة |
الإدخال النص الناتج تضمينات النص |
[*] | حدود الرموز المميزة
الحد الأقصى لإدخال الرموز المميّزة 2,048 حجم بُعد الإخراج 768 |
[**] | حدود السعر1,500 طلب في الدقيقة |
إعدادات أمان قابلة للتعديل | غير متاح |
آخر تحديث | أبريل 2024 |
التضمين
يمكنك استخدام نموذج التضمين لإنشاء تضمينات النص في إدخال نص.
تم تحسين نموذج التضمين لإنشاء عمليات تضمين بحجم 768. للنصوص التي تصل إلى 2,048 رمزًا مميزًا.
تضمين تفاصيل النموذج
الموقع | الوصف |
---|---|
رمز الطراز |
models/embedding-001
|
أنواع البيانات المتوافقة |
الإدخال النص الناتج تضمينات النص |
[*] | حدود الرموز المميزة
الحد الأقصى لإدخال الرموز المميّزة 2,048 حجم بُعد الإخراج 768 |
[**] | حدود السعر1,500 طلب في الدقيقة |
إعدادات أمان قابلة للتعديل | غير متاح |
آخر تحديث | كانون الأول (ديسمبر) 2023 |
جودة الهواء
يمكنك استخدام نموذج AQA لإجراء الإجابة عن أسئلة تحديد المصدر (AQA) - المهام المتعلقة بمستند أو مجموعة من الفقرات. مؤشر جودة الهواء إجابات عن الأسئلة القائمة على المصادر المتوفرة إلى جانب تقدير الاحتمالية القابلة للإجابة.
تفاصيل الطراز
الموقع | الوصف |
---|---|
رمز الطراز | models/aqa |
أنواع البيانات المتوافقة |
الإدخال النص الناتج النص |
اللغات المتاحة | الإنجليزية |
[*] | حدود الرموز المميزة
الحد الأقصى لإدخال الرموز المميّزة 7,168 حد الرمز المميّز للإخراج 1,024 |
[**] | حدود السعر1,500 طلب في الدقيقة |
إعدادات أمان قابلة للتعديل | متاح |
آخر تحديث | كانون الأول (ديسمبر) 2023 |
اطّلِع على الأمثلة لاستكشاف إمكانات هذه النماذج. المختلفة.
[*] يعادل الرمز المميّز 4 أحرف تقريبًا في نماذج Gemini. 100 رمز مميّز حوالي 60-80 كلمة إنجليزية.
[**] RPM: عدد الطلبات في الدقيقة
TPM: عدد الرموز المميّزة في الدقيقة
RPD: الطلبات في اليوم
TPD: الرموز المميّزة في اليوم
بسبب القيود المفروضة على السعة، لا يتم ضبط الحدود القصوى لمعدّل الاستخدام.
مضمون.
أنماط اسم إصدار النموذج
تتوفّر نماذج Gemini إما في إصدار المعاينة أو الثابت. في يمكنك استخدام أحد تنسيقات أسماء النماذج التالية لتحديد النموذج والإصدار الذي تريد استخدامه.
الأحدث: يشير هذا المصطلح إلى أحدث إصدار من النموذج لنموذج الإنشاء والتباين. يتم تحديث النموذج الأساسي بانتظام وقد إصدار معاينة. يجب فقط تطبيقات الاختبار الاستكشافي والنماذج الأولية استخدام هذا الاسم المستعار.
لتحديد أحدث إصدار، استخدِم النمط التالي:
<model>-<generation>-<variation>-latest
على سبيل المثال:gemini-1.0-pro-latest
أحدث إصدار ثابت: يشير إلى أحدث إصدار ثابت تم طرحه إنشاء نموذج محدد وتنوعه.
لتحديد أحدث إصدار ثابت، استخدِم النمط التالي:
<model>-<generation>-<variation>
مثلاً:gemini-1.0-pro
ثابت: يشير إلى نموذج ثابت معيَّن. لا تتغير النماذج الثابتة. يجب أن تستخدم معظم تطبيقات الإنتاج طرازًا ثابتًا ومحددًا.
لتحديد إصدار ثابت، استخدم النمط التالي:
<model>-<generation>-<variation>-<version>
على سبيل المثال:gemini-1.0-pro-001
اللغات المتاحة
يتم تدريب نم��ذج Gemini على العمل باللغات التالية:
- العربية (
ar
) - البنغالية (
bn
) - البلغارية (
bg
) - الصينية المبسّطة والتقليدية (
zh
) - الكرواتية (
hr
) - التشيكية (
cs
) - الدانمركية (
da
) - الهولندية (
nl
) - الإنجليزية (
en
) - الإستونية (
et
) - الفنلندية (
fi
) - الفرنسية (
fr
) - الألمانية (
de
) - اليونانية (
el
) - العبرية (
iw
) - الهندية (
hi
) - الهنغارية (
hu
) - الإندونيسية (
id
) - الإيطالية (
it
) - اليابانية (
ja
) - الكورية (
ko
) - اللاتفية (
lv
) - الليتوانية (
lt
) - النرويجية (
no
) - البولندية (
pl
) - البرتغالية (
pt
) - الرومانية (
ro
) - الروسية (
ru
) - الصربية (
sr
) - السلوفاكية (
sk
) - السلوفينية (
sl
) - الإسبانية (
es
) - السواحيلية (
sw
) - السويدية (
sv
) - التايلاندية (
th
) - التركية (
tr
) - الأوكرانية (
uk
) - الفيتنامية (
vi
)