মডেল বৈকল্পিক
Gemini API বিভিন্ন মডেল অফার করে যা নির্দিষ্ট ব্যবহারের ক্ষেত্রে অপ্টিমাইজ করা হয়। এখানে মিথুন ভেরিয়েন্টগুলির একটি সংক্ষিপ্ত বিবরণ রয়েছে যা উপলব্ধ:
মডেল বৈকল্পিক | ইনপুট(গুলি) | আউটপুট | জন্য অপ্টিমাইজ করা হয়েছে |
---|---|---|---|
মিথুন 1.5 প্রোgemini-1.5-pro | অডিও, ছবি, ভিডিও এবং পাঠ্য | পাঠ্য | জটিল যুক্তির কাজ যেমন কোড এবং টেক্সট জেনারেশন, টেক্সট এডিটিং, সমস্যা সমাধান, ডেটা এক্সট্রাকশন এবং জেনারেশন |
মিথুন 1.5 ফ্ল্যাশgemini-1.5-flash | অডিও, ছবি, ভিডিও এবং পাঠ্য | পাঠ্য | বিভিন্ন ধরনের কাজ জুড়ে দ্রুত এবং বহুমুখী কর্মক্ষমতা |
জেমিনি 1.0 প্রোgemini-1.0-pro | পাঠ্য | পাঠ্য | প্রাকৃতিক ভাষার কাজ, মাল্টি-টার্ন টেক্সট এবং কোড চ্যাট এবং কোড জেনারেশন |
(বঞ্চিত) জেমিনি 1.0 প্রো ভিশনgemini-pro-vision | ছবি, ভিডিও এবং পাঠ্য | পাঠ্য | ভিজ্যুয়াল-সম্পর্কিত কাজগুলি, যেমন চিত্রের বর্ণনা ��ৈরি করা বা ছবিতে বস্তু শনাক্ত করা |
পাঠ্য এমবেডিংtext-embedding-004 | পাঠ্য | টেক্সট এম্বেডিং | টেক্সট স্ট্রিং এর সংশ্লিষ্টতা পরিমাপ |
AQAaqa | পাঠ্য | পাঠ্য | প্রশ্নের উৎস-ভিত্তিক উত্তর প্রদান করা |
নিম্নলিখিত সারণীতে মিথুন মডেলের বৈশিষ্ট্যগুলি বর্ণনা করা হয়েছে যা সমস্ত মডেলের বৈকল্পিকগুলির জন্য সাধারণ:
বৈশিষ্ট্য | বর্ণনা |
---|---|
প্রশিক্ষণ তথ্য | মিথুনের জ্ঞান কাটঅফ নভেম্বর 2023৷ সেই সময়ের পরে ঘটনাগুলি সম্পর্কে জ্ঞান সীমিত৷ |
সমর্থিত ভাষা | উপলব্ধ ভাষা দেখুন |
কনফিগারযোগ্য মডেল পরামিতি |
|
এই প্রতিটি প্যারামিটার সম্পর্কে তথ্যের জন্য জেনারেটিভ মডেল গাইডের মডেল প্যারামিটার বিভাগটি দেখুন।
মিথুন 1.5 ফ্ল্যাশ
জেমিনি 1.5 ফ্ল্যাশ হল একটি দ্রুত এবং বহুমুখী মাল্টিমডাল মডেল যা বিভিন্ন কাজ জুড়ে স্কেলিং করার জন্য।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
মডেল কোড | models/gemini-1.5-flash |
সমর্থিত ডেটা প্রকার | ইনপুট অডিও, ছবি, ভিডিও এবং পাঠ্য আউটপুট পাঠ্য |
[*] | টোকেন সীমাইনপুট টোকেন সীমা 1,048,576 আউটপুট টোকেন সীমা 8,192 |
অডিও/ভিজ্যুয়াল স্পেস | প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি ৩,৬০০ ভিডিওর সর্বোচ্চ দৈর্ঘ্য 1 ঘন্টা সর্বাধিক অডিও দৈর্ঘ্য প্রায় 9.5 ঘন্টা |
[**] | হারের সীমা
|
ক্ষমতা | সিস্টেম নির্দেশাবলী সমর্থিত JSON মোড সমর্থিত JSON স্কিমা সমর্থিত নয় সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস সমর্থিত ক্যাশিং সমর্থিত টিউনিং সমর্থিত নয় ফাংশন কলিং সমর্থিত ফাংশন কলিং কনফিগারেশন সমর্থিত কোড এক্সিকিউশন সমর্থিত |
সর্বশেষ আপডেট | মে 2024 |
মিথুন 1.5 প্রো
Gemini 1.5 Pro হল একটি মধ্য-আকারের মাল্টিমোডাল মডেল যা বিস্তৃত পরিসরের যুক্তিমূলক কাজের জন্য অপ্টিমাইজ করা হয়েছে। 1.5 Pro একসাথে 2 ঘন্টা ভিডিও, 19 ঘন্টার অডিও, কোডের 60,000 লাইনের কোডবেস বা 2,000 পৃষ্ঠার পাঠ্য সহ প্রচুর পরিমাণে ডেটা প্রক্রিয়া করতে পারে।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
মডেল কোড | models/gemini-1.5-pro |
সমর্থিত ডেটা প্রকার | ইনপুট অডিও, ছবি, ভিডিও এবং পাঠ্য আউটপুট পাঠ্য |
[*] | টোকেন সীমাইনপুট টোকেন সীমা 2,097,152 আউটপুট টোকেন সীমা 8,192 |
অডিও/ভিজ্যুয়াল স্পেস | প্রতি প্রম্পটে সর্বাধিক সংখ্যক ছবি 7,200 ভিডিওর সর্বোচ্চ দৈর্ঘ্য ২ ঘন্টা সর্বাধিক অডিও দৈর্ঘ্য প্রায় 19 ঘন্টা |
[**] | হারের সীমা
|
ক্ষমতা | সিস্টেম নির্দেশাবলী সমর্থিত JSON মোড সমর্থিত JSON স্কিমা সমর্থিত সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস সমর্থিত ক্যাশিং সমর্থিত টিউনিং সমর্থিত নয় ফাংশন কলিং সমর্থিত ফাংশন কলিং কনফিগারেশন সমর্থিত কোড এক্সিকিউশন সমর্থিত |
সর্বশেষ আপডেট | মে 2024 |
জেমিনি 1.0 প্রো
Gemini 1.0 Pro হল একটি NLP মডেল যা মাল্টি-টার্ন টেক্সট এবং কোড চ্যাট এবং কোড জেনারেশনের মতো কাজগুলি পরিচালনা করে।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
মডেল কোড | models/gemini-1.0-pro |
সমর্থিত ডেটা প্রকার | ইনপুট পাঠ্য আউটপুট পাঠ্য |
[**] | হারের সীমা
|
ক্ষমতা | সিস্টেম নির্দেশাবলী সমর্থিত নয় JSON মোড সমর্থিত নয় JSON স্কিমা সমর্থিত নয় সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস সমর্থিত ক্যাশিং সমর্থিত নয় টিউনিং সমর্থিত ফাংশন কলিং সমর্থিত ফাংশন কলিং কনফিগারেশন সমর্থিত নয় কোড এক্সিকিউশন সমর্থিত নয় |
সর্বশেষ আপডেট | ফেব্রুয়ারি 2024 |
(বঞ্চিত) জেমিনি 1.0 প্রো ভিশন
জেমিনি 1.0 প্রো ভিশন হল একটি পারফরম্যান্স-অপ্টিমাইজ করা মাল্টিমোডাল মডেল যা ভিজ্যুয়াল-সম্পর্কিত কাজগুলি সম্পাদন করতে পারে। উদাহরণস্বরূপ, 1.0 প্রো ভিশন চিত্রের বর্ণনা তৈরি করতে পারে, চিত্রগুলিতে উপস্থিত বস্তুগুলি সনাক্ত করতে পারে, চিত্রগুলিতে উপস্থিত স্থান বা বস্তু সম্পর্কে তথ্য প্রদান করতে পারে এবং আরও অনেক কিছু।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
মডেল কোড | models/gemini-pro-vision |
সমর্থিত ডেটা প্রকার | ইনপুট ছবি, ভিডিও এবং পাঠ্য আউটপুট পাঠ্য |
[*] | টোকেন সীমাইনপুট টোকেন সীমা 12,288 আউটপুট টোকেন সীমা ৪,০৯৬ |
অডিও/ভিজ্যুয়াল স্পেস | ভিডিওর সর্বোচ্চ দৈর্ঘ্য ২ মিনিট |
[**] | হারের সীমাপ্রতি মিনিটে 60টি অনুরোধ |
ক্ষমতা | সিস্টেম নির্দেশাবলী সমর্থিত নয় JSON মোড সমর্থিত নয় JSON স্কিমা সমর্থিত নয় সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস সমর্থিত ক্যাশিং সম���্থিত নয় টিউনিং সমর্থিত নয় ফাংশন কলিং সমর্থিত ফাংশন কলিং কনফিগারেশন সমর্থিত নয় কোড এক্সিকিউশন সমর্থিত নয় |
সর্বশেষ আপডেট | ডিসেম্বর 2023 |
টেক্সট এম্বেডিং এবং এমবেডিং
পাঠ্য এমবেডিং
ইনপুট টেক্সটের জন্য টেক্সট এমবেডিং তৈরি করতে আপনি টেক্সট এমবেডিং মডেল ব্যবহার করতে পারেন। টেক্সট এমবেডিং মডেল সম্পর্কে আরও তথ্যের জন্য, টেক্সট এম্বেডিং সম্পর্কে Vertex AI ডকুমেন্টেশনের জেনারেটিভ এআই দেখুন।
টেক্সট এমবেডিং মডেলটি 2,048 টোকেন পর্যন্ত টেক্সটের জন্য 768 মাত্রা সহ এমবেডিং তৈরি করার জন্য অপ্টিমাইজ করা হয়েছে। টেক্সট এম্বেডিং 768-এর নিচে ইলাস্টিক এমবেডিং মাপ অফার করে। ছোট আউটপুট ডাইমেনশন তৈরি করতে আপনি ইলাস্টিক এম্বেডিং ব্যবহার করতে পারেন এবং ছোটখাট কর্মক্ষমতা ক্ষতির সাথে কম্পিউটিং এবং স্টোরেজ খরচ সাশ্রয় করতে পারেন।
মডেলের বিবরণ
সম্পত্তি | ��র্ণনা |
---|---|
মডেল কোড | জেমিনি API |
সমর্থিত ডেটা প্রকার | ইনপুট পাঠ্য আউটপুট টেক্সট এম্বেডিং |
[*] | টোকেন সীমাইনপুট টোকেন সীমা 2,048 আউটপুট মাত্রা আকার 768 |
[**] | হারের সীমাপ্রতি মিনিটে 1,500টি অনুরোধ |
সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস | সমর্থিত নয় |
সর্বশেষ আপডেট | এপ্রিল 2024 |
এমবেডিং
আপনি ইনপুট পাঠ্যের জন্য টেক্সট এম্বেডিং তৈরি করতে এমবেডিং মডেল ব্যবহার করতে পারেন।
এমবেডিং মডেলটি 2,048 টোকেন পর্যন্ত পাঠ্যের জন্য 768 মাত্রা সহ এমবেডিং তৈরি করার জন্য অপ্টিমাইজ করা হয়েছে।
মডেল বিশদ এম্বেডিং
সম্পত্তি | বর্ণনা |
---|---|
মডেল কোড | models/embedding-001 |
সমর্থিত ডেটা প্রকার | ইনপুট পাঠ্য আউটপুট টেক্সট এম্বেডিং |
[*] | টোকেন সীমাইনপুট টোকেন সীমা 2,048 আউটপুট মাত্রা আকার 768 |
[**] | হারের সীমাপ্রতি মিনিটে 1,500টি অনুরোধ |
সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস | সমর্থিত নয় |
সর্বশেষ আপডেট | ডিসেম্বর 2023 |
AQA
আপনি AQA মডেল ব্যবহার করতে পারেন অ্যাট্রিবিউটেড প্রশ্ন-উত্তর প্রদান (AQA)-এর সাথে সম্পর্কিত কাজগুলি একটি নথি, কর্পাস বা প্যাসেজের একটি সেটে। AQA মডেল প্রশ্নগুলির উত্তর দেয় যেগুলি প্রদত্ত উত্সগুলিতে ভিত্তি করে, উত্তরযোগ্য সম্ভাব্যতার অনুমান সহ।
মডেলের বিবরণ
সম্পত্তি | বর্ণনা |
---|---|
মডেল কোড | models/aqa |
সমর্থিত ডেটা প্রকার | ইনপুট পাঠ্য আউটপুট পাঠ্য |
সমর্থিত ভাষা | ইংরেজি |
[*] | টোকেন সীমাইনপুট টোকেন সীমা 7,168 আউটপুট টোকেন সীমা 1,024 |
[**] | হারের সীমাপ্রতি মিনিটে 1,500টি অনুরোধ |
সামঞ্জস্যযোগ্য নিরাপত্তা সেটিংস | সমর্থিত |
সর্বশেষ আপডেট | ডিসেম্বর 2023 |
এই মডেল বৈচিত্রগুলির ক্ষমতাগুলি অন্বেষণ করতে উদাহরণগুলি দেখুন৷
[*] মিথুন মডেলের জন্য একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য। 100 টোকেন প্রায় 60-80 ইংরেজি শব্দ।
[**] RPM: প্রতি মিনিটে অনুরোধ
TPM: প্রতি মিনিটে টোকেন
RPD: প্রতিদিনের অনুরোধ
TPD: প্রতিদিন টোকেন
ক্ষমতার সীমাবদ্ধতার কারণে, নির্দিষ্ট সর্বোচ্চ হারের সীমা নিশ্চিত করা হয় না।
মডেল সংস্করণ নামের নিদর্শন
মিথুন মডেলগুলি পূর��বরূপ বা স্থিতিশীল সংস্করণে উপলব্ধ। আপনার কোডে, আপনি কোন মডেল এবং সংস্করণটি ব্যবহার করতে চান তা নির্দিষ্ট করতে আপনি নিম্নলিখিত মডেল নামের ফর্ম্যাটগুলির মধ্যে একটি ব্যবহার করতে পারেন৷
সর্বশেষ: একটি নির্দিষ্ট প্রজন্ম এবং প্রকরণের জন্য মডেলের অত্যাধুনিক সংস্করণের দিকে নির্দেশ করে৷ অন্তর্নিহিত মডেল নিয়মিত আপডেট করা হয় এবং একটি পূর্বরূপ সংস্করণ হতে পারে. শুধুমাত্র অনুসন্ধানমূলক পরীক্ষামূলক অ্যাপ এবং প্রোটোটাইপ এই উপনাম ব্যবহার করা উচিত।
সর্বশেষ সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন:
<model>-<generation>-<variation>-latest
। উদাহরণস্বরূপ,gemini-1.0-pro-latest
।সর্বশেষ স্থিতিশীল: নির্দিষ্ট মডেল জেনারেশন এবং প্রকরণের জন্য প্রকাশিত সবচেয়ে সাম্প্রতিক স্থিতিশীল সংস্করণের দিকে নির্দেশ করে।
সর্বশেষ স্থিতিশীল সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন:
<model>-<generation>-<variation>
। উদাহরণস্বরূপ,gemini-1.0-pro
।স্থিতিশীল: একটি নির্দিষ্ট স্থিতিশীল মডেলের দিকে নির্দেশ করে। স্থিতিশীল মডেল পরিবর্তন হয় না. বেশিরভাগ উৎপাদন অ্যাপের একটি নির্দিষ্ট স্থিতিশীল মডেল ব্যবহার করা উচিত।
একটি স্থিতিশীল সংস্করণ নির্দিষ্ট করতে, নিম্নলিখিত প্যাটার্নটি ব্যবহার করুন:
<model>-<generation>-<variation>-<version>
। উদাহরণস্বরূপ,gemini-1.0-pro-001
।
উপলব্ধ ভাষা
মিথুন মডেলদের নিম্নলিখিত ভাষাগুলির সাথে কাজ করার জন্য প্রশিক্ষণ দেওয়া হয়:
- আরবি (
ar
) - বাংলা (
bn
) - বুলগেরিয়ান (
bg
) - চীনা সরলীকৃত এবং ঐতিহ্যগত (
zh
) - ক্রোয়েশিয়ান (
hr
) - চেক (
cs
) - ডেনিশ (
da
) - ডাচ (
nl
) - ইংরেজি (
en
) - এস্তোনিয়ান (
et
) - ফিনিশ (
fi
) - ফরাসি (
fr
) - জার্মান (
de
) - গ্রীক (
el
) - হিব্রু (
iw
) - হিন্দি (
hi
) - হাঙ্গেরিয়ান (
hu
) - ইন্দোনেশিয়ান (
id
) - ইতালীয় (
it
) - জাপানি (
ja
) - কোরিয়ান (
ko
) - লাটভিয়ান (
lv
) - লিথুয়ানিয়ান (
lt
) - নরওয়েজিয়ান (
no
) - পোলিশ (
pl
) - পর্তুগিজ (
pt
) - রোমানিয়ান (
ro
) - রাশিয়ান (
ru
) - সার্বিয়ান (
sr
) - স্লোভাক (
sk
) - স্লোভেনীয় (
sl
) - স্প্যানিশ (
es
) - স����়া��ি��ি (
sw
) - ��������িশ (
sv
) - থাই (
th
) - তুর্কি (
tr
) - ইউক্রেনীয় (
uk
) - ভিয়েতনামী (
vi
)