ดูข้อมูลเกี่ยวกับโมเดลของ Gemini

กลุ่มโมเดลของ Gemini ถือเป็นสื่อหลากรูปแบบ เนื่องจากมีความสามารถในการประมวลผลข้อมูลจากรูปแบบต่างๆ เช่น รูปภาพ วิดีโอ และข้อความ ตัวอย่างเช่น คุณอาจส่งรูปจานคุกกี้ ให้โมเดล Gemini และขอให้บอกสูตรสำหรับคุกกี้เหล่านั้นแก่คุณ

พรอมต์ การตอบกลับ

ขอสูตรทำคุกกี้พวกนี้หน่อย

ภาพคุกกี้ช็อกโกแลตชิปหลายๆ ชิ้น
**ส่วนผสม**
- 1 ค. เนยจืด (2 แท่ง) เนยนิ่มจาง
- น้ำตาลทรายป่น 3/4 ค.
- น้ำตาลทราย 3/4 ค. บรรจุก้อน
- 1 ช้อนชา วานิลลาสกัด
- ไข่ใหญ่ 2 ฟอง
- แป้งอเนกประสงค์ 2 1/4 ค.
- เบกกิ้งโซดา 1 ช้อนชา
- เกลือ 1 ช้อนชา
...

คุณสามารถโต้ตอบกับกลุ่มโมเดล Gemini ได้โดยใช้ Gemini API ที่ให้บริการโดย Vertex AI ใน Google Cloud สำหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บแอป คุณสามารถใช้ SDK ของ Vertex AI สำหรับ Firebase เพื่อเรียกใช้ Gemini API และโต้ตอบกับโมเดล Gemini ได้จากแอปโดยตรง

หน้านี้จะให้ข้อมูลต่อไปนี้เกี่ยวกับโมเดล Gemini

รุ่นที่พร้อมใช้งาน

คุณสามารถใช้โมเดล Gemini รุ่นใดก็ได้ต่อไปนี้กับ Vertex AI สำหรับ Firebase

  • Gemini 1.5 Flash
    โมเดลมัลติโมดัลที่รองรับอินพุตและเอาต์พุตประเภทเดียวกันกับ 1.5 Pro (และจำนวนโทเค็นทั้งหมดด้วย) แต่ 1.5 Flash นั้นออกแบบมาโดยเฉพาะสำหรับแอปพลิเคชันที่มีปริมาณมากและคุ้มค่า

  • Gemini 1.5 Pro
    โมเดลมัลติโมดัลที่รองรับการเพิ่มไฟล์รูปภาพ เสียง วิดีโอ และ PDF ในพรอมต์ข้อความหรือแชทสำหรับการตอบกลับที่เป็นข้อความหรือโค้ด นอกจากนี้ยังรองรับการทำความเข้าใจบริบทแบบยาวด้วยโทเค็นสูงถึง 1 ล้านโทเค็น

  • Gemini 1.0 Pro Vision
    โมเดลหลายรูปแบบออกแบบมาเพื่อจัดการกับข้อความ รวมถึง รูปภาพและวิดีโอสำหรับการตอบกลับที่เป็นข้อความหรือโค้ด ใช้สำหรับการแชทไม่ได้

  • Gemini 1.0 Pro
    โมเดลที่ออกแบบมาเพื่อจัดการงานทางภาษาธรรมชาติ การแชทแบบหลายเลี้ยวที่มีข้อความและโค้ด และการสร้างโค้ด

ข้ามไปที่ชื่อโมเดลเพื่อรวมไว้ในโค้ด

กรณีการใช้งานและความสามารถของแต่ละโมเดล

Gemini แต่ละโมเดลมีความสามารถเพื่อรองรับกรณีการใช้งานที่แตกต่างกัน ดูข้อมูลเพิ่มเติมในเอกสารประกอบของ Google Cloud เกี่ยวกับโมเดล Gemini แต่ละรุ่นได้

อินพุตและเอาต์พุตที่รองรับของแต่ละรุ่น

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
ประเภทการป้อนข้อมูล
ข้อความ
รหัส
อิมเมจ
PDF
วิดีโอ (เฟรมเท่านั้น)
วิดีโอ (เฟรมและเสียง)
เสียง
ประเภทเอาต์พุต
ข้อความ
รหัส

ดูข้อมูลเกี่ยวกับประเภทไฟล์ที่รองรับได้ที่ไฟล์อินพุตที่รองรับและข้อกำหนดสำหรับ Vertex AI Gemini API

ความสามารถที่รองรับและฟีเจอร์ทั่วไปของแต่ละรุ่น

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
การสร้างข้อความจากพรอมต์แบบข้อความเท่านั้น
การสร้างข้อความจากพรอมต์หลายรูปแบบ
เอาต์พุต JSON (โหมดสคีมาที่จํากัด)
(จะมีให้บริการใน Vertex AI สำหรับ Firebase SDK เร็วๆ นี้)
การแชทแบบมัลติเทิร์น
กำลังเรียกฟังก์ชัน
การเรียกใช้ฟังก์ชันพื้นฐาน
การเรียกใช้ฟังก์ชันพร้อมกัน
โหมดการเรียกฟังก์ชัน
นับโทเค็นและอักขระที่เรียกเก็บเงินได้
วิธีการของระบบ

ข้อมูลโดยละเอียดเกี่ยวกับแต่ละโมเดล

พร็อพเพอร์ตี้ Gemini 1.5 Flash /
Gemini 1.5 Pro
Gemini 1.0 Pro Vision Gemini 1.0 Pro
ขีดจำกัดโทเค็นทั้งหมด (อินพุตและเอาต์พุตแบบรวม) * 1 ล้านโทเค็น โทเค็น 16,384 รายการ โทเค็น 32,760 รายการ
ขีดจำกัดโทเค็นเอาต์พุต * 8,192 โทเค็น 2,048 โทเค็น 8,192 โทเค็น
จำนวนรูปภาพสูงสุดต่อคำขอ รูปภาพ 3,000 รูป รูปภาพ 16 รูป ไม่มี
ขนาดรูปภาพที่เข้ารหัสฐาน 64 สูงสุด 7 เมกะไบต์ 7 เมกะไบต์ ไม่มี
ขนาดสูงสุดของ PDF 30 MB 30 MB ไม่มี
จำนวนไฟล์วิดีโอสูงสุดต่อคำขอ ไฟล์วิดีโอ 10 ไฟล์ ไฟล์วิดีโอ 1 ไฟล์ ไม่มี
ความยาวสูงสุดของวิดีโอ (เฟรมเท่านั้น) วิดีโอความยาว 60 นาที 2 นาที ไม่มี
ความยาวสูงสุดของวิดีโอ (เฟรมและเสียง) วิดีโอความยาวประมาณ 45 นาที ไม่มี ไม่มี
จำนวนไฟล์เสียงสูงสุดต่อคำขอ ไฟล์เสียง 1 ไฟล์ ไม่มี ไม่มี
ความยาวสูงสุดของเสียง เสียงประมาณ 8.4 ชั่วโมง ไม่มี ไม่มี

* สำหรับโมเดล Gemini ทั้งหมด โทเค็นจะเท่ากับอักขระประมาณ 4 ตัว ดังนั้นโทเค็น 100 รายการจึงเป็นคำภาษาอังกฤษประมาณ 60-80 คำ คุณระบุจำนวนโทเค็นทั้งหมดในคำขอได้โดยใช้ countTokens

คุณสามารถดูข้อมูลโดยละเอียดเพิ่มเติมเกี่ยวกับโมเดลและไฟล์อินพุตได้ที่นี่

การกำหนดเวอร์ชันของโมเดล

โมเดล Gemini ให้บริการในเวอร์ชันเสถียร อัปเดตอัตโนมัติ และแสดงตัวอย่าง

  • เวอร์ชันเสถียรจะถือว่าพร้อมใช้งานสำหรับเวอร์ชันสำหรับผู้ใช้ทั่วไป

    • เวอร์ชันเสถียรจะมีชื่อโมเดลต่อท้ายด้วยหมายเลขเวอร์ชัน 3 หลักที่เจาะจง เช่น gemini-1.0-pro-001
  • เวอร์ชันที่อัปเดตอัตโนมัติจะชี้ไปที่เวอร์ชันเสถียรล่าสุดของโมเดลนั้นเสมอ หากมีการเผยแพร่เวอร์ชันเสถียรใหม่ เวอร์ชันอัปเดตอัตโนมัติจะเริ่มชี้ไปยังเวอร์ชันเสถียรใหม่โดยอัตโนมัติ

    • เวอร์ชันที่อัปเดตอัตโนมัติจะมีชื่อโมเดลที่ไม่มีส่วนต่อท้าย เช่น gemini-1.0-pro
  • เวอร์ชันเวอร์ชันตัวอย่างมีความสามารถใหม่และถือว่าไม่เสถียร โปรดทราบว่าเวอร์ชันตัวอย่างจะชี้ไปที่ตัวอย่างเวอร์ชันล่าสุดของโมเดลนั้นเสมอ หากมีการเผยแพร่เวอร์ชันตัวอย่างใหม่ เวอร์ชันตัวอย่างที่มีอยู่จะเริ่มชี้ไปที่เวอร์ชันตัวอย่างใหม่โดยอัตโนมัติ

    • เวอร์ชันตัวอย่างจะมีชื่อโมเดลต่อท้ายด้วย -preview พร้อมด้วยวันที่เปิดตัวครั้งแรกของโมเดล (-MMDD) ตัวอย่างเช่น gemini-1.5-pro-preview-0409 (เผยแพร่เมื่อวันที่ 9 เมษายน 2024)

ดูข้อมูลเพิ่มเติมเกี่ยวกับเวอร์ชันโมเดล Gemini ที่มีอยู่และวงจรการใช้งานในเอกสารประกอบของ Google Cloud

ชื่อโมเดลที่ใช้ได้

ชื่อโมเดลคือค่าที่ชัดเจนซึ่งคุณใส่ไว้ในโค้ดระหว่างการเริ่มต้นโมเดล Generative (ซึ่งเป็นขั้นตอนที่จำเป็นในการเรียกใช้ Gemini API) ดูตัวอย่างการเริ่มต้นสำหรับภาษาของคุณได้ในคู่มือเริ่มต้นใช้งาน

ชื่อโมเดล Flash ของ Gemini 1.5

ชื่อรุ่น คำอธิบาย ช่วงการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่ปิดให้บริการ
เวอร์ชันที่เสถียร
gemini-1.5-flash-001 Gemini 1.5 Flash เวอร์ชันล่าสุดที่มีความเสถียร สำหรับผู้ใช้ทั่วไป 2024-05-24 ไม่เกิน 24-05-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.5-flash ชี้ไปที่ Flash 1.5 เวอร์ชันที่เสถียรล่าสุด
(ปัจจุบันคือ gemini-1.5-flash-001)
สำหรับผู้ใช้ทั่วไป 2024-05-24 ---
เวอร์ชันตัวอย่าง
gemini-1.5-flash-preview-0514 เวอร์ชันตัวอย่างล่าสุดของ Gemini 1.5 Flash เวอร์ชันตัวอย่างแบบสาธารณะ 2024-05-14 2024-06-24

ชื่อรุ่น Gemini 1.5 Pro

ชื่อรุ่น คำอธิบาย ช่วงการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่ปิดให้บริการ
เวอร์ชันที่เสถียร
gemini-1.5-pro-001 Gemini 1.5 Pro เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-05-24 ไม่เกิน 24-05-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.5-pro ชี้ไปที่เวอร์ชัน 1.5 Pro ที่เสถียรล่าสุด
(ปัจจุบันคือ gemini-1.5-pro-001)
สำหรับผู้ใช้ทั่วไป 2024-05-24 ---
เวอร์ชันตัวอย่าง
gemini-1.5-pro-preview-0514 Gemini 1.5 Pro เวอร์ชันตัวอย่างล่าสุด เวอร์ชันตัวอย่างแบบสาธารณะ 2024-05-14 2024-06-24
gemini-1.5-pro-preview-0409 ชี้ไปที่ gemini-1.5-pro-preview-0514
(ซึ่งเป็นตัวอย่างเวอร์ชันล่าสุด)
เวอร์ชันตัวอย่างแบบสาธารณะ 2024-04-09 2024-06-14

ชื่อโมเดล Gemini 1.0 Pro Vision

ชื่อรุ่น คำอธิบาย ช่วงการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่ปิดให้บริการ
เวอร์ชันที่เสถียร
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-02-15 ไม่เกิน 15-02-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.0-pro-vision ชี้ไปที่เวอร์ชันเสถียรล่าสุด 1.5 Pro Vision
(ปัจจุบันมี gemini-1.5-pro-vision-001)
สำหรับผู้ใช้ทั่วไป 2024-01-04 ---

ชื่อโมเดล Gemini 1.0 Pro

ชื่อรุ่น คำอธิบาย ช่วงการเผยแพร่ วันที่เปิดตัวครั้งแรก วันที่ปิดให้บริการ
เวอร์ชันที่เสถียร
gemini-1.0-pro-002 Gemini 1.0 Pro เวอร์ชันเสถียรล่าสุด สำหรับผู้ใช้ทั่วไป 2024-04-09 ไม่เกิน 09-04-2025
gemini-1.0-pro-001 Gemini 1.0 Pro เวอร์ชันเสถียร สำหรับผู้ใช้ทั่วไป 2024-02-15 ไม่เกิน 15-02-2025
เวอร์ชันที่อัปเดตอัตโนมัติ
gemini-1.0-pro ชี้ไปที่เวอร์ชัน 1.0 Pro ที่เสถียรล่าสุด
(ปัจจุบันคือ gemini-1.0-pro-002)
สำหรับผู้ใช้ทั่วไป 2024-02-15 ---

ภาษาที่สนับสนุน

โมเดล Gemini รองรับภาษาต่อไปนี้

ภาษาอาหรับ (อารบิก) เบงกาลี (bn), บัลแกเรีย (bg), จีนตัวย่อและตัวเต็ม (zh), โครเอเชีย (โครเอเชีย), เช็ก (cs), เดนมาร์ก (ดา), ดัตช์ (ดัตช์), อังกฤษ (en), เอสโตเนีย (et), ฟินแลนด์ (ฟินแลนด์), ฝรั่งเศส (ฝรั่งเศส), เยอรมัน (de), กรีก (เอล) ฮีบรู (iw), ฮินดี (ฮิ), ฮังการี (ภาษาเกาหลี), ภาษาเกาหลี (ฮิบรู (อิสลาม)

ขั้นตอนถัดไป

ลองใช้ความสามารถของ Gemini API