Llama ของ Meta ใน Amazon Bedrock

สร้างอนาคตของ AI ด้วย Llama

ขอแนะนำ Llama 3.3

Llama 3.3 เป็นโมเดลที่ปรับแต่งคำแนะนำเฉพาะข้อความ 70B ที่ให้ประสิทธิภาพที่เพิ่มขึ้นเมื่อเทียบกับ Llama 3.1 70B และ Llama 3.2 90B เมื่อใช้สำหรับแอปพลิเคชันที่มีข้อความเท่านั้น Llama 3.3 70B ให้ประสิทธิภาพที่คล้ายคลึงกับ Llama 3.1 405B ในขณะที่ใช้ทรัพยากรการคำนวณเพียงเล็กน้อยเท่านั้น

การฝึกที่ครอบคลุมของ Llama 3.3 70B ส่งผลให้เกิดความเข้าใจที่แข็งแกร่งและความสามารถในการสร้างงานที่หลากหลาย โมเดลนี้รองรับ AI สนทนาประสิทธิภาพสูงที่ออกแบบมาสำหรับการสร้างเนื้อหา แอปพลิเคชันสำหรับองค์กร และการวิจัย โดยให้ความสามารถในการทำความเข้าใจภาษาขั้นสูง รวมถึงการสรุปข้อความ การจำแนกประเภท การวิเคราะห์ความรู้สึก และการสร้างโค้ด

Llama 3.2 90B เป็นรุ่นที่ทันสมัยที่สุดของ Meta และเหมาะอย่างยิ่งสำหรับการใช้งานระดับองค์กร Llama 3.2 เป็นโมเดล Llama ตัวแรกที่รองรับงานวิสัยทัศน์ โดยมีสถาปัตยกรรมโมเดลใหม่ที่บูรณาการการแสดงตัวเข้ารหัสภาพลงในโมเดลภาษา แบบจำลองนี้มีความโดดเด่นในด้านความรู้ทั่วไป การสร้างข้อความแบบยาว การแปลหลายภาษา การเขียนโค้ด คณิตศาสตร์ และการให้เหตุผลขั้นสูง นอกจากนี้ ยังแนะนำความสามารถในการให้เหตุผลภาพช่วยให้เข้าใจภาพที่ซับซ้อนและการให้เหตุผลด้วยภาพ โมเดลนี้เหมาะอย่างยิ่งสำหรับกรณีการใช้งานต่อไปนี้: การสร้างคำบรรยายภาพ การดึงข้อความในภาพ การค้นหาภาพ การตอบคำถามด้วยภาพและการใช้เหตุผลด้วยภาพ และการตอบคำถามด้วยภาพบนเอกสาร

Llama 3.2 11B เหมาะอย่างยิ่งสำหรับการสร้างเนื้อหา AI เชิงสนทนา ความเข้าใจภาษา และแอปพลิเคชันระดับองค์กรที่ต้องใช้การใช้เหตุผลทางภาพ โมเดลนี้แสดงให้เห็นประสิทธิภาพที่แข็งแกร่งในการสรุปข้อความ การวิเคราะห์ความรู้สึก การสร้างโค้ด และการปฏิบัติตามคำสั่ง พร้อมด้วยความสามารถเพิ่มเติมในการให้เหตุผลเกี่ยวกับรูปภาพ โมเดลนี้เหมาะอย่างยิ่งสำหรับกรณีการใช้งานต่อไปนี้: การสร้างคำบรรยายภาพ การดึงข้อความในภาพ การค้นหาภาพ การตอบคำถามด้วยภาพและการใช้เหตุผลด้วยภาพ และการตอบคำถามด้วยภาพบนเอกสาร

Llama 3.2 3B มอบประสบการณ์ AI ที่เป็นส่วนตัวมากขึ้นด้วยการประมวลผลบนอุปกรณ์ Llama 3.2 3B ออกแบบมาสำหรับการใช้งานที่ต้องการการอนุมานแฝงต่ำและทรัพยากรการประมวลผลที่ จำกัด เหมาะอย่างยิ่งสำหรับการสรุปข้อความ การจำแนกประเภท และการแปลภาษา รุ่นนี้เหมาะอย่างยิ่งสำหรับกรณีการใช้งานต่อไปนี้: ผู้ช่วยการเขียนที่ขับเคลื่อนด้วย AI บนมือถือ และแอปพลิเคชันบริการลูกค้า

Llama 3.2 1B เป็นโมเดลที่น้ำหนักเบาที่สุดในคอลเลกชันโมเดล Llama 3.2 และเหมาะอย่างยิ่งสำหรับการดึงข้อมูลและสรุปข้อมูลสำหรับอุปกรณ์ Edge และแอปพลิเคชันมือถือ เปิดใช้งานความสามารถ AI บนอุปกรณ์ในขณะที่รักษาความเป็นส่วนตัวของผู้ใช้และลดเวลาแฝง โมเดลนี้เหมาะอย่างยิ่งสำหรับกรณีการใช้งานต่อไปนี้: การจัดการข้อมูลส่วนบุคคลและการดึงความรู้หลายภาษา

ประโยชน์

Llama 3.2 มอบประสบการณ์ AI ที่เป็นส่วนตัวมากขึ้นด้วยการประมวลผลบนอุปกรณ์ รุ่น Llama 3.2 ได้รับการออกแบบให้มีประสิทธิภาพมากขึ้น โดยลดความหน่วงและปรับปรุงประสิทธิภาพ ทำให้เหมาะกับการใช้งานที่หลากหลาย
ความยาวบริบท 128K ช่วยให้ Llama สามารถจับภาพความสัมพันธ์ที่มีรายละเอียดลึกซึ้งยิ่งขึ้นในข้อมูล
โมเดล Llama ได้รับการฝึกด้วยโทเค็น 15 ล้านล้านรายการจากแหล่งที่มาของข้อมูลสาธารณะออนไลน์เพื่อให้เข้าใจความซับซ้อนของภาษาได้ดีขึ้น
Llama 3.2 เป็นโมเดลภาษาหลายภาษาและรองรับแปดภาษา ได้แก่ อังกฤษ เยอรมัน ฝรั่งเศส อิตาลี โปรตุเกส ฮินดี สเปน และไทย
API ที่มีการจัดการของ Amazon Bedrock ทำให้การใช้โมเดล Llama ง่ายกว่าที่ผ่านมา องค์กรทุกขนาดสามารถเข้าถึงพลังของ Llama ได้โดยไม่ต้องกังวลเกี่ยวกับโครงสร้างพื้นฐาน เนื่องจาก Amazon Bedrock ไม่ต้องใช้เซิร์ฟเวอร์ คุณจึงไม่จำเป็นต้องจัดการโครงสร้างพื้นฐานใด ๆ และคุณสามารถผสานรวมและนำความสามารถ AI ช่วยสร้างของ Llama มาใช้ในแอปพลิเคชันของคุณได้อย่างปลอดภัย โดยใช้บริการ AWS ที่คุณคุ้นเคยอยู่แล้ว ซึ่งหมายความว่าคุณสามารถมุ่งเน้นไปที่สิ่งที่คุณทำได้ดีที่สุด นั่นคือ การสร้างแอปพลิเคชัน AI ของคุณ

ขอแนะนำ Llama

ในช่วงทศวรรษที่ผ่านมา Meta มุ่งเน้นไปที่การนำเครื่องมือไปไว้ในมือของนักพัฒนา และส่งเสริมการทำงานร่วมกันรวมถึงความก้าวหน้าในหมู่นักพัฒนา นักวิจัย และองค์กร โมเดล Llama มีให้เลือกหลายขนาดพารามิเตอร์ ทำให้นักพัฒนาสามารถเลือกรุ่นที่เหมาะกับความต้องการและงบประมาณการอนุมานได้ดีที่สุด โมเดล Llama ใน Amazon Bedrock เปิดโลกแห่งความเป็นไปได้เนื่องจากนักพัฒนาไม่จำเป็นต้องกังวลเกี่ยวกับความสามารถในการปรับขนาดหรือการจัดการโครงสร้างพื้นฐาน Amazon Bedrock เป็นวิธีแบบครบวงจรที่ง่ายมากสำหรับนักพัฒนาในการเริ่มใช้ Llama

กรณีใช้งาน

นางแบบลามะมีความเป็นเลิศในด้านการเข้าใจภาพและการใช้เหตุผลทางภาพ ความแตกต่างของภาษา การเข้าใจบริบท และงานที่ซับซ้อน เช่น การวิเคราะห์ข้อมูลภาพ การใส่คำบรรยายภาพ การสร้างบทสนทนา การแปลและการสร้างบทสนทนา และสามารถจัดการงานหลายขั้นตอนได้อย่างสบาย ๆ กรณีการใช้งานเพิ่มเติมที่โมเดล Llama เหมาะอย่างยิ่งสำหรับ ได้แก่ การใช้เหตุผลและความเข้าใจภาพที่ซับซ้อน การดึงภาพและข้อความ การวางพื้นฐานด้วยภาพ การตอบคำถามด้วยภาพเอกสาร การสรุปข้อความและความแม่นยำ การจำแนกข้อความ การวิเคราะห์ความรู้สึกและการใช้เหตุผลแบบแยกแยะรายละเอียด การสร้างแบบจำลองภาษา ระบบบทสนทนา การสร้างโค้ด และการปฏิบัติตามคำสั่ง

เวอร์ชันโมเดล

Llama 3.3 70B

โมเดลที่ปรับแต่งคำแนะนำเฉพาะข้อความ 70B ที่ให้ประสิทธิภาพที่เพิ่มขึ้นเมื่อเทียบกับ Llama 3.1 70B และ Llama 3.2 90B เมื่อใช้สำหรับแอปพลิเคชันที่มีข้อความเท่านั้น Llama 3.3 70B ให้ประสิทธิภาพที่คล้ายคลึงกับ Llama 3.1 405B ในขณะที่ใช้ทรัพยากรการคำนวณเพียงเล็กน้อยเท่านั้น

โทเค็นสูงสุด: 128K

ภาษา: อังกฤษ เยอรมัน ฝรั่งเศส อิตาลี โปรตุเกส สเปน และไทย

รองรับการปรับแต่งอย่างละเอียด: ไม่

กรณีการใช้งานที่รองรับ: AI เชิงสนทนาประสิทธิภาพสูงที่ออกแบบมาสำหรับการสร้างเนื้อหา แอปพลิเคชันสำหรับองค์กร และการวิจัย โดยให้ความสามารถในการทำความเข้าใจภาษาขั้นสูง รวมถึงการสรุปข้อความ การจำแนกประเภท การวิเคราะห์ความรู้สึก และการสร้างโค้ด โมเดลนี้ยังรองรับความสามารถในการใช้เอาต์พุตของโมเดลเพื่อปรับปรุงโมเดลอื่นๆ รวมถึงการสร้างและการถ่ายโอนเพื่อลดขนาดข้อมูลสังเคราะห์

Llama 3.2 90B

โมเดลหลายรูปแบบที่ใช้ทั้งอินพุตและเอาต์พุตข้อความและรูปภาพ เหมาะสำหรับแอปพลิเคชันที่ต้องการความฉลาดกับภาพที่ซับซ้อน เช่น การวิเคราะห์ภาพ การประมวลผลเอกสาร แชทบอทโมเดลหลายรูปแบบ และระบบอิสระ

โทเค็นสูงสุด: 128,000

ภาษา: อังกฤษ เยอรมัน ฝรั่งเศส อิตาลี โปรตุเกส ฮินดี สเปน และไทย

รองรับการปรับแต่งอย่างละเอียด: ไม่

กรณีการใช้งานที่รองรับ: การทำความเข้าใจรูปภาพ การให้เหตุผลด้วยภาพ และการโต้ตอบโมเดลหลายรูปแบบ ทำให้แอปพลิเคชันขั้นสูงเช่นคำบรรยายภาพ การดึงข้อความ การแยกวัตถุจากพื้นหลัง การตอบคำถามด้วยภาพ และการตอบคำถามด้วยภาพเอกสาร ด้วยความสามารถพิเศษในการเหตุผลและสรุปจากอินพุตภาพและข้อความ

อ่านบล็อก

Llama 3.2 11B

โมเดลหลายรูปแบบที่ใช้ทั้งอินพุตและเอาต์พุตข้อความและรูปภาพ เหมาะสำหรับแอปพลิเคชันที่ต้องการความฉลาดกับภาพที่ซับซ้อน เช่น การวิเคราะห์ภาพ การประมวลผลเอกสาร และแชทบอทโมเดลหลายรูปแบบ

โทเค็นสูงสุด: 128,000

ภาษา: อังกฤษ เยอรมัน ฝรั่งเศส อิตาลี โปรตุเกส ฮินดี สเปน และไทย

รองรับการปรับแต่งอย่างละเอียด: ไม่

กรณีการใช้งานที่รองรับ: การทำความเข้าใจรูปภาพ การให้เหตุผลด้วยภาพ และการโต้ตอบโมเดลหลายรูปแบบ ทำให้แอปพลิเคชันขั้นสูงเช่นคำบรรยายภาพ การดึงข้อความ การแยกวัตถุจากพื้นหลัง การตอบคำถามด้วยภาพ และการตอบคำถามด้วยภาพเอกสาร

อ่านบล็อก

Llama 3.2 3B

โมเดลน้ำหนักเบาเฉพาะข้อความที่สร้างขึ้นเพื่อให้ได้ผลลัพธ์ที่แม่นยำและมีความเกี่ยวข้องสูง ออกแบบมาสำหรับแอปพลิเคชันที่ต้องการการอนุมานแฝงต่ำและทรัพยากรการประมวลผลจำกัด เหมาะสำหรับการสอบถามและการเขียนใหม่พร้อมท์ที่รวดเร็ว ผู้ช่วยเขียนที่ขับเคลื่อนด้วย AI บนมือถือ และแอปพลิเคชันบริการลูกค้า โดยเฉพาะอย่างยิ่งบนอุปกรณ์ Edge ที่มีประสิทธิภาพและเวลาแฝงต่ำช่วยให้สามารถรวมเข้ากับแอปพลิเคชันต่าง ๆ ได้อย่างราบรื่น รวมถึงผู้ช่วยเขียนที่ขับเคลื่อนด้วย AI บนมือถือและแชทบอทบริการลูกค้า

โทเค็นสูงสุด: 128,000

ภาษา: อังกฤษ เยอรมัน ฝรั่งเศส อิตาลี โปรตุเกส ฮินดี สเปน และไทย

รองรับการปรับแต่งอย่างละเอียด: ไม่

กรณีการใช้งานที่รองรับ: การสร้างข้อความขั้นสูง สรุป การวิเคราะห์ความรู้สึก ความฉลาดทางอารมณ์ ความเข้าใจตามบริบท และการให้เหตุผลสามัญสำนึก

อ่านบล็อก

Llama 3.2 1B

โมเดลน้ำหนักเบาที่มีข้อความเท่านั้นที่สร้างขึ้นเพื่อตอบสนองที่รวดเร็วและแม่นยำ เหมาะสำหรับอุปกรณ์ Edge และแอปพลิเคชันมือถือ โมเดลนี้เปิดใช้งานความสามารถ AI บนอุปกรณ์ในขณะที่รักษาความเป็นส่วนตัวของผู้ใช้และลดเวลาแฝงให้ต่ำที่สุด

โทเค็นสูงสุด: 128,000

ภาษา: อังกฤษ เยอรมัน ฝรั่งเศส อิตาลี โปรตุเกส ฮินดี สเปน และไทย

รองรับการปรับแต่งอย่างละเอียด: ไม่

กรณีการใช้งานที่รองรับ: กรณีการใช้งานบทสนทนาหลายภาษา เช่น การจัดการข้อมูลส่วนบุคคล การดึงความรู้หลายภาษา และงานการเขียนซ้ำ

อ่านบล็อก

Llama 3.1 405B

เหมาะสำหรับการใช้งานระดับองค์กรการวิจัยและพัฒนาการสร้างข้อมูลสังเคราะห์และการกลั่นโมเดล ด้วยความสามารถในการอนุมานที่ปรับให้เหมาะสมกับความล่าช้าที่มีอยู่ในตัวอย่างสาธารณะ โมเดลนี้ให้ประสิทธิภาพและความสามารถในการปรับขนาดที่ยอดเยี่ยม ช่วยให้องค์กรสามารถเร่งการริเริ่มของ AI ในขณะที่ยังคงรักษาผลลัพธ์ที่มีคุณภาพสูงในกรณีการใช้งานที่หลากหลาย

โทเค็นสูงสุด
: 128K

ภาษา: อังกฤษ เยอรมัน ฝรั่งเศส อิตาลี โปรตุเกส ฮินดี สเปน และไทย

รองรับการปรับแต่งที่ละเอียด: เร็ว ๆ นี้

กรณีการใช้งานที่รองรับ: โมเดลนี้มีความโดดเด่นในด้านความรู้ทั่วไป การสร้างข้อความแบบยาว การแปลภาษาด้วยเครื่อง ความเข้าใจตามบริบทที่ดีขึ้น การให้เหตุผลและการตัดสินใจขั้นสูง การจัดการกับความกำกวมและความไม่แน่นอนที่ดีขึ้น ความคิดสร้างสรรค์และความหลากหลายที่เพิ่มขึ้น ความสามารถในการควบคุม คณิตศาสตร์ การใช้เครื่องมือ การแปลหลายภาษา และการเข้ารหัส

อ่านบล็อก

Llama 3.1 70B

เหมาะสำหรับการสร้างเนื้อหา AI แบบสนทนา ความเข้าใจภาษา การพัฒนาการวิจัย และแอปพลิเคชันองค์กร ด้วยความสามารถในการอนุมานที่ปรับให้เหมาะสมกับความล่าช้าใหม่ที่มีอยู่ในการแสดงตัวอย่างสาธารณะ โมเดลนี้จะกำหนดเกณฑ์มาตรฐานประสิทธิภาพใหม่สำหรับโซลูชัน AI ที่ประมวลผลอินพุตข้อความที่กว้างขวาง ทำให้แอปพลิเคชันสามารถตอบสนองได้เร็วขึ้นและจัดการแบบสอบถามที่ยาวนานขึ้นอย่างมีประสิทธิภาพมากขึ้น

โทเค็นสูงสุด: 128k

ภาษา: อังกฤษ เยอรมัน ฝรั่งเศส อิตาลี โปรตุเกส ฮินดี สเปน และไทย

รองรับการปรับแต่งอย่างละเอียด: ใช่

กรณีการใช้งานที่รองรับ: สรุปข้อความ การจำแนกข้อความ การวิเคราะห์ความรู้สึกและการแปลภาษา

อ่านบล็อก

Llama 3.1 8B

เหมาะสำหรับพลังงานและทรัพยากรการคำนวณ จำกัด เวลาฝึกอบรมที่เร็วขึ้น และอุปกรณ์ Edge

โทเค็นสูงสุด: 128,000

ภาษา: อังกฤษ เยอรมัน ฝรั่งเศส อิตาลี โปรตุเกส ฮินดี สเปน และไทย

รองรับการปรับแต่งอย่างละเอียด: ใช่

กรณีการใช้งานที่รองรับ: สรุปข้อความ การจำแนกข้อความ การวิเคราะห์ความรู้สึกและการแปลภาษา

อ่านบล็อก

Llama 3 70B

เหมาะสำหรับการสร้างเนื้อหา AI แบบสนทนา ความเข้าใจภาษา การพัฒนาการวิจัย และแอปพลิเคชันองค์กร 

โทเค็นสูงสุด: 8K

ภาษา: อังกฤษ

รองรับการปรับแต่งอย่างละเอียด: ไม่

กรณีการใช้งานที่รองรับ: การสรุปข้อความ และความถูกต้อง การจำแนกข้อความ และการจำแนกความแตกต่างของข้อความ การวิเคราะห์ความรู้สึกและการให้เหตุผลที่แตกต่างกัน การสร้างแบบจำลองภาษา ระบบบทสนทนา การสร้างรหัส และการปฏิบัติตามคำแนะนำ

อ่านบล็อก

Llama 3 8B

เหมาะสำหรับพลังงานและทรัพยากรการคำนวณ จำกัด เวลาฝึกอบรมที่เร็วขึ้น และอุปกรณ์ Edge

โทเค็นสูงสุด: 8K

ภาษา: อังกฤษ

รองรับการปรับแต่งอย่างละเอียด: ไม่

กรณีการใช้งานที่รองรับ: สรุปข้อความ การจำแนกข้อความ การวิเคราะห์ความรู้สึกและการแปลภาษา

อ่านบล็อก

Llama 2 70B

โมเดลที่ได้รับการปรับแต่งอย่างละเอียดซึ่งมีพารามิเตอร์ขนาด 70B เหมาะสำหรับงานขนาดใหญ่ขึ้น เช่น การสร้างโมเดลภาษา การสร้างข้อความ และระบบบทสนทนา

โทเค็นสูงสุด: 4K

ภาษา: อังกฤษ

รองรับการปรับแต่งอย่างละเอียด: ใช่

กรณีการใช้งานที่รองรับ: แชทได้เหมือนผู้ช่วย

อ่านบล็อก

Llama 2 13B

โมเดลที่ได้รับการปรับแต่งอย่างละเอียดซึ่งมีพารามิเตอร์ขนาด 13B เหมาะสำหรับงานขนาดเล็ก เช่น การจำแนกประเภทข้อความ การวิเคราะห์ความรู้สึก และการแปลภาษา

โทเค็นสูงสุด: 4K

ภาษา: อังกฤษ

รองรับการปรับแต่งอย่างละเอียด: ใช่

กรณีการใช้งานที่รองรับ: แชทได้เหมือนผู้ช่วย

อ่านบล็อก

Nomura ใช้โมเดล Llama จาก Meta ใน Amazon Bedrock เพื่อสร้างระบบ AI ช่วยสร้างเชิงประชาธิปไตย

 

Aniruddh Singh ผู้อำนวยการบริหารและสถาปนิกองค์กรของ Nomura สรุปเส้นทางของสถาบันการเงินในการสร้างระบบ AI ช่วยสร้างเชิงประชาธิปไตยทั่วทั้งบริษัทโดยใช้โมเดล Amazon Bedrock และ Llama จาก Meta Amazon Bedrock ให้การเข้าถึงโมเดลพื้นฐานชั้นนำที่สำคัญอย่าง Llama ซึ่งช่วยให้สามารถผสานการทำงานได้อย่างราบรื่น Llama มอบประโยชน์ที่สำคัญให้กับ Nomura ได้แก่ นวัตกรรมที่รวดเร็ว ความโปร่งใส กฎควบคุมระบบอคติ และประสิทธิภาพที่แข็งแกร่งในการสรุปข้อความ การสร้างรหัส การวิเคราะห์ข้อมูลบันทึก และการประมวลผลเอกสาร 

TaskUs ปฏิวัติประสบการณ์ของลูกค้าโดยใช้โมเดล Llama จาก Meta ใน Amazon Bedrock

TaskUs ผู้ให้บริการด้านดิจิทัลภายนอกชั้นนำและผู้ให้บริการด้านประสบการณ์สำหรับลูกค้ารุ่นต่อไปให้กับบริษัทที่มีนวัตกรรมมากที่สุดในโลก ช่วยให้เป็นตัวแทนลูกค้า ปกป้อง และขยายแบรนด์ของตน แพลตฟอร์ม TaskGPT ที่เป็นนวัตกรรมใหม่ซึ่งขับเคลื่อนโดยโมเดล Amazon Bedrock และ Llama จาก Meta ช่วยให้เพื่อนร่วมทีมสามารถให้บริการที่ยอดเยี่ยม TaskUs สร้างเครื่องมือบน TaskGPT ซึ่งใช้ประโยชน์จาก Amazon Bedrock และ Llama สำหรับการกำหนดคำอธิบายที่คุ้มค่า การสร้างเนื้อหา ความเข้าใจ และการจัดการงานที่ซับซ้อน