Представляем модель Llama 3.3
Llama 3.3 – это исключительно текстовая модель, настраиваемая с помощью инструкций 70B, что обеспечивает повышенную производительность по сравнению с Llama 3.1 70B и Llama 3.2 90B при использовании в текстовых приложениях. Llama 3.3 70B обеспечивает производительность, аналогичную производительности Llama 3.1 405B, но требует лишь малой части вычислительных ресурсов.
Преимущества
Встречайте Llama
В прошлом десятилетии компания Meta стремилась упрощать работу разработчиков, а также содействовать их прогрессу и сотрудничеству с исследователями и организациями. Модели Llama доступны в различных конфигурациях. Разработчики могут выбрать ту, которая наилучшим образом соответствует их потребностям и бюджету на логические выводы. Модели Llama в Amazon Bedrock открывают целый мир возможностей, поскольку разработчикам не нужно беспокоиться о масштабируемости и управлять инфраструктурой. Amazon Bedrock – это очень простой для разработчиков способ начать использовать Llama.
Примеры использования
Модели Llama отлично справляются с пониманием изображений и рассуждениями о визуальных материалах, языковыми нюансами, пониманием контекста и сложными задачами, такими как визуальный анализ данных, субтитры к изображениям, создание диалогов, перевод и генерация диалогов, а также могут легко выполнять многоэтапные задачи. Модели Llama отлично подходят и для других сценариев использования, среди которых сложные рассуждения о визуальных объектах и их понимание, извлечение текста из изображений, визуальное обоснование, ответы на визуальные вопросы в документах, резюмирование и точность текста, классификация текста, анализ настроений и аргументация нюансов, языковое моделирование, диалоговые системы, генерация кода и выполнение инструкций.
Версии модели
Llama 3.3 70B
Исключительно текстовая модель, настраиваемая с помощью инструкций 70B, что обеспечивает повышенную производительность по сравнению с Llama 3.1 70B и Llama 3.2 90B при использовании в текстовых приложениях. Llama 3.3 70B обеспечивает производительность, аналогичную производительности Llama 3.1 405B, но требует лишь малой части вычислительных ресурсов.
Максимальное количество токенов: 128 000
Языки: английский, немецкий, французский, итальянский, португальский, испанский и тайский.
Поддержка точной настройки: нет
Поддерживаемые варианты использования: эта модель поддерживает высокопроизводительный разговорный искусственный интеллект, предназначенный для создания контента, корпоративных приложений и исследований, а также предлагает расширенные возможности понимания языка, включая суммирование текста, классификацию, анализ настроений и генерацию кода. Модель также поддерживает возможность использования своих выходных данных для улучшения других моделей, включая генерацию и обработку синтетических данных.
Llama 3.2 90B
Мультимодальная модель, которая принимает как текстовые, так и графические входы и выходы. Идеально подходит для приложений, требующих сложного визуального интеллекта, таких как анализ изображений, обработка документов, мультимодальные чат-боты и автономные системы.
Максимальное количество токенов: 128 000
Языки: английский, испанский, итальянский, немецкий, португальский, тайский, французский и хинди.
Поддержка точной настройки: нет
Поддерживаемые варианты использования: понимание изображений, визуальное мышление и мультимодальное взаимодействие, позволяющие передовым приложениям, таким как субтитры к изображениям, извлечение текста из изображений, визуальное обоснование, визуальные ответы на вопросы и ответы на вопросы в документах, с уникальной способностью рассуждать и делать выводы на основе визуальных и текстовых данных.
Llama 3.2 11B
Мультимодальная модель, которая принимает как текстовые, так и графические входы и выходы. Идеально подходит для приложений, требующих сложного визуального интеллекта, таких как анализ изображений, обработка документов и мультимодальные чат-боты.
Максимальное количество токенов: 128 000
Языки: английский, испанский, итальянский, немецкий, португальский, тайский, французский и хинди.
Поддержка точной настройки: нет
Поддерживаемые варианты использования: понимание изображений, визуальное мышление и мультимодальное взаимодействие, позволяющее применять передовые приложения, такие как субтитры к изображениям, поиск текста из изображений, визуальное обоснование, визуальные ответы на вопросы и ответы на вопросы в документах.
Llama 3.2 3B
Легкая модель, содержащая только текст, создана для получения высокоточных и релевантных результатов. Предназначено для приложений, требующих логических выводов с малой задержкой и ограниченными вычислительными ресурсами. Идеально подходит для запросов и быстрого переписывания, мобильных помощников по написанию текстов на базе ИИ, а также приложений для обслуживания клиентов, особенно на периферийных устройствах, где эффективность и низкая задержка обеспечивают беспрепятственную интеграцию с различными приложениями, включая мобильных помощников по написанию текстов на базе ИИ и чат-ботов для обслуживания клиентов.
Максимальное количество токенов: 128 000
Языки: английский, испанский, итальянский, немецкий, португальский, тайский, французский и хинди.
Поддержка точной настройки: нет
Поддерживаемые варианты использования: расширенная генерация текста, обобщение, анализ настроений, эмоциональный интеллект, понимание контекста и рассуждение на основе здравого смысла.
Llama 3.2 1B
Легкая модель, состоящая только из текста, предназначена для быстрого и точного ответа. Идеально подходит для периферийных устройств и мобильных приложений. Модель обеспечивает возможности ИИ на устройстве, сохраняя конфиденциальность пользователей и сводя к минимуму задержки.
Максимальное количество токенов: 128 000
Языки: английский, испанский, итальянский, немецкий, португальский, тайский, французский и хинди.
Поддержка точной настройки: нет
Поддерживаемые варианты использования: сценарии применения многоязычных диалогов, такие как управление персональной информацией, поиск многоязычных знаний и задачи переписывания.
Llama 3.1 405B
Идеально подходит для корпоративных приложений, исследований и разработок, генерации синтетических данных и обучения моделей. Благодаря возможностям вывода, оптимизированным с учетом задержек, которые доступные в предварительной версии, эта модель обеспечивает исключительную производительность и масштабируемость, что позволяет организациям ускорить реализацию инициатив в области искусственного интеллекта, сохраняя при этом высокое качество результатов в различных сценариях использования.
Максимальное количество токенов: 128 000
Языки: английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский.
Поддерживается точная настройка: ожидается
Поддерживаемые варианты использования: модель демонстрирует отличные общие знания, генерирует длинные тексты, осуществляет переводы (в том числе многоязычные), хорошо понимает контекст, имеет продвинутое мышление и способна принимать решения, эффективно устраняет двусмысленность и неопределенности, обладает креативностью и стремлением к разнообразию. Она управляема и помогает с расчетами, использованием инструментов и программированием.
Llama 3.1 70B
Идеально подходит для создания контента, использования разговорного ИИ, распознавания высказываний, исследований и корпоративных приложений. Благодаря новым возможностям вывода, оптимизированным с учетом задержек, которые доступные в предварительной версии, эта модель устанавливает новый стандарт производительности для решений искусственного интеллекта, обрабатывающих большой объем вводимого текста, позволяя приложениям быстрее реагировать и эффективнее обрабатывать более длинные запросы.
Максимальное количество токенов: 128 000
Языки: английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский.
Поддержка точной настройки: да
Поддерживаемые варианты использования: суммирование текста, его классификация, анализ заложенных смыслов и языковой перевод.
Llama 3.1 8B
Идеально подходит для ограниченных вычислительных мощностей и ресурсов, сокращения времени обучения и периферийных устройств.
Максимальное количество токенов: 128 000
Языки: английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский.
Поддержка точной настройки: да
Поддерживаемые варианты использования: суммирование текста, его классификация, анализ заложенных смыслов и языковой перевод.
Llama 3 70B
Идеально подходит для создания контента, использования разговорного ИИ, понимания языка, исследований и корпоративных приложений.
Максимальное количество токенов: 8000
Языки: английский
Поддержка тонкой настройки: нет
Поддерживаемые варианты использования: суммирование и сохранение точности текста, его классификация и определение, а также аргументация нюансов, анализ заложенных смыслов, языковое моделирование, диалоговые системы, генерация кода и следование инструкциям.
Llama 3 8B
Идеально подходит для ограниченных вычислительных мощностей и ресурсов, сокращения времени обучения и периферийных устройств.
Максимальное количество токенов: 8000
Языки: английский
Поддержка тонкой настройки: нет
Поддерживаемые варианты использования: суммирование текста, его классификация, анализ заложенных смыслов и перевод на другие языки
Llama 2 70B
Усовершенствованная модель с размером параметра 70 Б. Подходит для более масштабных задач, таких как языковое моделирование, генерация текста и диалоговые системы.
Максимальное количество токенов: 4000
Языки: английский
Поддержка тонкой настройки: да
Поддерживаемые примеры использования: чат-ассистент
Llama 2 13B
Усовершенствованная модель с размером параметра 13 Б. Подходит для небольших задач, таких как классификация текста, анализ настроений и языковой перевод.
Максимальное количество токенов: 4000
Языки: английский
Поддержка тонкой настройки: да
Поддерживаемые примеры использования: чат-ассистент
Nomura использует модели Llama от Meta в Amazon Bedrock, чтобы улучшать генеративный искусственный интеллект
Анирудд Сингх, исполнительный директор и корпоративный архитектор компании Nomura, рассказывает о том, как они стремятся улучшить генеративный искусственный интеллект в масштабах всей компании с использованием моделей Amazon Bedrock и Llama от Meta. Amazon Bedrock предоставляет критически важный доступ к ведущим базовым моделям, таким как Llama, обеспечивая беспрепятственную интеграцию. Nomura использует ключевые преимущества Llama, в том числе более быстрые инновации, прозрачность, защиту от предвзятости и высокую производительность резюмирования текста, генерации кода, анализа журналов и обработки документов.
TaskUs совершает революционный прорыв в обслуживании клиентов, используя модели Llama от Meta в Amazon Bedrock
TaskUs, ведущий поставщик аутсорсинговых цифровых услуг и инструментов нового поколения для взаимодействия с клиентами самых инновационных компаний мира, помогает своим клиентам представлять, защищать и развивать свои бренды. Инновационная платформа TaskUs под названием TaskGPT, основанная на моделях Amazon Bedrock и Llama от Meta, позволяет предоставлять обслуживание высочайшего уровня. TaskUs создает на основе TaskGPT инструменты, использующие Amazon Bedrock и Llama для создания, анализа и преобразования контента, а также обработки сложных задач.