Llama от Meta в Amazon Bedrock

Постройте будущее ИИ с помощью Llama

Представляем модель Llama 3.3

Llama 3.3 – это исключительно текстовая модель, настраиваемая с помощью инструкций 70B, что обеспечивает повышенную производительность по сравнению с Llama 3.1 70B и Llama 3.2 90B при использовании в текстовых приложениях. Llama 3.3 70B обеспечивает производительность, аналогичную производительности Llama 3.1 405B, но требует лишь малой части вычислительных ресурсов.

Комплексное обучение Llama 3.3 70B обеспечивает глубокое понимание и способность к освоению различных задач. Эта модель поддерживает высокопроизводительный разговорный искусственный интеллект, предназначенный для создания контента, корпоративных приложений и исследований, а также предлагает расширенные возможности понимания языка, включая суммирование текста, классификацию, анализ настроений и генерацию кода.

Llama 3.2 90B – самая передовая модель Meta, которая идеально подходит для задач корпоративного уровня. Llama 3.2 – первая модель Llama, поддерживающая задачи машинного зрения, с новой архитектурой модели, которая интегрирует представления кодировщика изображений в языковую модель. Эта модель отлично подходит для общих знаний, создания длинных текстов, многоязычного перевода, написания программного кода, математики и продвинутых рассуждений. Она также может рассуждать об изображениях, понимать их нюансы и приводить визуальные аргументы. Эта модель идеально подходит для следующих сценариев использования: подписи к изображениям, извлечение текста из изображений, визуальное обоснование, визуальные ответы на вопросы и визуальные аргументы, а также ответы на визуальные вопросы в документах.

Llama 3.2 11B хорошо подходит для создания контента, разговорного искусственного интеллекта, понимания языка и корпоративных приложений, требующих визуального мышления. Модель демонстрирует высокую производительность при резюмировании текста, анализе настроений, генерации кода и выполнении инструкций, а также добавлена возможность рассуждать об изображениях. Эта модель идеально подходит для следующих сценариев использования: подписи к изображениям, извлечение текста из изображений, визуальное обоснование, визуальные ответы на вопросы и визуальные аргументы, а также ответы на визуальные вопросы в документах.

Взаимодействие с искусственным интеллектом в Llama 3.2 3B более персонализированное, при этом данные обрабатываются на устройстве. Llama 3.2 3B разработана для задач, в которых требуются логические выводы с малой задержкой, а вычислительные ресурсы ограничены. Она отлично справляется с задачами резюмирования, классификации и языкового перевода. Эта модель идеально подходит для следующих сценариев использования: мобильных помощников по написанию текстов на базе искусственного интеллекта и приложений для обслуживания клиентов.

Llama 3.2 1B – самая легкая модель в коллекции Llama 3.2, которая идеально подходит для поиска и резюмирования на периферийных устройствах и в мобильных приложениях. Она создает возможности искусственного интеллекта на устройстве, сохраняя конфиденциальность пользователей и сводя к минимуму задержки. Эта модель идеально подходит для следующих сценариев использования: управление персональной информацией и получение знаний на разных языках.

Преимущества

Взаимодействие с искусственным интеллектом в Llama 3.2 более персонализированное, при этом данные обрабатываются на устройстве. Модели Llama 3.2 отличаются высокой эффективностью и производительностью, а также малой задержкой, поэтому подходят для самых разных задач.
Используя контекст длиной 128 тыс., Llama фиксирует еще более тонкие взаимосвязи в данных.
Модели Llama обучаются на 15 триллионах токенов из общедоступных онлайн-источников данных, чтобы лучше понимать тонкости языка.
Модель Llama 3.2 поддерживает восемь языков: английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский.
Управляемый API Amazon Bedrock упрощает использование моделей Llama. Организации любого масштаба могут воспользоваться возможностями Llama, не беспокоясь о базовой инфраструктуре. Поскольку Amazon Bedrock является бессерверным сервисом, вам не нужно управлять какой-либо инфраструктурой. Вы можете безопасно интегрировать и развертывать генеративные возможности искусственного интеллекта Llama в свои приложения с помощью уже знакомых сервисов AWS. чтобы сосредоточиться на главном, а именно на разработке приложений на базе искусственного интеллекта.

Встречайте Llama

В прошлом десятилетии компания Meta стремилась упрощать работу разработчиков, а также содействовать их прогрессу и сотрудничеству с исследователями и организациями. Модели Llama доступны в различных конфигурациях. Разработчики могут выбрать ту, которая наилучшим образом соответствует их потребностям и бюджету на логические выводы. Модели Llama в Amazon Bedrock открывают целый мир возможностей, поскольку разработчикам не нужно беспокоиться о масштабируемости и управлять инфраструктурой. Amazon Bedrock – это очень простой для разработчиков способ начать использовать Llama.

Примеры использования

Модели Llama отлично справляются с пониманием изображений и рассуждениями о визуальных материалах, языковыми нюансами, пониманием контекста и сложными задачами, такими как визуальный анализ данных, субтитры к изображениям, создание диалогов, перевод и генерация диалогов, а также могут легко выполнять многоэтапные задачи. Модели Llama отлично подходят и для других сценариев использования, среди которых сложные рассуждения о визуальных объектах и их понимание, извлечение текста из изображений, визуальное обоснование, ответы на визуальные вопросы в документах, резюмирование и точность текста, классификация текста, анализ настроений и аргументация нюансов, языковое моделирование, диалоговые системы, генерация кода и выполнение инструкций.

Версии модели

Llama 3.3 70B

Исключительно текстовая модель, настраиваемая с помощью инструкций 70B, что обеспечивает повышенную производительность по сравнению с Llama 3.1 70B и Llama 3.2 90B при использовании в текстовых приложениях. Llama 3.3 70B обеспечивает производительность, аналогичную производительности Llama 3.1 405B, но требует лишь малой части вычислительных ресурсов.

Максимальное количество токенов: 128 000

Языки: английский, немецкий, французский, итальянский, португальский, испанский и тайский.

Поддержка точной настройки: нет

Поддерживаемые варианты использования: эта модель поддерживает высокопроизводительный разговорный искусственный интеллект, предназначенный для создания контента, корпоративных приложений и исследований, а также предлагает расширенные возможности понимания языка, включая суммирование текста, классификацию, анализ настроений и генерацию кода. Модель также поддерживает возможность использования своих выходных данных для улучшения других моделей, включая генерацию и обработку синтетических данных.

Llama 3.2 90B

Мультимодальная модель, которая принимает как текстовые, так и графические входы и выходы. Идеально подходит для приложений, требующих сложного визуального интеллекта, таких как анализ изображений, обработка документов, мультимодальные чат-боты и автономные системы.

Максимальное количество токенов: 128 000

Языки: английский, испанский, итальянский, немецкий, португальский, тайский, французский и хинди.

Поддержка точной настройки: нет

Поддерживаемые варианты использования: понимание изображений, визуальное мышление и мультимодальное взаимодействие, позволяющие передовым приложениям, таким как субтитры к изображениям, извлечение текста из изображений, визуальное обоснование, визуальные ответы на вопросы и ответы на вопросы в документах, с уникальной способностью рассуждать и делать выводы на основе визуальных и текстовых данных.

Читать блог

Llama 3.2 11B

Мультимодальная модель, которая принимает как текстовые, так и графические входы и выходы. Идеально подходит для приложений, требующих сложного визуального интеллекта, таких как анализ изображений, обработка документов и мультимодальные чат-боты.

Максимальное количество токенов: 128 000

Языки: английский, испанский, итальянский, немецкий, португальский, тайский, французский и хинди.

Поддержка точной настройки: нет

Поддерживаемые варианты использования: понимание изображений, визуальное мышление и мультимодальное взаимодействие, позволяющее применять передовые приложения, такие как субтитры к изображениям, поиск текста из изображений, визуальное обоснование, визуальные ответы на вопросы и ответы на вопросы в документах.

Читать блог

Llama 3.2 3B

Легкая модель, содержащая только текст, создана для получения высокоточных и релевантных результатов. Предназначено для приложений, требующих логических выводов с малой задержкой и ограниченными вычислительными ресурсами. Идеально подходит для запросов и быстрого переписывания, мобильных помощников по написанию текстов на базе ИИ, а также приложений для обслуживания клиентов, особенно на периферийных устройствах, где эффективность и низкая задержка обеспечивают беспрепятственную интеграцию с различными приложениями, включая мобильных помощников по написанию текстов на базе ИИ и чат-ботов для обслуживания клиентов.

Максимальное количество токенов: 128 000

Языки: английский, испанский, итальянский, немецкий, португальский, тайский, французский и хинди.

Поддержка точной настройки: нет

Поддерживаемые варианты использования: расширенная генерация текста, обобщение, анализ настроений, эмоциональный интеллект, понимание контекста и рассуждение на основе здравого смысла.

Читать блог

Llama 3.2 1B

Легкая модель, состоящая только из текста, предназначена для быстрого и точного ответа. Идеально подходит для периферийных устройств и мобильных приложений. Модель обеспечивает возможности ИИ на устройстве, сохраняя конфиденциальность пользователей и сводя к минимуму задержки.

Максимальное количество токенов: 128 000

Языки: английский, испанский, итальянский, немецкий, португальский, тайский, французский и хинди.

Поддержка точной настройки: нет

Поддерживаемые варианты использования: сценарии применения многоязычных диалогов, такие как управление персональной информацией, поиск многоязычных знаний и задачи переписывания.

Читать блог

Llama 3.1 405B

Идеально подходит для корпоративных приложений, исследований и разработок, генерации синтетических данных и обучения моделей. Благодаря возможностям вывода, оптимизированным с учетом задержек, которые доступные в предварительной версии, эта модель обеспечивает исключительную производительность и масштабируемость, что позволяет организациям ускорить реализацию инициатив в области искусственного интеллекта, сохраняя при этом высокое качество результатов в различных сценариях использования.

Максимальное количество токенов:
128 000

Языки: английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский.

Поддерживается точная настройка: ожидается

Поддерживаемые варианты использования: модель демонстрирует отличные общие знания, генерирует длинные тексты, осуществляет переводы (в том числе многоязычные), хорошо понимает контекст, имеет продвинутое мышление и способна принимать решения, эффективно устраняет двусмысленность и неопределенности, обладает креативностью и стремлением к разнообразию. Она управляема и помогает с расчетами, использованием инструментов и программированием.

Читать блог

Llama 3.1 70B

Идеально подходит для создания контента, использования разговорного ИИ, распознавания высказываний, исследований и корпоративных приложений. Благодаря новым возможностям вывода, оптимизированным с учетом задержек, которые доступные в предварительной версии, эта модель устанавливает новый стандарт производительности для решений искусственного интеллекта, обрабатывающих большой объем вводимого текста, позволяя приложениям быстрее реагировать и эффективнее обрабатывать более длинные запросы.

Максимальное количество токенов: 128 000

Языки: английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский.

Поддержка точной настройки: да

Поддерживаемые варианты использования: суммирование текста, его классификация, анализ заложенных смыслов и языковой перевод.

Читать блог

Llama 3.1 8B

Идеально подходит для ограниченных вычислительных мощностей и ресурсов, сокращения времени обучения и периферийных устройств.

Максимальное количество токенов: 128 000

Языки: английский, немецкий, французский, итальянский, португальский, хинди, испанский и тайский.

Поддержка точной настройки: да

Поддерживаемые варианты использования: суммирование текста, его классификация, анализ заложенных смыслов и языковой перевод.

Читать блог

Llama 3 70B

Идеально подходит для создания контента, использования разговорного ИИ, понимания языка, исследований и корпоративных приложений. 

Максимальное количество токенов: 8000

Языки: английский

Поддержка тонкой настройки: нет

Поддерживаемые варианты использования: суммирование и сохранение точности текста, его классификация и определение, а также аргументация нюансов, анализ заложенных смыслов, языковое моделирование, диалоговые системы, генерация кода и следование инструкциям.

Читать блог

Llama 3 8B

Идеально подходит для ограниченных вычислительных мощностей и ресурсов, сокращения времени обучения и периферийных устройств.

Максимальное количество токенов: 8000

Языки: английский

Поддержка тонкой настройки: нет

Поддерживаемые варианты использования: суммирование текста, его классификация, анализ заложенных смыслов и перевод на другие языки

Читать блог

Llama 2 70B

Усовершенствованная модель с размером параметра 70 Б. Подходит для более масштабных задач, таких как языковое моделирование, генерация текста и диалоговые системы.

Максимальное количество токенов: 4000

Языки: английский

Поддержка тонкой настройки: да

Поддерживаемые примеры использования: чат-ассистент

Читать блог

Llama 2 13B

Усовершенствованная модель с размером параметра 13 Б. Подходит для небольших задач, таких как классификация текста, анализ настроений и языковой перевод.

Максимальное количество токенов: 4000

Языки: английский

Поддержка тонкой настройки: да

Поддерживаемые примеры использования: чат-ассистент

Читать блог

Nomura использует модели Llama от Meta в Amazon Bedrock, чтобы улучшать генеративный искусственный интеллект

 

Анирудд Сингх, исполнительный директор и корпоративный архитектор компании Nomura, рассказывает о том, как они стремятся улучшить генеративный искусственный интеллект в масштабах всей компании с использованием моделей Amazon Bedrock и Llama от Meta. Amazon Bedrock предоставляет критически важный доступ к ведущим базовым моделям, таким как Llama, обеспечивая беспрепятственную интеграцию. Nomura использует ключевые преимущества Llama, в том числе более быстрые инновации, прозрачность, защиту от предвзятости и высокую производительность резюмирования текста, генерации кода, анализа журналов и обработки документов. 

TaskUs совершает революционный прорыв в обслуживании клиентов, используя модели Llama от Meta в Amazon Bedrock

TaskUs, ведущий поставщик аутсорсинговых цифровых услуг и инструментов нового поколения для взаимодействия с клиентами самых инновационных компаний мира, помогает своим клиентам представлять, защищать и развивать свои бренды. Инновационная платформа TaskUs под названием TaskGPT, основанная на моделях Amazon Bedrock и Llama от Meta, позволяет предоставлять обслуживание высочайшего уровня. TaskUs создает на основе TaskGPT инструменты, использующие Amazon Bedrock и Llama для создания, анализа и преобразования контента, а также обработки сложных задач.