Claude 3.5 - Computer Use Beta и обновления моделей [2024]

Что это значит простыми словами:

Представьте, что у вас есть AI-помощник, который может:

  • Открывать программы и работать с ними как человек
  • Искать информацию в браузере
  • Создавать и редактировать файлы
  • Управлять мышкой и клавиатурой
  • Выполнять рутинные задачи за вас

Примеры использования:

  • Автоматизация тестирования программ
  • Сбор данных с веб-сайтов
  • Обработка документов
  • Анализ и сортировка файлов
Важно:
  • Функция находится в бета-тестировании
  • Рекомендуется использовать в изолированной среде (Docker/VM)
  • Необходимо внимательно проверять действия AI

Простой пример использования на Go:

package main

import (
    "context"
    "log"
    "github.com/anthropic-ai/anthropic-sdk-go"
)

func main() {
    client := anthropic.Anthropic()

    response, err := client.Beta.Messages.Create(
        context.Background(),
        &anthropic.Message{
            Model: "claude-3-5-sonnet-20241022",
            MaxTokens: 1024,
            Tools: []anthropic.Tool{
                {
                    Type: "computer_20241022",
                    Name: "computer",
                    DisplayWidthPx: 1024,
                    DisplayHeightPx: 768,
                    DisplayNumber: 1,
                },
                {
                    Type: "text_editor_20241022",
                    Name: "str_replace_editor",
                },
                {
                    Type: "bash_20241022",
                    Name: "bash",
                },
            },
            Messages: []anthropic.MessagePart{{
                Role: "user",
                Content: "Сохрани картинку кота на рабочий стол",
            }},
            Betas: []string{"computer-use-2024-10-22"},
        },
    )

    if err != nil {
        log.Fatal(err)
    }

    log.Printf("Response: %v", response)
}

Другие улучшения в Claude 3.5

Claude 3.5 Sonnet (обновленная версия)

  • Улучшена производительность на SWE-bench Verified с 33.4% до 49.0%
  • Повышена эффективность в задачах TAU-bench до 69.2%
  • Те же цены при значительном улучшении возможностей

Claude 3.5 Haiku (новая модель)

  • Производительность на уровне Claude 3 Opus
  • 40.6% на SWE-bench Verified
  • Оптимизирована для быстрых ответов

Доступность

  • Computer Use Beta доступен через API Anthropic, Amazon Bedrock и Google Cloud Vertex AI
  • Claude 3.5 Sonnet доступен сейчас
  • Claude 3.5 Haiku выйдет до конца октября

Спасибо за уделенное время! Рекомендую подписаться на мой телеграмм канал, где вы сможете найти актуальные новости, примеры и хаки в мире разработки: @asanov_tech

Комментарии

Популярные сообщения из этого блога

Как преобразовать строку в массив в ClickHouse / How to transform string to array in ClickHouse

Как разложить массив на несколько строк в ClickHouse

Экспорт одной таблицы базы данных или mysqldump одной таблицы (MySQL)