Sztuczna inteligencjaRynek

IBM zaprezentował nową generację rodziny dużych modeli językowych Granite 3.2

Granite 3.2 to najnowsza wersja trzeciej generacji modeli IBM Granite. Wszystkie z nich są już dostępne na platformie Hugging Face na licencji Apache 2.0. Z kolei wybrane modele są już dostępne na IBM watsonx.ai, Ollama, Replicate oraz LM Studio, a wkrótce pojawią się także w wersji RHEL AI 1.5, udostępniając zaawansowane możliwości zarówno firmom, jak i społeczności open source.

IBM zaprezentował nową generację rodziny dużych modeli językowych Granite 3.2

Najważniejsze cechy nowych modeli obejmują:

  • Nowy Vision Language Model (VLM) do zadań związanych ze zrozumieniem dokumentów, który osiąga wyniki porównywalne lub przewyższające znacznie większe modele – takie jak Llama 3.2 11B i Pixtral 12B – w kluczowych benchmarkach dla zastosowań biznesowych: DocVQA, ChartQA, AI2D oraz OCRBench. Oprócz solidnego zestawu danych treningowych, IBM wykorzystał również własny, otwartoźródłowy zestaw narzędzi Docling do przetworzenia 85 milionów plików PDF i wygenerowania 26 milionów syntetycznych par pytanie–odpowiedź, co znacząco zwiększyło zdolność modelu VLM do pracy z dokumentami o wysokim stopniu złożoności.
  • Zdolności do rozumowania typu „chain of thought” (łańcuch myślowy) dostępne w modelach 3.2 2B i 8B, z możliwością włączania i wyłączania tego mechanizmu w celu optymalizacji wydajności. Dzięki tej funkcjonalności, model 8B osiąga dwucyfrową poprawę względem poprzednika w testach oceniających umiejętność wykonywania instrukcji, takich jak ArenaHard i Alpaca Eval – bez pogorszenia wyników w zakresie bezpieczeństwa czy wydajności. Co więcej, dzięki nowatorskim metodom skalowania inferencji, model Granite 3.2 8B może zostać skalibrowany tak, by dorównywać znacznie większym modelom, takim jak Claude 3.5 Sonnet czy GPT-4o, w zadaniach matematycznego rozumowania, np. AIME2024 i MATH500.
  • Odchudzone wersje modeli bezpieczeństwa Granite Guardian, które przy zachowaniu wydajności poprzedniej generacji Granite 3.1 Guardian charakteryzują się o 30% mniejszym rozmiarem. Modele w wersji 3.2 wprowadzają również nową funkcjonalność, określaną mianem werbalizowanego zaufania, która umożliwia bardziej precyzyjną ocenę ryzyka i pozwala uwzględniać niejednoznaczność w procesach monitorowania bezpieczeństwa.

Strategia IBM polegająca na dostarczaniu mniejszych, wyspecjalizowanych modeli AI dla przedsiębiorstw nadal potwierdza swoją skuteczność w testach. Model Granite 3.1 8B niedawno uzyskał wysokie noty pod względem dokładności w benchmarku Salesforce LLM Benchmark dla CRM.

Obok modeli Granite 3.2 Instruct, Vision i Guardrail, IBM wprowadza także nową generację modeli TinyTimeMixers (TTM) (poniżej 10 milionów parametrów), które umożliwiają prognozowanie długoterminowe sięgające nawet dwóch lat w przód. Jak przekonują specjaliści IBM, modele te stanowią potężne narzędzie do analizy trendów długoterminowych, w tym prognoz finansowych i ekonomicznych, przewidywania popytu w łańcuchach dostaw oraz planowania sezonowego zatowarowania w handlu detalicznym.

Wyniki testów modelu Vision i Instruct są dostępne w artykule technicznym IBM: IBM Granite 3.2: Reasoning, Vision, Forecasting, and More, opublikowanym 26 lutego 2025 r.

Tagi

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *