Sztuczna inteligencja Rynek

IBM zaprezentował nową generację rodziny dużych modeli językowych Granite 3.2

Mikołaj Marszycki 10 kwietnia 2025

0 1 096 1 minuta czytania

Granite 3.2 to najnowsza wersja trzeciej generacji modeli IBM Granite. Wszystkie z nich są już dostępne na platformie Hugging Face na licencji Apache 2.0. Z kolei wybrane modele są już dostępne na IBM watsonx.ai, Ollama, Replicate oraz LM Studio, a wkrótce pojawią się także w wersji RHEL AI 1.5, udostępniając zaawansowane możliwości zarówno firmom, jak i społeczności open source.

Najważniejsze cechy nowych modeli obejmują:

Nowy Vision Language Model (VLM) do zadań związanych ze zrozumieniem dokumentów, który osiąga wyniki porównywalne lub przewyższające znacznie większe modele – takie jak Llama 3.2 11B i Pixtral 12B – w kluczowych benchmarkach dla zastosowań biznesowych: DocVQA, ChartQA, AI2D oraz OCRBench. Oprócz solidnego zestawu danych treningowych, IBM wykorzystał również własny, otwartoźródłowy zestaw narzędzi Docling do przetworzenia 85 milionów plików PDF i wygenerowania 26 milionów syntetycznych par pytanie–odpowiedź, co znacząco zwiększyło zdolność modelu VLM do pracy z dokumentami o wysokim stopniu złożoności.
Zdolności do rozumowania typu „chain of thought” (łańcuch myślowy) dostępne w modelach 3.2 2B i 8B, z możliwością włączania i wyłączania tego mechanizmu w celu optymalizacji wydajności. Dzięki tej funkcjonalności, model 8B osiąga dwucyfrową poprawę względem poprzednika w testach oceniających umiejętność wykonywania instrukcji, takich jak ArenaHard i Alpaca Eval – bez pogorszenia wyników w zakresie bezpieczeństwa czy wydajności. Co więcej, dzięki nowatorskim metodom skalowania inferencji, model Granite 3.2 8B może zostać skalibrowany tak, by dorównywać znacznie większym modelom, takim jak Claude 3.5 Sonnet czy GPT-4o, w zadaniach matematycznego rozumowania, np. AIME2024 i MATH500.
Odchudzone wersje modeli bezpieczeństwa Granite Guardian, które przy zachowaniu wydajności poprzedniej generacji Granite 3.1 Guardian charakteryzują się o 30% mniejszym rozmiarem. Modele w wersji 3.2 wprowadzają również nową funkcjonalność, określaną mianem werbalizowanego zaufania, która umożliwia bardziej precyzyjną ocenę ryzyka i pozwala uwzględniać niejednoznaczność w procesach monitorowania bezpieczeństwa.

Strategia IBM polegająca na dostarczaniu mniejszych, wyspecjalizowanych modeli AI dla przedsiębiorstw nadal potwierdza swoją skuteczność w testach. Model Granite 3.1 8B niedawno uzyskał wysokie noty pod względem dokładności w benchmarku Salesforce LLM Benchmark dla CRM.

Obok modeli Granite 3.2 Instruct, Vision i Guardrail, IBM wprowadza także nową generację modeli TinyTimeMixers (TTM) (poniżej 10 milionów parametrów), które umożliwiają prognozowanie długoterminowe sięgające nawet dwóch lat w przód. Jak przekonują specjaliści IBM, modele te stanowią potężne narzędzie do analizy trendów długoterminowych, w tym prognoz finansowych i ekonomicznych, przewidywania popytu w łańcuchach dostaw oraz planowania sezonowego zatowarowania w handlu detalicznym.

Wyniki testów modelu Vision i Instruct są dostępne w artykule technicznym IBM: IBM Granite 3.2: Reasoning, Vision, Forecasting, and More, opublikowanym 26 lutego 2025 r.

Tagi

Sztuczna inteligencja Rynek

IBM zaprezentował nową generację rodziny dużych modeli językowych Granite 3.2

Dodaj komentarz Anuluj pisanie odpowiedzi

IBM, Politechnika Wrocławska i Uniwersytet Łódzki rozwijają nowy model z rodziny PLLuM

IBM FlashSystem zbliża warstwę danych do potrzeb biznesu

Nowa generacja pamięci masowych IBM wykorzystuje AI do poprawy wydajności i bezpieczeństwa

CXO HUB: Odporność infrastruktury w dobie AI i ransomware

IBM przyspiesza w wyścigu o przewagę kwantową - nowe procesory Nighthawk i Loon

Anthropic wstrzymuje model zbyt groźny dla cyberbezpieczeństwa

AI Act, gigafabryki i europejski portfel tożsamości: nowa architektura cyfrowej UE

Rosyjscy hakerzy przejmują routery na całym świecie

PFR stawia na naukę – nowy komponent ma zwiększyć inwestycje VC

KSC bez tajemnic – co powinien wiedzieć każdy menedżer

AI wchodzi na halę produkcyjną. Comarch wydał nową wersję systemu do planowania produkcji

Big Techy inwestują w elektrownie gazowe, aby zasilić rozwój AI

43,1% freelancerów ukrywa przed klientami korzystanie z AI

CloudFerro uruchamia w Łodzi region suwerennej chmury

6 powodów, by przenieść się do chmury Integrated Computing jeszcze w tym roku

OVHcloud wesprze cyfrowe euro Europejskiego Banku Centralnego

Google finalizuje przejęcie Wiz

Rosyjscy cyberprzestępcy miesiącami szpiegowali ukraińskie systemy, ukrywając ataki w chmurze

Infrastruktura IT z certyfikatem cyfrowej suwerenności

Dan Popa pokieruje Veeam w Europie Wschodniej

Virendra Shelar nowym prezesem OMRON Europe

Krystian Palica dołącza do B2Bnetwork

Łukasz Bromirski przechodzi z Cisco do IS-Wireless

Jovan Ćetković w zarządzie T‑Mobile Polska

Tomasz Rychter dyrektorem technologicznym w Grupie Zero

Wojciech Zieliński został CIO w Sklepy Komfort

Jacek Przybylski został dyrektorem generalnym Cisco w Polsce

Dariusz Piekarski wzmacnia Sanmargar Team

Zbigniew Mądry nowym prezesem zarządu AB

Redakcja

O ITwiz

Popularne w serwisie:

Polskie uczelnie zmuszone do ograniczania przyjęć na studia IT

Nowa polityka licencyjna VMware uderza w małe i średnie firmy

e-Doręczenia niosą wartości, które dają przewagę konkurencyjną

Czytaj też

Anthropic wstrzymuje model zbyt groźny dla cyberbezpieczeństwa

PFR stawia na naukę – nowy komponent ma zwiększyć inwestycje VC

AI wchodzi na halę produkcyjną. Comarch wydał nową wersję systemu do planowania produkcji

Big Techy inwestują w elektrownie gazowe, aby zasilić rozwój AI

43,1% freelancerów ukrywa przed klientami korzystanie z AI

Microsoft Partner – optymalizacja procesów, usprawnianie współpracy i osiągnięcie zwinności biznesowej

Dodaj komentarz Anuluj pisanie odpowiedzi

IBM, Politechnika Wrocławska i Uniwersytet Łódzki rozwijają nowy model z rodziny PLLuM

IBM FlashSystem zbliża warstwę danych do potrzeb biznesu

Nowa generacja pamięci masowych IBM wykorzystuje AI do poprawy wydajności i bezpieczeństwa

CXO HUB: Odporność infrastruktury w dobie AI i ransomware

IBM przyspiesza w wyścigu o przewagę kwantową - nowe procesory Nighthawk i Loon

Redakcja

Polskie uczelnie zmuszone do ograniczania przyjęć na studia IT

Nowa polityka licencyjna VMware uderza w małe i średnie firmy

e-Doręczenia niosą wartości, które dają przewagę konkurencyjną