Sztuczna inteligencja Rynek

Gemini 2.0 – nowy model AI od Google

Mikołaj Marszycki 12 grudnia 2024

0 2 464 1 minuta czytania

Google wprowadza pierwszy model z serii Gemini 2.0 – wersję eksperymentalną Gemini 2.0 Flash. Jak zapewniają przedstawiciele koncernu, jest to wszechstronny model AI wyróżniający się niskimi opóźnieniami i lepszą wydajnością. Flash 2.0 jest dwa razy szybszy niż wersja 1.5 Pro, obejmuje nowe wyjścia multimodalne i jest wyposażony w natywne narzędzia. Programiści mogą już testować Gemini 2.0 Flash za pośrednictwem Gemini API w Google AI Studio i Vertex AI. Ogólne udostępnienie nowego modelu planowane jest natomiast na styczeń 2025 roku.

Gemini 2.0 Flash wykorzystuje wszystkie możliwości wersji 1.5 Flash, ale działa dwukrotnie szybciej i ma nowe funkcje. Poza multimodalnymi danymi wejściowymi – takimi jak obrazy, filmy i dźwięki – model 2.0 Flash obsługuje także multimodalne dane wyjściowe. A więc natywnie generowane obrazy połączone z tekstem oraz sterowalnym dźwiękiem TTS w wielu językach. Może również natywnie wywoływać narzędzia takie jak wyszukiwarka Google, wykonywać kod oraz uruchamiać zewnętrzne funkcje określone przez użytkownika.

Kolejne nowe rozwiązanie to Deep Research – wykorzystujące funkcje zaawansowanego rozumowania i długiego kontekstu, aby działać jako asystent badający złożone tematy i kompilujący raporty w imieniu użytkownika. Gemini 2.0 lepiej też rozumie złożone instrukcje oraz analizuje kontekst rozmowy, dzięki czemu jest bardziej precyzyjny w odpowiedziach i sugestiach.

Gemini 2.0 w praktyce

Eksperci Google podzielili się również postępami badań nad agentami, prezentując prototypy oparte na natywnych multimodalnych możliwościach Gemini 2.0:

agenci korzystający z analizy multimodalnej do rozumienia rzeczywistego świata: Project Astra, prototyp badawczy Google, który bada możliwości uniwersalnego asystenta AI, jest lepszy z wersją 2.0 i jest teraz dostępny dla grupy zaufanych testerów. Przykładowo, dzięki modelowi Gemini 2.0 prototyp Project Astra może korzystać z wyszukiwarki Google, Obiektywu oraz Map, co sprawia, że może być znacznie bardziej przydatny na co dzień jako asystent;
agenci pomagający w wykonywaniu złożonych zadań: Project Mariner to wczesny prototyp badawczy zbudowany przy użyciu Gemini 2.0, który bada przyszłość interakcji między człowiekiem a agentem, zaczynając od przeglądarki. Jako prototyp badawczy jest w stanie zrozumieć i przeanalizować informacje znajdujące się na ekranie przeglądarki, w tym piksele i elementy internetowe, takie jak tekst, kod, obrazy i formularze, a następnie wykorzystuje te informacje za pośrednictwem eksperymentalnego rozszerzenia Chrome do wykonywania zadań za użytkownika. Jest również dostępny dla ograniczonej grupy zaufanych testerów;
agenci dla deweloperów: Jules, eksperymentalny agent kodujący oparty na sztucznej inteligencji, który integruje się bezpośrednio z przepływem pracy GitHub. który jest zintegrowany bezpośrednio z przepływem pracy platformy GitHub. Potrafi on rozwiązywać problemy, opracowywać plany i je realizować, a wszystko to pod kierunkiem i nadzorem dewelopera. Jest już dostępny dla zaufanych testerów;
agenci stosowani w innych dziedzinach: Google stworzył agentów korzystających z Gemini 2.0, którzy mogą pomóc poruszać się po wirtualnym świecie gier wideo, oraz agentów, którzy mogą pomóc w świecie fizycznym, stosując możliwości rozumowania przestrzennego Gemini 2.0 w robotyce.

Tagi

Sztuczna inteligencja Rynek

Gemini 2.0 – nowy model AI od Google

Gemini 2.0 w praktyce

Dodaj komentarz Anuluj pisanie odpowiedzi

Microsoft Partner – optymalizacja procesów, usprawnianie współpracy i osiągnięcie zwinności biznesowej

Creotech wydziela segment kwantowy i szykuje debiut nowej spółki na GPW

Groźby Iranu wobec Big Techów zmieniają zasady gry. Czy polskie firmy są gotowe na nowe ryzyka cyfrowe?

Przemysł wdraża AI szybciej niż cyberbezpieczeństwo

Microsoft prezentuje własne modele AI nowej generacji

Nowelizacja ustawy o KSC zaczyna obowiązywać – rusza harmonogram wdrożenia NIS2 w Polsce

Polski startup odpowiada na krytyczny brak specjalistów ds. cyberbezpieczeństwa

Integracja Shopify z Allegro, kurierami i ERP – jak to spiąć w jednym systemie

CloudFerro uruchamia w Łodzi region suwerennej chmury

6 powodów, by przenieść się do chmury Integrated Computing jeszcze w tym roku

OVHcloud wesprze cyfrowe euro Europejskiego Banku Centralnego

Google finalizuje przejęcie Wiz

Rosyjscy cyberprzestępcy miesiącami szpiegowali ukraińskie systemy, ukrywając ataki w chmurze

Infrastruktura IT z certyfikatem cyfrowej suwerenności

Krystian Palica dołącza do B2Bnetwork

Łukasz Bromirski przechodzi z Cisco do IS-Wireless

Jovan Ćetković w zarządzie T‑Mobile Polska

Tomasz Rychter dyrektorem technologicznym w Grupie Zero

Wojciech Zieliński został CIO w Sklepy Komfort

Jacek Przybylski został dyrektorem generalnym Cisco w Polsce

Dariusz Piekarski wzmacnia Sanmargar Team

Zbigniew Mądry nowym prezesem zarządu AB

Mateusz Krawczyk objął stanowisko AI Product Director w InPost

Wiesław Kotecki dołącza do Future Mind jako Senior Advisor

Redakcja

O ITwiz

Popularne w serwisie:

Polskie uczelnie zmuszone do ograniczania przyjęć na studia IT

Nowa polityka licencyjna VMware uderza w małe i średnie firmy

e-Doręczenia niosą wartości, które dają przewagę konkurencyjną

Microsoft Partner – optymalizacja procesów, usprawnianie współpracy i osiągnięcie zwinności biznesowej

Creotech wydziela segment kwantowy i szykuje debiut nowej spółki na GPW

NIS2 i CER w praktyce – jak połączyć cyberodporność z ochroną fizyczną?

Groźby Iranu wobec Big Techów zmieniają zasady gry. Czy polskie firmy są gotowe na nowe ryzyka cyfrowe?

Przemysł wdraża AI szybciej niż cyberbezpieczeństwo

Gemini 2.0 w praktyce

Czytaj też

Dodaj komentarz Anuluj pisanie odpowiedzi

Redakcja

Polskie uczelnie zmuszone do ograniczania przyjęć na studia IT

Nowa polityka licencyjna VMware uderza w małe i średnie firmy

e-Doręczenia niosą wartości, które dają przewagę konkurencyjną