Sztuczna inteligencjaRynek
Gemini 2.0 – nowy model AI od Google
Google wprowadza pierwszy model z serii Gemini 2.0 – wersję eksperymentalną Gemini 2.0 Flash. Jak zapewniają przedstawiciele koncernu, jest to wszechstronny model AI wyróżniający się niskimi opóźnieniami i lepszą wydajnością. Flash 2.0 jest dwa razy szybszy niż wersja 1.5 Pro, obejmuje nowe wyjścia multimodalne i jest wyposażony w natywne narzędzia. Programiści mogą już testować Gemini 2.0 Flash za pośrednictwem Gemini API w Google AI Studio i Vertex AI. Ogólne udostępnienie nowego modelu planowane jest natomiast na styczeń 2025 roku.
Gemini 2.0 Flash wykorzystuje wszystkie możliwości wersji 1.5 Flash, ale działa dwukrotnie szybciej i ma nowe funkcje. Poza multimodalnymi danymi wejściowymi – takimi jak obrazy, filmy i dźwięki – model 2.0 Flash obsługuje także multimodalne dane wyjściowe. A więc natywnie generowane obrazy połączone z tekstem oraz sterowalnym dźwiękiem TTS w wielu językach. Może również natywnie wywoływać narzędzia takie jak wyszukiwarka Google, wykonywać kod oraz uruchamiać zewnętrzne funkcje określone przez użytkownika.
Kolejne nowe rozwiązanie to Deep Research – wykorzystujące funkcje zaawansowanego rozumowania i długiego kontekstu, aby działać jako asystent badający złożone tematy i kompilujący raporty w imieniu użytkownika. Gemini 2.0 lepiej też rozumie złożone instrukcje oraz analizuje kontekst rozmowy, dzięki czemu jest bardziej precyzyjny w odpowiedziach i sugestiach.
Gemini 2.0 w praktyce
Eksperci Google podzielili się również postępami badań nad agentami, prezentując prototypy oparte na natywnych multimodalnych możliwościach Gemini 2.0:
- agenci korzystający z analizy multimodalnej do rozumienia rzeczywistego świata: Project Astra, prototyp badawczy Google, który bada możliwości uniwersalnego asystenta AI, jest lepszy z wersją 2.0 i jest teraz dostępny dla grupy zaufanych testerów. Przykładowo, dzięki modelowi Gemini 2.0 prototyp Project Astra może korzystać z wyszukiwarki Google, Obiektywu oraz Map, co sprawia, że może być znacznie bardziej przydatny na co dzień jako asystent;
- agenci pomagający w wykonywaniu złożonych zadań: Project Mariner to wczesny prototyp badawczy zbudowany przy użyciu Gemini 2.0, który bada przyszłość interakcji między człowiekiem a agentem, zaczynając od przeglądarki. Jako prototyp badawczy jest w stanie zrozumieć i przeanalizować informacje znajdujące się na ekranie przeglądarki, w tym piksele i elementy internetowe, takie jak tekst, kod, obrazy i formularze, a następnie wykorzystuje te informacje za pośrednictwem eksperymentalnego rozszerzenia Chrome do wykonywania zadań za użytkownika. Jest również dostępny dla ograniczonej grupy zaufanych testerów;
- agenci dla deweloperów: Jules, eksperymentalny agent kodujący oparty na sztucznej inteligencji, który integruje się bezpośrednio z przepływem pracy GitHub. który jest zintegrowany bezpośrednio z przepływem pracy platformy GitHub. Potrafi on rozwiązywać problemy, opracowywać plany i je realizować, a wszystko to pod kierunkiem i nadzorem dewelopera. Jest już dostępny dla zaufanych testerów;
- agenci stosowani w innych dziedzinach: Google stworzył agentów korzystających z Gemini 2.0, którzy mogą pomóc poruszać się po wirtualnym świecie gier wideo, oraz agentów, którzy mogą pomóc w świecie fizycznym, stosując możliwości rozumowania przestrzennego Gemini 2.0 w robotyce.