Upss… Coś nie tak z Twoją przeglądarką
Do poprawnego wyświetlania formularza zalecana jest przeglądarka Chrome lub Safari.
Blog

Build with Gemini: Jak najnowsze technologie Google rewolucjonizują rozwój AI

W erze dynamicznego rozwoju sztucznej inteligencji, najnowsze technologie potrafią zaskakiwać nawet najbardziej doświadczonych specjalistów. Konferencja Build with Gemini, zorganizowana przez Google, to nie tylko prezentacja przełomowego modelu Gemini 2.5 Pro, ale przede wszystkim praktyczne warsztaty i konkretna wiedza, które pozwalają deweloperom skuteczniej wykorzystać potencjał AI w codziennej pracy.

Aleksandra Szałajko, doświadczona inżynierka ML w Comarch, dzieli się swoimi spostrzeżeniami z konferencji. Opowiada, jakie innowacje w modelu Gemini 2.5 Pro zrobiły na niej największe wrażenie, jak AI zmienia codzienną pracę deweloperów i jakie możliwości otwierają się przed zespołami dzięki najnowszym narzędziom Google. Zapraszamy do lektury inspirującej rozmowy o przyszłości technologii i roli liderów AI w biznesie.

Ola, co skłoniło Cię do udziału w konferencji Build with Gemini?

Z zawodowego punktu widzenia ta decyzja była bardzo prosta. Już sama marka Google i jakość ich produktów gwarantują, że będziemy mieli do czynienia z technologią z najwyższej półki. Model Gemini 2.5 Pro, który był głównym bohaterem konferencji, jest obecnie uznawany za jeden z najlepszych na świecie. Jako inżynier ML chcę stale poszerzać swoją wiedzę o najnowsze narzędzia AI, a ta konferencja była idealną okazją, by zobaczyć jak Gemini działa w praktyce i ocenić jego możliwości pod kątem zastosowań w naszych projektach.

Czy miałaś wcześniej okazję uczestniczyć w wydarzeniach organizowanych przez Google, zwłaszcza tych skierowanych do inżynierów?

Tak, nasza współpraca z Google ma już pewną historię. Dwa lata temu cały nasz zespół AI został zaproszony do nowo otwartej siedziby Google w Krakowie. Zaprezentowano nam wtedy najnowsze rozwiązania i produkty chmurowe. W tym samym okresie otrzymaliśmy również dostęp do specjalnej platformy szkoleniowej z narzędzi Google, w której kursach aktywnie brałam udział. To była świetna okazja do pogłębienia wiedzy na temat narzędzi AI, które oferuje Google Workspace.

A jak w praktyce wyglądały Twoje pierwsze wrażenia? Czy konferencja spełniła Twoje oczekiwania pod względem organizacji i merytorycznej zawartości?

Konferencja była świetnie zorganizowana – zamiast ogólnych, marketingowych haseł, dostaliśmy solidną dawkę konkretnej wiedzy technicznej, fragmenty kodu i praktyczne warsztaty. Widać było, że to eksperci z ogromną pasją, którzy potrafią w przystępny sposób przekazać skomplikowaną wiedzę. Co najważniejsze, konferencja była wypełniona praktycznymi informacjami i przykładami, które planujemy wykorzystać w implementacji naszych projektów. Google wyraźnie postawiło na deweloperów, dając nam do rąk narzędzia i pokazując, jak ich używać. To była solidna porcja inżynierskiej wiedzy, a nie tylko teoria.

Skoro konferencja była tak dobrze przygotowana, które z zaprezentowanych nowości wzbudziły u Ciebie największe zainteresowanie? Co z kolei uważasz za prawdziwie przełomowe w modelu Gemini?

Najbardziej zainteresowała mnie funkcja wyrażania emocji przez chatboty. To, że rozmowa z AI może coraz bardziej przypominać interakcję z człowiekiem, a nie z maszyną, ma ogromny potencjał w kontekście interfejsów użytkownika w systemach biznesowych. Natomiast jeśli chodzi o najbardziej przełomową funkcję Gemini, to bez dwóch zdań jest nią narzędzie Veo 3, które umożliwia generowanie wideo wysokiej jakości na podstawie opisów tekstowych. Możliwość opisania sceny słowami i zobaczenia jej na ekranie w formie filmu to coś, co naprawdę robi ogromne wrażenie.


Comarch Team na konferencji Build with Gemini (Aleksandra - druga od lewej).

Jak w takim razie oceniasz kierunek rozwoju AI w ekosystemie Google, w szczególności w kontekście Gemini?

Uważam, że tempo rozwoju Gemini jest zdumiewające. Pojawiają się coraz to nowsze, przełomowe funkcje, o których jeszcze niedawno ciężko było sobie nawet wyobrazić, że modele AI będą w stanie je realizować. Mam na myśli właśnie takie rzeczy, jak tworzenie realistycznych filmów czy rozpoznawanie i wyrażanie emocji. Google wyraźnie dąży do stworzenia AI, która jest nie tylko analityczna, ale też bardziej ludzka i kreatywna.

Mając na uwadze tę dynamikę rozwoju, czy widzisz możliwość wdrożenia Gemini lub innych pokrewnych modeli w swoich projektach? Jakie konkretne obszary pracy widzisz jako najbardziej obiecujące?

Tak, mamy już pewne plany, ale dotyczące modelu Gemma. Kluczowe jest dla nas to, że jest to model open-source, z którego funkcjonalności możemy swobodnie korzystać w naszych komercyjnych rozwiązaniach. Gemma oferuje kilka ważnych dla nas funkcji, dzięki którym będziemy w stanie rozbudować i ulepszyć nasze projekty.

Aby lepiej poznać możliwości Gemini, w jakich warsztatach i sesjach brałaś udział? Co z nich szczególnie zapadło Ci w pamięć i przydało się w Twojej pracy?

Wzięłam udział w trzech warsztatach związanych z oceną modeli językowych oraz projektowaniem systemów opartych na agentach. Poza tym uczestniczyłam w kilku wykładach, głównie związanych z funkcjonalnościami, które sami rozwijamy w naszych projektach, a także tych pokazujących najnowsze możliwości narzędzia Gemini 2.5. Najbardziej wartościowy był dla mnie warsztat poświęcony ewaluacji modeli LLM (Large Language Model). To temat, nad którym sama intensywnie pracowałam, rozwijając podobną funkcjonalność w naszym projekcie ChatERP. Warsztat ten dostarczył mi dodatkowej, cennej wiedzy i pokazał nowe narzędzia, dzięki którym z pewnością będę mogła znacząco ulepszyć dokładność i efektywność naszego modułu do ewaluacji modeli językowych.

Czy uczestnictwo w tych zajęciach i prezentacjach zmieniło Twoje spojrzenie na AI? Czy coś Cię zaskoczyło lub zainspirowało do nowych rozwiązań?

Na pewno zaskoczyło mnie tempo rozwoju Gemini, a także fakt, jak szybko te przełomowe technologie stają się praktycznymi narzędziami. Jeszcze niedawno multimodalność czy generowanie wideo za pomocą AI, wydawało się odległą przyszłością. Dziś widzimy, że multimodalność w narzędziach AI staje się standardem. Wizja, w której używamy telefonu jako swojego osobistego asystenta, który rozumie kontekst, potrafi przetwarzać zdjęcia i wykonuje złożone zadania, przestaje być przyszłością - to dzieje się tu i teraz.

Podczas konferencji była też okazja do testów demo i narzędzi – czy miałaś możliwość samodzielnie sprawdzić te rozwiązania? Jakie były Twoje wrażenia?

Jak najbardziej i było to jedno z najciekawszych doświadczeń na całej konferencji! Poza głównym nurtem wykładów i warsztatów zorganizowano specjalną strefę z stoiskami, które obsługiwali pracownicy Google. Prezentowali tam swoje produkty i można było je swobodnie testować i zadawać pytania. Największe wrażenie zrobiła na mnie interaktywna gra. Miałam okazję w nią zagrać i zobaczyć, jak jej grafika jest na bieżąco personalizowana na podstawie preferencji użytkownika. Co więcej, sama rozgrywka za każdym razem przebiega inaczej, gdyż algorytmy sztucznej inteligencji analizują wszystkie wykonane ruchy, a kolejne etapy są dynamicznie dopasowywane na podstawie tych wcześniejszych kroków. To była świetna okazja, żeby zobaczyć jak kreatywne rozwiązania można tworzyć z wykorzystaniem sztucznej inteligencji.

Patrząc na swoją codzienną pracę deweloperską, jak oceniasz rolę AI, a zwłaszcza Gemini? W jaki sposób wpływa na efektywność i jakość Twojej pracy?

Sztuczna inteligencja, taka jak Gemini, staje się kluczowym partnerem w codziennej pracy dewelopera. Jako inteligentny Copilot, znacząco przyspiesza pisanie kodu i rozwiązywanie błędów, automatyzując powtarzalne czynności i sugerując trafne poprawki. W fazie projektowej, dzięki funkcjom takim jak "deep research", AI działa jak zaawansowany analityk, syntezując informacje z wielu źródeł, by zaproponować najlepsze wzorce architektoniczne i technologie. W rezultacie narzędzia te usprawniają cały proces deweloperski, pozwalając mi skupić się na bardziej kreatywnych i strategicznych wyzwaniach.

Po takim intensywnym wydarzeniu, co najbardziej zabierasz ze sobą do dalszej pracy – wiedzę, pomysły, kontakty? Jakie masz plany na ich wykorzystanie?

Przede wszystkim ogromną dawkę praktycznej wiedzy, którą mogę wykorzystać w naszych projektach - szczególnie w kwestii ewaluacji modeli językowych i implementacji mechanizmów zabezpieczających. Podczas warsztatów i wykładów pojawiło się kilka nowych pomysłów na rozwój naszych rozwiązań, które z pewnością wkrótce przetestujemy.

Na koniec – gdybyś mogła zadać modelowi Gemini jedno pytanie, na które tylko AI mogłoby odpowiedzieć, co by to było i dlaczego?

To trudne pytanie! Jako inżynier zajmujący się systemami optymalizującymi działanie firm, zapytałabym: „Biorąc pod uwagę wszystkie publicznie dostępne dane o globalnych łańcuchach dostaw, przepływach finansowych i zależnościach między gospodarkami, jaki jeden proces optymalizacyjny wywołałby największy pozytywny efekt dla całej światowej gospodarki?”. Jestem ciekawa, czy odpowiedź byłaby trywialna, czy może wskazałaby na coś, czego jako ludzie kompletnie nie dostrzegamy.

Dodaj komentarz

      Adres e-mail nie zostanie opublikowany
            Komentarze
            (0)

              Najczęściej czytane w kategorii Praca w IT